輝達 (NVDA.US) 在年度 GTC 大會上宣布推出全新的 BlueField-4 STX 儲存架構,主打為需要長上下文推理能力的人工智慧 (AI) 工作負載打造,試圖解決大型 AI 模型在運算與資料存取上的瓶頸。公司表示,隨著 AI 系統逐步走向能夠長時間推理與持續學習的新階段,資料儲存與運算基礎架構也必須同步升級。
根據輝達發布的新聞稿,STX 參考架構相較於傳統儲存系統,最高可提供 5 倍的 Token 吞吐量,能源效率最高提升 4 倍,企業 AI 資料的匯入速度也可提升 2 倍。這套架構的核心目標是支援需要大量上下文記憶與高速資料存取的 AI 模型,尤其是近年快速發展的長上下文推理系統。
STX 架構整合輝達的 CMX 上下文記憶儲存平台,該平台透過高效能的上下文層來擴展 GPU 記憶體容量,使 AI 模型能夠處理更大規模的資料與更長的推理上下文。整體系統採用 BlueField-4 處理器,結合輝達 Vera CPU 與 ConnectX-9 SuperNIC,並搭配 Spectrum-X 乙太網路架構,以提供高速資料傳輸與運算能力。
輝達創辦人兼執行長黃仁勳表示:「Agentic AI 正在重新定義軟體的能力,而支撐這些系統的運算基礎架構也必須重新設計。能夠在龐大上下文中進行推理並持續學習的 AI 系統,需要一種全新的儲存架構。」
目前已有多家雲端與 AI 基礎設施企業計畫採用 STX 架構作為上下文記憶儲存解決方案,早期採用者包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure 以及 Vultr 等。
同時,多家儲存與系統製造商也將基於 STX 設計開發相關基礎設施產品,包括 AIC、Cloudian、DDN、戴爾科技 (DELL.US) 、Everpure、Hitachi Vantara、慧與科技 (HPE.US) 、IBM(IBM.US) 、MinIO、NetApp(NTAP.US) 、Nutanix(NTNX.US) 、美超微 (SMCI.US) 、Quanta Cloud Technology、VAST Data 以及 WEKA 等。
輝達表示,基於 STX 架構打造的平台預計將由合作夥伴於今年下半年正式推出,未來將用於支援需要長上下文推理能力的新一代 AI 系統與大型模型應用。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網