Arm:Agent AI崛起,CPU需求成長速度超出預期
Rene指出,GPU的主要工作是生成Token,無論是訓練或推論,其本質上是高效率的Token生產工廠;但Agent AI與傳統聊天機器人最大的差異在於,它不只是產生答案,而是能夠持續執行任務、呼叫工具、管理工作流程、協調其他Agent,甚至建立多個Agent組成的工作團隊,在這個過程中,大量的工作負載將落在CPU身上。
Rene Haas表示,當Agent開始大量部署後,Token的管理、分發、協調與執行等等,這些都需要CPU負責。未來在相同功耗條件下,資料中心需要的CPU核心數量可能是目前的4倍以上,而隨著Agent之間彼此呼叫、彼此協作的規模持續擴大,這個倍數甚至可能進一步提高。
他表示,今年3月Arm曾預估未來5年CPU市場規模將超過1,200億美元,當時外界普遍認為這項預測過於樂觀,但短短數個月內,市場對Agent AI成長速度的認知已出現變化。從OpenAI Codex、Anthropic,再到Salesforce、ServiceNow等企業軟體業者陸續將Agent導入其產品,這使得CPU需求成長速度甚至超出Arm原先預期。
從IP供應商走向CPU供應商
看準Agent AI帶來的新一波基礎架構需求,Arm也開始從傳統IP授權模式,進一步跨足完整CPU產品市場。
今年3月,一改過去Arm架構IP供應商的角,Arm首度發表了Arm AGI CPU。這款產品採用Arm自家Neoverse架構,並搭配Compute Subsystem(CSS)平臺設計,針對AI資料中心的大規模部署需求進行最佳化。
Arm推出CPU揮軍直指資料中心的底氣是,AGI CPU具有的能源效率優勢。
根據Arm公布的數據,相較於同級的x86系統,Arm AGI CPU提供約2倍的每瓦效能(Performance per Watt)。在機架層級配置上,採用氣冷的系統可在36kW功耗下提供8,160個CPU核心,配置超過180TB的低延遲記體;至於採用液冷的系統,在200kW功耗下提供超過45,000個核心,配置超過1PB的記憶體。

AI資料中心競爭轉向每MW算力
Rene Haas指出,隨著全球超大型AI資料中心持續擴建,電力與散熱已成為限制運算規模的重要因素。對營運商而言,更高的機架密度與能源效率,意味著能在相同的電力條件下能夠部署更多CPU資源。
以同樣機架系統來看,採用x86架構CPU的機架(17x 2U),可容納4,352個CPU核心,而採用Arm AGI CPU的機架,採用30臺1U伺服器配置,可容納8,160個CPU核心,相較於x86機架,Arm AGI CPU能提供超過2倍的機架效能。
他估計,若大規模採用Arm架構CPU,未來可望協助資料中心業者節省約10GW電力容量需求,以及超過100億美元的基礎設施投資成本。
Rene希望將AI時代資料中心的競爭焦點從單純比較晶片效能,轉向每MW電力能夠產生多少運算能力。由於現今的超大型AI資料中心的建設成本已涵蓋電力設施、冷卻系統、配電設備與機房空間等龐大資本支出(CAPEX),提升CPU能源效率將直接影響資料中心的建置規模與投資成本
Arm AGI CPU自3月公布至今,已有不少的採用案例,例如OCI與字節跳動加入Arm AGI CPU陣營。而更大的從Arm架構來看,Google Axion、AWS Graviton,以及Nvidia的Grace與Vera等資料中心CPU產品,都採用Arm架構設計。
Rene Haas認為,這些案例顯示Arm已不再只是手機處理器架構,而是逐漸成為AI資料中心的重要運算平臺。
AI PC成為Agent執行的重要平臺,聯手Nvidia共同重新定義PC
除了資料中心市場,Agent AI也正在改變個人電腦的定位。
在昨天Nvidia執行長黃仁勳公開發表PC運算平臺Nvidia RTX Spark,其整合聯發科客製化的Grace CPU正是採用Arm架構,搭配Blackwell GPU,提供最高1 PFLOPS FP4運算能力與128GB統一記憶體容量。
黃仁勳受邀上臺與Rene對談,雙方將焦點轉向AI PC的未來發展。
黃仁勳表示,傳統PC是以人類執行應用程式為中心,未來的PC將逐漸轉變為Agent執行工作的運算平臺。Agent不僅能夠理解使用者需求,也能直接操作應用程式與工具完成任務。
他舉例說明,當他外出時,將電腦或筆電留在家中或公司,可以透過身體的手機告訴Agent想要完成什麼工作,家中或公司電腦上的Agent便能自動使用Photoshop、Premiere、Blender或CAD軟體進行編輯與創作,而不需要使用者自行操作複雜功能。
黃仁勳指出,透過新的NVFP4模型壓縮格式,未來在PC本機端能夠運行1,000億參數的AI模型,使大量Agent工作負載直接在裝置端完成,不必完全依賴雲端。
從GPU時代走向CPU與Agent協同運算的新架構
從昨天Nvidia的演說到今天Arm的演說,AI產業下一階段競爭焦點,已不再只是模型規模或GPU效能。
當Agent AI逐漸成為企業應用與個人運算的新模式,CPU在任務協調、工作流程管理、記憶體存取與工具調用等環節的重要性正快速提升。這也讓過去被視為AI配角的CPU,再次成為資料中心與終端裝置架構設計的重要核心。
Arm正將Arm架構從手機擴大雲端到PC布局,反映其試圖把握Agent AI帶來的新一輪運算平臺轉型機會。Google、AWS、Oracle到Nvidia採用Arm架構來看,CPU在AI時代的重要性,一如Rene所說的,現在才剛剛開始。
Comments (0)