Nvidia與微軟推RTX Spark,押注Windows PC成為本機AI代理平臺
Nvidia表示,RTX Spark最高可提供1 petaflop的AI運算效能,可在本機執行具備1,200億個參數的大型語言模型,並支援最高100萬token上下文處理能力。這次合作不只強調運算效能,也將AI代理的安全治理納入設計重點。Nvidia與微軟將在Windows加入身分識別、隔離、原則控管,以及運作全程皆可獲得安全防護等基礎能力,並搭配AI代理執行環境Nvidia OpenShell,讓使用者與管理員可定義代理能執行哪些動作、可存取哪些資源。
IDC分析指出,這次發表顯示Windows AI PC的發展方向正在調整。微軟先前推動AI PC時,主要強調神經處理單元(NPU)與Copilot+ PC功能,但RTX Spark這次改以GPU、本機推論與AI代理執行環境作為核心。對企業而言,採用關鍵未必在於運算效能本身,而是AI代理能否在受管理裝置上安全運作,並讓IT部門維持控管能力。
不過,IDC也提醒,目前Anthropic、Google與OpenAI等基礎模型業者的主力服務仍建立在雲端推論與訂閱制之上。若未來未出現可讓部分推論工作轉向客戶端GPU執行的授權或訂閱模式,Windows AI PC上的代理功能仍將主要依賴開放權重模型,與先進模型可能存在能力落差。
NVIDIA and Microsoft Are Betting the Future of the PC Is Agents and Local Inference
NVIDIA and Microsoft are betting that local AI inference on the PC can cut cloud costs and unlock agentic AI. IDC's Tom Mainelli examines whether the RTX Spark wager holds up — and what has to change for it to pay off.
www.idc.com
Comments (0)