Skip to main content

黃仁勳:AI已從生成式AI走向代理AI, Nvidia全面轉型為AI基礎設施公司

Posted in 業界新聞
新聞

黃仁勳認為,AI已從成本中心轉變為獲利來源,推動全球企業加速建置AI工廠(AI Factory),未來10年的核心競爭力,將是企業建置、管理與營運AI基礎設施的能力。

AI已成GDP與獲利來源,代理AI正式進入實用階段

黃仁勳指出,過去兩年業界從生成式AI邁向代理AI,現在真正有用的AI已經出現。

他以GitHub開發者生態系為例指出,全球約3千萬至4千萬名軟體工程師,在AI輔助下程式開發效率大幅提升。GitHub程式提交量從2023年的3億筆,增加至2024年的4億筆,至2025年達到5億筆,而到2026年前幾個月已接近三倍成長。

黃仁勳認為,AI並未取代工程師,反而提升軟體開發產出,進一步帶動企業增加人才投資。「AI現在是GDP的創造者,也是利潤的創造者」。

如同他先前多次對外宣揚的觀點,AI時代下能夠產出愈多的Token,代表企業能獲得更多利益,而在今天的演講中強調,AI時代的獲利單位已從傳統軟體授權轉變為Token。企業若能產生更多Token,就能創造更多收入,因此全球競相擴建AI工廠。

代理AI成為新運算模型,企業應用架構全面改變

黃仁勳認為,代理AI代表一種全新的企業應用架構。傳統企業應用是由程式碼與作業系統構成,但未來應用將由大型語言模型、Agent Framework、記憶體系統、工具、Runtime執行環境組成。

在這種模式下,AI不再只是回答問題,而是能夠理解情境、規畫工作流程、呼叫工具、存取資料庫、執行任務,自動產生程式碼、CAD設計、文件與工作流程。

黃仁勳指出,未來企業軟體將不再是供人類使用,而是供AI代理(Agent)使用,他也藉此機會駁斥外界對於AI對於軟體產業帶來危機的看法,他認為企業軟體產業並不會消失,反而將迎來新的成長機會。

發表企業Agent平台,助企業建立專屬AI代理

為了支援企業導入代理AI,Nvidia推出企業級Agent開發平台。該平台包括Nemotron開放模型、Open Shell執行環境、AI Agent Framework、CUDA-X函式工具庫、安全與治理機制。

黃仁勳預言,未來企業將會成為Agent公司,每家公司都需要自己的Agent作業系統。他也同步發表新一代的開放模型Nemotron 3 Ultra。該模型採用混合架構,結合State Space Model(SSM)、Mixture of Experts(MoE)。

相較前一代,新模型的推理速度提升5倍,而推理成本降低30%。透過開放模型、訓練資料與訓練方法,將能夠讓企業能建立自己的專屬Agent。

不同於一般開源模型僅提供模型權重,Nemotron 3 Ultra開放了訓練資料、訓練腳本與工具鏈,並以長時間推理、任務求解及工具使用資料集進行訓練,專門支援代理AI應用。黃仁勳表示,未來企業將需要自己的Agent作業系統,而Nemotron 3 Ultra將成為企業建立專屬AI代理的重要基礎。

Nvidia也展示與Cadence合作的晶片設計Agent,透過Agent自動執行RTL驗證、模擬與除錯,將原本需要數週的驗證流程縮短至數小時,效率提升超過40倍。

Vera Rubin全面投產,瞄準代理AI工作負載

硬體基礎架構方面,Nvidia的下一代AI平臺Vera Rubin正式全面投產。不同於過去聚焦訓練(Training)的Hopper,以及專注推理(Inference)的Grace Blackwell,Vera Rubin的設計目標就是代理AI。

Vera Rubin不是單一的GPU,是一套完整的Agent運算系統。其整體架構包括Vera CPU、Rubin GPU、NVLink 72、BlueField DPU、Connect X-9 SuperNIC網路、新一代儲存架構,並整合安全、儲存與網路功能。

他指出,Agent系統涉及大量模型推理、工具呼叫、記憶體管理與資料存取,需要新的分散式運算架構,而非單純提升GPU效能即可解決。

專為Agent時代打造的Vera CPU

黃仁勳也介紹新一代的資料中心CPU,Vera。他強調現有CPU主要是為人類使用設計,但是Agent工作模式完全不同,Agent需要高互動性、極低延遲需求、頻繁呼叫工具、高度依賴資料存取。

Vera是為Agent設計,特別針對單執行緒效能、記憶體頻寬、CPU互連頻寬、能源效率進行最佳化。Nvidia宣稱其在SQL查詢的效能提升3倍、即時串流分析效能提升6倍、Agent的Sandbox效能提升1.8倍。

基於Agent的運算需求增加,黃仁勳認為,未來會出現全新的Agent CPU市場,其規模甚至可能超越現有人類運算市場。

搶攻AI PC市場

除了看好資料中心轉型為AI Factory的商機,順應Agent的趨勢,Nvidia也搶進AI PC,展示Nvidia RTX Spark,採用台積電3奈米製程,內含700億電晶體,整合具有6144 CUDA核心的Blackwell RTX GPU,該GPU可提供1PF FP4的AI效能。

Nvidia還與聯發科合作客製化的20核心Grace CPU,在GPU與CPU之間使用128GB LPDDR5統一記憶體,以NVLink C2C連接GPU與CPU,可達600GB/s速度。

Nvidia RTX Spark的特色在於單一封裝內同時提供AI推論、圖形運算與通用運算能力,並特別強調能效比提升,使筆電與輕薄型PC可支援大型AI模型的本地運行。

在該款晶片的基礎上,Nvidia與微軟合作打造專為Agent設計的Windows平臺,象徵向AI原生化發展,讓作業系統能直接調度GPU與AI加速資源,並與雲端模型形成混合運算。

這使得AI PC在架構上更接近一種個人AI工作站的概念,兼顧本地即時運算與雲端協同作業,進一步強化Nvidia所強調的端雲一體的AI運算平台概念。

從DGX走向DSX,Nvidia進軍AI工廠營運設計平臺

隨著Nvidia逐漸將業務重心從晶片、伺服器擴展到AI工廠營運。黃仁勳也宣布DSX(Data Center/AI Factory Stack),DSX定位為AI工廠的參考架構與作業系統。功能涵蓋AI工廠的規畫與模擬、電力管理、液冷管理、GPU部署最佳化、電網協同運作。

「現今許多AI資料中心高達40%的電力配置浪費」,黃仁勳表示,透過DSX的動態電力分配、功率平滑技術、AI代理協調冷卻系統,能夠提升資料中心利用率。此外,其中導入的45度高溫液冷設計,可降低資料中心的耗水與耗能。

如同先前多次對外形容的,黃仁勳將AI工廠視為人類史上規模最大的基礎建設工程。1GW級AI工廠投資規模已達600億美元,而在未來上看800億至1,000億美元

而AI資料中心的競爭指標不再只是效能,而是每瓦Token產出量、系統可靠性、上線速度、總持有成本(TCO)等等。「計算就是收入」,他說。

他直言,企業未來競爭的核心是如何在有限的電力下產生最多Token與AI服務。

Nvidia試圖從過去單一GPU到機架,到AI工廠整體架構設計,轉型為AI基礎設施供應商。如同黃仁勳一再強調的,未來企業競爭關鍵不只是建模型,而是能不能建立、營運並持續優化AI工廠,Nvidia的目標是成為這套AI工廠的核心供應者。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.