黃仁勳：AI已從生成式AI走向代理AI， Nvidia全面轉型為AI基礎設施公司

黃仁勳認為，AI已從成本中心轉變為獲利來源，推動全球企業加速建置AI工廠（AI Factory），未來10年的核心競爭力，將是企業建置、管理與營運AI基礎設施的能力。

AI已成GDP與獲利來源，代理AI正式進入實用階段

黃仁勳指出，過去兩年業界從生成式AI邁向代理AI，現在真正有用的AI已經出現。

他以GitHub開發者生態系為例指出，全球約3千萬至4千萬名軟體工程師，在AI輔助下程式開發效率大幅提升。GitHub程式提交量從2023年的3億筆，增加至2024年的4億筆，至2025年達到5億筆，而到2026年前幾個月已接近三倍成長。

黃仁勳認為，AI並未取代工程師，反而提升軟體開發產出，進一步帶動企業增加人才投資。「AI現在是GDP的創造者，也是利潤的創造者」。

如同他先前多次對外宣揚的觀點，AI時代下能夠產出愈多的Token，代表企業能獲得更多利益，而在今天的演講中強調，AI時代的獲利單位已從傳統軟體授權轉變為Token。企業若能產生更多Token，就能創造更多收入，因此全球競相擴建AI工廠。

代理AI成為新運算模型，企業應用架構全面改變

黃仁勳認為，代理AI代表一種全新的企業應用架構。傳統企業應用是由程式碼與作業系統構成，但未來應用將由大型語言模型、Agent Framework、記憶體系統、工具、Runtime執行環境組成。

在這種模式下，AI不再只是回答問題，而是能夠理解情境、規畫工作流程、呼叫工具、存取資料庫、執行任務，自動產生程式碼、CAD設計、文件與工作流程。

黃仁勳指出，未來企業軟體將不再是供人類使用，而是供AI代理（Agent）使用，他也藉此機會駁斥外界對於AI對於軟體產業帶來危機的看法，他認為企業軟體產業並不會消失，反而將迎來新的成長機會。

發表企業Agent平台，助企業建立專屬AI代理

為了支援企業導入代理AI，Nvidia推出企業級Agent開發平台。該平台包括Nemotron開放模型、Open Shell執行環境、AI Agent Framework、CUDA-X函式工具庫、安全與治理機制。

黃仁勳預言，未來企業將會成為Agent公司，每家公司都需要自己的Agent作業系統。他也同步發表新一代的開放模型Nemotron 3 Ultra。該模型採用混合架構，結合State Space Model（SSM）、Mixture of Experts（MoE）。

相較前一代，新模型的推理速度提升5倍，而推理成本降低30%。透過開放模型、訓練資料與訓練方法，將能夠讓企業能建立自己的專屬Agent。

不同於一般開源模型僅提供模型權重，Nemotron 3 Ultra開放了訓練資料、訓練腳本與工具鏈，並以長時間推理、任務求解及工具使用資料集進行訓練，專門支援代理AI應用。黃仁勳表示，未來企業將需要自己的Agent作業系統，而Nemotron 3 Ultra將成為企業建立專屬AI代理的重要基礎。

Nvidia也展示與Cadence合作的晶片設計Agent，透過Agent自動執行RTL驗證、模擬與除錯，將原本需要數週的驗證流程縮短至數小時，效率提升超過40倍。

Vera Rubin全面投產，瞄準代理AI工作負載

硬體基礎架構方面，Nvidia的下一代AI平臺Vera Rubin正式全面投產。不同於過去聚焦訓練（Training）的Hopper，以及專注推理（Inference）的Grace Blackwell，Vera Rubin的設計目標就是代理AI。

Vera Rubin不是單一的GPU，是一套完整的Agent運算系統。其整體架構包括Vera CPU、Rubin GPU、NVLink 72、BlueField DPU、Connect X-9 SuperNIC網路、新一代儲存架構，並整合安全、儲存與網路功能。

他指出，Agent系統涉及大量模型推理、工具呼叫、記憶體管理與資料存取，需要新的分散式運算架構，而非單純提升GPU效能即可解決。

專為Agent時代打造的Vera CPU

黃仁勳也介紹新一代的資料中心CPU，Vera。他強調現有CPU主要是為人類使用設計，但是Agent工作模式完全不同，Agent需要高互動性、極低延遲需求、頻繁呼叫工具、高度依賴資料存取。

Vera是為Agent設計，特別針對單執行緒效能、記憶體頻寬、CPU互連頻寬、能源效率進行最佳化。Nvidia宣稱其在SQL查詢的效能提升3倍、即時串流分析效能提升6倍、Agent的Sandbox效能提升1.8倍。

基於Agent的運算需求增加，黃仁勳認為，未來會出現全新的Agent CPU市場，其規模甚至可能超越現有人類運算市場。

搶攻AI PC市場

除了看好資料中心轉型為AI Factory的商機，順應Agent的趨勢，Nvidia也搶進AI PC，展示Nvidia RTX Spark，採用台積電3奈米製程，內含700億電晶體，整合具有6144 CUDA核心的Blackwell RTX GPU，該GPU可提供1PF FP4的AI效能。

Nvidia還與聯發科合作客製化的20核心Grace CPU，在GPU與CPU之間使用128GB LPDDR5統一記憶體，以NVLink C2C連接GPU與CPU，可達600GB/s速度。

Nvidia RTX Spark的特色在於單一封裝內同時提供AI推論、圖形運算與通用運算能力，並特別強調能效比提升，使筆電與輕薄型PC可支援大型AI模型的本地運行。

在該款晶片的基礎上，Nvidia與微軟合作打造專為Agent設計的Windows平臺，象徵向AI原生化發展，讓作業系統能直接調度GPU與AI加速資源，並與雲端模型形成混合運算。

這使得AI PC在架構上更接近一種個人AI工作站的概念，兼顧本地即時運算與雲端協同作業，進一步強化Nvidia所強調的端雲一體的AI運算平台概念。

從DGX走向DSX，Nvidia進軍AI工廠營運設計平臺

隨著Nvidia逐漸將業務重心從晶片、伺服器擴展到AI工廠營運。黃仁勳也宣布DSX（Data Center/AI Factory Stack），DSX定位為AI工廠的參考架構與作業系統。功能涵蓋AI工廠的規畫與模擬、電力管理、液冷管理、GPU部署最佳化、電網協同運作。

「現今許多AI資料中心高達40%的電力配置浪費」，黃仁勳表示，透過DSX的動態電力分配、功率平滑技術、AI代理協調冷卻系統，能夠提升資料中心利用率。此外，其中導入的45度高溫液冷設計，可降低資料中心的耗水與耗能。

如同先前多次對外形容的，黃仁勳將AI工廠視為人類史上規模最大的基礎建設工程。1GW級AI工廠投資規模已達600億美元，而在未來上看800億至1,000億美元

而AI資料中心的競爭指標不再只是效能，而是每瓦Token產出量、系統可靠性、上線速度、總持有成本（TCO）等等。「計算就是收入」，他說。

他直言，企業未來競爭的核心是如何在有限的電力下產生最多Token與AI服務。

Nvidia試圖從過去單一GPU到機架，到AI工廠整體架構設計，轉型為AI基礎設施供應商。如同黃仁勳一再強調的，未來企業競爭關鍵不只是建模型，而是能不能建立、營運並持續優化AI工廠，Nvidia的目標是成為這套AI工廠的核心供應者。

Comments (0)