Skip to main content

Google公布Gemini 3.5 Flash推理模型,主打代理人開發作業

Posted in 業界新聞
新聞

3.5 Flash最大亮點是大幅提升開發代理人模型的能力,它是Gemini 3.5系列第一個推出的版本,Google並預告正在內部測試及使用旗艦版3.5 Pro,預定下個月問世。

3.5 Flash是輕量級模型,但在多個推理及程式撰寫等面向上超越更大的模型。它在程式開發和代理人相關標竿測試Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)及MCP Atlas(83.6%)都超越Gemini 3.1 Pro。

它還越級挑戰旗艦模型OpenAI GPT 5.5及Anthropic Claude Opus 4.7。雖然在程式撰寫測試及綜合推理與知識兩項,仍是由兩個旗艦模型領先,但在AI代理及工具調用標竿測試MCP Atlas中,3.5 Flash得分83.6%,超越GPT 5.5和Claude Opus 4.7(75.3%和79.1%)。其多模態能力尤其突出,在MMMU-Pro及CharXiv Reasoning中它分別取得83.6%及84.2%也超越舊版及競爭對手。Artificial Analysis Intelligence指標及輸出速度象限中,3.5 Flash以分析能力和速度兼具獨居右上象限。

依據其速度和推理、多模態能力,3.5 Flash擅於處理多步驟工作流程、大規模部署子代理(Sub-agents)以及長期運行的複雜任務。新模型配合升級版的Antigravity執行框架成強大引擎,能夠部署多個協同運作的子代理人(Subagents),執行複雜的應用場景任務。在人類監督下,得以執行多步驟工作流程及程式撰寫任務。它能快速規劃、打造和重新嘗試以解決真實世界的問題,不論是開發新應用、維護程式或協助準備財務報表。過去開發人員或稽核者幾天或幾個星期的工作,都能大幅縮短。

Gemini 3.5 Flash目前已全面部署到Gemini App及Google Search的AI模式。其中,Google Search新增的個人AI搜尋代理人Gemini Spark,底層即為3.5 Flash。而在開發人員,新模型已經由開發平臺Google Antigravity及Google AI Studio及Android Studio的Gemini API提供。而企業也可以透過Gemini Enterprise Agent Platform和Gemini Enterprise存取。

Google同時公布Antigravity 2.0。它是一款全新獨立桌面應用程式,提供開發者集中工作空間,來引導、自訂和協調代理人,而不需依賴IDE。目前已公布macOS、Linux及Windows版。Antigravity 2.0可在此下載

With expanded Antigravity platform, Google accelerates agent-native software development - SiliconANGLE

With expanded Antigravity platform, Google accelerates agent-native software development - SiliconANGLE

siliconangle.com
View original 0 Likes 0 Boosts

Comments (0)

No comments yet.