Google公布Gemma 4號稱最強本地端開放模型

新聞

Gemma 4主打以Gemini 3為基礎開發，具備強大能力，整個家族都不再只限於簡單對話，而能處理複雜邏輯和代理人工作流程。Gemma 4推出4個版本：Effective 2B (E2B)、Effective 4B (E4B)、26B Mixture of Experts (MoE)及31B Dense。根據Google說明，最大的二個版本都展現同級中最強效能，其中31B及26B版分別名列是Arena AI文字標竿測試中排行榜開放模型的第3及第6，也超過參數量更大的模型，如Mistral-Large3或DeepSeek-v3.2。

由於Gemma 4可在工作站執行，Google特別強調Gemma 4在開發上的效益。其一，Gemma 4具備更強推理能力，得以執行多步驟規劃及深度邏輯，在數學及指令遵從測試表現較前代大幅提升。Gemma 4原生支援功能呼叫、結構化JSON輸出及原生系統指令，使開發人員可以開發能透過API使用不同工具和執行流程的自主代理人。它也支援高品質離線撰寫程式，可在工作站執行開發工作，而且原生支援140多種語言，可用於開發出多個市場的應用程式。

Gemma 4家族具備更長脈絡（context）空間，基本款有128K，最大的二款有256K，允許用戶傳送儲存庫或長文件。所有4個模型都原生支援影片和圖像辨識，利於OCR及圖表理解。E2B和E4B版本還支援原生聲音檔輸入，可用於語音辨識和理解。

對Android開發人員而言，在Android Studio中Gemma 4可提供AI編程輔助，而利用ML Kit Gen Prompt API可直接在Android裝置上執行Gemma 4。

值得一提的是，相較於之前版本，Gemma 4採用如同Mistral、Qwen的無限制Apache 2.0授權開源，使其成為完全開放的版本。

Google強調Gemma 4支援眾多開發工具，包括Hugging Face(Transformer、TRL、Transformers.js、Candle)、LiteRT-LM、vLLM、llama.cpp、MLX,Ollama、NVIDIA NIM and NeMo、LM Studio、Unsloth、SGLang、Cactus、Baseten、Docker、MaxText、Tunix、Keras。以晶片平臺而言，Gemma 4為NVIDIA Jetson Orin Nano到Blackwell GPUs最佳化，能透過開源軟體ROCm整合AMD GPU，也能在Google的Trillium和Ironwood TPU平臺部署。

現在Gemma 4四個版本可分別在Google AI Studio（31B及26B MoE）及Google AI Edge Gallery（E4B及E2B）下載試用。欲客製化模型者可在自有遊戲GPU平臺環境，或是Google Colab或Vertex AI測試。Google也鼓勵開發人員在Google Cloud環境部署，包括Vertex AI、Cloud Run、GKE、主權雲（Sovereign Cloud）等。

Google公布Gemma 4號稱最強本地端開放模型

Gemma 4

Comments (0)