Google公布Gemma 4號稱最強本地端開放模型
Gemma 4主打以Gemini 3為基礎開發,具備強大能力,整個家族都不再只限於簡單對話,而能處理複雜邏輯和代理人工作流程。Gemma 4推出4個版本:Effective 2B (E2B)、Effective 4B (E4B)、26B Mixture of Experts (MoE)及31B Dense。根據Google說明,最大的二個版本都展現同級中最強效能,其中31B及26B版分別名列是Arena AI文字標竿測試中排行榜開放模型的第3及第6,也超過參數量更大的模型,如Mistral-Large3或DeepSeek-v3.2。
由於Gemma 4可在工作站執行,Google特別強調Gemma 4在開發上的效益。其一,Gemma 4具備更強推理能力,得以執行多步驟規劃及深度邏輯,在數學及指令遵從測試表現較前代大幅提升。Gemma 4原生支援功能呼叫、結構化JSON輸出及原生系統指令,使開發人員可以開發能透過API使用不同工具和執行流程的自主代理人。它也支援高品質離線撰寫程式,可在工作站執行開發工作,而且原生支援140多種語言,可用於開發出多個市場的應用程式。
Gemma 4家族具備更長脈絡(context)空間,基本款有128K,最大的二款有256K,允許用戶傳送儲存庫或長文件。所有4個模型都原生支援影片和圖像辨識,利於OCR及圖表理解。E2B和E4B版本還支援原生聲音檔輸入,可用於語音辨識和理解。
對Android開發人員而言,在Android Studio中Gemma 4可提供AI編程輔助,而利用ML Kit Gen Prompt API可直接在Android裝置上執行Gemma 4。
值得一提的是,相較於之前版本,Gemma 4採用如同Mistral、Qwen的無限制Apache 2.0授權開源,使其成為完全開放的版本。
Google強調Gemma 4支援眾多開發工具,包括Hugging Face(Transformer、TRL、Transformers.js、Candle)、LiteRT-LM、vLLM、llama.cpp、MLX,Ollama、NVIDIA NIM and NeMo、LM Studio、Unsloth、SGLang、Cactus、Baseten、Docker、MaxText、Tunix、Keras。以晶片平臺而言,Gemma 4為NVIDIA Jetson Orin Nano到Blackwell GPUs最佳化,能透過開源軟體ROCm整合AMD GPU,也能在Google的Trillium和Ironwood TPU平臺部署。
現在Gemma 4四個版本可分別在Google AI Studio(31B及26B MoE)及Google AI Edge Gallery(E4B及E2B)下載試用。欲客製化模型者可在自有遊戲GPU平臺環境,或是Google Colab或Vertex AI測試。Google也鼓勵開發人員在Google Cloud環境部署,包括Vertex AI、Cloud Run、GKE、主權雲(Sovereign Cloud)等。
Gemma 4
Our most intelligent open models, built from Gemini 3 research.
deepmind.google
Comments (0)