Skip to main content

微軟發布7款AI模型,強化Microsoft Foundry模型陣容

Posted in 業界新聞
新聞

此次發表的模型包括旗艦推理模型MAI-Thinking-1、程式開發模型MAI-Code-1-Flash、影像生成模型MAI-Image-2.5與MAI-Image-2.5-Flash、語音生成模型MAI-Voice-2與MAI-Voice-2-Flash,以及語音轉文字模型MAI-Transcribe-1.5。

在7款模型中,MAI-Thinking-1最受關注,因為它是Microsoft AI目前最能代表自研基礎模型能力的旗艦推理模型。相較於程式、影像、語音與轉錄模型多半對應特定任務,推理模型則更接近OpenAI、Anthropic與Google等業者競逐的核心能力,可用於複雜問題拆解、數學推理、軟體工程與企業流程自動化,也因此被視為微軟降低對外部模型依賴、建立自家AI技術底座的重要一步。

MAI-Thinking-1採用稀疏專家混合(Mixture of Experts,MoE)架構,活躍參數約350億個,總參數約1兆個。該模型在SWE-Bench Pro軟體工程測試中可與Claude Opus 4.6匹敵,在AIME 2025與AIME 2026數學測試中分別取得97.0%與94.5%的成績。微軟也強調,MAI-Thinking-1完全從零開始訓練,使用企業級、乾淨且具商業授權的資料,未採用第三方模型蒸餾技術,並支援256K Token長脈絡、函式呼叫與開發者指令。

相較之下,其餘模型則屬於特定領域模型。MAI-Code-1-Flash主要面向GitHub Copilot與Visual Studio Code等開發工具,以50億參數實現較低成本與更高推論效率;MAI-Image-2.5與MAI-Image-2.5-Flash則支援文字生成圖片與圖片編輯功能;MAI-Voice-2提供15種語言的自然語音生成能力,甚至可透過短語音樣本模仿特定聲音;MAI-Transcribe-1.5則主打高準確率語音辨識,支援43種語言與專業術語轉錄。

其實微軟自2024年起便傳出開發代號MAI-1的大型語言模型,由Microsoft AI執行長Mustafa Suleyman領軍推動。隨著此次MAI模型家族正式亮相,微軟已逐步補齊推理、程式開發、影像、語音與語音辨識等AI基礎能力,形成完整的模型產品線。

除了模型本身,微軟也同步推出所謂的Frontier Tuning技術,允許企業利用自身工作流程資料訓練客製化模型。微軟表示,在內部測試中,針對Excel工作負載調校後的MAI模型,在能力接近GPT-5.4的情況下,推論效率最高可提升10倍。未來企業可利用自身資料與工作流程打造專屬模型,同時掌控相關知識與權限。

美國媒體多將這次發表解讀為微軟降低對OpenAI依賴、強化自研AI能力的重要訊號;金融時報(Financial Times,FT)則認為,微軟這波模型發布也有追趕Anthropic的意味,特別是在企業與開發者市場。

Preview image for Introducing MAI-Thinking-1 | Microsoft AI

Introducing MAI-Thinking-1 | Microsoft AI

microsoft.ai
View original 0 Likes 0 Boosts

Comments (0)

No comments yet.