Skip to main content

Meta發表由超級智慧實驗室開發的首款模型Muse Spark,將直接應用在產品上

Posted in 業界新聞
新聞

2025年6月創辦的Meta超級智慧實驗室由Alexandr Wang領導,為Meta核心AI研發單位,它整合了FAIR(Fundamental AI Research)與生成式AI團隊,負責開發新一代通用人工智慧與個人超級智慧(Personal Superintelligence)。至於Meta AI則是個獨立的AI助理程式,提供網頁與行動版,2025年4月發表時採用的是Llama 4模型。

不同於Meta過去以開源基礎模型為主的Llama系列,Muse Spark轉向以產品應用為核心設計,直接整合進Meta AI與旗下社群與通訊服務,強調即時互動與任務處理能力,反映Meta由模型供應者轉向AI產品平臺的策略轉變。

在功能上,Muse Spark為一款原生多模態模型,可同時理解文字與影像,並支援工具調用與視覺思維鏈,使其不僅能生成回應,亦可處理多步驟任務。此外,在其Contemplating推理模式下,Muse Spark可啟動多個子代理人進行分工與平行處理,例如同時規畫行程、比較選項與蒐集資訊,提升整體效率與結果品質,展現其由單一模型邁向AI協作系統的設計方向。

Meta亦公布Muse Spark於多項基準測試的表現,涵蓋多模態理解、推理、醫療與代理人任務等面向。其中,在圖像與跨模態理解測試CharXiv與MMMU Pro中,Muse Spark表現優於或接近GPT與Gemini等模型;在視覺問答測試SimpleVQA中亦維持競爭力。在高難度推理方面,GPQA Diamond(博士級科學推理測試)與Humanity's Last Exam(跨領域複雜問題測試)顯示其已具備第一梯隊水準。

在醫療領域,Muse Spark於HealthBench(開放式醫療問答測試)與MedXpertQA(醫學選擇題測試)中亦展現穩定表現,顯示其在健康與醫療知識理解上的能力。此外,在程式能力測試LiveCodeBench與軟體修復測試SWE-Bench,以及代理人任務測試DeepSearchQA與Terminal-Bench中,Muse Spark亦具備一定競爭力,反映其在多步驟任務與工具操作上的表現。

在Contemplating推理模式中,Muse Spark於跨領域推理測試Humanity's Last Exam的無工具情境下達50.2%,高於Gemini 3.1 Deep Think與GPT 5.4 Pro,在可使用工具情境下則達58.4%,接近GPT 5.4 Pro水準。在科學研究測試FrontierScience Research中,Muse Spark達38.3%,亦優於Gemini的23.3%,並略高於GPT的36.7%,顯示其在複雜推理與科學問題處理上的競爭力。

Meta表示,Muse Spark除整合至Meta AI與旗下產品外,也將透過API開放部分合作夥伴測試與導入,逐步擴大應用範圍,並隨全球部署推進擴展至更多服務與市場,朝個人超級智慧的長期目標邁進。

Preview image for Meta推出獨立AI程式Meta AI

Meta推出獨立AI程式Meta AI

基於Llama 4模型的Meta AI程式,具備個人化回應能力以及全雙工(full-duplex)語音技術來提升使用者體驗,使用者可以在AI回答的途中插話,AI則可據此調整回應

www.ithome.com.tw
View original 0 Likes 0 Boosts

Comments (0)

No comments yet.