Meta發表由超級智慧實驗室開發的首款模型Muse Spark，將直接應用在產品上

新聞

2025年6月創辦的Meta超級智慧實驗室由Alexandr Wang領導，為Meta核心AI研發單位，它整合了FAIR（Fundamental AI Research）與生成式AI團隊，負責開發新一代通用人工智慧與個人超級智慧（Personal Superintelligence）。至於Meta AI則是個獨立的AI助理程式，提供網頁與行動版，2025年4月發表時採用的是Llama 4模型。

不同於Meta過去以開源基礎模型為主的Llama系列，Muse Spark轉向以產品應用為核心設計，直接整合進Meta AI與旗下社群與通訊服務，強調即時互動與任務處理能力，反映Meta由模型供應者轉向AI產品平臺的策略轉變。

在功能上，Muse Spark為一款原生多模態模型，可同時理解文字與影像，並支援工具調用與視覺思維鏈，使其不僅能生成回應，亦可處理多步驟任務。此外，在其Contemplating推理模式下，Muse Spark可啟動多個子代理人進行分工與平行處理，例如同時規畫行程、比較選項與蒐集資訊，提升整體效率與結果品質，展現其由單一模型邁向AI協作系統的設計方向。

Meta亦公布Muse Spark於多項基準測試的表現，涵蓋多模態理解、推理、醫療與代理人任務等面向。其中，在圖像與跨模態理解測試CharXiv與MMMU Pro中，Muse Spark表現優於或接近GPT與Gemini等模型；在視覺問答測試SimpleVQA中亦維持競爭力。在高難度推理方面，GPQA Diamond（博士級科學推理測試）與Humanity's Last Exam（跨領域複雜問題測試）顯示其已具備第一梯隊水準。

在醫療領域，Muse Spark於HealthBench（開放式醫療問答測試）與MedXpertQA（醫學選擇題測試）中亦展現穩定表現，顯示其在健康與醫療知識理解上的能力。此外，在程式能力測試LiveCodeBench與軟體修復測試SWE-Bench，以及代理人任務測試DeepSearchQA與Terminal-Bench中，Muse Spark亦具備一定競爭力，反映其在多步驟任務與工具操作上的表現。

在Contemplating推理模式中，Muse Spark於跨領域推理測試Humanity's Last Exam的無工具情境下達50.2%，高於Gemini 3.1 Deep Think與GPT 5.4 Pro，在可使用工具情境下則達58.4%，接近GPT 5.4 Pro水準。在科學研究測試FrontierScience Research中，Muse Spark達38.3%，亦優於Gemini的23.3%，並略高於GPT的36.7%，顯示其在複雜推理與科學問題處理上的競爭力。

Meta表示，Muse Spark除整合至Meta AI與旗下產品外，也將透過API開放部分合作夥伴測試與導入，逐步擴大應用範圍，並隨全球部署推進擴展至更多服務與市場，朝個人超級智慧的長期目標邁進。

Meta發表由超級智慧實驗室開發的首款模型Muse Spark，將直接應用在產品上

Meta推出獨立AI程式Meta AI

Comments (0)