蘋果借力Google開發第三代基礎AI模型

新聞

蘋果基礎模型（Apple Foundation Models，AFM）家族涵括從機上(on-device)模型到基於Private Cloud Compute的伺服器端5款模型。這些模型將驅動蘋果裝置上的新Siri及其他AI工具。5款模型中2款為機上模型AFM 3 Core及AFM 3 Core Advanced，皆為蘋果自行打造。AFM 3 Core為30億參數的精簡模型，AFM 3 Core Advanced為200億參數的原生多模態模型。它使用稀疏架構，可依據用戶請求一次僅啟動10到40億個參數，降低資源耗用。此外，透過指令遵循剪枝（Instruction-Following Pruning，IFP）技術將整個模型儲存在快閃記憶體（NAND）而非完全擠在動態記憶體（DRAM）中，在需要時才快速讀取，提高推論時間彈性與降低記憶體佔用。

機上模型針對蘋果Apple Silicon晶片進行優化，提高處理高表現性的聲音和高準確率聽寫的效能。

三款伺服器端模型則整合Private Cloud Compute。其AFM 3 Cloud結合平行追蹤專家混合(Parallel-Track Mixture-of-Expert，PT-MoE)來推升其多模態推理能力的速度和效能。ADM 3 Cloud (Image)則是用於圖像生成和編輯，可支援相片編輯工具如Photos中的Spatial Reframing（空間重構）、Playground個人化圖片、Genmoji等應用。

AFM 3 Cloud Pro是最強大的基礎模型，將支援最繁重的任務，包括代理式工具使用與複雜推理。AFM 3 Cloud Pro是Google及Nvidia合作，在Google的TPU基礎設施進行預訓練，並將Private Cloud Compute延伸到Google Cloud中的Nvidia GPU，以發揮保障用戶隱私的效果。

蘋果並在內部測試人員對最新版和前代機上模型、及伺服器端模型的偏好程度。其中，在機上模型方面，AFM 3在提示詞、視覺輸入及圖像理解面向上皆獲得人類評估員的偏好。在伺服器模型方面，AFM 3的一般文本能力、提示詞遵循、回應速度與圖像理解能力也更受肯定。

蘋果借力Google開發第三代基礎AI模型

Comments (0)