蘋果借力Google開發第三代基礎AI模型
蘋果基礎模型(Apple Foundation Models,AFM)家族涵括從機上(on-device)模型到基於Private Cloud Compute的伺服器端5款模型。這些模型將驅動蘋果裝置上的新Siri及其他AI工具。5款模型中2款為機上模型AFM 3 Core及AFM 3 Core Advanced,皆為蘋果自行打造。AFM 3 Core為30億參數的精簡模型,AFM 3 Core Advanced為200億參數的原生多模態模型。它使用稀疏架構,可依據用戶請求一次僅啟動10到40億個參數,降低資源耗用。此外,透過指令遵循剪枝(Instruction-Following Pruning,IFP)技術將整個模型儲存在快閃記憶體(NAND)而非完全擠在動態記憶體(DRAM)中,在需要時才快速讀取,提高推論時間彈性與降低記憶體佔用。
機上模型針對蘋果Apple Silicon晶片進行優化,提高處理高表現性的聲音和高準確率聽寫的效能。
三款伺服器端模型則整合Private Cloud Compute。其AFM 3 Cloud結合平行追蹤專家混合(Parallel-Track Mixture-of-Expert,PT-MoE)來推升其多模態推理能力的速度和效能。ADM 3 Cloud (Image)則是用於圖像生成和編輯,可支援相片編輯工具如Photos中的Spatial Reframing(空間重構)、Playground個人化圖片、Genmoji等應用。
AFM 3 Cloud Pro是最強大的基礎模型,將支援最繁重的任務,包括代理式工具使用與複雜推理。AFM 3 Cloud Pro是Google及Nvidia合作,在Google的TPU基礎設施進行預訓練,並將Private Cloud Compute延伸到Google Cloud中的Nvidia GPU,以發揮保障用戶隱私的效果。
蘋果並在內部測試人員對最新版和前代機上模型、及伺服器端模型的偏好程度。其中,在機上模型方面,AFM 3在提示詞、視覺輸入及圖像理解面向上皆獲得人類評估員的偏好。在伺服器模型方面,AFM 3的一般文本能力、提示詞遵循、回應速度與圖像理解能力也更受肯定。
Comments (0)