OpenSSF前總經理Brian Behlendorf:AI對開源的依賴愈深,將放大軟體供應鏈問題
他表示,當企業爭相導入生成式AI、大型語言模型與AI代理(Agent)應用時,這些創新的底層支撐技術,愈來愈多建立在開源生態系上。但是,AI產業對開源的高度依賴,也使得原本就存在的軟體供應鏈風險被全面放大。
他形容,開源軟體就像數位世界裡的「暗物質」(Dark Matter),雖然平時不容易被看見,卻支撐著現代軟體產業運作。根據相關研究,平均約74%的企業軟體程式碼來自開源元件,而96%的程式碼庫都包含開源套件。從作業系統、資料庫到雲端平臺與AI框架,開源早已成為軟體開發的預設選項。
但是這也意味著,一旦核心元件出現漏洞,其影響範圍往往遠超出單一產品或企業的範籌,影響之大難以估量。
從Log4j到XZ事件,開源供應鏈問題浮上檯面
回顧過去的幾起重大資安事件,軟體供應鏈已成為企業不可忽視的風險來源。

以2021年爆發的Log4Shell漏洞事件為例,由Apache基金會維護的Log4j是一套被廣泛使用的日誌記錄元件,該漏洞曝光後迅速波及大量企業系統。更值得注意的是,許多企業在第一時間甚至無法確認自身是否受到影響,因為根本並不清楚系統內部實際使用了哪些開源元件,曝露企業軟體的組成資訊缺乏透明度的問題。
另一個案例是2024年的XZ後門事件。攻擊者長期以正常貢獻者身分參與專案開發,逐步取得社群信任後獲得維護權限,最終成功將惡意程式碼植入核心套件中。幸運的是,漏洞在正式大規模部署前即被發現,但這個事件曝露開源社群治理與信任機制可能面臨挑戰。
Brian指出,這些案例反映的並非是單純的技術問題,而是整個開源供應鏈管理問題。過去依賴社群信任與開發者自律的模式,一旦面對國家級攻擊者或是高度組織化的供應鏈攻擊時,已顯得不足。
AI時代讓供應鏈風險「搭上火箭」
進入AI時代後,上述的問題又被進一步放大。
首先,AI產業高度依賴少數關鍵開源專案。以PyTorch為例,已成為大型語言模型訓練與推論的重要基礎設施;GitHub、Hugging Face等平臺也逐漸成為AI生態系的重要節點。一旦這些核心元件遭到攻擊,影響範圍可能遍及整個產業。
其次是,AI開發流程也新增了大量供應鏈環節。除了傳統軟體開發流程外,還有模型訓練、微調(Fine-tuning)、後訓練(Post-training)、RAG(Retrieval-Augmented Generation)、Agent框架等等,每個環節都可能成為新的攻擊面。
Brian直言,AI開發工具與框架正在快速發展,但許多專案仍處於發展初期,尚未建立成熟的安全治理機制。許多新進開發者對供應鏈安全議題也缺乏足夠認識,這使得風險進一步增加。
更值得關注的是,AI本身也可能成為漏洞擴散的新管道。如今愈來愈多開發者利用生成式AI協助撰寫程式碼,而這些模型大多以既有開源程式碼進行訓練。如果訓練資料中包含歷史漏洞或不安全的開發模式,AI就有可能將這些問題重新複製到新的應用程式中。
「過去存在的問題並沒有消失,而是在AI環境中被放大了」,Brian說。
從被動防禦轉向建立可信任供應鏈
面對AI時代的開源風險,Brian認為企業不能只關注漏洞修補,而必須建立完整的供應鏈治理能力。
他特別提到近年受到產業廣泛採用的SBOM軟體物料清單概念。透過建立軟體組成清單,企業才能掌握系統中實際使用的開源元件,在漏洞事件發生時快速評估影響範圍。
此外,OpenSSF近年也推動包括Scorecard、Sigstore與SLSA等工具與框架,希望建立更透明、更可供驗證的開源供應鏈管理機制。例如透過數位簽章確認套件來源,或以標準化方式驗證軟體建置流程是否符合安全要求。
.jpeg)
另方面,AI也反過來協助提升開源安全,例如Anthropic的GlassWing計畫,利用大型語言模型分析開源專案中的潛在漏洞,短短數個月便產生超過2萬份漏洞報告,協助社群找出大量長期潛伏的安全問題。
不過,他認為真正的挑戰並不只是技術工具,而是資源投入。許多企業仰賴開源專案建立產品與服務,卻鮮少回饋資源給維護社群。未來若要建立可信任的AI基礎設施,企業除了導入開源,也應支持關鍵專案的安全改善工作,讓開源生態具備更長期、穩定的維運能力。
「自由軟體不等於免費安全」(Free software is not free security),Brian強調,開源已成為AI時代最重要的數位基礎設施,而建立安全可信的供應鏈,更是整個產業共同面對的課題。
Comments (0)