Cloudflare測試Claude Mythos,能串聯多個低風險漏洞形成攻擊鏈
Claude Mythos是Anthropic針對資安研究打造的實驗性AI模型,主打漏洞分析、攻擊鏈推理與PoC生成等能力。Anthropic今年4月啟動名為Project Glasswing的研究計畫,邀請Cloudflare等資安與基礎設施業者,在受控環境中測試Mythos Preview對真實程式碼庫的漏洞研究能力,以評估先進AI模型在攻防兩端可能帶來的影響。
而Cloudflare則將Mythos Preview導入超過50個內部程式碼儲存庫,涵蓋執行環境、邊緣資料路徑、通訊協定堆疊、控制平面及其依賴的開源專案等,藉此測試模型於真實大型程式碼庫中的漏洞研究能力。Cloudflare並未直接以單一通用Coding Agent掃描整個程式碼庫,而是建立一套名為Harness的協調框架,將漏洞搜尋、驗證、去重與可利用性追蹤等工作拆分給多個AI代理人平行執行。
Cloudflare表示,Mythos Preview最明顯的進步,在於能將多個低風險漏洞組合成完整攻擊鏈,而非只停留在漏洞描述階段。例如,模型可把多個攻擊原語(Attack Primitive)串聯成可實際利用的漏洞利用流程,甚至自行撰寫、編譯與執行概念驗證(PoC)程式碼。
過去其他前沿模型雖也能找到部分漏洞,但往往停留在「描述問題」階段,無法真正完成漏洞利用鏈;而Mythos Preview則能在驗證失敗後,自行根據錯誤結果調整假設並重新嘗試。這種能力已更接近資深漏洞研究員,而非傳統自動化掃描工具。
不過,Cloudflare發現,Mythos Preview的安全邊界仍有待釐清。這次測試的研究版模型雖未加入公開模型常見的額外安全限制,但在合法漏洞研究中,模型有時仍會拒絕產生示範攻擊程式;而同樣的請求換個說法,又可能得到不同結果。這代表模型的拒絕機制並不穩定,不能單獨作為安全防線。
Cloudflare認為,面對AI加速漏洞研究與攻擊能力成長,企業不能只靠「更快修補漏洞」來因應,因為若壓縮修補時程而跳過完整回歸測試,反而可能引入更多新問題。未來更重要的是調整整體系統架構,例如在應用程式前方加入防護機制、降低單一漏洞的橫向擴散能力,以及建立可同步部署修補的基礎設施,以減少漏洞從揭露到修補期間的風險。
Anthropic發布Claude Mythos Preview,AI資安能力直逼頂尖人類駭客並啟動全球資安防禦計畫
Claude Mythos Preview已發現數千個高嚴重性漏洞,並可生成漏洞利用程式,在部分任務上超越多數人類專家
www.ithome.com.tw
Comments (0)