Skip to main content

Anthropic調整Mythos級模型資料留存政策,提示詞與輸出將保留30天

Posted in 業界新聞
新聞

該資料留存政策適用於Claude Mythos 5、Claude Fable 5,以及之後由Anthropic指定,具備類似能力的模型。Anthropic表示,Claude Mythos 5模型能力大幅提高,部分能力可能同時被用於正當用途與惡意用途。Claude Fable 5則與Claude Mythos 5使用相同底層模型,但在網路安全與生物領域加入額外防護,以便讓模型供更廣泛場景使用。

Anthropic解釋,部分濫用行為無法只從單一次請求判斷,必須跨多次提示詞與輸出觀察模式,例如Best-of-N越獄攻擊會送出大量微調後的提示詞,尋找可能繞過限制的版本。而規模更大的濫用,包括由國家支持的間諜活動或資料勒索活動,也可能需要安全防護分類器從多次請求中比對行為脈絡。因此,Anthropic暫時留存相關資料,以便把多次互動放在一起分析。

該變更不影響Claude Free、Pro與Max等一般消費者方案,Anthropic表示,這些服務原本就會為安全目的保留輸入與輸出。受影響的是已在Claude Console設定ZDR工作區,還有在Claude Enterprise以ZDR使用Claude Code,以及透過AWS Bedrock、Google Cloud Agent Platform與Microsoft Foundry等雲端平臺以ZDR存取Claude的組織。

Anthropic強調,員工不能任意存取使用者對話,除非內容被標記為可能造成嚴重危害,或客戶提出書面要求。相關審查只能由少數核准人員透過受控工具執行,工具會限制匯出、複製或下載,所有存取也會記錄在審查人員無法修改的稽核紀錄中。資料原則上會在30天後自動刪除,但若涉及安全調查或法律要求,可能例外保存。

外媒The Verge報導指出,微軟因Anthropic新的資料留存政策,已限制員工在內部GitHub Copilot模型選單使用Claude Fable 5。報導稱,微軟仍向GitHub Copilot與Foundry客戶提供Claude Fable 5,但公司法務團隊顧慮客戶資料與機密資訊,正在評估相關資料政策。

https://www.theverge.com/report/947575/microsoft-claude-fable-5-restricted-internally www.theverge.com
View original 0 Likes 0 Boosts

Comments (0)

No comments yet.