Anthropic調整Mythos級模型資料留存政策，提示詞與輸出將保留30天

新聞

該資料留存政策適用於Claude Mythos 5、Claude Fable 5，以及之後由Anthropic指定，具備類似能力的模型。Anthropic表示，Claude Mythos 5模型能力大幅提高，部分能力可能同時被用於正當用途與惡意用途。Claude Fable 5則與Claude Mythos 5使用相同底層模型，但在網路安全與生物領域加入額外防護，以便讓模型供更廣泛場景使用。

Anthropic解釋，部分濫用行為無法只從單一次請求判斷，必須跨多次提示詞與輸出觀察模式，例如Best-of-N越獄攻擊會送出大量微調後的提示詞，尋找可能繞過限制的版本。而規模更大的濫用，包括由國家支持的間諜活動或資料勒索活動，也可能需要安全防護分類器從多次請求中比對行為脈絡。因此，Anthropic暫時留存相關資料，以便把多次互動放在一起分析。

該變更不影響Claude Free、Pro與Max等一般消費者方案，Anthropic表示，這些服務原本就會為安全目的保留輸入與輸出。受影響的是已在Claude Console設定ZDR工作區，還有在Claude Enterprise以ZDR使用Claude Code，以及透過AWS Bedrock、Google Cloud Agent Platform與Microsoft Foundry等雲端平臺以ZDR存取Claude的組織。

Anthropic強調，員工不能任意存取使用者對話，除非內容被標記為可能造成嚴重危害，或客戶提出書面要求。相關審查只能由少數核准人員透過受控工具執行，工具會限制匯出、複製或下載，所有存取也會記錄在審查人員無法修改的稽核紀錄中。資料原則上會在30天後自動刪除，但若涉及安全調查或法律要求，可能例外保存。

外媒The Verge報導指出，微軟因Anthropic新的資料留存政策，已限制員工在內部GitHub Copilot模型選單使用Claude Fable 5。報導稱，微軟仍向GitHub Copilot與Foundry客戶提供Claude Fable 5，但公司法務團隊顧慮客戶資料與機密資訊，正在評估相關資料政策。

Anthropic調整Mythos級模型資料留存政策，提示詞與輸出將保留30天

Comments (0)