Anthropic調整Mythos級模型資料留存政策,提示詞與輸出將保留30天
該資料留存政策適用於Claude Mythos 5、Claude Fable 5,以及之後由Anthropic指定,具備類似能力的模型。Anthropic表示,Claude Mythos 5模型能力大幅提高,部分能力可能同時被用於正當用途與惡意用途。Claude Fable 5則與Claude Mythos 5使用相同底層模型,但在網路安全與生物領域加入額外防護,以便讓模型供更廣泛場景使用。
Anthropic解釋,部分濫用行為無法只從單一次請求判斷,必須跨多次提示詞與輸出觀察模式,例如Best-of-N越獄攻擊會送出大量微調後的提示詞,尋找可能繞過限制的版本。而規模更大的濫用,包括由國家支持的間諜活動或資料勒索活動,也可能需要安全防護分類器從多次請求中比對行為脈絡。因此,Anthropic暫時留存相關資料,以便把多次互動放在一起分析。
該變更不影響Claude Free、Pro與Max等一般消費者方案,Anthropic表示,這些服務原本就會為安全目的保留輸入與輸出。受影響的是已在Claude Console設定ZDR工作區,還有在Claude Enterprise以ZDR使用Claude Code,以及透過AWS Bedrock、Google Cloud Agent Platform與Microsoft Foundry等雲端平臺以ZDR存取Claude的組織。
Anthropic強調,員工不能任意存取使用者對話,除非內容被標記為可能造成嚴重危害,或客戶提出書面要求。相關審查只能由少數核准人員透過受控工具執行,工具會限制匯出、複製或下載,所有存取也會記錄在審查人員無法修改的稽核紀錄中。資料原則上會在30天後自動刪除,但若涉及安全調查或法律要求,可能例外保存。
外媒The Verge報導指出,微軟因Anthropic新的資料留存政策,已限制員工在內部GitHub Copilot模型選單使用Claude Fable 5。報導稱,微軟仍向GitHub Copilot與Foundry客戶提供Claude Fable 5,但公司法務團隊顧慮客戶資料與機密資訊,正在評估相關資料政策。
Comments (0)