Claude Code降智非錯覺,Anthropic承認產品層變更造成品質下滑
由於部分使用者在過去一個月反映Claude回應品質變差,特別是在Claude Code使用情境中,出現判斷能力下降、重複、健忘或工具選擇異常等問題。Anthropic表示,調查後確認API與底層推論服務未受影響,也否認刻意降低模型品質。
第一項原因是Claude Code預設推理強度調整。Anthropic在3月4日將Claude Code的預設推理強度從high調降為medium,官方解釋,原意是降低部分使用者在high模式下遇到的長延遲,避免介面看似凍結,同時減少Token消耗。不過,使用者隨後反映Claude Code變得不夠聰明,官方在4月7日回復較高推理強度,目前Opus 4.7預設為xhigh,其他模型預設為high。
第二項問題來自快取最佳化。Anthropic在3月26日上線一項調整,原本只打算在工作階段閒置超過一小時後,清除先前累積的推理脈絡,以降低使用者恢復該工作階段時的成本與延遲。但實作錯誤導致系統在後續每一輪對話中持續清除舊推理歷史,使Claude在執行任務時逐漸失去先前判斷脈絡,才出現重複與異常工具使用。此問題已在4月10日修復。
第三項原因是系統提示詞變更。第三項原因是系統提示詞調整。Anthropic為減少Opus 4.7回覆過於冗長的情況,4月16日在Claude Code加入新提示詞,限制工具呼叫間的文字長度與最終回覆篇幅。但該變更卻影響了Sonnet 4.6、Opus 4.6與Opus 4.7,Anthropic後續的評估測試,發現該提示詞使Opus 4.6與Opus 4.7表現下滑約3%,因此已在4月20日撤回。
Anthropic表示,後續將讓更多內部員工使用與外部相同的Claude Code公開版本,並加強內部Code Review工具。對於Claude Code系統提示詞變更,官方也承諾將會對不同模型進行更完整的評估,並透過提示詞拆解測試、長時間觀察與漸進式發布,及早發現可能影響程式品質的變化。
Comments (0)