Anthropic啟動Project Deal實驗，讓AI代替人類交易與議價

新聞

Anthropic在舊金山辦公室打造了一個類似Craigslist的分類式交易市場，並邀請69名員工參與，先由Claude訪談每人欲出售與購買的物品、價格與談判風格，並建立專屬AI代理人，同時提供100美元預算進行交易。所有代理人在Slack上自主發文、報價與議價，過程完全無人類介入；並同步運行於4個市場，以比較不同模型對交易結果的影響。

這4個市場採平行運行設計，其中Run A與Run D皆全數採用Claude Opus 4.5，分別作為實際交易與重複實驗；Run B與Run C則為混合配置，參與者以約50%機率隨機分配使用Opus或較小模型Haiku 4.5。Anthropic並未設置全Haiku市場，實驗重點在於觀察強弱模型在同一市場中競爭時的差異。

需要注意的是，雖然同一商品會在4個市場中同時被AI代理進行交易，但只有Run A的結果會被採用為實際交易依據，參與者最終僅依此完成實體商品交換，其餘市場僅用於模擬與數據分析。

在實際市場（Run A）中，AI共促成186筆交易，涵蓋500多件商品，總成交金額超過4,000美元，顯示AI代理已具備完整交易能力。

進一步針對混合市場（Run B與Run C）進行分析後發現，模型能力對交易結果影響顯著。使用Claude Opus 4.5的代理平均多完成約2筆交易，且在相同商品條件下，賣價平均高出3.64美元；作為賣家可多賺約2.68美元，作為買家則可少花約2.45美元，在平均商品價格約20美元的情境下差距約達15%至20%，極端案例甚至達70%。

儘管交易價格存在明顯差異，但參與者幾乎無法察覺這種不平等，其對交易公平性的評價在不同模型間幾乎一致。

Anthropic指出，該實驗顯示AI代理人已具備在市場中代表人類進行交易的能力，且模型品質差距將帶來可量化的交易優勢；同時，處於劣勢的一方可能難以察覺自身交易結果較差。不過，隨著AI代理逐步進入真實市場，相關影響仍有待進一步觀察。

Anthropic啟動Project Deal實驗，讓AI代替人類交易與議價

Comments (0)