Skip to main content

Anthropic啟動Project Deal實驗,讓AI代替人類交易與議價

Posted in 業界新聞
新聞

Anthropic在舊金山辦公室打造了一個類似Craigslist的分類式交易市場,並邀請69名員工參與,先由Claude訪談每人欲出售與購買的物品、價格與談判風格,並建立專屬AI代理人,同時提供100美元預算進行交易。所有代理人在Slack上自主發文、報價與議價,過程完全無人類介入;並同步運行於4個市場,以比較不同模型對交易結果的影響。

這4個市場採平行運行設計,其中Run A與Run D皆全數採用Claude Opus 4.5,分別作為實際交易與重複實驗;Run B與Run C則為混合配置,參與者以約50%機率隨機分配使用Opus或較小模型Haiku 4.5。Anthropic並未設置全Haiku市場,實驗重點在於觀察強弱模型在同一市場中競爭時的差異。

需要注意的是,雖然同一商品會在4個市場中同時被AI代理進行交易,但只有Run A的結果會被採用為實際交易依據,參與者最終僅依此完成實體商品交換,其餘市場僅用於模擬與數據分析。

在實際市場(Run A)中,AI共促成186筆交易,涵蓋500多件商品,總成交金額超過4,000美元,顯示AI代理已具備完整交易能力。

進一步針對混合市場(Run B與Run C)進行分析後發現,模型能力對交易結果影響顯著。使用Claude Opus 4.5的代理平均多完成約2筆交易,且在相同商品條件下,賣價平均高出3.64美元;作為賣家可多賺約2.68美元,作為買家則可少花約2.45美元,在平均商品價格約20美元的情境下差距約達15%至20%,極端案例甚至達70%。

儘管交易價格存在明顯差異,但參與者幾乎無法察覺這種不平等,其對交易公平性的評價在不同模型間幾乎一致。

Anthropic指出,該實驗顯示AI代理人已具備在市場中代表人類進行交易的能力,且模型品質差距將帶來可量化的交易優勢;同時,處於劣勢的一方可能難以察覺自身交易結果較差。不過,隨著AI代理逐步進入真實市場,相關影響仍有待進一步觀察。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.