復古模型talkie問世，僅蒐集1930年以前知識以測試推理能力

新聞

研究團隊表示，人們或許曾想像與過去的人對話，如果對方完全不了解現代世界，會如何回答問題？又會提出哪些疑問？雖然無法真正回到過去，但透過僅使用歷史資料訓練語言模型，可以在某種程度上模擬這種跨時代對話。talkie不僅可用來跟古人聊天，還能用來觀察AI在知識受限的情況下能夠如何推理及回應問題，進而理解其能力來源與行為模式。

在訓練資料方面，talkie完全採用1930年以前的英文文本，總計約2600億個Token，內容涵蓋書籍、報紙、期刊、科學論文、專利與判例等歷史資料，刻意排除現代網路內容，以確保模型的知識停留在1930年前。

在模型設計上，talkie為一個具備130億參數的語言模型，並提供原始版本與可對話版本。此外，研究團隊也建立一個以現代網路資料訓練的對照模型，藉此比較不同訓練資料對AI能力的影響。

實驗顯示，talkie在語言理解與基本數學能力上表現接近同架構的現代模型，但在知識性任務上明顯落後。不過，當問題排除時代錯置（Anachronism）後，兩者差距可縮小一半，顯示部分差異來自知識缺口而非能力不足。

而在實際互動示範中，talkie呈現出明顯的時代風格，例如以偏向維多利亞時代的語氣回答問題，並在缺乏相關知識時出現錯誤推論。

研究人員認為，這類「時間切片」模型可用於探索AI如何從有限資料中形成理解，甚至評估其「預測未來」或生成新知識的潛力。

目前talkie僅支援英文，但已被餵進各種奇怪的問題，例如有人問它誰統治印度，印度有朝一日會自由嗎？結果talkie回答「印度是由英國國王統治，而且印度不會獨立。」問說能不能打電話給它，它說「可以，打到North 3360。」問它火箭能不能回收，他說「不行」。

該團隊打算進一步將資料訓練規模擴大至兆級Token，並開發更高品質的歷史文字辨識技術，以提升talkie的表現。

復古模型talkie問世，僅蒐集1930年以前知識以測試推理能力

Comments (0)