Skip to main content

復古模型talkie問世,僅蒐集1930年以前知識以測試推理能力

Posted in 業界新聞
新聞

研究團隊表示,人們或許曾想像與過去的人對話,如果對方完全不了解現代世界,會如何回答問題?又會提出哪些疑問?雖然無法真正回到過去,但透過僅使用歷史資料訓練語言模型,可以在某種程度上模擬這種跨時代對話。talkie不僅可用來跟古人聊天,還能用來觀察AI在知識受限的情況下能夠如何推理及回應問題,進而理解其能力來源與行為模式。

在訓練資料方面,talkie完全採用1930年以前的英文文本,總計約2600億個Token,內容涵蓋書籍、報紙、期刊、科學論文、專利與判例等歷史資料,刻意排除現代網路內容,以確保模型的知識停留在1930年前。

在模型設計上,talkie為一個具備130億參數的語言模型,並提供原始版本與可對話版本。此外,研究團隊也建立一個以現代網路資料訓練的對照模型,藉此比較不同訓練資料對AI能力的影響。

實驗顯示,talkie在語言理解與基本數學能力上表現接近同架構的現代模型,但在知識性任務上明顯落後。不過,當問題排除時代錯置(Anachronism)後,兩者差距可縮小一半,顯示部分差異來自知識缺口而非能力不足。

而在實際互動示範中,talkie呈現出明顯的時代風格,例如以偏向維多利亞時代的語氣回答問題,並在缺乏相關知識時出現錯誤推論。

研究人員認為,這類「時間切片」模型可用於探索AI如何從有限資料中形成理解,甚至評估其「預測未來」或生成新知識的潛力。

目前talkie僅支援英文,但已被餵進各種奇怪的問題,例如有人問它誰統治印度,印度有朝一日會自由嗎?結果talkie回答「印度是由英國國王統治,而且印度不會獨立。」問說能不能打電話給它,它說「可以,打到North 3360。」問它火箭能不能回收,他說「不行」。

該團隊打算進一步將資料訓練規模擴大至兆級Token,並開發更高品質的歷史文字辨識技術,以提升talkie的表現。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.