新加坡政府公布AI代理沙盒測試結果，評估公共服務應用效益與治理風險

這項AI代理沙盒計畫自2025年8月啟動，測試期約4個月。Google在沙盒環境中開放GovTech Singapore測試團隊試用可操作電腦與瀏覽器的AI代理，觀察這類代理能否在公共服務情境中依照指示瀏覽網站、操作介面並完成多步驟任務。

在這次沙盒測試中，新加坡政府與Google根據風險與效益程度，將AI代理應用分成4類：低風險高效益（Advance）、低風險低效益（Adopt）、高風險高效益（Adapt），以及高風險低效益（Avoid）。依此框架，沙盒最後選定3個公共部門場景：政府數位服務品質檢測，屬於可優先推進的Advance類型；聊天機器人上線前AI安全測試，屬於可中期導入的Adopt類型；協助民眾或社工申辦社福服務流程，屬於需要搭配防護措施再測試的Adapt類型，藉此觀察AI代理在不同應用情境中的表現。

在政府數位服務品質檢測方面，結果顯示，AI代理能夠協助檢查政府網站回應時間、搜尋功能與頁面完整性，也能辨識測試環境中刻意放入的失效頁面、填充文字（filler text），以及測試環境網址與正式網站網域不一致等問題。

在聊天機器人安全測試場景中，AI代理可依照指示，在不同聊天機器人介面傳送測試用提示詞，減少人工重複執行測試的負擔。不過，白皮書也指出，當聊天機器人回應內容較長時，AI代理在記錄結果時仍可能出現不準確或幻覺問題。

至於社福服務申辦場景，白皮書將其歸類為高風險、高效益的Adapt類型。測試顯示，AI代理能協助使用者完成申請流程，包括找出缺漏或不一致資訊，並將社工訪談紀錄等非結構化內容整理成表單欄位所需資料。白皮書指出，這類能力未來可延伸至其他複雜表單處理、多來源資訊彙整或行政申請流程，但由於涉及個資與敏感資料，部署時仍須納入人工審查與權限控管機制。

白皮書也提醒，AI代理能夠讀取網頁與外部內容，因此必須留意間接提示注入等AI模型安全風險。這類攻擊手法可能透過變造的網頁內容或惡意指令，誘使代理前往未核准網站、揭露敏感資料或執行非預期動作。

因此，新加坡政府與Google建議，組織導入AI代理應用時，應採取分層防禦與風險分級監督。高風險任務應設置事前審查機制；低風險且可回復的任務，則可透過日誌與事後稽核控管，避免每個步驟都要求人工確認，反而削弱AI代理原本可帶來的自動化效益。

新加坡政府公布AI代理沙盒測試結果，評估公共服務應用效益與治理風險

Comments (0)