Skip to main content

新加坡政府公布AI代理沙盒測試結果,評估公共服務應用效益與治理風險

Posted in 業界新聞
新聞

這項AI代理沙盒計畫自2025年8月啟動,測試期約4個月。Google在沙盒環境中開放GovTech Singapore測試團隊試用可操作電腦與瀏覽器的AI代理,觀察這類代理能否在公共服務情境中依照指示瀏覽網站、操作介面並完成多步驟任務。

在這次沙盒測試中,新加坡政府與Google根據風險與效益程度,將AI代理應用分成4類:低風險高效益(Advance)、低風險低效益(Adopt)、高風險高效益(Adapt),以及高風險低效益(Avoid)。依此框架,沙盒最後選定3個公共部門場景:政府數位服務品質檢測,屬於可優先推進的Advance類型;聊天機器人上線前AI安全測試,屬於可中期導入的Adopt類型;協助民眾或社工申辦社福服務流程,屬於需要搭配防護措施再測試的Adapt類型,藉此觀察AI代理在不同應用情境中的表現。

在政府數位服務品質檢測方面,結果顯示,AI代理能夠協助檢查政府網站回應時間、搜尋功能與頁面完整性,也能辨識測試環境中刻意放入的失效頁面、填充文字(filler text),以及測試環境網址與正式網站網域不一致等問題。

在聊天機器人安全測試場景中,AI代理可依照指示,在不同聊天機器人介面傳送測試用提示詞,減少人工重複執行測試的負擔。不過,白皮書也指出,當聊天機器人回應內容較長時,AI代理在記錄結果時仍可能出現不準確或幻覺問題。

至於社福服務申辦場景,白皮書將其歸類為高風險、高效益的Adapt類型。測試顯示,AI代理能協助使用者完成申請流程,包括找出缺漏或不一致資訊,並將社工訪談紀錄等非結構化內容整理成表單欄位所需資料。白皮書指出,這類能力未來可延伸至其他複雜表單處理、多來源資訊彙整或行政申請流程,但由於涉及個資與敏感資料,部署時仍須納入人工審查與權限控管機制。

白皮書也提醒,AI代理能夠讀取網頁與外部內容,因此必須留意間接提示注入等AI模型安全風險。這類攻擊手法可能透過變造的網頁內容或惡意指令,誘使代理前往未核准網站、揭露敏感資料或執行非預期動作。

因此,新加坡政府與Google建議,組織導入AI代理應用時,應採取分層防禦與風險分級監督。高風險任務應設置事前審查機制;低風險且可回復的任務,則可透過日誌與事後稽核控管,避免每個步驟都要求人工確認,反而削弱AI代理原本可帶來的自動化效益。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.