OpenAI公布防範濫用的AI抓蟲獎勵方案

新聞

新的抓蟲獎勵方案將補足OpenAI現有的安全性臭蟲獎勵方案，它主要接受造成AI濫用的臭蟲通報，即使不符合傳統安全漏洞的定義。研究人員、白帽駭客和安全專家可透過專屬網站參與申請。通報的臭蟲將由OpenAI兩個安全漏洞獎勵方案小組視影響範疇和負責人分類及判定歸屬。

本抓蟲獎勵方案涵括三大類別臭蟲或問題。第一是代理人風險，下分三類：首先是第三方提示注入及資料外洩類型，可讓攻擊者劫持代理人，如AI瀏覽器、ChatGPT代理人或類似代理產品，使其執行有害行為、洩露敏感資訊，漏洞下惡意行為可複製率需達50%以上。其次是造成OpenAI產品大規模在OpenAI網站上執行不被允許行為。第三是導致OpenAI代理式產品執行兩者以外有害行為的臭蟲。而任何MCP風險的測試需符合第三方產品廠商的服務條款。

第二類臭蟲和OpenAI獨有資訊有關，包括導致模型回應OpenAI獨有和推理有關資訊的臭蟲，以及可暴露OpenAI其他獨有資訊的漏洞。第三類臭蟲和帳號和平臺完整性有關，包含帳號和平臺訊號漏洞，如繞過反自動（anti-automation）控制、操弄帳號信任訊號、迴避帳號限制／封鎖／禁令等問題。

此外，OpenAI也不定期針對特定問題舉行不公開抓蟲獎勵方案，像是ChatGPT Agent和GPT-5的生物風險內容問題。至於上述類型之外的臭蟲，OpenAI也會視個案考慮提供獎勵。一般性內容政策違規，例如讓模型回應粗俗語言的問題，就不在獎勵範圍內。

OpenAI公布防範濫用的AI抓蟲獎勵方案

Safety Bug Bounty | Bugcrowd

Comments (0)