OpenAI公布防範濫用的AI抓蟲獎勵方案
新的抓蟲獎勵方案將補足OpenAI現有的安全性臭蟲獎勵方案,它主要接受造成AI濫用的臭蟲通報,即使不符合傳統安全漏洞的定義。研究人員、白帽駭客和安全專家可透過專屬網站參與申請。通報的臭蟲將由OpenAI兩個安全漏洞獎勵方案小組視影響範疇和負責人分類及判定歸屬。
本抓蟲獎勵方案涵括三大類別臭蟲或問題。第一是代理人風險,下分三類:首先是第三方提示注入及資料外洩類型,可讓攻擊者劫持代理人,如AI瀏覽器、ChatGPT代理人或類似代理產品,使其執行有害行為、洩露敏感資訊,漏洞下惡意行為可複製率需達50%以上。其次是造成OpenAI產品大規模在OpenAI網站上執行不被允許行為。第三是導致OpenAI代理式產品執行兩者以外有害行為的臭蟲。而任何MCP風險的測試需符合第三方產品廠商的服務條款。
第二類臭蟲和OpenAI獨有資訊有關,包括導致模型回應OpenAI獨有和推理有關資訊的臭蟲,以及可暴露OpenAI其他獨有資訊的漏洞。第三類臭蟲和帳號和平臺完整性有關,包含帳號和平臺訊號漏洞,如繞過反自動(anti-automation)控制、操弄帳號信任訊號、迴避帳號限制/封鎖/禁令等問題。
此外,OpenAI也不定期針對特定問題舉行不公開抓蟲獎勵方案,像是ChatGPT Agent和GPT-5的生物風險內容問題。至於上述類型之外的臭蟲,OpenAI也會視個案考慮提供獎勵。一般性內容政策違規,例如讓模型回應粗俗語言的問題,就不在獎勵範圍內。
Safety Bug Bounty | Bugcrowd
Learn more about OpenAI’s Bug Bounty engagement powered by Bugcrowd, the leader in crowdsourced security solutions.
bugcrowd.com
Comments (0)