(資料圖片僅供參考)
OpenAI 發(fā)文介紹了其最新的研究發(fā)現(xiàn),即 GPT-4可以幫助在線平臺更有效地管理用戶內(nèi)容。
“使用 GPT-4 的內(nèi)容審核系統(tǒng)可以更快地迭代政策變更,將周期從數(shù)月縮短至數(shù)小時(shí)。GPT-4 還能解釋冗長的內(nèi)容政策文檔中的規(guī)則和細(xì)微差別,并即時(shí)適應(yīng)政策更新,從而使標(biāo)簽更加一致。我們相信,這為數(shù)字平臺的未來提供了一個(gè)更積極的愿景,即人工智能可以根據(jù)平臺特定的政策幫助節(jié)制在線流量,減輕大量人工版主的精神負(fù)擔(dān)。任何擁有 OpenAI API 訪問權(quán)限的人都可以實(shí)施這種方法來創(chuàng)建自己的人工智能輔助審核系統(tǒng)?!?/p>
OpenAI 聲稱,他們的大型語言模型(例如 GPT-4)可以理解并生成自然語言,使其適用于內(nèi)容審核。這些模型可以根據(jù)提供給他們的政策指南做出適度判斷。
一項(xiàng)新的內(nèi)容政策發(fā)布后,首先得人工了解政策的執(zhí)行;然后收集反饋意見以確定新政策是否可行,以及對反饋中的問題進(jìn)行糾正。某些情況下,這一過程可能需耗時(shí)幾個(gè)月,但 OpenAI 研究認(rèn)為,GPT-4 可以在幾個(gè)小時(shí)內(nèi)完成該任務(wù)。
一旦制定了政策指南,政策專家就可以通過識別少量示例并根據(jù)政策為其分配標(biāo)簽來創(chuàng)建一組黃金數(shù)據(jù)。 然后,GPT-4 讀取策略并將標(biāo)簽分配給同一數(shù)據(jù)集,而不會看到答案。 通過檢查 GPT-4 的判斷與人類判斷之間的差異,政策專家可以要求 GPT-4 提出其標(biāo)簽背后的推理,分析政策定義中的模糊性,解決混亂并相應(yīng)地在政策中提供進(jìn)一步的澄清??梢灾貜?fù)步驟 2 和 3,直到對策略質(zhì)量感到滿意為止。在內(nèi)部測試中,OpenAI 還將 GPT-4 與人類內(nèi)容審核團(tuán)隊(duì)進(jìn)行了比較得出,受過內(nèi)容審核訓(xùn)練的 GPT-4 比受過輕度訓(xùn)練的人類審核員表現(xiàn)更好。不過,受過嚴(yán)格訓(xùn)練且經(jīng)驗(yàn)豐富的人類審核員表現(xiàn)仍要優(yōu)于兩者。
OpenAI 透露,他們還在積極探索進(jìn)一步提高 GPT-4 的預(yù)測質(zhì)量,包括納入鏈?zhǔn)酵评砘蜃晕遗u;以及嘗試檢測未知風(fēng)險(xiǎn)的方法。
更多詳情可查看官方博客。
關(guān)鍵詞:

營業(yè)執(zhí)照公示信息