經(jīng)過將近一年的懸念和爭議,現(xiàn)在,OpenAI的人工智能(AI)研究人員團隊將有一天發(fā)布GPT-2的完整和最終版本,該語言模型可以“生成連貫的段落并進行基本的閱讀理解,機器翻譯,問題解答和摘要-所有這些都無需特定任務(wù)的培訓(xùn)。”當(dāng)OpenAI在2月份首次發(fā)布該程序時,它具有令人贊嘆的壯舉:例如,關(guān)于安第斯山脈獨角獸的兩句提示,該程序制作了一條連貫的九段新聞文章。當(dāng)時,技術(shù)成就是有新聞價值,但它是如何OpenAI選擇了釋放,真正引起了軒然大波新技術(shù)。
機器學(xué)習(xí)研究社區(qū)中存在一種普遍的開放性規(guī)范,該領(lǐng)域的開放者是該領(lǐng)域的早期巨頭有意識地創(chuàng)建的:期望可以共享進步,以便可以對其進行評估,從而使整個領(lǐng)域都在進步。但是,在2月份,由于擔(dān)心該程序可能被用來產(chǎn)生誤導(dǎo)性的新聞報道,OpenAI選擇了更有限的發(fā)布;在網(wǎng)上模擬人;或自動制作可惡,偽造或垃圾內(nèi)容。因此,該公司共享了一個小的117M版本以及采樣代碼,但宣布將不共享數(shù)據(jù)集的關(guān)鍵元素,培訓(xùn)代碼或模型權(quán)重。
盡管一些觀察者贊賞OpenAI的謹(jǐn)慎,但許多人感到失望。一組評論員指責(zé)該組織散布恐懼,并夸大了該技術(shù)引起人們注意的危險;其他人則建議該公司背叛其核心使命,應(yīng)將自己重命名為“ClosedAI”。5月份,OpenAI發(fā)布了該模型的較大版本3.45億,并宣布將與也正在努力的有限合作伙伴共享762M和1.5B版本。制定針對惡意使用的對策。再次有人鼓掌。其他人則不為所動。
不管GPT-2是否足夠危險以至于無法保留,OpenAI的出版策略都引發(fā)了關(guān)于確定原則和策略的跨學(xué)科對話,以決定何時適當(dāng)限制對AI研究的訪問。在過去的八個月中,OpenAI作為規(guī)范企業(yè)家的努力已經(jīng)影響了其他人:AI合作伙伴關(guān)系組織了一次活動,討論開放研究與預(yù)防性關(guān)注之間的緊張關(guān)系。Hugging Face公司限量發(fā)行社交聊天機器人的文章,描述了如何濫用該系統(tǒng),并提出了識別他人誤導(dǎo)性聊天機器人的方法。華盛頓大學(xué)和艾倫人工智能研究所的研究人員揭示了GROVER(一種GPT-2風(fēng)格的語言模型)時,他們決定不發(fā)布該模型的大型版本-這一決定部分基于OpenAI的論點。同樣,人工智能初創(chuàng)公司AI21 Labs發(fā)布了其神經(jīng)文本生成器的345M版本,理由是“它的大小相當(dāng)于Grover和GPT-2的公開發(fā)布版本。”“好奇的黑客” Connor Leahy獨立復(fù)制了OpenAI的未發(fā)布1.5 B GPT-2,并計劃公開發(fā)布它-但隨后決定不這樣做,幫助制定負(fù)責(zé)任的發(fā)布規(guī)范。
GPT-2案引發(fā)了AI界內(nèi)部關(guān)于OpenAI是否做出正確選擇的激烈辯論?,F(xiàn)在,任務(wù)是從GPT-2案例研究中推斷出來,并就負(fù)責(zé)任的AI發(fā)布規(guī)范達成共識。