語音欺騙技術(shù)曾在3月份從一位不知情的能源公司首席執(zhí)行官那里竊取了25萬美元,后者認(rèn)為他正在與(德國(guó))老板交談。最近的一項(xiàng)研究表明,有72%的人在閱讀AI產(chǎn)生的新聞故事時(shí)認(rèn)為這是可信的。9月,名為Zao的智能手機(jī)應(yīng)用在中國(guó)引起了轟動(dòng)。在政府突然將其取締之前,趙無極允許人們無縫地將自己融入著名的電影場(chǎng)景。
還有一個(gè)臭名昭著的案例,就是眾議院議長(zhǎng)南希·佩洛西(D-Calif。)篡改過的視頻,在被發(fā)現(xiàn)被操縱使自己看上去醉酒之前就開始傳播。
人工智能在人工智能方面的最新進(jìn)展大部分都來自于感知智能領(lǐng)域。這使我們的設(shè)備可以查看(例如,識(shí)別朋友的面孔),收聽(和識(shí)別歌曲),甚至解析文本(并識(shí)別郵箱中電子郵件的粗略意圖)。當(dāng)今的AI技術(shù)也可以產(chǎn)生這些感知力-我們的設(shè)備可以產(chǎn)生從未存在的場(chǎng)景和面孔,克隆聲??音以產(chǎn)生語音,甚至對(duì)收件箱中的電子郵件寫出簡(jiǎn)明的(如果是僵硬的)響應(yīng)。
這種產(chǎn)生感知的能力使AI處于充滿希望和巨大危險(xiǎn)的位置。
合成媒體可以有許多有益的應(yīng)用。畢竟,引起觀眾懷疑的中止是許多娛樂活動(dòng)的基石。然而,正是這種技術(shù)的潛在濫用,尤其是在“深層假貨”的名義下,引起了警報(bào)。
如果感知是現(xiàn)實(shí),那么當(dāng)AI可以產(chǎn)生或操縱感知時(shí),現(xiàn)實(shí)會(huì)發(fā)生什么?盡管在人類的許多歷史上都存在偽造,偽造和欺騙,但必須手工制造……直到現(xiàn)在。感知AI技術(shù)的出現(xiàn)大大減少了產(chǎn)生令人信服的假貨所需的工作。如我們所見,Zao應(yīng)用程序允許非專業(yè)用戶將自己切換到電影場(chǎng)景中。而且,隨著技術(shù)的發(fā)展,發(fā)現(xiàn)假貨將變得更加困難。諸如“哪張臉是真實(shí)的?”已經(jīng)表明,大多數(shù)人已經(jīng)無法從真實(shí)圖像中分辨出AI生成的圖像。
合成媒體的易于產(chǎn)生和廣泛傳播會(huì)對(duì)公民社會(huì)的許多方面產(chǎn)生相當(dāng)嚴(yán)重的不利影響。可以通過傳播深層的虛假視頻來操縱選舉,從而使某些候選人處于劣勢(shì)。欺騙語音和視頻通話會(huì)釋放大量新的消費(fèi)者騙局。通過將人們的肖像插入到妥協(xié)(有時(shí)是色情)的圖片和視頻中,可以侵犯?jìng)€(gè)人隱私。
在應(yīng)對(duì)這種基于AI的合成媒體沖擊時(shí),我們有哪些選擇?首先,人工智能技術(shù)本身可以通過利用當(dāng)前人工智能技術(shù)中的已知缺陷來幫助我們檢測(cè)深層偽造;有些技術(shù)可以發(fā)現(xiàn)偽造的文本,語音,圖像和視頻。例如,在圖像的情況下,偽造可以通過無法察覺的像素級(jí)缺陷或背景不一致來檢測(cè);對(duì)于大多數(shù)偽造發(fā)電機(jī)而言,很難正確獲取背景細(xì)節(jié)。(以幾乎相同的方式,當(dāng)我們記住早晨的夢(mèng)時(shí),沒有意義的部分通常不是人的臉,而是背景故事。)要檢測(cè)人的假冒視頻,請(qǐng)使用當(dāng)前的技術(shù)重點(diǎn)關(guān)注原始說話者的嘴唇運(yùn)動(dòng),語音模式和手勢(shì)之間的相關(guān)性。一旦檢測(cè)到,