手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>科學(xué)>

新的AI系統(tǒng)將人腦信號轉(zhuǎn)換為文本的準(zhǔn)確性高達(dá)97%

世界只是在適應(yīng)亞馬遜和谷歌等公司提供的虛擬助手的功能和先進(jìn)性,與幾年前相比,該技術(shù)可以以令人毛骨悚然的精度解碼我們的語音。

然而,實(shí)際上,一個(gè)更令人印象深刻且令人難以置信的里程碑可能就在眼前,這使得語音識(shí)別似乎幾乎像兒童游戲:人工智能(AI)系統(tǒng)可以將我們的大腦活動(dòng)轉(zhuǎn)化為完整的文本,而不會(huì)聽到說出一個(gè)字。

這不完全是科幻小說。從動(dòng)物模型到人類參與者,腦機(jī)接口在過去的幾十年中得到了長足的發(fā)展,實(shí)際上已經(jīng)在嘗試這種事情。

加利福尼亞大學(xué)舊金山分校的研究人員在一項(xiàng)新研究中解釋說,這還不夠準(zhǔn)確。

為了看看他們是否可以改善這一狀況,由加州大學(xué)舊金山分校張氏實(shí)驗(yàn)室的神經(jīng)外科醫(yī)生愛德華·張領(lǐng)導(dǎo)的研究小組使用一種新的方法來解碼皮層電圖:皮層活動(dòng)期間發(fā)生的電脈沖的記錄由植入大腦的電極采集。

在這項(xiàng)研究中,四名癲癇患者戴上了植入物以監(jiān)測由他們的醫(yī)療狀況引起的癲癇發(fā)作,加州大學(xué)舊金山分校的團(tuán)隊(duì)進(jìn)行了一項(xiàng)輔助實(shí)驗(yàn):讓參與者朗讀并重復(fù)一些固定的句子,而電極記錄他們的大腦活動(dòng)在運(yùn)動(dòng)中。

然后,將這些數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)中,該神經(jīng)網(wǎng)絡(luò)會(huì)根據(jù)實(shí)驗(yàn)的音頻記錄來分析與某些語音簽名(例如元音,輔音或嘴巴動(dòng)作)相對應(yīng)的大腦活動(dòng)模式。

此后,另一個(gè)神經(jīng)網(wǎng)絡(luò)解碼了這些表示形式(從重復(fù)的30–50個(gè)口頭句子收集而來),并僅基于單詞的皮層簽名,使用它來嘗試預(yù)測所說的內(nèi)容。

在最佳狀態(tài)下,該系統(tǒng)產(chǎn)生了一個(gè)誤碼率(WER),其中只有3%的參與者將腦信號轉(zhuǎn)換為文本-這可能與AI所獲得的閱讀力差不多,至少在嚴(yán)格意義上講確定的實(shí)驗(yàn)條件。

在他們的論文中,團(tuán)隊(duì)詳細(xì)介紹了參與者所說的參考句子的許多示例,以及網(wǎng)絡(luò)生成的“預(yù)測”,有時(shí)是錯(cuò)誤的,但并非總是如此。但是,當(dāng)錯(cuò)誤顯而易見時(shí),它們似乎與人耳聽到的語音結(jié)果有很大不同(這可能是引入AI的有限數(shù)據(jù)集的副作用)。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!