手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>互聯(lián)網(wǎng)>

Clickbait的秘密曝光了 人類和AI聯(lián)手改善點(diǎn)擊誘餌檢測

賓夕法尼亞州立大學(xué)和亞利桑那州立大學(xué)的研究人員說,人類和機(jī)器共同協(xié)作,以幫助訓(xùn)練一種優(yōu)于其他點(diǎn)擊誘餌檢測器的人工智能模型。他們說,此外,新的基于AI的解決方案還能夠分辨出由機(jī)器(或機(jī)器人)生成的clickbait標(biāo)題與由人編寫的clickbait標(biāo)題之間的區(qū)別。

在一項(xiàng)研究中,研究人員要求人們編寫自己的點(diǎn)擊誘餌-這是一個(gè)有趣但具有誤導(dǎo)性的新聞標(biāo)題,旨在吸引讀者點(diǎn)擊其他在線故事的鏈接。研究人員還對機(jī)器進(jìn)行了編程以生成人工點(diǎn)擊誘餌。然后,將人和機(jī)器的標(biāo)題作為數(shù)據(jù)來訓(xùn)練點(diǎn)擊誘餌檢測算法。

研究人員表示,由此產(chǎn)生的算法預(yù)測點(diǎn)擊誘餌標(biāo)題的能力比其他系統(tǒng)好14.5%,研究人員今天(8月28日)在2019年IEEE / ACM國際社交網(wǎng)絡(luò)分析先進(jìn)會(huì)議(ASONAM)上發(fā)布了他們的發(fā)現(xiàn)。加拿大溫哥華。

該項(xiàng)目的首席研究員,信息科學(xué)與技術(shù)學(xué)院副教授Dongwon Lee表示,除了將其用于點(diǎn)擊誘餌檢測之外,該團(tuán)隊(duì)的方法還可能有助于總體上提高機(jī)器學(xué)習(xí)性能。Lee還是賓夕法尼亞州立大學(xué)計(jì)算機(jī)科學(xué)研究所(ICS)的附屬機(jī)構(gòu),該研究所為賓夕法尼亞州立大學(xué)的研究人員提供了超級計(jì)算資源的訪問權(quán)限。

“我們成功地證明了機(jī)器生成的點(diǎn)擊誘餌訓(xùn)練數(shù)據(jù)可以反饋到訓(xùn)練管道中,以訓(xùn)練各種各樣的機(jī)器學(xué)習(xí)模型來提高性能,這一結(jié)果非常有趣。” Lee說。“這是解決需要大量高質(zhì)量培訓(xùn)數(shù)據(jù)的監(jiān)督型機(jī)器學(xué)習(xí)的基本瓶頸的一步。”

賓夕法尼亞州立大學(xué)信息科學(xué)與技術(shù)學(xué)院的一名博士生Thai Le表示,點(diǎn)擊誘餌檢測技術(shù)的發(fā)展面臨的挑戰(zhàn)之一是缺乏標(biāo)記數(shù)據(jù)。就像人們需要老師和學(xué)習(xí)指南來幫助他們學(xué)習(xí)一樣,人工智能模型也需要帶有標(biāo)簽的數(shù)據(jù)來幫助他們學(xué)習(xí)建立正確的聯(lián)系和關(guān)聯(lián)。

Le說:“當(dāng)我們開始這個(gè)項(xiàng)目時(shí),我們意識(shí)到的一件事是,我們沒有很多積極的數(shù)據(jù)點(diǎn)。”“為了識(shí)別點(diǎn)擊誘餌,我們需要讓人員標(biāo)記訓(xùn)練數(shù)據(jù)。有必要增加正面數(shù)據(jù)點(diǎn)的數(shù)量,以便以后我們可以訓(xùn)練更好的模型。”

盡管在互聯(lián)網(wǎng)上找到點(diǎn)擊誘餌很容易,但點(diǎn)擊誘餌的多種變化又增加了另一層難度,據(jù)Donald P媒體效應(yīng)教授兼媒體效應(yīng)研究實(shí)驗(yàn)室聯(lián)合主任James P. Jimirro的S. Shyam Sundar稱。 Bellisario通信學(xué)院,以及ICS子公司。

“有一些點(diǎn)擊誘餌是列表或列表;有一些點(diǎn)擊誘餌被表述為問題;有一些以誰,什么地方,何時(shí)開始;還有我們在研究中發(fā)現(xiàn)的各種其他種類的點(diǎn)擊誘餌。年。”桑達(dá)爾說。“因此,要找到足夠數(shù)量的所有這些類型的Clickbait樣本是一個(gè)挑戰(zhàn)。盡管我們都在抱怨周圍的Clickbait數(shù)量,但是當(dāng)您四處獲取并標(biāo)記它們時(shí),這些數(shù)據(jù)集并不多。”

根據(jù)研究人員的說法,該研究揭示了人和機(jī)器在創(chuàng)建標(biāo)題方面的差異。與機(jī)器產(chǎn)生的點(diǎn)擊誘餌相比,人們產(chǎn)生的標(biāo)題傾向于在其標(biāo)題中包含更多確定性詞(例如“ that”和“ that”)。

培訓(xùn)似乎也促使點(diǎn)擊誘餌的創(chuàng)建有所不同。例如,受過訓(xùn)練的作家(例如記者)比其他參與者傾向于使用更長的單詞和更多的代詞。記者也可能會(huì)使用數(shù)字作為頭條新聞。

據(jù)Sundar稱,研究人員計(jì)劃利用這些發(fā)現(xiàn)來指導(dǎo)他們對更強(qiáng)大的假新聞檢測系統(tǒng)的研究。

Sundar說:“對我們來說,點(diǎn)擊誘餌只是構(gòu)成虛假新聞的眾多因素之一,但是這項(xiàng)研究是確保我們建立良好的點(diǎn)擊誘餌檢測系統(tǒng)的有用準(zhǔn)備步驟。”

為了尋找人類點(diǎn)擊誘餌作者進(jìn)行研究,研究人員從在線人群資源網(wǎng)站Amazon Turk招募了新聞專業(yè)的學(xué)生和工人。他們從現(xiàn)場招募了125名學(xué)生和85名工人。參與者首先閱讀了clickbait的定義,然后被要求閱讀了簡短的文章(約500個(gè)單詞)。然后要求參與者為每篇文章寫一個(gè)點(diǎn)擊誘餌標(biāo)題。

機(jī)器生成的點(diǎn)擊誘餌標(biāo)題是使用稱為變分自動(dòng)編碼器(VAE)生成模型的機(jī)器學(xué)習(xí)模型開發(fā)的,該模型依賴于在數(shù)據(jù)中查找模式的可能性。

研究人員針對在線點(diǎn)擊誘餌檢測競賽Clickbait Challenge 2017的頂級系統(tǒng)測試了他們的算法。

賓夕法尼亞州大眾傳播學(xué)的博士候選人Maria Molina也為這項(xiàng)研究做出了貢獻(xiàn)。亞利桑那州立大學(xué)的計(jì)算機(jī)科學(xué)與工程教授劉歡和計(jì)算機(jī)科學(xué)與工程博士學(xué)位候選人凱舒。

國家科學(xué)基金會(huì),橡樹嶺聯(lián)合大學(xué)和海軍研究辦公室支持這項(xiàng)工作。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!