手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁(yè)>科技>

亞馬遜正在使用AI和機(jī)器學(xué)習(xí)來(lái)根據(jù)客戶(hù)的查詢(xún)預(yù)測(cè)上下文

亞馬遜正在使用AI和機(jī)器學(xué)習(xí)來(lái)根據(jù)客戶(hù)的查詢(xún)預(yù)測(cè)上下文。在預(yù)定于本月舉行的ACM SIGIR人類(lèi)信息交互與檢索會(huì)議上接受的預(yù)印本中,亞馬遜研究人員描述了一種系統(tǒng),該系統(tǒng)可根據(jù)“阿迪達(dá)斯男式褲子”等查詢(xún)來(lái)預(yù)測(cè)“跑步”等活動(dòng)。它可以幫助提高Amazon.com上搜索結(jié)果的質(zhì)量,從而可以改善整體Amazon購(gòu)物體驗(yàn)。

正如特約作者兼Amazon Search客戶(hù)體驗(yàn)應(yīng)用科學(xué)家Adrian Boteanu在博客文章中解釋的那樣,大多數(shù)產(chǎn)品發(fā)現(xiàn)算法都在查詢(xún)和產(chǎn)品之間尋找關(guān)聯(lián)。相比之下,研究人員的AI根據(jù)使用情況確定最佳匹配項(xiàng)。

為了對(duì)系統(tǒng)進(jìn)行培訓(xùn),團(tuán)隊(duì)根據(jù)通用產(chǎn)品匯總了173種使用環(huán)境類(lèi)別的列表,分為112種活動(dòng)(例如閱讀,清潔和跑步)和61位受眾(例如孩子,女兒,男人和專(zhuān)業(yè)人員)查詢(xún)。他們使用標(biāo)準(zhǔn)參考文本為用于表示類(lèi)別的術(shù)語(yǔ)創(chuàng)建別名,然后搜尋與數(shù)百萬(wàn)種產(chǎn)品相關(guān)的語(yǔ)料庫(kù),以查詢(xún)字符串以查看類(lèi)別術(shù)語(yǔ)及其別名的評(píng)論。如果在給定產(chǎn)品的任何評(píng)論中出現(xiàn)了原始類(lèi)別術(shù)語(yǔ)或別名,則該產(chǎn)品將標(biāo)記有相應(yīng)的類(lèi)別術(shù)語(yǔ)。

上述語(yǔ)料庫(kù)根據(jù)親和力得分(從1到15)將字符串與產(chǎn)品相關(guān)聯(lián),其中低得分表示弱相關(guān)性。為了訓(xùn)練使用上下文的預(yù)測(cè)器,研究人員生成了另一個(gè)數(shù)據(jù)集,其中每個(gè)條目都包含三個(gè)數(shù)據(jù)項(xiàng):查詢(xún);產(chǎn)品ID,使用上下文類(lèi)別進(jìn)行注釋;以及查詢(xún)產(chǎn)品親和力得分。該數(shù)據(jù)集被分為兩個(gè)較小的集合,一個(gè)根據(jù)活動(dòng)進(jìn)行注釋?zhuān)硪粋€(gè)根據(jù)受眾進(jìn)行注釋?zhuān)糜谟?xùn)練六個(gè)不同的機(jī)器學(xué)習(xí)模型。

每個(gè)模型都經(jīng)過(guò)培訓(xùn),可以根據(jù)查詢(xún)字符串預(yù)測(cè)使用環(huán)境,在測(cè)試中,效果最好的模型可以預(yù)測(cè)產(chǎn)品注釋?zhuān)渲谢顒?dòng)類(lèi)別的準(zhǔn)確性為97%,受眾類(lèi)別的準(zhǔn)確性為92%。當(dāng)向人類(lèi)審閱者顯示由活動(dòng)模型生成的類(lèi)別的按等級(jí)排序的列表時(shí),審閱者同意平均81%的時(shí)間接受系統(tǒng)的逐項(xiàng)預(yù)測(cè)。

“這表明我們的系統(tǒng)確定的使用環(huán)境可以幫助產(chǎn)品發(fā)現(xiàn)算法提供更相關(guān)的結(jié)果,從而改善客戶(hù)體驗(yàn)。此外,生成培訓(xùn)數(shù)據(jù)所需的最低限度的人力監(jiān)督意味著我們的方法可以以相對(duì)較少的努力擴(kuò)展到新的類(lèi)別,”博客文章說(shuō)。

免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章