對(duì)于AI的投資回報(bào)率,企業(yè)仍然不清楚。許多人認(rèn)為AI就像其他任何軟件解決方案一樣:從理論上講,回報(bào)應(yīng)該是立竿見(jiàn)影的。但這種情況并非如此。此外,由于AI供應(yīng)商往往會(huì)夸大其軟件生成的結(jié)果,因此業(yè)務(wù)領(lǐng)導(dǎo)者常常被誤認(rèn)為ROI的路徑要比AI的平滑得多。
實(shí)際上,要確定一個(gè)指標(biāo)來(lái)可靠地衡量AI對(duì)企業(yè)的影響是非常困難的。
在本文中,我們更深入地探討了業(yè)務(wù)領(lǐng)導(dǎo)者應(yīng)如何考慮確定可幫助他們理解AI項(xiàng)目可能產(chǎn)生的回報(bào)的ROI指標(biāo)。為此,我們通過(guò)對(duì)上個(gè)月在我們的行業(yè)人工智能播客中的三位專(zhuān)家的訪談來(lái)探索見(jiàn)解。
如何衡量AI投資回報(bào)率
在被認(rèn)為是成功的之前,人工智能項(xiàng)目固有地包含著一定程度的不確定性和實(shí)驗(yàn)性。在少數(shù)AI用例中,為預(yù)計(jì)回報(bào)確定可衡量的指標(biāo)可能相對(duì)簡(jiǎn)單。例如,在制造業(yè)的預(yù)測(cè)性維護(hù)應(yīng)用中,企業(yè)可以將回報(bào)直接與維護(hù)成本的減少或機(jī)器停機(jī)時(shí)間的減少聯(lián)系起來(lái)。
但是在其他應(yīng)用程序中,例如改善銀行業(yè)的客戶體驗(yàn),識(shí)別少量可靠的度量標(biāo)準(zhǔn)來(lái)衡量成功則更具挑戰(zhàn)性。
除非企業(yè)對(duì)收益有清晰的了解,否則他們將有可能遭受AI投資損失的風(fēng)險(xiǎn)。確保AI項(xiàng)目具有可衡量指標(biāo)的一種方法是選擇一個(gè)已經(jīng)存在非AI解決方案并且正在測(cè)量和跟蹤結(jié)果的特定業(yè)務(wù)問(wèn)題。
NVIDIA學(xué)習(xí)與感知研究副總裁Jan Kautz在我們之前的播客系列有關(guān)AI入門(mén)的訪談中接受了采訪,他似乎同意,針對(duì)現(xiàn)有業(yè)務(wù)問(wèn)題開(kāi)發(fā)AI解決方案比衡量成功要容易得多。開(kāi)發(fā)一個(gè)沒(méi)有先例的全新AI用例:
業(yè)務(wù)領(lǐng)導(dǎo)者還需要了解,為了在整個(gè)組織中部署AI項(xiàng)目,他們不僅需要數(shù)據(jù)科學(xué)家,還需要數(shù)據(jù)工程師。數(shù)據(jù)科學(xué)家是那些為特定功能開(kāi)發(fā)機(jī)器學(xué)習(xí)算法的人。
數(shù)據(jù)工程師通常承擔(dān)在整個(gè)企業(yè)中實(shí)施解決方案的任務(wù)。這可能涉及確定現(xiàn)有數(shù)據(jù)基礎(chǔ)結(jié)構(gòu)是否以可持續(xù)的方式建立,這將使AI系統(tǒng)隨著時(shí)間的推移在整個(gè)組織中平穩(wěn)運(yùn)行,或者devops流程能夠維持AI項(xiàng)目。
Narayanan認(rèn)為,可以顯示積極成果的最成功的AI項(xiàng)目將涉及與數(shù)據(jù)工程師合作的數(shù)據(jù)科學(xué)家。這些員工的投入對(duì)于理解可衡量的回報(bào)指標(biāo)至關(guān)重要,因?yàn)樗麄儗?duì)AI系統(tǒng)可以做什么有最深的了解。
但是這些員工通常缺乏將技術(shù)優(yōu)勢(shì)與整體業(yè)務(wù)收益聯(lián)系起來(lái)的見(jiàn)識(shí),而這需要來(lái)自應(yīng)用AI領(lǐng)域的主題專(zhuān)家。
業(yè)務(wù)領(lǐng)導(dǎo)者需要考慮這兩種觀點(diǎn),才能真正了解他們今天從AI項(xiàng)目中可能會(huì)獲得什么收益。這也將幫助他們準(zhǔn)確地分析他們希望這些AI收益在未來(lái)看起來(lái)如何,并針對(duì)最終情況調(diào)整系統(tǒng)。
衡量AI投資回報(bào)率方面面臨的挑戰(zhàn)
分階段評(píng)估投資回報(bào)率
馬丁認(rèn)為,為了成功地實(shí)現(xiàn)AI項(xiàng)目的回報(bào),企業(yè)需要弄清楚如何測(cè)試其最初的假設(shè),嘗試AI系統(tǒng)以及盡快確定用例。
測(cè)試這些最初的試點(diǎn)項(xiàng)目是否成功,意味著在應(yīng)用AI的任務(wù)中評(píng)估AI系統(tǒng)的性能。
衡量這些初始項(xiàng)目的成功甚至可能會(huì)以與AI涉及的技術(shù)挑戰(zhàn)無(wú)關(guān)的方式出錯(cuò)。例如,如果一家企業(yè)實(shí)施了AI客戶服務(wù)軟件,并且由于無(wú)效的營(yíng)銷(xiāo)活動(dòng)而僅向其介紹了幾個(gè)用戶,那么衡量AI系統(tǒng)的回報(bào)就變得更具挑戰(zhàn)性。
這是因?yàn)锳I系統(tǒng)可能設(shè)計(jì)得很完美,但是試點(diǎn)測(cè)試可能無(wú)法準(zhǔn)確代表在整個(gè)組織中部署時(shí)所獲得的任何回報(bào)是否會(huì)真正帶來(lái)收益。
Martin認(rèn)為,對(duì)于業(yè)務(wù)領(lǐng)導(dǎo)者來(lái)說(shuō),至關(guān)重要的一點(diǎn)是,一定不能在整個(gè)企業(yè)范圍內(nèi)大規(guī)模運(yùn)行試點(diǎn)測(cè)試項(xiàng)目。只有仔細(xì)分析了幾個(gè)試驗(yàn)性試點(diǎn)項(xiàng)目的結(jié)果之后,才能實(shí)施大型項(xiàng)目,例如徹底檢查銀行的??欺詐檢測(cè)系統(tǒng)。這與吳安德(Andrew Ng)的建議相吻合,即建議在6到12個(gè)月的時(shí)間內(nèi)(而不是大規(guī)模的多年部署)拍攝第一個(gè)AI項(xiàng)目。