手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>AI>

富士通借助壓縮技術(shù)簡化了AI視頻識別

富士通實(shí)驗(yàn)室有限公司開發(fā)了一種技術(shù),用于將超高清,大容量視頻數(shù)據(jù)壓縮到AI視頻識別應(yīng)用所需的最小大小。這項(xiàng)技術(shù)可以將視頻數(shù)據(jù)壓縮到使用常規(guī)壓縮技術(shù)準(zhǔn)備的,供人類視覺確認(rèn)的數(shù)據(jù)大小的十分之一。

近年來,各個業(yè)務(wù)領(lǐng)域?qū)σ曨l數(shù)據(jù)的AI分析的需求急劇增加。尤其是第五代移動通信系統(tǒng)(1)的普及 ,預(yù)計將極大地增加相機(jī)拍攝的超高清視頻圖像的數(shù)量,以及在街上和路上拍攝的許多圖像的數(shù)量。生產(chǎn)線。

在開發(fā)這項(xiàng)新的壓縮技術(shù)時,富士通專注于AI和人類識別圖像的方式上的重要差異。即,在識別視頻數(shù)據(jù)中的人,動物或物體時,人工智能和人類在圖像區(qū)域上往往會有所不同,這些區(qū)域被認(rèn)為對判斷很重要。富士通開發(fā)了一種技術(shù),可以自動分析AI所重視的區(qū)域,并將數(shù)據(jù)壓縮到AI可以識別的最小大小。這使得可以分析大量視頻數(shù)據(jù)而不會影響識別精度,同時可以顯著降低操作和數(shù)據(jù)傳輸成本。還可以預(yù)料,該技術(shù)將允許用戶通過組合存儲在云中的多個視頻數(shù)據(jù),傳感器數(shù)據(jù)和性能數(shù)據(jù)(例如銷售數(shù)據(jù))來分析更高級的視頻數(shù)據(jù)。

背景與挑戰(zhàn)

近年來,使用AI分析圖像的技術(shù)發(fā)展迅速,并且有望成為許多行業(yè)中許多公司進(jìn)行數(shù)字化轉(zhuǎn)型的驅(qū)動力之一。隨著2020年復(fù)雜的5G移動服務(wù)的到來,對AI分析的需求預(yù)計會進(jìn)一步增加,同時超高清4K和8K攝像機(jī)以及大量視頻數(shù)據(jù)在包括行為分析在內(nèi)的應(yīng)用中的使用也將增加。制造業(yè)和零售業(yè)。

盡管如此,對于用于圖像分析的深度學(xué)習(xí)技術(shù)的處理要求仍提出了巨大的挑戰(zhàn)。一種確保處理這些任務(wù)的計算能力的有效技術(shù)是與云一起處理,但是由于視頻數(shù)據(jù)通常非常占用資源,因此需要一種可以將所有視頻數(shù)據(jù)傳輸?shù)皆频母邏嚎s技術(shù)。而不會影響質(zhì)量,從而不會使網(wǎng)絡(luò)帶寬過載。

關(guān)于最新技術(shù)

壓縮視頻會根據(jù)壓縮率降低圖像質(zhì)量,并且如果AI聚焦的區(qū)域過度壓縮,識別精度會降低。富士通開發(fā)了一種視頻壓縮技術(shù),該技術(shù)可以自動分析一幀視頻數(shù)據(jù)圖像中被AI識別為判斷材料的對象的區(qū)域, 以每個區(qū)域識別所需的最低圖像質(zhì)量對圖像進(jìn)行壓縮(2)(圖1)。與傳統(tǒng)的壓縮技術(shù)相比,通過應(yīng)用此技術(shù),可以顯著減小視頻數(shù)據(jù)的大小,同時保持識別精度。

自動估算壓縮比而不影響AI識別精度的技術(shù)

針對每個區(qū)域分析了特定于壓縮的圖像質(zhì)量下降對識別精度的影響。根據(jù)AI識別結(jié)果自動估計不影響識別精度的壓縮率(圖2)。

當(dāng)改變整個圖像的壓縮比并改變圖像質(zhì)量時,通過匯總對識別結(jié)果的影響,可以確定所有區(qū)域中AI在識別過程中特征的重要程度。將緊接在每個區(qū)域中的識別精度迅速惡化之前的壓縮率估計為不影響識別精度的壓縮率。

它還會反饋連續(xù)圖像的AI結(jié)果,以將壓縮率提高到AI可以識別的最大范圍。這樣,該技術(shù)在保持AI識別精度的同時實(shí)現(xiàn)了高圖像壓縮。

影響

新開發(fā)的技術(shù)已應(yīng)用于由多名工人打包在工廠中的4K攝像機(jī)拍攝的視頻鏡頭??梢源_定的是,數(shù)據(jù)大小可以減小到傳統(tǒng)壓縮技術(shù)的數(shù)據(jù)大小的1/10,而不會降低識別精度。預(yù)計該技術(shù)將用于不需要嚴(yán)格實(shí)時性能的應(yīng)用程序,以及用于分析高級視頻數(shù)據(jù)的分析,該高級視頻數(shù)據(jù)將存儲在云中的多個視頻數(shù)據(jù),傳感器數(shù)據(jù)以及性能數(shù)據(jù)(例如銷售數(shù)據(jù))結(jié)合在一起。

未來的計劃

富士通實(shí)驗(yàn)室正在各種情況下對該技術(shù)進(jìn)行評估,并正在進(jìn)行進(jìn)一步的研究和開發(fā),以進(jìn)一步改善壓縮性能。富士通有望在2020財年末將該技術(shù)商業(yè)化,并將其引入不同行業(yè)的各種應(yīng)用中,包括其富士通制造業(yè)解決方案COLMINA服務(wù)平臺。

[1]第五代移動通信系統(tǒng)-3GPP(第三代合作伙伴計劃)第五代系統(tǒng)的縮寫。一種具有高速,大容量,超低延遲和多個同時連接的移動通信系統(tǒng)。

[2]壓縮- 此技術(shù)采用國際標(biāo)準(zhǔn)H.265 / HEVC和現(xiàn)有的視頻壓縮方法。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!