密歇根大學的一家初創(chuàng)公司Voxel51今天推出了其旗艦產品-一種軟件平臺,旨在使人們能夠更輕松,更快,更實惠地訪問未開發(fā)的視頻數據潛力。
該軟件針對的是使用視頻但難以從中提取所需信息的公司。盡管視頻是一種豐富的數據形式,但由于其復雜性,大文件大小以及缺少諸如單詞之類的已定義單位,因此很難對其進行分析和搜索。
Voxel51已著手通過其視頻分析平臺和開源軟件庫克服這些障礙,這些軟件庫可共同實現最新的視頻識別。它標識并遵循每個剪輯中的對象和動作。正如聯合創(chuàng)始人Brian Moore所說:“我們將視頻轉化為價值。”
他們最初關注的重點是無人駕駛汽車,主要關注道路場景和公共安全方面的錄像。在這兩種應用中,相機都是關鍵傳感器,但是人類處理數據以使計算機可以對其進行分析非常耗時。更快,自動化的處理應加快更好的計算機視覺的開發(fā)。
電氣和計算機工程學教授聯合創(chuàng)始人Jason Corso說:“這是第一個也是唯一一個公開的道路場景理解平臺。”“汽車公司正在建造它們,但使用的是專有倉庫。我們的汽車將可供任何人使用和嘗試。
“通過使視頻處理民主化并訪問大型的帶注釋的庫,我們使年輕的初創(chuàng)公司能夠與資源豐富的團隊競爭,這些團隊致力于大型公司的無人駕駛汽車和其他計算機視覺應用。”
在當今的無人駕駛車輛中,感知算法是使用機器學習技術生成的,這意味著它們需要在帶有對象識別和跟蹤注釋的視頻剪輯上進行訓練,例如,行人,車輛,路燈柱,標志和交通信號燈。
在對系統(tǒng)進行培訓之前,必須對視頻進行注釋(通常是人工注??釋)。這就是為什么為機器學習算法創(chuàng)建訓練數據既費時又昂貴的原因。
借助Voxel51,用戶可以依靠平臺的AI軟件來加快此過程的速度。然后,可以搜索非常具體的視頻內容,例如,walk狗。借助開源庫,一些用戶可以訪問比他們原本無法承受的更大的數據集。
UM Tech Transfer許可總監(jiān)Bryce Pilz說:“對于Voxel51在自動車輛領域開發(fā)的尖端AI技術存在明顯的需求,我們對已經取得的進展充滿熱情。 。
“目前,Voxel51技術正在幫助Mcity的自動駕駛汽車了解他們在路上看到的東西,以便他們做出更好的決策,而且毫無疑問,我們最終將看到這些創(chuàng)新將其應用于量產汽車,使它們更加安全,高效和可靠。”
除了將強大的AI視頻分析交給開發(fā)人員之外,Voxel51的主要內在差異在于,其處理工作在跨幀的時空體積中進行,它們可以捕獲隨時間變化的運動和外觀。換句話說,他們不是在看像素而是在看像素。
該公司已經籌集了200萬美元的風險投資。Corso說,它位于安阿伯(Ann Arbor),擁有15名員工,并且正在招聘更多人。
“從現代計算的曙光開始,人類一直在適應計算機。我認為現在是計算機開始適應我們的時候了,這需要對視覺世界有更深入的了解,” Corso說。“ Voxel51的新平臺是朝這個方向邁出的重要一步。我們希望使新公司能夠輕松,強大地添加視覺感知功能,而這是他們本來無法做到的。”