手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>AI>

神經(jīng)網(wǎng)絡模型在密集圖像中發(fā)現(xiàn)小物體

為了自動從科學論文中捕獲重要數(shù)據(jù),美國國家標準技術(shù)研究院(NIST)的計算機科學家開發(fā)了一種方法,可以在圖像數(shù)據(jù)中包含的密集,低質(zhì)量繪圖中準確檢測小的幾何對象,例如三角形。NIST模型采用旨在檢測模式的神經(jīng)網(wǎng)絡方法,在現(xiàn)代生活中具有許多可能的應用。

NIST的神經(jīng)網(wǎng)絡模型在一組定義的測試圖像中捕獲了97%的對象,并將對象的中心定位在手動選擇位置的幾個像素內(nèi)。

NIST的計算機科學家Adele Peskin解釋說:“該項目的目的是恢復期刊文章中丟失的數(shù)據(jù)。” “但是,小型密集物體檢測的研究還有很多其他應用。物體檢測被廣泛用于圖像分析,自動駕駛汽車,機器檢查等領域,而小型密集物體的檢測尤其困難。找到并分開。”

研究人員從NIST的熱力學研究中心(TRC)的金屬特性數(shù)據(jù)庫中獲取了可追溯到1900年代初的期刊文章的數(shù)據(jù)。通常,結(jié)果僅以圖形格式顯示,有時是手工繪制,而由于掃描或影印而退化。研究人員希望提取數(shù)據(jù)點的位置,以恢復原始的原始數(shù)據(jù),以進行進一步的分析。到目前為止,這些數(shù)據(jù)都是手動提取的。

圖像為數(shù)據(jù)點提供了各種不同的標記,主要是圓形,三角形和正方形(實心和實心),具有不同的大小和清晰度。這種幾何標記通常用于標記科學圖中的數(shù)據(jù)。在訓練神經(jīng)網(wǎng)絡之前,使用圖形編輯軟件從文本的子集中手動刪除了可能會錯誤地顯示為數(shù)據(jù)點的文本,數(shù)字和其他符號。

由于多種原因,準確檢測和定位數(shù)據(jù)標記是一個挑戰(zhàn)。標記的清晰度和確切形狀不一致;它們可能是開放的或充滿的,有時是模糊的或失真的。例如,某些圓形看起來非常圓形,而其他圓形則沒有足夠的像素來完全定義其形狀。另外,許多圖像包含非常密集的重疊圓,正方形和三角形的補丁。

研究人員試圖創(chuàng)建一種網(wǎng)絡模型,以至少與手動檢測一樣準確地識別出繪圖點-在繪圖實際位置的五個像素之內(nèi),每側(cè)大小為數(shù)千個像素。

如一篇新的期刊論文所述,NIST研究人員采用了最初由德國研究人員開發(fā)的用于分析生物醫(yī)學圖像的網(wǎng)絡架構(gòu),稱為U-Net。首先縮小圖像尺寸以減少空間信息,然后添加要素和上下文信息層以建立精確的高分辨率結(jié)果。

為了幫助訓練網(wǎng)絡對標記形狀進行分類并確定其中心,研究人員嘗試了四種使用蒙版標記訓練數(shù)據(jù)的方法,即為每個幾何對象使用不同大小的中心標記和輪廓。

研究人員發(fā)現(xiàn),向蒙版添加更多信息(例如,更粗的輪廓)可以提高對物體形狀進行分類的準確性,但可以降低在圖中確定其位置的準確性。最后,研究人員結(jié)合了幾種模型的最佳方面,以獲得最佳分類和最小的位置誤差。事實證明,更改掩碼是提高網(wǎng)絡性能的最佳方法,它比其他方法(例如在網(wǎng)絡末端進行小的更改)更有效。

網(wǎng)絡的最佳性能-定位對象中心的精度達到97%-僅對于圖像點的子集是可能的,在這些圖像中,繪圖點最初由非常清晰的圓形,三角形和正方形表示。對于TRC而言,其性能足夠好,可以使用神經(jīng)網(wǎng)絡從較新的期刊論文中從圖中恢復數(shù)據(jù)。

盡管NIST研究人員目前沒有后續(xù)研究計劃,但神經(jīng)網(wǎng)絡模型 “絕對”可以應用于其他圖像分析問題,Peskin說。

免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!