代理商正處于到達(dá)2022年底美國國家檔案局(National Archives and Records Administration)電子記錄截止日期的旅程的各個階段。實際上,在最近的數(shù)字政府學(xué)院電子發(fā)現(xiàn),記錄和信息管理虛擬會議上,活動組織者調(diào)查了讓觀眾了解參與者在數(shù)字化轉(zhuǎn)型工作中的進(jìn)展。毫不奇怪,結(jié)果甚至在“取得進(jìn)展”,“我們還有很長的路要走”和“別問”之間平均分配。在與政府機構(gòu)的討論中,我們發(fā)現(xiàn)了類似的觀點。
無論代理機構(gòu)在電子記錄管理過程中處于何處,都應(yīng)利用這一機會來部署可以從該信息中獲取見解的功能。然而,這是說起來容易做起來難,因為大多數(shù)機構(gòu)都在努力發(fā)掘其信息的價值。他們擁有太多的非結(jié)構(gòu)化和未分類的信息,或者缺乏內(nèi)部資源和分析這些信息的技能-或兩者兼而有之。
NARA的最后期限要求所有機構(gòu)記錄必須在2022年底之前達(dá)到100%數(shù)字化。當(dāng)今的分布式機構(gòu)環(huán)境的特征是系統(tǒng)多樣化,系統(tǒng)具有來自各種數(shù)據(jù)源的多種數(shù)據(jù)類型,包括物理和數(shù)字信息。這使負(fù)責(zé)執(zhí)行NARA電子記錄管理要求的機構(gòu)記錄管理者感到頭疼。但是,借助支持AI和ML的內(nèi)容分析,數(shù)據(jù)管理和信息治理工具來對物理和數(shù)字內(nèi)容進(jìn)行分類,提取和豐富,代理商可以成功地克服這些難點。
在數(shù)字化轉(zhuǎn)型過程中,將AI和ML功能集成到代理商的信息管理程序中,將使他們能夠自動分類,提取和豐富物理和數(shù)字內(nèi)容。從高層次看,三步過程如下所示:
輸入記錄–系統(tǒng)使用光學(xué)字符識別,圖像識別和視頻處理功能來提取信息并將其保存為電子格式。
應(yīng)用AI / ML –通過將分類過程和實體提取與AI / ML策略結(jié)合使用,系統(tǒng)將自動訓(xùn)練模型,應(yīng)用模型,捕獲反饋并為下一階段準(zhǔn)備數(shù)據(jù)。
輸出–數(shù)據(jù)準(zhǔn)備好后,將其導(dǎo)出到數(shù)據(jù)可視化功能中,該功能使代理商可以搜索,分析,查看和生成更深刻的見解,從而根據(jù)該信息做出更好的決策。
AI / ML方法的好處
在數(shù)字化轉(zhuǎn)換和簡化記錄管理流程方面,合并AI / ML的特定好處包括:
用于搜索和跟蹤的元數(shù)據(jù)。元數(shù)據(jù)標(biāo)記是數(shù)字化過程的一部分,可幫助機構(gòu)正確地分類,搜索和管理信息。元數(shù)據(jù)對于在其整個生命周期中管理,訪問和最終跟蹤信息至關(guān)重要。與AI / ML結(jié)合使用時,元數(shù)據(jù)可以提供有關(guān)代理記錄的重要信息,例如內(nèi)容是什么以及它具有什么特征。
從多個來源提取數(shù)據(jù)。AI / ML系統(tǒng)可幫助機構(gòu)從孤立的來源中獲取信息,并通過類型和關(guān)聯(lián)的元數(shù)據(jù)對每條信息進(jìn)行分類。
數(shù)據(jù)分類。AI / ML解決方案中有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的結(jié)合有助于避免在這些系統(tǒng)自動查找,分離和了解數(shù)據(jù)中任何意外文檔類時了解所有文檔類的需求。此過程訓(xùn)練連接到AI / ML平臺的神經(jīng)網(wǎng)絡(luò),以便一旦完成文檔和元數(shù)據(jù)索引編制,便會建立基線庫,然后可以在基線庫中搜索模式和趨勢。
用于可視化的用戶界面。增加以通用格式查看/可視化信息的功能,可以提高整個機構(gòu)的責(zé)任感和透明度,同時為決策者提供更多有價值的數(shù)據(jù)。
持續(xù)改進(jìn)。AI / ML系統(tǒng)不斷使用人工校正等人工信號來改善電子學(xué)習(xí),以提供更準(zhǔn)確的結(jié)果。
盡管將所有記錄轉(zhuǎn)換為數(shù)字格式的過程可能令人生畏-尤其是考慮到代理機構(gòu)管理的記錄的數(shù)量和種類繁多,但它確實為代理機構(gòu)提供了從該信息中獲取價值的機會。通過將AI / ML技術(shù)整合到他們的記錄管理程序中,代理商可以在其信息中釋放這種潛力,以幫助做出更好,更明智的決策并增強他們所提供的全面服務(wù)。