伊恩·哈欽斯(Ian Hutchins)和美國國立衛(wèi)生研究院(National Institutes of Health)喬治·桑坦格洛(George Santangelo)領導的研究小組(OPA)的同事伊恩·哈欽斯(Ian Hutchins)和同事開發(fā)了一種人工智能/機器學習模型,用于預測哪些科學進展最終可能會轉化為臨床應用。
(NIH)。這項工作在10月10日發(fā)表在開放存取期刊PLOS Biology上的Meta-Research文章中進行了描述,旨在縮短科學發(fā)現與臨床應用之間有時長達數十年的時間間隔。該方法確定了將來的臨床試驗或指南(翻譯進度的早期指標)會引用研究文章的可能性。
哈欽斯和同事已經量化了這些預測,作為一種稱為“近似翻譯潛力”(APT)的新穎指標,這些預測在發(fā)布后只有兩年的時間里非常準確。研究人員和決策者可以使用APT值將注意力集中在具有強大翻譯潛力的科學領域。盡管單靠數字絕對不能代替人類專家的評估,但作為數據驅動決策的一個組成部分,APT指標具有加速生物醫(yī)學進步的潛力。
計算APT值的模型根據研究文章和引用它們的文章的內容進行預測。諸如APT之類的度量標準研究和開發(fā)的長期障礙是,此類引文數據一直隱藏在專有的,限制性的且通常成本高昂的許可協(xié)議之后。為了消除對科學界的這種障礙,提高透明度并促進可重復性,OPA匯總了來自公開資源的引文數據,以創(chuàng)建一個開放的引文集(NIH-OCC),其詳細信息顯示在《同一期的PLOS Biology。NIH-OCC目前包含超過4.2億個引用鏈接,隨著引用量的不斷積累,它將每月更新一次。對于自2010年以來的出版物,NIH-OCC已經比領先的專有引文數據來源更全面。
NIH-OCC的引文數據可用于計算APT值和相對引文比率(RCR)。后者是文章級別的科學影響力的一種衡量標準,已針對研究領域和發(fā)表以來的時間進行了標準化,該方法先前由NIH的Santangelo團隊開發(fā),現已在科學界和評估界廣泛采用。這兩篇文章發(fā)表后,APT值和NIH-OCC將作為iCite網絡工具的新組件免費公開發(fā)布,并將繼續(xù)作為RCR數據的主要來源。OPA團隊鼓勵使用iCite改進研究評估和決策制定,從而有助于優(yōu)化科學企業(yè)。