上消化道癌(包括食道癌和胃癌)是全世界最常見的癌癥。使用深度學(xué)習(xí)算法的人工智能平臺在醫(yī)學(xué)成像方面取得了顯著進(jìn)步,但它們在上消化道癌中的應(yīng)用受到限制。我們旨在通過分析臨床內(nèi)鏡檢查的影像數(shù)據(jù)來開發(fā)和驗(yàn)證用于上消化道癌診斷的胃腸道人工智能診斷系統(tǒng)(GRAIDS)。
方法
這項(xiàng)多中心,病例對照,診斷性研究是在中國的六家不同級別(即市,省和國家級)醫(yī)院中進(jìn)行的。從所有參與調(diào)查的醫(yī)院中檢索未曾接受過內(nèi)窺鏡檢查的18歲或18歲以上連續(xù)參與者的圖像。經(jīng)組織學(xué)證實(shí)為惡性腫瘤的所有上消化道癌病變(包括食道癌和胃癌)患者均符合本研究的條件。只有具有標(biāo)準(zhǔn)白光的圖像才被認(rèn)為是合格的。來自中山大學(xué)癌癥中心的圖像被隨機(jī)分配(8:1:1)用于發(fā)展GRAIDS的訓(xùn)練和內(nèi)在驗(yàn)證數(shù)據(jù)集,以及用于評估GRAIDS性能的內(nèi)部驗(yàn)證數(shù)據(jù)集。使用中山大學(xué)癌癥中心(一家國立醫(yī)院)的內(nèi)部和前瞻性驗(yàn)證集以及來自五家初級保健醫(yī)院的其他外部驗(yàn)證集對它的診斷性能進(jìn)行了評估。還將GRAIDS的表現(xiàn)與具有三級專業(yè)知識的內(nèi)鏡醫(yī)師進(jìn)行了比較:專家,主管和受訓(xùn)者。通過使用Clopper-Pearson方法計(jì)算95%CI,評估了GRAIDS和內(nèi)鏡醫(yī)師對癌性病變的診斷準(zhǔn)確性,敏感性,特異性,陽性預(yù)測值和陰性預(yù)測值。主管和實(shí)習(xí)生。通過使用Clopper-Pearson方法計(jì)算95%CI,評估了GRAIDS和內(nèi)鏡醫(yī)師對癌性病變的診斷準(zhǔn)確性,敏感性,特異性,陽性預(yù)測值和陰性預(yù)測值。主管和實(shí)習(xí)生。通過使用Clopper-Pearson方法計(jì)算95%CI,評估了GRAIDS和內(nèi)鏡醫(yī)師對癌性病變的診斷準(zhǔn)確性,敏感性,特異性,陽性預(yù)測值和陰性預(yù)測值。
發(fā)現(xiàn)
使用來自84 424個個體的1 036 496個內(nèi)窺鏡圖像來開發(fā)和測試GRAIDS。在內(nèi)部驗(yàn)證集中,識別上消化道癌的診斷準(zhǔn)確性為0·955(95%CI 0·952-0·957),在前瞻性集中為0·927(0·925-0·929),范圍為在五個外部驗(yàn)證集中,從0·915(0·913-0·917)到0·977(0·977-0·978)。GRAIDS實(shí)現(xiàn)了與專家內(nèi)鏡醫(yī)師相似的診斷敏感性(0·942 [95%CI 0·924-0·957]vs0·945 [0·927-0.959];p = 0·692)和靈敏度(0·858 [0·832-0·880],p <0·0001)和受訓(xùn)者(0·722 [0·691-0·752],p < 0·0001)內(nèi)鏡醫(yī)師。GRAIDS的陽性預(yù)測值為0·814(95%CI 0·788-0·838),專家內(nèi)鏡醫(yī)師的陽性預(yù)測值為0·932(0·913-0·948),0·974(0·960-0··主管內(nèi)鏡醫(yī)師為984),受訓(xùn)內(nèi)鏡醫(yī)師為0·824(0·795-0·850)。GRAIDS的陰性預(yù)測值為0·978(95%CI 0·971-0·984),專家內(nèi)窺鏡專家的陰性預(yù)測值為0·980(0·974-0·985),0·951(0·942-0· 959)(主管內(nèi)窺鏡檢查員)和0·904(0·893-0·916)(受訓(xùn)內(nèi)窺鏡檢查員)。