中新網(wǎng)2月12日電 2月11日,國際醫(yī)學(xué)科研期刊《Nature Medicine》在線發(fā)布了題為“Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence”(《使用人工智能評估和準(zhǔn)確診斷兒科疾病》)的文章。該文章由廣州市婦女兒童醫(yī)療中心與依圖醫(yī)療等企業(yè)和科研機(jī)構(gòu)共同完成,基于機(jī)器學(xué)習(xí)的自然語言處理(NLP)技術(shù)實(shí)現(xiàn)不輸人類醫(yī)生的強(qiáng)大診斷能力,并具備多場景的應(yīng)用能力。
業(yè)界公認(rèn),人工智能是醫(yī)療行業(yè)革新的核心動力。然而,盡管機(jī)器學(xué)習(xí)在影像診斷方面表現(xiàn)強(qiáng)勢,但在數(shù)量巨大、多樣的電子病歷數(shù)據(jù)分析方面,仍面臨巨大挑戰(zhàn)。電子病歷的數(shù)據(jù)信息之廣、數(shù)據(jù)類型之多,以及某些方面的數(shù)據(jù)貧乏及可能出現(xiàn)的特殊案例等,都導(dǎo)致機(jī)器學(xué)習(xí)難以進(jìn)行精確的數(shù)據(jù)分析,并進(jìn)而形成預(yù)測臨床檢測的數(shù)據(jù)模型。
依圖提出并測試了一個專門對電子醫(yī)學(xué)病例進(jìn)行數(shù)據(jù)挖掘的系統(tǒng)框架,將醫(yī)學(xué)知識和數(shù)據(jù)驅(qū)動模型結(jié)合在一起。
“此次成果的核心技術(shù)部分,實(shí)際上是通過深度學(xué)習(xí)技術(shù)與醫(yī)學(xué)知識圖譜,對EHR數(shù)據(jù)進(jìn)行解構(gòu),從而構(gòu)建了高質(zhì)量的智能病種庫。使得后續(xù)可以較容易地利用智能病種庫建立各種診斷模型。而診斷模型證明了基于AI的系統(tǒng)可以幫助醫(yī)生處理大型數(shù)據(jù)和輔助診斷,同時在診斷的不確定性和復(fù)雜性上給予臨床支持”,依圖醫(yī)療總裁倪浩表示,“兒科疾病癥狀多種多樣,臨床醫(yī)生同樣難以區(qū)分,診斷流程費(fèi)時費(fèi)力,但明確診斷非常重要。擁有可與經(jīng)驗豐富的兒科醫(yī)生相媲美的助手進(jìn)行輔助診斷,能夠讓醫(yī)生有效地降低診斷時間,顯著優(yōu)化診斷流程?!?/p>
依圖與廣州市婦女兒童醫(yī)療中心進(jìn)行合作,收集了該中心在2016年1月至2017年7月間的567,498個門診病人的1,362,559次問診電子病歷,抽取到覆蓋初始診斷包括兒科55種病例學(xué)中常見疾病的1.016億個數(shù)據(jù)點(diǎn),并將這些信息用于訓(xùn)練和驗證系統(tǒng)框架。相比以往模型,此次研究使用了超過140萬的龐大數(shù)據(jù),以完善診斷系統(tǒng),此外,此次研究中使用數(shù)據(jù)在表達(dá)和描述上的一致性,極大的提高了數(shù)據(jù)質(zhì)量。
不僅如此,此次研究還基于NLP實(shí)現(xiàn)了病歷的重新格式化。首先,有超過25年臨床實(shí)踐經(jīng)驗的資深主治醫(yī)師手動注釋了6,183個圖表,然后用3,564張人工標(biāo)注的圖表對NLP信息提取模型進(jìn)行訓(xùn)練,并用剩下的2,619張圖表對模型進(jìn)行驗證。該NLP模型總結(jié)了代表臨床數(shù)據(jù)的關(guān)鍵概念類別,利用深度學(xué)習(xí)技術(shù)自動將EHR注釋到標(biāo)準(zhǔn)化詞匯和臨床特征中,從而允許對診斷分類進(jìn)行進(jìn)一步處理。
廣州市婦女兒童醫(yī)療中心夏慧敏教授表示,“這篇文章的啟示意義在于,通過系統(tǒng)學(xué)習(xí)文本病歷,人工智能或?qū)⒖梢栽\斷更多疾病。但須要清醒認(rèn)識到,我們?nèi)杂泻芏嗷A(chǔ)性工作要做扎實(shí),比如高質(zhì)量數(shù)據(jù)的集成便是一個長期的過程,因為大數(shù)據(jù)的收集和分析需要算法工程師、臨床醫(yī)生、流行病學(xué)專家等在內(nèi)的多專家的通力合作。此外,人工智能學(xué)習(xí)了海量數(shù)據(jù)后,其診斷結(jié)果的準(zhǔn)確性仍然需要更大范圍的數(shù)據(jù)對其進(jìn)行驗證和比對。”