今日最新上線的《自然》子刊《Nature Medicine》上,發(fā)表了一項激動人心的成果:利用機器學習和自然語言處理等人工智能(AI)技術,廣州市婦女兒童醫(yī)療中心的夏慧敏教授和加州大學圣地亞哥分校(UCSD)張康教授領銜的一支研究團隊,合作帶來一款全新的AI診斷工具。這項工具和人類醫(yī)生一樣,當填寫完患者口述和醫(yī)生體查文本型病歷之后,工具可直接閱讀醫(yī)療病歷,自動分析患者病情,智能給出推薦診斷。這是該團隊在《細胞》雜志封面發(fā)表有關AI圖像診斷的論文后,不到一年時間里,在AI技術實施應用于醫(yī)療方面取得的另一個重要里程碑。它標志AI模擬人類醫(yī)生進行疾病診斷時代的到來。
近年來,AI在基于醫(yī)學圖像的診斷上一次次超越人類。在放射學、病理學、眼科學、皮膚病學等影像數據的識別和篩查上,以機器學習為基礎的診斷工具表現(xiàn)搶眼。不過,這些應用對于迅猛發(fā)展的AI技術來說,還只是小試身手。真正的考驗,在于AI能否像人類一樣,讀懂疾病信息,而不是僅僅分析圖片。在這項研究中,科學家們成功實現(xiàn)了這一目標,挖掘出了AI在輔助醫(yī)生診斷上的巨大潛力。而他們所關注的,是對多種兒科疾病的準確診斷。
對兒科疾病的診斷是醫(yī)療中的一大痛點。一方面,兒童的抵抗力較弱,容易罹患多種疾病。另一方面,一些兒科疾病威脅程度較大,需要盡快得到治療。能夠快速、準確地對兒科疾病進行診斷,不但可以減少患者們的等待時間,還可以讓那些情況危急的兒童及時得到醫(yī)療診治。
▲本研究團隊的負責人夏慧敏教授(左)與張康教授(右)(圖片來源:兩位學者所任職科研院所官網)
為了解決這一痛點,研究人員們首先訓練AI理解海量電子病歷中的臨床特征數據,這包括了醫(yī)生輸入的大量文本報告。光是這一步,難度就比分析影像數據要大多了!電子病歷中,包括個人史、體格檢查、實驗室檢驗結果、用藥和手術等許多方面,維度遠遠高于圖像。而且,電子病歷數據中往往存在一些系統(tǒng)差錯,以及有意或無意的輸入錯誤,都會給數據分析帶來噪音。因此,怎么從電子病歷中挖掘數據,用機器學習方法來進行準確的模式識別,這是一個挑戰(zhàn)。
為此,研究人員整合醫(yī)學知識和數據建模,提出了一個數據挖掘框架,以深度學習技術為基礎,開發(fā)了一套自然語言處理系統(tǒng)。
▲AI診斷框架的設計流程圖(圖片來源:參考資料[1])
深度學習是機器學習的一個類別,使用多層神經網絡進行推理,需要大量的訓練數據來實現(xiàn)高精度。而這項研究的大量數據來自近60萬名患兒、超過130萬門診人次的電子病歷,讓機器學習的技術提高有了極大保障。
尤其值得一提的是,針對電子病歷中醫(yī)生記錄的診斷文本,研究人員建立了一套自然語言處理模型進行信息提取。在這一階段,兩個研究機構的醫(yī)生和科學家通力合作,由高級主治醫(yī)師和信息學研究人員組成的專家團隊手動給電子病歷上的6000多張圖表進行注釋,對模型進行訓練和檢驗。高質量的數據輸入成為這套系統(tǒng)的關鍵優(yōu)勢。
有了良好的訓練為基礎,接下來,研究團隊采用邏輯回歸分類器的機器學習方式,建立了一套AI分診系統(tǒng)。這套分類系統(tǒng)模擬人類醫(yī)生問診的框架,把電子病歷中提取到的臨床特征按人體各大系統(tǒng)來逐級劃分。
具體來看,這套系統(tǒng)首先會按呼吸系統(tǒng)疾病、胃腸道疾病、全身性疾病等幾大系統(tǒng)分,然后在每一類下面做細分。舉例來說,在最常見的呼吸系統(tǒng)疾病中,這個系統(tǒng)會先按上呼吸道和下呼吸道進行區(qū)分,再按喉炎、氣管炎、支氣管炎、肺炎進行細分。經過檢驗,在每一層級,由AI做出的初級診斷在精確度上都接近檢查醫(yī)師做出的初級診斷。例如在患兒群體中最常見的急性上呼吸道感染,模型對病例的診斷達到95%的準確率。
對于一些兇險的、有可能威脅生命的疾?。ɡ缂毙韵l(fā)作、細菌性腦膜炎等),算法也同樣表現(xiàn)出了強大的診斷性能。這在臨床應用中有非常重要的意義,因為有了AI快速分診的輔助,就可以讓醫(yī)療服務的有限資源用于最需要幫助的患者。
▲AI診斷系統(tǒng)的分診層級(圖片來源:參考資料[1])
最后,要真正檢驗AI的實力,當然要讓AI來和富有經驗的人類醫(yī)生比試一番了。研究人員拿出近12000份兒科患者的病歷記錄,并把20位“參賽”兒科醫(yī)生按年資和臨床經驗高低分成5組,看看AI的成績和哪一組醫(yī)生接近。結果顯示,AI模型的平均得分高于兩組低年資醫(yī)生,接近三組高年資醫(yī)生。從這個結果來看,AI模型或許可以為年輕醫(yī)生做診治判斷時助他們一臂之力了。
“我們的工作借助AI復制優(yōu)質兒科醫(yī)療智力資源,增加優(yōu)質兒科醫(yī)療資源供給,通過輔助賦能,提升兒科醫(yī)療行業(yè)效率和體驗,并有望通過遠程醫(yī)療和互聯(lián)網醫(yī)療形成更大范圍的示范推廣,從而為基層兒科醫(yī)生和年輕兒科醫(yī)生提供輔助診療服務,為患兒家長提供智能自診服務和權威的第二診療意見,避免誤診、漏診造成的醫(yī)療風險?!?夏慧敏教授說。
“我們的工作為不久的將來提供一種準確快速廉價的兒科AI醫(yī)生系統(tǒng)打下了堅實的基礎?!?張康教授補充說。
我們再次祝賀夏慧敏教授和張康教授的研究團隊,也期待人工智能的實施可以在不久的未來為廣大患者提供準確高效的診斷,徹底改變看病難看病貴的現(xiàn)象。