[訪問手機版]
掃一掃關(guān)注學(xué)校更多資訊
贊!Nature子刊發(fā)文,北郵人矢志創(chuàng)新!
我校教師王光宇在國際頂級期刊Nature子刊發(fā)文
提出肺部疾病的通用智能識別框架,發(fā)布國內(nèi)首個大型胸部X光片數(shù)據(jù)集
4月15日,北京郵電大學(xué)信息與通信工程學(xué)院王光宇(研究員、博導(dǎo))在頂級國際學(xué)術(shù)期刊《自然》子刊 (Nature Biomedical Engineering)在線發(fā)表文章,提出了基于X-ray影像的肺部疾病通用智能識別框架,并對肺炎進行檢測和嚴重程度評估。此智能系統(tǒng)通過了多中心、真實世界場景的臨床驗證,并且在新冠肺炎的智能分診的科技應(yīng)對疫情過程中發(fā)揮作用。此項工作的代碼和數(shù)據(jù)集發(fā)布到了國家生物信息中心云平臺,是目前國內(nèi)最大規(guī)模、多臨床場景的胸部X光片公開數(shù)據(jù)集,希望進一步推動信息領(lǐng)域與生物醫(yī)學(xué)的創(chuàng)新交叉研究工作。
本論文由北京郵電大學(xué)等國內(nèi)外多家機構(gòu)合作完成,王光宇老師為第一作者及通訊作者,北京郵電大學(xué)為第一完成單位1,這也是我校首次以第一完成單位在該期刊發(fā)表研究成果。
圖1. 真實世界場景下肺部疾病的通用智能識別框架
目前,基于數(shù)據(jù)驅(qū)動的人工智能方法在醫(yī)學(xué)影像的領(lǐng)域中不斷突破。然而在復(fù)雜、開放的真實場景下進行臨床驗證時,仍存在諸多挑戰(zhàn)。尤其是在新冠疫情期間,各國的計算機科學(xué)家們發(fā)布了上千種機器學(xué)習(xí)算法,認為這些算法能根據(jù)胸部 X 光片、CT 圖像診斷或預(yù)測新冠肺炎。然而劍橋大學(xué)的一項研究發(fā)現(xiàn),由于算法偏見和不可重復(fù)性等問題,科學(xué)論文和預(yù)印本提到的相關(guān)機器學(xué)習(xí)算法很少具有潛在的臨床應(yīng)用價值2。
為解決智慧醫(yī)療場景中所面臨的這些挑戰(zhàn),團隊從魯棒的AI框架設(shè)計、高質(zhì)量的數(shù)據(jù)集構(gòu)建,多中心臨床驗證等層面開展深入的研究工作,并經(jīng)過了嚴格的同行評議過程。對此項研究成果,王光宇老師也應(yīng)期刊編輯邀請在Nature Portfolio Community發(fā)表了評論和深度解讀3。
具體地,X-ray影像作為醫(yī)學(xué)重要的輔助診斷工具,相較于實驗室里進行的分子學(xué)檢測,速度快,能更直觀地觀察到肺部的病理學(xué)特征及變化。因此,開發(fā)智能影像AI系統(tǒng)可以幫助臨床醫(yī)生進行快速診斷并預(yù)測危重等級,這在醫(yī)療系統(tǒng)超負荷的情況下具有尤其重要的臨床應(yīng)用價值。在方法層面,研究團隊提出了基于胸部X-ray圖像的通用處理框架。由于X-ray拍攝容易出現(xiàn)扭曲、變形、飾物遮擋等問題,通過關(guān)鍵點檢測,智能矯正和肺部-病灶分割等模塊,可以將X-ray圖像進行自動的預(yù)處理和標(biāo)準(zhǔn)化。此外,臨床影像報告的敘述中包含許多身體部位和健康狀況的關(guān)鍵信息,是臨床診斷和疾病治療證據(jù)的主要組成部分。我們基于影像報告,通過自然語言處理技術(shù)抽取了影像發(fā)現(xiàn)和疾病標(biāo)簽, 包括肺炎、胸腔積液、肺腫塊等等。由于同一張X-ray影像中多種影像發(fā)現(xiàn)/疾病常常并存,研究團隊設(shè)計了新穎的多標(biāo)簽分類模型,可以對臨床場景下的肺部疾病進行精準(zhǔn)識別。最終,該智能識別系統(tǒng)經(jīng)受住了真實世界研究的考驗--在來自4個隊列的不同臨床場景,及多國家的數(shù)千張外部影像數(shù)據(jù)上,進行回顧性和前瞻性測試均具有良好的泛化性能。
圖2. AI 系統(tǒng)輔助臨床流程
在這項工作中,科研團隊采用了多源多中心的14萬張胸部X-ray圖像構(gòu)建了深度學(xué)習(xí)系統(tǒng)。這是國內(nèi)乃至世界上首個多臨床場景的胸部X-ray影像公開數(shù)據(jù)集4。已有的開源胸部X-ray數(shù)據(jù)來源于國外住院人群,如斯坦福大學(xué)團隊發(fā)布的ChestX-ray14。相比較于已有開源數(shù)據(jù)集,這個數(shù)據(jù)集包括了多種臨床真實場景和人群,如住院、門診、體檢。比如,其中的體檢數(shù)據(jù)集包含大量健康數(shù)據(jù),門診包含不同肺部異常的輕癥患者,可以供研究者對健康人群建模,構(gòu)建疾病異常檢測AI系統(tǒng)。該研究數(shù)據(jù)集已經(jīng)通過國家生物信息中心平臺發(fā)布,以協(xié)助來自不同國家和地區(qū)的研究團隊和臨床醫(yī)生開展研究。
頂尖的成果背后
是優(yōu)秀北郵人的不懈奮斗
讓我們一起來認識下!
王光宇,研究員,博士生導(dǎo)師。在智慧醫(yī)療、智能影像分析,醫(yī)學(xué)文本中的自然語言處理等有深厚的研究基礎(chǔ)。在Cell、Nature Biomedical Engineering、MICCAI等國際著名期刊和頂會發(fā)表學(xué)術(shù)論文多篇。在相關(guān)領(lǐng)域主持多項國家級項目,包括國家重點研發(fā)計劃《醫(yī)學(xué)人工智能產(chǎn)品檢測共性關(guān)鍵技術(shù)及標(biāo)準(zhǔn)研究》、國家自然科學(xué)基金《基于RWS的暈厥臨床不良事件風(fēng)險評估與智能預(yù)警關(guān)鍵技術(shù)研究》等,致力于以信息技術(shù)為內(nèi)核,解決健康醫(yī)學(xué)問題的重大挑戰(zhàn)。
王光宇老師隸屬張平院士團隊。張平院士團隊作為我國網(wǎng)絡(luò)通信領(lǐng)域的優(yōu)勢團隊,面向國家戰(zhàn)略重大需求,不斷凝聚多學(xué)科力量,開展信息科學(xué)前沿交叉探索。并且在工業(yè)互聯(lián)網(wǎng)、智慧醫(yī)療等“新基建”領(lǐng)域,為培育我國經(jīng)濟發(fā)展新動能,不斷作出突出貢獻。