《imit白皮書:計算醫學:數智時代的醫學發展新范式(44頁).pdf》由會員分享,可在線閱讀,更多相關《imit白皮書:計算醫學:數智時代的醫學發展新范式(44頁).pdf(44頁珍藏版)》請在三個皮匠報告上搜索。
1、計算醫學:數智時代的醫學發展新范式Computational Medicine:A Novel Paradigm of Medical Development in the Era of Digital Intelligence數據的飛速積累和方法的加速更新換代預示著未來醫學范式的轉變方向:一種以數據和計算方法為主的計算醫學(Computational Medicine,CM)。通過計算模型、超算技術,數據之間的相關關系被更好的體現出來,具有高通量高維度特征的海量數據,通過復雜系統的計算建模,以更逼近真實的方式理解生命機理和疾病機制,提高疾病預測、臨床診療和健康維護水平,使個性化決策成為可能,
2、有可能徹底改變從單個病人護理到政策制定的整個醫學領域。本期導讀浙江數字醫療衛生技術研究院浙江數字醫療衛生技術研究院浙江樹人大學浙江樹人大學媒體支持媒體支持李瑩瑩周佳卉張建楠朱燁琳鄭 杰王力飛葉芳芳江 俊動脈網IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式1內容摘要(一)引言與其他學科相比,醫學實踐具有相當大的不確定性,而且這種不確定性一直存在,這也是醫學實踐如此具有挑戰性的原因。大數據的發展,賦予了醫生和臨床科研人員更多、更細致的維度去了解疾病發生發展過程,大大拓展了醫學研究的深度和廣度。但是,生物醫學大數據的規模和產生速度已遠遠超出了個人的處理能力,急需新的方
3、式與手段幫助醫生從從多維、立體、融合的數據中摸索出規律,從而更精確地進行疾病的診斷和治療。一種以數據和計算方法為主的計算醫學的出現與發展預示著未來醫學發展范式的轉向。(二)計算醫學概念與知識體系計算醫學的核心是通過應用數學、計算科學來理解人類疾病的機理,為醫學服務提供新洞見,提高并改善疾病診療水平,廣義上應用計算機和計算模型來支持醫療保健服務的醫學研究的所有方面都可以被納入到計算醫學范疇。作為一門較高難度的交叉學科,計算醫學需要綜合來自計算機科學、數學、統計學、生物化學、化學工程、生物醫學工程、生物物理學、分子生物學、遺傳學、生態學、解剖學等學科的知識。(三)計算醫學研究進展計算醫學研究熱度持
4、續上升,最近幾年在項目研發投入與文獻發布量上增速明顯,但相較于美國,中國在計算醫學領域的研發投入整體較少。研究內容上,模型研究、各類應用模式(表達、模擬、算法、識別、預測、分類)以及癌癥、系統等為計算醫學領域研究的核心。研究內容變化上呈現:從原有的理論、模型研究向應用領域研究發展;從數理統計算法研究向基于人工智能技術發展;從生物、解剖數學模型構建、到基于大數據驅動的計算基因組學再到精準醫療等臨床醫療應用發展。國家比較來看,中美兩國在計算醫學研究領域涉及面較廣,各類研究主題均有布局;中國在精準醫療應用、模型、機器學習、個性化醫療、仿真模擬五個方面的研究關注度與美國差距較大。(四)計算醫學主要研究
5、內容本文結合技術與醫學應用兩個維度,并依據時間發展順序,歸納了計算醫學的研究內容,包括四個方面:以模型構建為核心的計算醫學基礎研究、以海量基因組學數據驅動的計算基因組學研究、基于人工智能技術的計算醫療應用研究、面向精準醫療的計算醫學研究。并簡要介紹了各個領域主要研究內容及典型應用。(五)計算醫學學科建設情況為了應對醫學范式向計算醫學轉變帶來的挑戰,提高計算醫學研究能力,世界各國的大學和科研機構紛紛成立計算醫學相關的研究部門,這些機構多數前身為計算生物、生物數學系、生物醫學工程系等,學科建設仍在持續發展過程中。在國外,這些高校院系也成為了計算醫學的主要研究中心。相較而言,中國除中國科學院外,還沒
6、有形成比較集中有影響力的計算醫學領域研究中心。盡管各個學校將建立的院系或開設的專業冠以“計算醫學”之名,但其研究的內容和側重點各不相同。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式2(六)計算醫學發展展望計算醫學的發展有望實現關于健康、疾病的量化理解,帶來醫學發展范式的變革,但與主流學術領域相比仍處于邊緣的位置?,F有的模型對現實情況的模擬仍然是不充分的,找到能夠定義虛擬世界與經驗世界之間聯系的工具,尤其是計算機仿真模型的有效性仍然是困難。隨著基因組學、醫學成像、診斷技術和轉化醫學方面的不斷發展,人工智能的深度融合,共性服務、共性平臺、公共設施的不斷完善,將為我
7、們開發癌癥、遺傳疾病和傳染性疾病的診斷工具和新療法提供可能性。計算醫學作為關鍵的融合手段,將構建人體“數字孿生”,實現精準健康維護,讓個性化醫療照進現實。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式3研究簡介(一)研究背景隨著基因測序技術、可穿戴設備等新的檢測方法和檢測工具的不斷涌現,醫療健康相關的數據正在指數級增長中。這些復雜數據的處理已經遠遠超出個人的處理能力,亟需新的方式與手段幫助醫生從多維、立體、融合的數據中摸索出規律,從而更精確地進行疾病的診斷和治療。一種以數據和計算方法為主的計算醫學,正受到越來越多的關注。(二)研究目標了解計算醫學的產生背景,明確
8、計算醫學的基本定義。了解當前國內外計算醫學的發展現狀以及主要研究內容的異同點,了解我國在計算醫學領域研究上與領先國家的主要差距點。了解計算醫學應用的主要方式。通過本期白皮書,幫助讀者形成對計算醫學的初步認知。(三)研究方法本研究主要通過對國內外相關文獻和資料進行檢索和整理歸納,并利用動態科學文獻分析 工 具 CiteSpace(CiteSpace 5.8.R1)對Web of Science 核心合集(1900-至今)中的計算醫學主題的文獻數據進行可視化分析,同時對國內有代表性的開展高校專家進行調研,深入了解計算醫學學科發展情況與主要研究內容。(四)機構介紹1.浙江數字醫療衛生技術研究院浙江數
9、字醫療衛生技術研究院(簡稱“數研院”,imitTM)是中國首家致力于數字與信息化技術在醫療衛生健康服務領域研發與應用的專業性非營利研究機構(NPO/NGO),院長為楊勝利院士,理事長為李蘭娟院士,常務副院長為鄭杰先生。數研院聚集眾多業內的資深院士和專家學者、全球著名的醫療保健設備廠商、國內外領先的行業軟件企業來共同從事該領域的研究開發、顧問咨詢、認證評估、國際合作、成果轉化等工作,并引領政、產、學、研、用、資六位一體的公益事業公共服務支撐平臺,進而營造出可生存可持續發展的數字醫療衛生產業鏈生態環境。2.浙江樹人大學浙江樹人學院(浙江樹人大學)創辦于 1984年,是一所由浙江省政協舉辦、省教育廳
10、主管的社會力量辦學本科高校。學?,F有杭州拱宸橋與紹興楊汛橋兩個校區,教職工 1200人,在校生 1.7 萬余人。設有院士領銜的樹蘭國際醫學院等 12 個二級學院,學科涵蓋醫學、文學、經濟學、管理學、理學、法學、工學、藝術學等8大學科門類,共有4個省一流學科;開設了 50 個本科專業,8 個??茖I,其中1 個國家特色專業,4 個省重點專業,1 個省優勢專業,1 個省優勢建設專業,4 個省新興特色建設專業,3 個省特色建設專業。共有教育部白俄羅斯國別與區域研究中心和省現代服務業研究中心 2 個省部級研究基地,2 個省行業平臺,1 個省創新團隊,25 個校級研究機構及平臺。2015 年學校被確定為
11、浙江省首批應用型試點示范建設學校,在中國民辦本科院校競爭力排行榜中連續多年榮獲第一。3.動脈網動脈網創立于 2014 年,是中國領先的醫療健康產業研究機構和媒體平臺,持續聚焦全球技術變革下的醫療健康產業變遷,對行業創新和創投進行長期的研究報道。動脈網擁有中國最大的醫療健康創新創投資源庫,提供優質的媒體傳播、產業研究、產業活動,IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式4及投融資對接和產業合作資源對接等服務。7年來,動脈網發布了 14000 多篇原創文章、360 多份原創產業報告、報道企業 6000 多家,70%以上創新企業選擇在動脈網首發。目前,動脈網的微信
12、公眾號粉絲超過 20 萬,40 多個自媒體渠道月均流量超過 1200 萬。(五)版權說明本白皮書版權屬于浙江數字醫療衛生技術研究院,并受法律保護。轉載、摘編或利用其它使用本白皮書文字或觀點內容,請注明“來源:浙江數字醫療衛生技術研究院”,若違反上述聲明者,本院將追究其相關法律責任。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式5一、引言(一)傳統醫學范式面臨的挑戰一個多世紀前 Sir William Osler 對醫學的描述“醫學是一門不確定的科學,也是一門概率的藝術”至今仍能引起我們的強烈共鳴。與其他學科相比,醫學實踐具有相當大的不確定性,而且這種不確定性一直
13、存在,這也是醫學實踐如此具有挑戰性的原因。由于做出決策的信息不完整以及偶然、隨機或運氣因素,使得醫療決策不得不面臨兩個問題:既沒有完美的測試,也沒有完美的治療方法1。傳統醫學模式中,面對這些決策中的不確定性,通常的處理方式是通過從經驗中積累的專業知識進行判斷,后發展為通過循證醫學的形式對研究進行系統的評估實現。但循證醫學主要以群體證據作為核心依據,往往無法有效的解釋個體差異?;驕y序、檢查檢驗設備、可穿戴設備等新的檢測方法和檢測工具的不斷涌現,使得我們可以獲取個人不同尺度上的健康、疾病數據,醫療健康相關的數據指數級增長。大數據賦予了醫生和臨床科研人員更多、更細致的維度去了解疾病發生發展過程,大
14、大拓展了醫學研究的深度和廣度。但人作為一個多層次非線性的復雜系統,與健康相關的影響因素與數據維度異常復雜,不同因素在不同尺度上相互作用影響著健康,見圖 1。例如,癌癥、糖尿病、心血管疾病和精神疾病等復雜疾病是由多種遺傳、表觀遺傳和環境因素引起的,可能是DNA 變異,也可能是由于生物網絡中的多個分子相互作用紊亂而發展起來的,一種復雜疾病的臨床特征是多尺度系統綜合行為的表型表現。這些復雜數據的處理已經遠遠超出個人的處理能力,急需新的方式與手段幫助醫生從多維、立體、融合的數據中摸索出規律,從而更精確地進行疾病的預測、預防、診斷和治療。圖 1:“人”系統涉及的數據維度尺度IMIT白皮書2021 年 0
15、7月 第21期計算醫學:數智時代的醫學發展新范式6(二)計算醫學的誕生早在 80 年代,如何在醫學領域里應用計算技術的研究就已經開始。1994 年,首屆計算醫學、公共衛生和生物科技大會在美國奧斯汀舉行,來自 30 個國家的超過 500名專家學者共同就計算模型在醫學領域的應用進行了交流?!癇uilding a man in the machine”是本次會議的主題,圍繞著這一主題,會議議程中討論了眾多計算領域話題包括:計算藥理學與藥物設計、計算免疫學、計算基因組學、計算生物力學、計算和數學生理學、計算機在精神醫學計算、心臟病學、腫瘤建模、人類大腦計劃、多模態腦成像建模等。時任美國環境保護局局長的
16、 William F.Raub 博士在主旨演講中提到計算醫學在當時還是一個非常小眾的研究,只有一小部分生物醫學科學家在使用計算方法,開展數學建模。隨著數據的飛速積累以及大數據的處理挖掘方法不斷成熟,以深度學習為代表的人工智能方法在圖像識別、自然語言處理等領域取得了令人矚目的成就。這些數據和技術領域的革新也推動了計算醫學進入快速發展周期。在當下,計算醫學通過高通量高維度特征的海量數據計算建模,以更逼近真實的方式理解生命機理和疾病機制,提高疾病預測、臨床診療和健康維護水平,使個性化決策成為可能。2012 年 10 月,約翰霍普金斯大學生物醫學 工 程 教 授 Raimond L.Winslow 在
17、 科學 轉 化 醫 學(Science Translational Medicine)發表了一篇名為計算醫學:從模 型 到 臨 床(Computational Medicine:Translating Models to Clinical Care)的綜述性文章,指出計算醫學已經從理論走向實踐,Winslow 也被公認為計算醫學新領域的創始人。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式7(一)概念Winslow 將通過計算建模理解疾病中生命系統的擾動結構和功能,從建模中獲得啟發用以改進疾病診斷和治療的方法稱之為“計算醫學”。這里的計算建模不僅包括分子網絡和生
18、理過程的模型,也包括了生理功能分層的解剖模型,其核心是使用定量模型來理解疾病的結構和功能改變2。紐約大學將計算醫學描述為“計算醫學是利用數據驅動的分析來發現復雜動態生物系統的結構、功能和進化”3。約翰霍普金斯大學的計算醫學所的定義則強調模型的構建:“計算醫學是計算機科學和醫學交界的一個跨學科領域,計算方法被開發來了解人類疾病。數學、信息學和計算模型被應用于為疾病的機制、診斷和治療提供見解,并最終改善病人的護理”4。雖然各自對計算醫學的定義不盡相同,但總體而言,作為一門新興的學科,計算醫學的核心是通過應用數學、計算科學來理解人類疾病的機理,為醫學服務提供新洞見,提高并改善疾病診療水平,廣義上應用
19、計算機和計算模型來支持醫療保健服務的醫學研究的所有方面都可以被納入到計算醫學范疇。另一個與計算醫學密切相關的學科為計算生物學(Computational Biology)。根據美國國家衛生研究院的定義,計算生物學是指開發和應用數據分析及理論的方法、數學建模和計算機仿真技術,用于生物學、行為學和社會群體系統的研究的一門學科。計算生物學重點以生命科學中的現象和規律作為研究對象,以解決生物學問題為最終目標,研究內容包括生物序列分析,基因鑒定,監管主題發現,基因組組裝,基因組復制和重排,進化理論,聚類算法,無標度網絡等5。從研究內容上計算醫學和計算生物學有部分交叉,例如在計算基因組學領域,但計算生物學
20、作為生物學的一個分支,仍然偏向于基礎科學,為醫學研究提供基礎支撐。而計算醫學更偏向于應用科學,關注的是人體健康與疾病相關問題的研究。根據文獻研究顯示,計算醫學的研究重點大致經歷了三個階段的演變:人體仿真與計算建模研究階段 基因大數據驅動的計算醫學應用研究階段 基于人工智能的計算醫學與應用研究階段具體到與醫學的融合,計算醫學與現代醫學的發展趨勢保持著相對的一致性?,F代醫學在研究層次上主要向著微觀和宏觀發展,從分子醫學的實驗方法發展到系統醫學的理論與實驗方法結合并進。學科體系上,既存在學科分立和學科之間的交叉融合?,F代醫學在向微觀發展的過程中,是伴隨著定量化分析技術的提升得以實現,兩個過程不可分割
21、,因此在計算機技術與醫學緊密結合的領域出現了計算醫學較早的研究內容,包括計算基因組學、計算神經遺傳學建模、計算神經科學等。在向宏觀發展方面,一種是人們認識到人本身是一個整體;二是把人作為一個與自然環境和社會環境密切相互作用的整體來研究,人體建模、數字人體、精準醫學等計算醫學領域研究內容則是在這一趨勢下產生。中國科學院計算技術研究所高性能計算機研究中心主任譚光明從四個維度清晰的闡釋了計算醫學的內涵6:二、計算醫學概念與知識體系IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式8(二)知識體系計算醫學是一門較高難度的交叉學科。需要綜合來自計算機科學、數學、統計學、生物化
22、學、化學工程、生物醫學工程、生物物理學、分子生物學、遺傳學、生態學、解剖學等學科的知識,見圖 2。計算醫學會涉及到使用近現代的數學工具來對生物對象進行數學建模,所以對數學的要求會比較高,尤其是動力系統和概率。而微積分和線性代數又是動力系統和概率的基礎。其他基礎必要的知識還包括生物學基礎、醫學基礎、計算機基礎和工程基礎領域知識,見表 1。來源:中國科學報,白皮書團隊整理來源:各高校計算醫學課程信息,白皮書團隊整理分析圖 2:計算醫學研究理論基礎IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式9表 1:主要涉及學科及基礎知識理論基礎分類學科主要內容數學相關基礎微積分函
23、數和極限;導數和微分,面(體)積和積分,微分和積分間的關系。微分方程,常微分方程組。微分方程的計算浮點運算、算法和收斂、求根(中點法、牛頓法和割線法)、數值微分和積分以及初值問題的數值解(龍格-庫塔法、多步法、外推法、穩定性、隱式法和剛度)。理論主題,如初值問題解的存在性、唯一性和穩定性,高階/非自治方程到系統的轉換等。線性代數向量,向量空間(或稱線性空間);線性空間里的線性相關與線性無關;線性空間的基;矩陣和線性變換;矩陣的特征值和特征向量。概率微積分水平上的概率及其應用。概率,組合概率,隨機變量,分布函數,重要概率分布,獨立性,條件概率,矩,協方差和相關性,極限定理。統計有限總體抽樣、近似
24、方法、經典參數估計、假設檢驗、方差分析和回歸。貝葉斯方法。隨機過程隨機過程的數學理論。重點是推導依賴關系、統計特性和樣本路徑行為,包括隨機行走、馬爾可夫鏈(離散和連續時間)、泊松過程、鞅和布朗運動。生物學基礎生物化學蛋白質、核酸、脂肪、糖等生物大分子的結構、功能、代謝。分子生物學中心法則;基因、染色體與染色質、基因組;DNA 復制、重組;轉錄、可變剪接、信使 RNA 的穩定性,翻譯;基因調控。細胞生物學細胞的形態結構、生理機能、細胞周期、細胞分裂、細胞自噬、細胞凋亡,以及各種細胞器及信號傳遞通路。醫學相關基礎人體生理學血液與循環系統、肺與呼吸系統、消化系統、腎臟與排泄、神經系統、感覺器官、內分
25、泌、生殖、衰老。人體解剖學研究正常人體各部分形態、結構、位置、毗鄰及結構與功能關系。診斷學診斷疾病步驟和臨床思維方法、常見癥狀、病歷內容、輔助檢查。計算機相關基礎編程語言熟悉一門編程語言(JAVA/PYTHON/Matlab)中變量、數組、函數以及控制結構(判斷結構和循環結構)的使用,并進一步熟悉指針、動態內存分配、多態性、重載、繼承、模板、集合、異常等概念(C+)。數據結構數據結構的設計和實現。相關數據結構包括數組、堆棧、隊列、鏈表、二叉樹、堆、平衡樹(如 2-3 樹、AVL 樹)和圖。機器學習統計機器學習方法、概率圖模型。邏輯回歸、廣義線性回歸、主成分分析、最近鄰、支持向量機、決策樹、隨機
26、森林、K-均值聚類、高斯混合等,概率圖的表示、推斷、參數和結構學習。深度學習的常用體系結構、深度學習優化方法、深度學習編程系統以及在計算機視覺、語音理解和機器人學中的應用。計算機視覺攝像機系統及其建模,雙目立體、運動和光度立體計算三維幾何;物體識別;邊緣檢測和顏色感知;機器視覺和生物視覺。工程類相關基礎電氣和計算機工程信號和系統、系統和控制、線性系統理論導論、非線性系統導論。機械工程動力學系統,動力系統的設計和分析,運動動力學與控制?;瘜W和生物分子工程化學與生物過程分析導論、應用與化學工程的動力學建模與控制、藥代和藥效動力學。來源:各高校計算醫學課程信息,白皮書團隊整理分析IMIT白皮書202
27、1 年 07月 第21期計算醫學:數智時代的醫學發展新范式10三、計算醫學研究進展(一)國內外研究投入情況搜索知領全球科研項目庫7最近 10 年題名或關鍵詞包含計算醫學相關的項目,共計 3417 條。(檢索式:(KY=computational OR KY=計算 OR TI=computational OR TI=計算 OR KY=AI OR KY=artificial intelligence OR KY=machine learning OR KY=deep learning OR KY=人工智 能 OR KY=機 器 學 習 OR KY=深 度學習)and(KY=medicine OR
28、KY=醫療 OR KY=healthcare OR KY=醫學 OR TI=medicine or TI=醫療 OR TI=healthcare OR TI=醫學 OR KY=gene OR KY=基因),KY=關鍵詞,TI=項目名稱)。對有效數據進行統計結果顯示,總體上,全球近十年計算醫學相關領域研究投入經費波動較大,2019 年在總研發投入經費和平均項目研發投入經費均達到了歷年最高值,見圖 3。國家分布上,研發經費投入最高的前三位國家分別為美國、比利時和英國,平均項目研發經費投入最高的國家分別為比利時、斯洛伐克和澳大利亞,見圖 4。研發經費投入排名前 10 的項目的開始時間主要集中在最近
29、5 年,重點投入在研究中心建設、基礎設施投入、人才培養、個性化治療等領域,見表 2:來源:知領全球科研項目庫數據;白皮書團隊分析來源:知領全球科研項目庫數據;白皮書團隊分析圖 3:全球近 10 年計算醫學研究投入情況圖 4:各國計算醫學研發投入情況IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式11(二)研究現狀與趨勢本 節 內 容 以 Web of Science 核 心 合集(1900-至 今)中 收 錄 的 主 題 為“computational medicine”的 5257 篇 文獻數據為樣本,進行計算醫學領域研究可視化分析,了解計算醫學整體發展情況,重
30、點研究內容及演進態勢等。(檢索條件:主題=Computational medicine,檢索時間截止至 2021 年 7 月 27 日,文獻類型:all)。本節圖表來源未特別標注均為白皮書團隊分析所得。1.總體情況1)時間趨勢文獻發布時間跨度為 1980 年-2021 年??傮w來看,全球范圍內計算醫學研究熱度持續上漲,尤其 2010 年前后開始出現快速上漲,整體呈加速趨勢,計算醫學研究熱度持續升高。中美兩國的研究趨勢與全球基本保持一致,見圖 5。2)國家/地區分布對國家分布進行分析,發文數量最高的前三個國家分為 美國(2154 篇)、中國(761 篇)、英國(499 篇)。僅從發文數量來看,中
31、國在研究關注度上與美國相比仍有一定差距,美國發文數量占總體文獻數的 34.24%,為中國(12.1%)的 2.83 倍,見圖 6。來源:知領全球科研項目庫數據;白皮書團隊分析表 2:近十年全球計算醫學領域研發投入經費前十的項目情況項目名稱資助機構承擔機構起止時間項目金額(美元)多發性硬化癥中遺傳和非遺傳因素的多種表現與多組學加速個性化治療的方法8歐盟Karolinska Institutet2017-202117,085,366深度學習和高性能計算機促進生物醫學健康應用9歐盟Everis Spain SL2019-202116,632,216倫敦國王學院醫學工程卓越研究中心10英國Kings
32、College London2017-202212,100,395為 DCCP 提供生物醫學計算支持服務11美國Information Management Services2015-201714,112,182倫敦醫學影像與人工智能價值醫療中心12英國Imperial College London2019-20229,985,272生 物 醫 學 學 習 和 學 生 培 訓(BLaST)計劃13美國University of Alaska Fairbanks2014-202412,396,907國家智能醫學成像聯盟(NCIMI)14英國University of Oxford2019-202
33、19,633,794醫學生物信息學:個性化醫學的數據驅動發現15英國University College London2014-202111,129,560通過大數據分析和動態建模,實現慢性呼吸系統疾病個性化醫療的數據驅動計算方法16歐盟Fundacio Institut De Bioenginyeria De Catalunya2020-2022196,434使用人工智能增強的社交機器人改善兒童的醫療體驗17英國University of Glasgow2020-2025636,497IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式123)主要研究機構情況從發文
34、機構來看,美國機構占了前十中的 9個,主要以約翰霍普金斯大學、哈佛大學醫學院、斯坦福大學、美國密歇根大學等高校為主,中國僅有 1 家機構進入前十,為中國科學院。國外相較國內在計算醫學領域已經形成了比較有影響力的領域研究中心,見圖 7。圖 7:計算醫學發文前十機構發文數量圖 5:1990-2021 年計算醫學研究領域發文量時間分布比較圖 6:計算醫學發文量國家分布情況IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式134)主要發文期刊發文量排名前 10 的期刊共刊登了計算醫學文獻 832 篇(15.83%),排名第一的為醫學物理學(Medical Physics)發
35、文量為385 篇(7.32%),IF 最高的生物信息學簡報(Briefings in Bioinformatics)發文量排名第 6 位。計算醫學文獻發文量前十的期刊及影像因子(IF),見表 3。圖 8:計算醫學領域發文數量前十學科領域情況表 3:計算醫學領域發文數量前十的期刊情況排序期刊數量IF(2020)IF(5 年)1醫學物理學(Medical Physics)3854.0713.7672醫學生物學超聲(Ultrasound in Medicine and Biology)762.9983.0513PloS One683.243.7884科學報告(Scientific Reports)6
36、04.3795.1335Bmc 生物信息學(Bmc Bioinformatics)553.1693.6296生物信息學簡報(Briefings in Bioinformatics)5011.62210.2887Plos 計算生物學(PloS Computational Biology)424.4755.3798計算與結構生物技術期刊(Computational and Structural Biotechnology Journal)357.2717.4099生物信息學(Bioinformatics)316.9378.4710威利跨學科評論-系統生物學和醫學(Wiley Interdiscip
37、linary Reviews-Systems Biology and Medicine)305.04.9385)學科領域特征從文獻學科分類統計來看,計算醫學主要與放射學、核醫學和醫學影像、生物化學和分子生物學、數學與計算生物學、計算機科學與跨學科應用、藥理學與制藥、生物醫學工程、生物化學研究方法學、工程、電器與電子、多學科科學、計算機科學、人工智能等學科密切相關。計算醫學作為醫學、工程與計算機的交叉學科,是多個學科專業共同的交叉研究領域,見圖 8。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式142.研究熱點與趨勢1)研究熱點分析 關鍵詞詞頻分布對文獻關鍵詞統計
38、結果進行分析,排名前十的關鍵詞,見圖 9??梢钥吹接嬎汜t學領域排名前十的關鍵詞分別為:模型(model)、癌 癥(cancer)、表 達(expression)、預 測(prediction)、仿真(simulation)、識別(identification)、系統生物學(system biology)、精準醫學(precision medicine)、系統(system)、算法(algorithm)。關鍵詞國家分布各國國家計算醫學關鍵詞分布情況見圖 10??梢钥闯?,在研究領域選擇上不同國家各有側重。中美兩國的研究領域涉及面較廣,各類研究關鍵詞均有相關文獻;印度主要側重“藥物發現(drug d
39、iscovery)”,大部分國家包括德國、加拿大、意大利等的研究關注點均集中在精準醫療(precision medicine)、模 型(model)和 機 器 學 習(machine learning)。中 美 兩 國 具 體 對比來看,中國的研究關鍵詞排名前三的為藥 物 發 現(drug discovery)、精 準 醫 療(precision medicine)、預測(prediction)。美國研究關鍵詞排名前三的則依次為精準醫療((precision medicine)、模型(model)和機器學習(machine learning),就研究關鍵詞的發文數量來看,中國在計算醫療技術領域
40、的模型構建、仿真模擬以及機器學習研究和應用領域的精準醫療、個性化醫療等五個方面的研究關注度與美國差距較大,見圖 11。圖 9:計算醫學領域關鍵詞詞云圖 10:主要國家計算醫學研究關鍵詞分布情況IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式15 各國研究熱點變化主要國家主題河流圖顯示了各個國家近 20年來研究熱點的變遷,總體來看主要是從原有理論、模型等基礎性研究向應用研究轉變。2009 年以前,各國研究主題非常多樣,存在重疊的主題主要集中在“方法(method)”和“模型(model)”,在 2002-2009 年和2006-2009 年分別成為日本、美國的研究熱
41、點;2010 年以后,各國的計算醫學研究熱點開始出現更多重疊,2014-2017 年“癌癥(cancer)”成為多個國家計算醫學領域的研究熱點,“表達(expression)”先后成為韓國、英國、中國在計算醫學領域的研究重點。2018年-2021年,“精準醫療(precision medicine)”成為美國計算醫學領域研究熱點,見圖 12。研究熱點時間變化我們將 1980 年-2021 年的 5257 篇文獻按每 5 年 1 個區間(years per slice=5),分別選擇每個區間內文獻被引次數前 50 的文獻為對象(selection criteria=Top N,50),圖 11:
42、中美兩國研究關鍵詞發文數量比較圖 12:主要國家計算醫學領域研究主題河流圖文獻篇IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式16進行關鍵詞(node types=keyword)共現網絡分析,并根據關鍵詞特征進行聚類,共得到了 10 個聚類類別。一般認為輪廓值(Silhouette)S0.5 聚類是合理的,S0.7意味著聚類是令人信服的。計算醫學形成的10 個聚類結構都非常清晰,見表 4。聚類序號越小,表明聚類中包含的關鍵詞越多,“精準醫學”的研究內容是所有聚類中最為豐富的,其次是“機器學習”子領域,第三則為虛擬篩選靶點發現等藥物發現相關的“計算研究”領域,同
43、時“計算研究”也是最新的領域方向,平均發文時間為 2013 年。表 4:計算醫學關鍵詞聚類信息匯總表序號聚類名稱節點數輪廓值平均年份聚類標簽詞(LLR 算法)0精準醫療precision medicine 270.9352000精準醫療(precision medicine)(584.39,0.0001);特征選擇(feature selection)(500.1,0.0001);立體定向放射治療計劃系統(stereotactic radiosurgery treatment planning)(441.45,0.0001);理論指導(theoretic steering)(441.45,0.
44、0001);coloring theory(436.95,0.0001)1機器學習machine learning 260.9682000機器學習(machine learning)(969.03,0.0001);人工智能(artificial intelligence)(759.7,0.0001);潛在靶點(potential target)(706.71,0.0001);創傷后應激障礙(posttraumatic stress disorder)(660.74,0.0001);認知框架(epistemological framework)(486.14,0.0001)2計算研究comput
45、ational study 210.9692013計算研究(computational study)(1251.14,0.0001);cov-2 主要蛋白酶(cov-2 main protease)(902.95,0.0001);蛋白酶(main protease)(873.95,0.0001);結構虛擬篩選(structure-based virtual screening)(851.42,0.0001);虛擬篩選(virtual screening)(664.72,0.0001)3實現路徑practical method 180.9181998實現路徑(practical method)(
46、314.6,0.0001);散射補償(incorporating scatter)(314.6,0.0001);精確散射補償(accurate scatter compensation)(314.6,0.0001);邊界元方法(boundary element approach)(307.27,0.0001);蒙特卡羅模擬研究(monte carlo modeling studies)(299.94,0.0001)4可行性研究feasibility study 160.9551997可行性研究(feasibility study)(568.6,0.0001);X 線透射(x-ray fluor
47、oscopy)(385.91,0.0001);消痛顆粒(xiaotong granule)(379.96,0.0001);治療骨關節炎(treating osteoarthritis)(379.96,0.0001);增加噪聲(using additive noise)(374.01,0.0001)IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式17序號聚類名稱節點數輪廓值平均年份聚類標簽詞(LLR 算法)5發展趨勢current trend 150.9951994發展趨勢 current trend(213.91,0.0001);人類基因組圖 mapping hu
48、man gene(213.91,0.0001);發現設計原則(discovering design principle)(205.34,0.0001);介觀動力學模型(mesoscopic model)(205.34,0.0001);食物過敏(food allergy)(196.78,0.0001)6基因序列dna sequence 150.8862003基因序列(dna sequence)(670.85,0.0001);組織工程學(tissue engineering)(639.12,0.0001);主題發現(discovering motif)(441.36,0.0001);生物信息學方法
49、(bioinformatics method)(436.62 0.0001);綜合組學(integrative omics)(431.87,0.0001)7血細胞比容varying hematocrit 140.9191996血細胞比容(varying hematocrit)(299.79,0.0001);血液流速剖面(blood velocity profile)(283.77,0.0001);靜脈導管進口(ductus venosus inle)(283.77,0.0001);多普勒(doppler measurement)(276.3,0.0001);靜脈導管流體動力學(ductus v
50、enosus fluid dynamics)(276.3,0.0001)8俄歇電子發射放射性核素auger-electron emitting radionuclide 130.9951994俄歇電子發射放射性核素(auger-electron emitting radionuclide)(219.77,0.0001);輻射能量頻譜(radiation spectra)(219.77,0.0001);原模型(source model)(209.27,0.0001);高效計算近距離放射療法(efficient brachytherapy computation)(209.27,0.0001);蒙
51、特卡洛(monte carlo)(209.27,0.0001)9非編碼 RNAnon-coding rna 110.9422003非編碼 RNA(non-coding rna)(516.1,0.0001);系統生物學(systems biology)(469.47,0.0001);系統醫學(systems medicine)(428.55,0.0001);網絡醫學(network medicine)(394.04,0.0001);靶向蛋白質組(targeted proteomics)(358.6,0.0001)11計算機斷層掃描computed tomography 100.941998計算機
52、斷層掃描(computed tomography)(466.01,0.0001);計量計算(dose calculation)(426.67,0.0001);CT 灌注(perfusion ct)(425.12,0.0001);噪聲特性統一(uniform noise properties)(371.11,0.0001);精準高效(efficient accurate)(364.45,0.0001)續上表IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式18將聚類結果繪制成關鍵詞聚類圖譜*(見圖 13)可以更加直觀的展示了計算醫學的研究熱點情況及變化趨勢情況??梢钥?/p>
53、到,除了#0(精準醫學)、#3(計量研究)、#4(可行性研究)、#7(血細胞比容)外,各個子領域間較少重疊,都是比較獨立的研究方向。大體上可分為三類:第一類計算建模相關研究,從最早的#8 放射建模相關內容、到#7 血流動力學建模、#3 蒙特卡洛模擬、#4 射線與疾病相關研究,最突現的關鍵詞為模型、仿真和系統。第二類為基因組學相關研究主要包括了#6基因序列研究、#9 非編碼 RNA 和#5 基因組學應用相關研究,并向#0 精準醫療和#2藥物篩選研究擴展,關鍵節點包括了癌癥、數據庫、基因表達。第三類為基于人工智能的相關研究包括了#1 機器學習領域和#11 精準計算機斷層掃描應用領域。2)研究前沿分
54、析 領域研究前沿時間線圖反映了各個研究子領域的時間變遷(見圖 14)。#1 機器學習子領域時間跨度從 1990-2021 年,是所有聚類中時間跨度最大的子領域,可以反映出機器學習技術在計算醫學領域應用研究的持續性。2010年左右,計算模型成為該領域研究熱點,2010-2013 計算模型與大數據高度共現,也體現出了數據驅動的計算醫療模型構建的研究熱度提升,2016 年以后計算醫學的機器學習領域熱點集中在了精準醫療領域,而最近的研究熱點則主要集中在深度學習。突現詞情況在某段時間內頻次變化率高的詞被稱為“突現詞”,突現詞往往反映了一個領域的研究前沿。對上個關鍵詞共現網絡進行突現詞分析,獲取變化率最高
55、的前 20 個關鍵詞,關鍵詞隨時間的變化也反映了研究前沿的變遷以及近期的研究前沿,見圖 15。圖 13:2010-2021 年計算醫學領域關鍵詞聚類圖譜關鍵詞聚類是指利用大量文獻中共同出現的關鍵詞對,有效地反映文本關鍵詞之間的關聯強度,以結構體的方式有效 地展現關鍵詞之間的關聯的分析方法。*IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式19圖 14:計算醫學各子領域研究 timeline 圖譜IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式20(三)小結計算醫學研究熱度持續上升,最近幾年在項目研發投入與文獻發布量上增速明顯,但相較于
56、美國,中國在計算醫療領域的研發投入整體較少。在國外,這些高校院系也成為了計算醫學的主要研究中心。相較而言,中國除中國科學院外,還沒有形成比較集中有影響力的計算醫學領域研究中心。研究內容上,模型研究、各類應用模式(表達、模擬、算法、識別、預測、分類)以及癌癥、系統等為計算醫學領域研究的核心。研究內容變化上呈現:從原有的理論、模型研究向應用領域研究發展;從數理統計算法研究向基于人工智能技術發展;從生物、解剖數學模型構建、到基于大數據驅動的計算基因再到精準醫療等臨床醫療應用發展。國家比較來看,中美兩國在計算醫學研究領域涉及面較廣,各類研究主題均有布局;印度主要側重在藥物發現,大部分國家包括德國、加拿
57、大、意大利等的研究關注點均集中在精準醫療、模型和機器學習。中國在精準醫療應用、模型、機器學習、個性化醫療、仿真模擬五個方面的研究關注度與美國差距較大。當下,計算醫學已經成為精準醫療的關鍵實現手段。圖 15:計算醫學領域關鍵詞突現情況-TOP20IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式21目前計算醫學相關院校對于計算醫學研究內容的分類不盡相同,主要有兩類。一種分類方法是從醫學視角出發,將計算醫學劃分為計算生理學、計算解剖學、計算病理學等,該種分類方法相當于做“+”,現有的醫學研究門類均可開展對應的計算科學門類研究。另一種分類方法主要是從基礎和臨床應用角度出發
58、,將共性的基礎性問題進行獨立的研究,主要是技術層面的內容,包括算法研究、數學建模等,臨床應用則與上述方法分類相似,但精細度上稍弱于前者。本文結合兩個維度,并依據時間發展順序,歸納了計算醫學的研究內容,見圖 16。(一)以模型構建為核心的計算醫學基礎研究1.計算解剖學-人體數學建模隨著影像學成像技術的不斷發展,圖像的質量不再是疾病診斷的限制條件。不過,精確識別健康個體和患病個體之間的解剖結構差異,仍然制約著醫療水平的發展18。想要了解健康狀態和疾病狀態下個體解剖結構形態之間的演變與差異,需要將人體解剖學和計算技術以及數學理論方法相結合,計算解剖學應運而生。計算解剖學涉及圖像處理、數字集合處理、數
59、學建模等技術,將人體解剖學數字化,加快了解剖學的發展腳步19。計算解剖學將個體的解剖學數據與人群中解剖學數據進行形態和功能的比較分析,從解剖學的角度實現疾病的診斷、治療評估以及預后判斷,是后續診斷治療的基礎性工作。早在上世紀 80 年代開始的可視人計劃作為計算解剖學的典型,推動了計算解剖學的快速發展??梢暼说闹饕芯績热菔菍⑷梭w的二維橫斷面切片圖像,經過計算機的數字化處理,形成人體解剖結構的數據資料。同時,利用三維重建技術,這些數據可以構建出更為直觀的人體結構三維立體形態20。因此,可視人應用的首要前提,是得到相對完整的人體結構數據集,美國、韓國、中國等國家在可視人數據集的采集等方面開展了研究
60、。1986 年,美國國立醫學圖書館(National Library of Medicine,NLM)開 展 了 可視 人 計 劃(The Visible Human Project,VHP),這是一項人體結構圖像數據庫開發的長期項目。該項目創建了公開、完整、詳細的人體 3D 解剖學圖像數據??梢暼四行詳祿?1994 年公布由 MRI、CT 和解剖圖像組成:MRI 圖像軸向間距為 4mm,圖像分辨率為 256256 像素,12 位灰度;CT 數據軸向間距為 1mm,圖像分辨率為 512512 像素,12 位灰度;四、計算醫學主要研究內容圖 15:計算醫學主要研究內容IMIT白皮書2021
61、年 07月 第21期計算醫學:數智時代的醫學發展新范式22解剖圖像數據軸向間距為 1mm,圖像分辨率為 20481216 像素,24 位彩色,男性數據集大小約為 15GB??梢暼伺詳祿?1995 年公布,數據集的特征與男性數據集相似,但解剖圖像的軸向間距縮小到0.33mm,共有 5189 張解剖圖像,數據集大小約為 40GB21。1998 年,NLM 的董事會報告肯定了可視人計劃的長期目標,即產生一個將視覺形式的知識與符號形式的知識相連接的知識結構系統。另外,NLM 還支持有關圖像數據集和工具的研究,從而為收集新的生物醫學知識提供了潛在可能。通過美國和國際研究伙伴的合作來開發和利用這些知
62、識,是對世界衛生的寶貴貢獻。到 1998 年,可視人數據集授權被全球 28 個國家的約 1000 個研究、學術和工業團隊使用。截至 2019 年 7 月,NLM 面向 66 個國家發放了大約 4000 個數據集的訪問許可。另外,自 2019 年起,VHP 數據集不再需要許可也可直接訪問。數據集主要用在以下幾個方面:(1)人體解剖學研究的參考;(2)用于測試醫學成像算法的公共領域數據;(3)用于構建網絡可訪問圖像圖書館的試驗臺和模型。VHP數據集廣泛應用于教育、診斷、治療計劃、虛擬現實、藝術、數學和工業領域。繼美國的可視人計劃之后,由于標本的人種差異、解剖部位缺乏、數據集不完整等原因,韓國于 2
63、000 年 7 月開展了一項為期 5 年的可視韓國人計劃(Visible Korean Human,VKH),旨在制作連續的切片圖像,從而對VHP 的數據進行補充,并且希望數據能夠促進 3D 圖像以及相關軟件的開發。韓國人的男性數據集包括了 MR、CT、解剖和分段圖像,共 197.5GB。MR 和 CT 圖像的間距為1mm,共 1718 張圖片,每張圖片分辨率為505276 像素,8 位灰度;解剖圖像的間距為 0.2mm,共 8590 張圖片,每張圖片分辨率為 30402008 像素,24 位彩色22-23。首 例 中 國 可 視 人(Chinese Visible Human,CVH)由第三
64、軍醫大學歷時 3 年完成,課題組于 2002 年 8 月完成數據集采集工作,并于 10 月完成計算機三維可視化研究工作。該數據集的標本為男性,連續橫斷面的層厚根據解剖部位有所不同:頭部和頸部的厚度為 0.5mm(其中顱底部為0.1mm),其他部位為 1.0mm,共有 2518個橫斷面,數據集大小為 90.468GB,2003年 2 月,我國完成了第一例中國女性數字化可視人的數據采集和研究,該數據集的聯系橫斷面層厚為:頭部 0.25mm,其他部位0.5mm,共有 3640 個斷面,數據集大小為131.04GB24。在張紹祥教授帶領下,陸軍軍醫大學數字醫學研究所目前已獲取了 8 例完整的數字化人體
65、全身數據集和心臟、肝臟、大腦以及膝關節等臟器的數據集,構建了男性、女性全身臟器的分割數據集和三維重建模型。研究所研究方向主要為數字解剖學和數字醫學,主要包括:一是基礎研究,根據數字人體的發展特點,研究數字人體相關生物數據的獲取、整合、知識表示,建立具有生物特性的中國數字人體模型,從事生物數學和生物醫學數學建模與分析方面的研究。二是應用研究,在數字人研究的不同階段,根據數字人模型的相關數據,開展數字解剖學的研究,建立數字解剖學平臺,研制能在國內外醫學院校推廣使用的用于人體解剖學教學的數字解剖學軟、硬件系統;結合數字人項目進行臨床技能虛擬仿真培訓系統的開發與研制、進行虛擬外科手術及術前計劃的設計等
66、方面的研究;研制能在計算機上模擬外科手術操作的軟、硬件系統,并將其推廣應用到各大醫院,進行外科手術的仿真設計、術前手術方案討論和外科醫生的手術培訓。數字解剖學和數字醫學為計算解剖學和計算醫學發展奠定了堅實基礎。2.計算生理醫學-系統機制模型定量分析IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式23計算生理醫學目標是發展疾病中生物系統的機制模型,通過建模思維將分子水平的信息整合到細胞、組織、器官和器官系統以實現對有機體、器官或系統的正常功能過程的定量理解。計算生理醫學通常將人體作為一個單一的復雜系統進行多層次建模研究,使用患者數據個性化這些模型,并將其應用于改善疾
67、病診斷和治療。當前,計算模型通常由疾病動物實驗模型中獲得的數據開發,然后使用有限的人類數據集進行轉化。實驗和建模以高度模塊化的方式進行,不同的生物過程被一一細化并詳細表征?;诓煌姆椒▽W,計算生理學在建模方式上存在著幾種不同的研究方向25:其一,是力學建模。從物理學的角度來看,人體內存在著許多物理場如傳輸速度、壓力、物質濃度和電勢,這些參數與將化學物質轉化為機械能及進一步活動的體內生化過程直接相關。因此,通過開發適當的計算模型,可以從理論上研究與力學耦合的質量傳輸和電生理學的整體問題。開發的力學網絡模型通常采用常微分方程耦合系統的形式,其中狀態是分子的濃度,可能包括它們的修正形式。模型方程被
68、求解,以觀察狀態在相互作用并對網絡輸入作出響應時是如何及時演化的。其他建模方法也被使用,包括隨機過程或隨機常微分方程,以捕獲過程隨機演化的方式,以及偏微分反應-擴散方程和基于代理的模型,在時間和空間中演化的過程。另一種機械網絡模型則描述了相互作用的分子及其濃度、作用速率、生化性質、影響因素,以及濃度時間變化。在網絡、通路和細胞水平上,機械模型中的狀態數量通常小于統計模型。這是因為很難通過實驗來測量某些狀態和反應速率,因此有必要對模型中應該包括哪些生物過程和成分作出假設。此類模型的維度相對較低,但它們的優勢是能夠預測生物系統在健康和疾病中的緊急行為,因為它們結合了系統組件相互作用的生物機制。計算
69、生理醫學的多層次建模方法可應用于癌癥、糖尿病、心臟和腦部疾病等的診療和疾病預測。以下列舉了幾個典型的應用:心血管生理模擬26:心血管模擬的開源軟件 SimVascular,主要用于從醫學圖像數據到三維模型的構建、網格劃分以及血流模擬等。其建模主要有 3 步,首先確定順著血管的中心線路徑,接著沿著每條路徑創建 2D分段,最后將各分段一起放樣來生成幾何模型。建模完成后,可以進行血流模擬仿真,計算時均血壓,時均壁切應力,振蕩剪切指數等。綜合人體生理學模型27:美國密西西比大學醫學中心開發了一種基于 Windows 的綜合人體生理學模型 HumMod。HumMod 根據從同行評審的生理學文獻中獲得的經
70、驗數據構建,由 5000 個變量組成,描述心血管、呼吸、腎臟、神經、內分泌、骨骼肌和代謝的生理學過程。HumMod 提供了一個建模環境來理解綜合生理學的復雜相互作用,有助于理解提出的生理機制和不明顯的生理相互作用,允許人們觀察復雜生理系統的更高級別的緊急特性。例如可用于分析腎臟對血壓的控制、肝臟在產生和維持胰島素抵抗中的核心作用,以及導致宇航員直立性低血壓的機制。用戶通過交互地改變數值參數和查看時間相關的反應來模擬不同的生理和病理生理情況。肝切除術中的應激反應模型28:在肝臟手術過程中,切除會誘發肝臟應激反應,這涉及信號通路和基因表達的調節。了解肝臟的信號網絡以及信號如何影響代謝、炎癥過程和再
71、生對于評估切除后的整體肝臟應激反應很重要。但由于信號通路是以非線性方式相互連接,涉及復雜的相互作用以及前饋和反饋回路,導致人們無法對信號網絡產生直觀IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式24理解。此時,通過數學建??捎糜诮忾_信號通路之間復雜的串擾,耦合信號和先天免疫反應的計算模型的使用可大大提高對物理損傷的即時肝臟應激反應的理解,并能夠將手術損傷程度與肝功能、炎癥反應和再生能力聯系起來。應用模型能夠根據手術損傷的程度和位置,預測肝臟對手術干預的反應以及與代謝或再生受損有關的可能的術后并發癥。(二)海量基因組學數據驅動的計算基因組學研究基因組學是一門將數據
72、驅動作為主要研究手段的學科,處理大規模的基因組學數據天然地需要借助計算機技術。機器學習方法和傳統的統計學方法在基因組學中的應用一直都比較廣泛。人類基因組計劃(Human Genome Project,HGP)于 1990 年正式啟動,其宗旨在于測定組成人類染色體(指單倍體)中所包含的 30 億個堿基對的核苷酸序列,從而繪制人類基因組圖譜。通過各國的協作,人類基因組的草圖在 2001 年發布,該草圖覆蓋了大約94%的人類基因組2930。拿到了人類基因組這個龐大的數據后,人和機器都無法直接讀懂,需要通過人類基因組的注釋,標記和鑒定出人類基因組中的功能區域和調控關系,才能更好地解碼人類基因組。為解碼
73、人類基因組,計算基因組學在此背景下誕生。早期的計算基因組學研究重點在應用相應的數理統計算法實現對基因的注釋與理解。例如在序列比對(sequence alignment)研究中,常用的方法為動態規劃算法(Dynamic Programming,DP)。比 如 全 局 比 對(Global alignment)和 局 部 對 比(Local alignment)都主要使用動態規劃算法3132。但對于基因組來說,序列比對的方法時間復雜度太大,需要更簡便的算法模型,后續提出的基本局部相似性比對搜索工具(Basic Local Alignment Search Tool,BLAST)是一個啟發式的局部比
74、對算法,是一套能在序列數據庫中進行相似性比較的分析工具,解決了這一問題33?;谛蛄斜葘Φ姆椒ㄊ抢脝蝹€序列中包含的特定信息來在基因組中尋找編碼蛋白序列的位置并推測其功能。而在基因組中,編碼蛋白質的序列具有一些共有的特征,比如都具有轉錄起始位點,外顯子,內含子,剪切位點等結構特征??梢岳眠@些編碼蛋白質序列的共有特征,通過統計模型來對編碼蛋白質的序列進行建模。隱馬爾可夫模型(Hidden Markov Model,HMM)在基因組注釋中扮演著極為重要的角色,特別是在基因預測(Gene prediction)方面。在基因預測中,隱馬爾可夫模型的隱藏狀態跟基因的標注相關(轉錄起始點,轉錄終止點,剪
75、切位點,外顯子,內含子)。在利用隱馬爾可夫模型進行基因預測時,輸入的是基因組的 DNA 序列,輸出的是序列的標注信息,從而對基因組進行注釋,鑒定出相關基因組中編碼蛋白質的基因34。研究表明,人類基因組中的絕大部分由非編碼區域組成。計算基因組學的研究人員正致力于通過計算和統計方法的發展以及通過 ENCODE(DNA 元素百科全書)等大型項目來了解人類基因組中非編碼區域的功能,鑒定出基因組中的調控元件,揭示基因間的調控關系35。此外,為了理解復雜的生命活動,僅理解對人類基因組中的編碼或非編碼基因,以及調控元件進行標注是遠遠不夠的。對于人體這樣一個由多種細胞組成的生物體,基因組的注釋并不能解釋蛋白表
76、達譜不同的各種細胞類型是如何從共享的同一套基因組中產生的問題。因此計算基因組學研究也從對基因的注釋向表觀基因組、轉錄組等領域發展,如路線圖表觀基因組計劃(Roadmap Epigenomics Project)36。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式25遺 傳 變 異(Genetic variation)是 生 物 多樣 性 的 基 礎。單 核 苷 酸 多 態 性(Single Nucleotide Polymorphism,SNP)主要是指在由單個核苷酸的變異所引起的 DNA 序列多態性。它是人類可遺傳的變異中最常見的一種,占 90%以上。國際單倍
77、體圖計劃(The International HapMap Project)和國際千人基因組計劃(The 1000 Genomes Project)繪制了詳盡的、具有巨大醫學應用價值的人類基因組遺傳多態性圖譜37-38。同時,全基因組關聯研究(Genome-Wide Association Studies,GWAS)可在全基因組范圍內,通過統計學方法將遺傳變異和可觀測的性狀(表型)相關聯,從而尋找與該性狀相關的遺傳因素。人類基因組遺傳多態性圖譜和全基因組關聯研究極大地推動了人們對復雜疾病遺傳基礎的了解,為提高疾病的診斷和治療打下了堅實的基礎?;蚪M,表觀基因組、轉錄組等組學測量方法的涌現帶來了
78、組學數據的激增,并進一步對組學數據處理方法提出了挑戰。組學數據的類型多種多樣,包括序列,類別信息,強度信息和圖像等,異構性較高。2015 年的開創性研究展示了深度神經網絡對 DNA 序列數據的適用性39-40,此后,利用深度神經網絡處理組學數據的出版物數量激增。Eraslan G 等41梳理了 168 篇相關文獻,全面地總結了目前深度學習在組學研究方面的應用。其中介紹了四種常見的網絡框架(前饋神經網絡、卷積神經網絡、循環神經網絡和圖卷積神經網絡)以及其適用的組學數據類型。同時也討論了針對多種數據集成的多任務學習和多模態學習;可跨領域應用的遷移學習在組學中的應用;以及在組學中包括變分自編碼器和生
79、成對抗網絡生成模型的應用。(三)基于人工智能技術的計算醫療應用研究人工智能(Artificial Intelligent,AI)在醫學領域的應用是計算醫學領域近年來發展最快的一個方向,顯著推動了醫療模式的進步與革新。AI 的發展依賴于海量的大數據。醫療數據中尤其是醫學影像數據,如 X 射線、計算機斷層成像(CT)、磁共振(MRI)、分子影像 PET 等產生的海量信息,為 AI 的發展提供有價值的科研及臨床數據。AI 可廣泛應用于疾病輔助診斷與診斷、提高醫學圖像質量、減低電離輻射、提供精準醫療建議以及減少醫療成本等方面。2012年以來,深度卷積神經網絡技術快速興起,推動了 AI的突破性的進展。深
80、度學習在生物醫學子領域的應用案例豐富,一系列綜述性的論文從各個維度給出了清晰的梳理42-47。大致上,AI 在生物醫學中的應用可以分為三個方向:(1)作為計算機輔助診斷,幫助醫生進行有效的早期診斷;(2)加強對患者的醫療護理,更好地進行個性化治療;(3)改善人類福祉,例如通過分析疾病傳播和社會行為與環境因素的關系,或實現用于控制輪椅的腦機接口48。以計算醫學研究最為廣泛的腫瘤學為例,人工智能技術在臨床腫瘤學中可應用于癌癥風險預測、篩查、診斷和治療。算法的復雜性通常由此類數據的數量、異質性和維數決定,其中有用的腫瘤學數據大致包括臨床表現、腫瘤分期、組織病理學、定性成像、腫瘤基因組學、患者基因組學
81、、定量成像、液體活檢、電子病歷、可穿戴設備來源等。不同環節中主要使用的數據各有側重,具體見下圖。比較經典的應用中,關于在診斷神經放射學中使用深度學習技術對腦腫瘤或繼發性病變進行分割,已經發表了許多相關文獻。例如,Charron 等人采用了現有的 3D CNN 算法(Deep-Medic)來檢測和分割正在接受立體定向治療的患者的 MRI 掃描中的腦腫瘤轉移情況,為在多模態 MR 圖像上識別和分割腦轉移瘤提供參考50。深度學習技術在IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式26腫瘤學中另一個非常重要的應用價值點是預測毒性、治療反應和預后,為臨床醫生提供有價值的決
82、策支持系統。在毒性預測方面,Pella 及其同事記錄了多名前列腺癌患者的臨床和劑量學數據,并對胃腸和生殖泌尿急性毒性進行評分,由此生成的神經網絡和基于 SVM 的解決方案顯示出相當的毒性預測準確性51。(四)面向精準醫療的計算醫學研究精準醫療是以個體化醫療為核心的醫學概念與模式。其關鍵是以患者為中心,綜合運用基因組技術、生物信息技術等前沿技術手段,精確定位患者的疾病發生發展原因,并明確疾病治療靶點,實現個性化的精確治療52。中山大學的研究團隊探索了利用計算機對鼻腔鼻竇精細化建模,并將其應用于精準手術設計。目前,在鼻科手術領域,利用基于計算流體力學的鼻腔全局氣流分析方法,結合三維重建技術,即可得
83、到鼻腔內不同解剖部位的壓強、溫度和濕度差異與變化,以及鼻腔中氣流的變化,從而進一步反映出鼻腔的生理功能如嗅覺、過濾、加濕加溫等與解剖結構特點之間的關系。通過計算機建模,還可以了解鼻腔的解剖結構改變對于鼻腔生理功能的具體影響與作用,從而明確鼻科手術中的禁區。在設計鼻科手術時,醫生需要為患者制定可以最大限度切除病灶,同時最大程度保留患者鼻腔生理功能的手術方案,利用計算醫學的建模技術以及計算流體力學技術,實現患者病灶部位的三維可視化,可以幫助醫生充分分析患者的患病情況,模擬手術過程,推演手術預后,最終為患者篩選出最佳的手術方案,為完成個性化精準手術創造了良好的條件53。在利用精準醫療手段治療惡性腫瘤
84、時,計算醫學的方法也起到了至關重要的作用。利用生物信息學中基于計算機算法的方法和原理,可以根據患者個體的具體情況和參數,來為惡性腫瘤患者選擇更有效的治療方案,提高患者的生存率和生活質量。將患者的基因型數據輸入預測抗癌藥物作用效果的計算模型中,模型可輸出該患者對單種或多種藥物的敏感性,從而幫助醫生篩選出最適合于該腫瘤患者的治療藥物,實現腫瘤患者的精準治療54。圖 17:基于 AI 技術的計算腫瘤學研究路徑49來源:Benjamin H.Kann,Ahmed Hosny,Hugo J.W.L.Aerts,Artificial intelligence for clinical oncology.J
85、Cancer Cell,Volume 39,Issue 7,2021,Pages 916-927.IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式27五、計算醫學學科建設情況為了應對醫學范式向計算醫學轉變帶來的挑戰,更好地推動計算醫學研究,世界各國的大學和科研機構紛紛成立計算醫學相關的機構。在國外,美國加州大學洛杉磯分校幾年前把原有的生物數學系,更名成為計算醫學系。約翰霍普金斯大學、斯坦福大學、牛津大學等高校都開設了相關課程。在這些大學和科研機構中,計算醫學或作為一個獨立的院系,或作為院系下的一個部門而存在。在我國,除了山東大學研究生專業出現計算醫學專業名稱外,其
86、他大學并沒有開設明確的計算醫學院系或專業,計算醫學研究的相關內容仍然主要劃歸在生物醫學工程、醫學信息學等專業或院系中,近兩年新出現的智能醫學工程則是聚焦于人工智能技術為驅動的醫學研究,可以算作計算醫學的一個子類。各個學校計算醫學相關機構的研究發展側重點也不一樣,下面舉例介紹中、美、英國幾所大學計算醫學相關的學科建設情況。(一)美國1.約翰霍普金斯大學(Johns Hopkins University)1)簡介約翰霍普金斯大學的計算醫學研究所隸屬于生物醫學工程系,其主要目標是開發人類疾病相關的定量計算模型,并讓這些模型能夠個體化應用,以改進疾病的診斷和治療。計算醫學研究所目前共有 19 名研究員
87、。計算醫學研究所還制定了一套體系性的計算醫學本科的授課課程。主要涉及大量計算機,應用數學,以及工程等專業內容。整個課程設計是順應了計算醫學“醫、工、信”交叉的特色,在培養過程中突出強調打牢學生的數學、信息學和工程學基礎,見圖 18。2)研究方向約翰霍普金斯計算醫學只是其生物醫學工程系中的一個研究方向,主要集中于研究各個醫學領域下的模型的構建。而機器學習與云計算、基因組學、醫學圖像信息處理等相關內容則在生物醫學工程系的其他研究方向中涉及,見表 5、表 655。圖 18:約翰霍普金斯大學計算醫學本科專業課程網絡來源:約翰霍普金斯官網,白皮書團隊整理IMIT白皮書2021 年 07月 第21期計算醫
88、學:數智時代的醫學發展新范式28表 5:約翰霍普金斯計算醫學研究所主要研究方向研究方向主要內容計算分子醫學Computational Molecular Medicine通過對分子網絡的結構以及其如何隨時間變化的深入理解,來改善臨床決策計算生理醫學Computational Physiological Medicine開發從分子,細胞再到組織和器官的多層次疾病模型并應用到醫療中計算解剖學Computational Anatomical Medicine應用數學理論來模擬解剖結構及其在健康和疾病中的變化計算醫療Computational Healthcare整合生物醫學信號處理、計算建模、機器學
89、習和醫療信息學等多個學科,通過電子健康記錄、生理狀態時序數據和基因組學信息來開發個性化醫療的新方法來源:約翰霍普金斯官網,白皮書團隊整理來源:約翰霍普金斯官網,白皮書團隊整理表 6:約翰霍普金斯其他生物醫學工程院系相關研究方向研究方向主要內容生物醫學數據科學Biomedical Data science其研究主要集中在開發新的數據分析技術來了解疾病的發病機制,以期用更低的成本來提供更好的醫療保健。主要的研究方向有:計算科學(Computational Science),融合計算機科學、數學和生物醫學工程,推動計算技術的進步來解決個性化醫療中的問題;機器學習與數據科學(Machine Learn
90、ing and Data Science),使用機器學習從大量數據集中提取符號和本體信息;生物醫學數據(Biomedical Data),將生物醫學數據與高性能計算相結合,使用機器學習和人工智能的工具來分析 TB級別數據??茖W即服務(Science as a Service),基于云技術提供共享數據集和工具,將科學解決方案集成在軟件中等?;蚪M學與系統生物學Genomics&Systems Biology通過開發新的計算和實驗方法,對基因組進行系統分析,來建立跨越時間和空間尺度的模型,并利用合成生物學設計新的生物醫學系統。其研究的主要方向有:基因組的組裝(Genome Assembly)、轉錄
91、組與 RNA測序(Transcriptomics and RNA Sequencing)、個體基因組學與數據建模(Personal Genomics and Data Modeling)、基因組和表觀基因組工程(Genomic and Epigenomic Engineering)、納米孔測序(Nanopore Sequencing)、細胞工程(Engineering Cell Fate)、合成生物學(Synthetic Biology)成像和醫療設備Imaging&Medical Devices主要研究內容包括:成像技術:光學、X射線、CT、MRI、超聲和分子成像;圖像分析:圖像配準和重建;
92、從圖像數據中提取知識;新型醫療器械:由臨床需求驅動的診斷和治療器械。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式29個人簡介:Raimond L.Winslow 是約翰霍普金斯生物醫學工程教授,1978 年在伍斯特理工學院獲得電氣工程學士學位,1985 年在約翰霍普金斯大學醫學院獲得生物醫學工程博士學位。他被公認為計算醫學新領域的創始人,該領域使用分子生物學、生理學和疾病解剖學的創新計算模型來理解、診斷,治療疾病,改善病人護理。他對從定量模型的角度理解心臟病的興趣導致了計算醫學作為一門學科的發展。研究方向:他開發了基于實驗的計算模型,并將其應用于深入了解心律失
93、常的分子基礎。具體而言,他研究心肌細胞中細胞內信號傳導、代謝和電興奮性的計算模型;生物醫學數據表示和數據庫設計;網格計算和數據共享;健康和疾病中心臟功能的綜合建模;心血管信息學。他的研究團隊的眾多成就之一是率先使用彌散張量磁共振成像(DTMRI)重建心室的幾何結構和纖維結構,DTMRI 現在已成為以高空間分辨率測量心臟纖維結構的標準方法。個人主頁:https:/www.bme.jhu.edu/people/faculty/raimond-l-winslow/個人簡介:Michael I.Miller 是約翰霍普金斯大學生物醫學工程系主任。Michael I.Miller 于 1976 年在紐約
94、州立大學石溪分校獲得學士學位,并分別于 1978 年和 1983 年在約翰霍普金斯大學獲得生物醫學工程碩士和博士學位。Miller 博士曾在圣路易斯華盛頓大學任生物醫學工程教授,并于 1998 年加入約翰霍普金斯大學,并在隨后任影像科學中心的主任。2017 年 Michael I.Mille 被任命為生物醫學工程系主任。研究方向:在計算醫學領域,Miller 開創了眾多診斷和理解神經退行性疾病的前沿技術。Michael I.Miller 的研究集中在人類大腦在正常和疾病狀態下的結構和功能特征。通過開發分析患者腦部掃描的新工具,Miller 致力于在出現臨床癥狀的數年前預測神經系統疾病的發生風險
95、。他的實驗室目前正在設計基于云的方法來構建和共享與神經精神疾病相關的大腦圖像庫-以及用于理解它們的算法。個人主頁:https:/www.bme.jhu.edu/people/faculty/Michael-I.-Miller/3)主要學者Raimond L.WinslowMichael I.MillerIMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式30表 7:UCLA 計算醫學系臨床科學主要研究方向研究方向主要內容醫療中的 AIAI in Medicine該研究領域使用機器學習和人工智能的方法去分析醫療活動中產生的大量數據。該研究領域中的項目開發方法識別高危病例
96、,提高診斷速度和準確性,預測治療結果和副作用,以降低醫療費用?;蚪M學+健康Genomics+Health該研究領域重點將病患的基因組信息與電子健康記錄整合起來,開發新的算法,將基因組學的信息應用到醫療決策中,以改善醫療的各個環節。區塊鏈與醫學安全計算Blockchain and Secure Computation in Medicine主要研究利用密碼學、可擴展計算、人工智能和醫學方面的綜合專業知識,開發滿足隱私保護和數據共享政策要求的基因組和醫學數據分析技術,例如差分隱私算法等。表 8:UCLA 計算醫學系基礎科學主要研究方向研究方向主要內容計算基因組學Computational Gen
97、omics將計算機科學和統計學中的知識和方法應用到基因組學中,用來解決基因組學中遇到的問題。研究內容主要包括:開發方法識別與疾病相關的遺傳位點(genetic loci)、變異體(variants)和相關基因(genes)。開發方法注釋和理解非編碼基因。疾病遺傳學(disease genetics)、群體遺傳學(population genetics)、表觀基因組學(epigenomics)、調控基因組學(regulatory genomics)、微生物組學(microbiome)和單細胞分析(single-cell analysis)等。來源:UCLA 計算醫學官網,白皮書團隊整理2.加州大
98、學洛杉磯分校(University of California,Los Angele,UCLA)1)簡介加州大學洛杉磯分校的計算醫學系作為一個獨立的院系,其前身是擁有 40 多年歷史的生物數學系。計算醫學系的成立是為了應對兩次最近發生的、能改變醫療本身的科學革命-基因組革命和大數據革命?;蚪M革命使得收集數百萬患者的基因組數據成為可能,在數據端推動了醫學的發展;大數據革命促進人工智能等數據處理方法的發展,使數據能被更好地利用,在工具端推動醫學的發展。計算醫學系在加州大學洛杉磯分校內部和醫學院、醫院以及工程學院緊密合作,目前計算醫學系共有 25 位教授(研究員)。2)研究方向UCLA 的計算醫學
99、系主要分為臨床科學和基礎科學兩個方向,各自方向又有細分的子領域。兩個研究方向都強調機器學習方法的應用和基于基因組數據的研究。臨床科學(Clinical Science)在臨床科學中,目前主要面臨的挑戰是如何利用大量的高維數據,包括各種基因組學數據、電子健康記錄、可穿戴設備監測數據、影像學數據,來協助臨床醫療。該子領域下UCLA 設置了三個主要研究方向56:基礎科學(Basic Science)基礎學科側重于臨床應用中的基礎性共性問題,包括醫學影像基礎研究、醫學數據機器學習方法等,數學建模、計算基因組學等內容57:IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式31
100、個人簡介:Eleazar Eskin是加州大學洛杉磯分校計算醫學系(UCLA Department of Computational Medicine)的首任主席,是計算機科學和人類遺傳學教授。Eleazar Eskin 于 1997 年在芝加哥大學獲得數學、經濟學和計算機科學的學士。并分別于 2000 年和 2002 年在哥倫比亞大學獲得計算機科學碩士和博士學位。曾經在加州大學圣迭戈分校做過博士后研究。隨后在加州大學洛杉磯分校計算機科學系工作。研究方向:Eleazar Eskin 的研究關注于計算遺傳學,即開發并應用計算機科學、統計學和生物信息學的方法來理解遺傳變異和性狀之間的關系。Elea
101、zar Eskin 的研究組開發了一系列全基因組關聯研究(GWAS)相關的工具,有助于發現疾病相關的變異位點。同時,研究組也開發了針對人類疾病的小鼠模型的相關工具。個人主頁:https:/compmed.ucla.edu/member/eskin-phd3)主要學者來源:UCLA 計算醫學官網,白皮書團隊整理Eleazar Eskin研究方向主要內容醫學影像學Medical Imaging該領域研究跨越了好幾個學科領域:從成像物理到三維圖像的重建和處理,再到基于機器學習和統計推斷的決策。該領域的研究可提高診斷準確性,優化醫療決策,并更好地理解疾病。該領域需要多種數學建模、估計和推理技術,尤其是
102、幾何相關的方法。醫療健康數據的機器學習Machine Learning on Health Data該研究領域將人工智能、機器學習用到醫療健康數據的分析中來,用來改進醫療。開展的相關研究包括用眼睛的醫學圖像來預測視網膜相關功能、根據電子健康記錄預測術后死亡率、用傳感器的數據來預測抑郁癥等。數學建模Mathematical Modeling該研究領域利用生物數學建模為生物學相關的問題提供理論框架,比如:如何量化不同生理條件下的病毒感染、理解移植后干細胞的再生、深入理解癌癥的生長和治療、量化細胞信號傳導途徑中不同分子因素的影響、量化血管病變和其對組織生長及死亡的影響等。3.密歇根大學(The Un
103、iversity of Michigan)1)簡介密歇根大學并沒有獨立的計算醫學系,而是設有計算醫學和生物信息學系。設立該系旨在通過開發新穎和有影響力的信息學和計算相關的方法工具,用于基礎和臨床研究。該系共 36 位研究員,其研究強調從基因型到表型(Genome to Phenome)以及從表型到基因型(Phenome to Genome),致力于揭示致病的具體分子機制。2)研究方向計算醫學和生物信息學系的研究主要可分為兩個部分:一是作為基礎的生物學背景研究,續上表IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式32表 9:密歇根大學計算醫學和生物信息學系主要研究
104、方向研究方向主要內容基因組學、調控基因組學和表觀基因組學研究內容主要包括:人類基因組的結構、功能和進化,以及其在生物性狀多樣性和疾病中的作用。DNA 序列中的調控元件(調控基因組學)、以及染色質和 DNA 上的化學修飾(表觀基因組學)對基因活性(時間、數量和變體)的調控。最終的目的是揭開人類基因組如何定義種群、個體及其健康的秘密。代表著信息儲存端的研究。蛋白質結構、蛋白質組學和可變剪接研究內容主要包括:從氨基酸序列預測蛋白質結構,從結構預測蛋白質功能;使用實驗方法來測量,并使用模擬和數學模型來預測調控網絡中的蛋白質的相互作用;基于蛋白質結構和功能,使用信息學工具來模擬和建模,促進藥物設計和發現
105、;利用蛋白質組學和信息學工具分析翻譯后修飾;研究差異表達的可變剪切異構體在癌癥相關通路中的作用;開發計算方法來處理和提取蛋白質組中的生物信息;代表著執行分子元件端的研究。二是相關的臨床應用?;A的生物學背景研究包括基于還原論分別針對信息存儲端(基因組,表觀基因組)和執行元件端(蛋白質)的進行分析,或基于系統論對多組學進行整合分析。相關的臨床應用主要是將生物信息學和計算生物學的理論和方法應用到精神疾病和其他復雜疾病中,見圖 1958。圖 19:密歇根大學整體研究圖示來源:密歇根大學計算醫學和生物信息學系官網介紹IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式33個人
106、簡介:Brian Athey 是密歇根大學醫學院及醫院系統計算醫學 和 生 物 信 息 學 系(Department ofcomputational medicine and bioinformatics in University of Michigan Health Systems)主任,也是精神病學和內科教授。Brian Athey 于 1990 年在密歇根 大學獲得細胞和分子生物學博士學位,并接受了高分子結構生物學家的培訓。Brian Athey 在密歇根大學工作了 37 年,于 1994 年加入醫學院。他是密歇根州臨床與健康研究所(MICHR)的創始人,并在該所擔任生物醫學信息學主任
107、 11 年。他曾擔任密歇根大學醫學院及醫院系統首席信息官(2010-2012 年),也曾擔任 UM 醫學院學術信息學主任(2009-2011 年)。2015 年至2018 年,他還擔任了密歇根數據科學學院(MIDAS)的聯合創始人和聯合主任。Brian Athey 一直擔任中國香港大學(CUHK-CZ)的顧問,也是深圳大數據研究所(SRIBD)的成員。他也是美國醫學信息學學院(FACMI)的當選院士。來源:密歇根大學計算醫學和生物信息學系官網,白皮書團隊整理研究方向主要內容多組學的整合研究該領域的研究整合來自基因組學、轉錄組學、蛋白質組學、代謝組學等學科的知識,以求對生命活動及疾病有更全面深刻
108、的理解。在多組學的整合中,涉及到整合工具的開發以及數據和方法的生物學可解釋性。系統生物學與網絡分析該領域的研究包括:基于網絡、系統與控制以及多元統計等理論,使用計算和統計的方法來研究造成基因組組織動態變化的網絡結構和功能基礎;在細胞命運分化、組織發育和代謝組學中的網絡分析;利用分子動力學、計算模型和科學計算來深入了解蛋白質聚集和蛋白質折疊相關疾病等。生物醫學數據科學、轉化生物信息學和藥物基因組學該領域的研究包括:開發疾病過程相關的動態遺傳網絡模型,并使用計算模型來理解基因剪接;設計傳感器來收集和分析生理信號和圖像并分析這些數據來支持臨床決策;使用數學建模和模擬生成實驗驗證的晝夜節律模型,并將機
109、器學習算法用于臨床圖像數據和基因分型數據的分析等;計算生物學中的方法學該領域的研究包括:大規模關聯分析、meta 分析和缺失值填充;分析現代測序方法不易解析的基因組復雜區域;多組學數據的整合算法;模式識別與基因組學數據的進化學分析;開發處理和分析復雜蛋白質組數據集的計算方法;開發信號/圖像處理和機器學習方法,以創建計算機輔助的臨床決策支持系統等。在復雜遺傳疾病中的應用該領域的研究將生物信息學和計算生物學的理論和方法應用到復雜疾病的診斷和治療中,相關疾病包括:阿爾茨海默?。ˋlzheimers Disease)、癌癥(Cancer)、糖尿?。―iabetes)、精神障礙(Mental disor
110、ders)、代謝性疾病和肥胖(Metabolic diseases and obesity)、腎臟疾?。≧enal diseases)、皮膚?。⊿kin diseases)、藥物濫用(Substance abuse)等。Brian Athey3)主要學者續上表IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式34聯的遺傳背景,目的是了解其病因,為新藥物靶點的發現提供基礎。(三)中國1.山東大學1)簡介山東大學的計算醫學專業由臨床醫學院開設。該專業招收三年制碩士研究生,其培養目標是培養具有在醫學和信息科學領域開展交叉研究能力,能熟悉應用信息技術解決醫學問題、適合到科研
111、單位與高校從事應用基礎研究或到企業開發新產品的高級專門人才。2)研究方向(二)英國1.劍橋大學(University of Cambridge)1)簡介劍橋大學的計算醫學部門隸屬于劍橋大學臨床醫學院的醫學系。醫學系共設有 12 個與人類疾病相關的部門,計算醫學部門是這12 個部門中的一個,目前共 4 位研究員。2)研究方向59開發統計學工具,以確定不同疾病關聯的遺傳背景,然后將疾病與基因、細胞類型、激發條件聯系起來,最終確定疾病的生物學通路。使用統計學方法來研究與自身免疫性疾病關表 10:山東大學計算醫學專業主要研究方向60研究方向主要內容三維造型與可視計算該研究領域包括:1.利用影像數據(M
112、RI,CT)構造三維虛擬人體模型。2.數字化可視人體的應用研究,建立能反映人體解剖、物理、生理和生化特性的數字人計算神經科學該研究領域利用計算機算法和數學分析的方法,對包括宏觀和微觀水平的神經系統的解剖學和影像學海量數據進行分析處理,研究和解決神經科學領域的問題。虛擬手術該研究領域利用計算機圖形學與虛擬現實等計算機技術,來模擬、指導醫學手術所涉及的各種過程。智能醫學信息處理該研究領域在醫院管理信息系統、醫學影像儲存與通信系統和遠程醫學等的平臺和基礎上,基于機器學習和數據挖掘等理論和技術開展深層次的智能醫學數據分析與處理,為臨床診療和醫學研究提供技術和方法支持。研究方向:Brian Athey
113、是藥物基因組學(pharmacogenomics)研究領域的領導者,也是藥物表觀基因組學(pharmacoepigenomics)的創建者之一。Brian Athey 的研究通過定義一類新的基因組特征,為藥物基因組學檢測提供信息。他現階段的研究側重于使用生物信息學和機器學習方法,從根本上提高精神類藥物的療效即使患者能夠服用最有效的藥物來治療疾病,并遭受最少的副作用。個人主頁:https:/athey.lab.medicine.umich.edu/來源:山東大學官網,白皮書團隊整理IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式352.浙江樹人大學浙江樹人大學樹蘭國
114、際醫學院在臨床本科階段開設了計算醫學課程,在國內屬于較早地將計算醫學內容引入到臨床醫學本科教學中來的院校。該課程的授課教師團隊具有多學科背景,分別來自樹蘭醫療集團、浙江數字醫療衛生技術研究院以及浙江樹人大學樹蘭國際醫學院和信息科技學院。課程設置基于臨床醫學本科教育的知識體系,緊扣計算醫學的發展趨勢,以人工智能技術、計算基因組學、醫療信息學等為主要內容。該課程的開設貫徹了浙江樹人大學打造“醫工信”平臺的建設目標。(四)小結為了應對醫學范式向計算醫學轉變帶來的挑戰,世界各國的大學和科研機構紛紛成立計算醫學相關的機構,大多數計算醫學院系前身為計算生物、生物數學系,生物醫學工程系等,學科建設仍在持續發
115、展過程中。盡管各個學校將建立的院系或開設的專業冠以“計算醫學”之名,但其研究的內容和側重點各不相同。加州大學洛杉磯分校的計算醫學系強調機器學習和基因組學,即利用機器學習的方法去分析醫療相關的大數據或基于基因組的信息輔助診斷和治療。除此以外,計算醫學系的研究方法還涉及到影像學和對生物問題的數學建模。密歇根大學的計算醫學和生物信息學系與生物學結合的更加緊密,強調在對生物醫學研究問題深刻理解的情況下,使用計算的方法來解決問題。因此,密歇根大學的計算醫學和生物信息學系的研究主要是基于基礎生物學問題的研究(信息儲存端的基因組,執行元件端的蛋白質,以及多組學整合分析和系統生物學),并利用計算生物學的方法,
116、將相關的生物學知識應用到疾病中診斷和治療中。約翰霍普金斯大學的計算醫學只是生物醫學工程系的一個研究方向,主要關注的是使用數學建模的手段來開發疾病相關的模型、模擬解剖結構等。而將機器學習相關的內容歸類于生物醫學數據科學方向,與基因組學的相關內容歸類于基因組學與系統生物學方向,和醫學影像學相關的內容歸類于成像和醫療設備方向。劍橋大學的計算醫學部門隸屬于劍橋大學臨床醫學院的醫學系,規模比較小,主要是基于生物學背景知識,開發統計學工具,并應用到疾病分子機制鑒定以及藥物開發中。山東大學開設的計算醫學專業主要是基于解剖學和影像學的數據,利用計算機圖像、圖形學知識來進行建模,以協助醫學教學、疾病的診斷和治療
117、。綜合來看,目前各高校計算醫學的學科建設主要涵蓋了三個方向:基于生物學背景知識(特別是組學知識),開發計算工具(特別是統計學方法),揭示疾病的分子機制,輔助疾病的診斷、治療以及新藥的開發。在醫療相關數據快速積累的情況下,利用機器學習的方法加速疾病的診斷和治療。對人體或者生物系統進行數學建模(動力學模型,幾何相關的三維模型)。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式36六、計算醫學發展展望計算醫學的發展有望實現關于健康、疾病的量化理解,帶來醫學發展范式的變革,但與主流學術領域相比仍處于邊緣的位置。作為多學科交叉的新興學科,其研究門檻較高,通常需要數學專家、計
118、算機專家和醫學學者共同參與,人才培養周期長。為推動計算醫學研究與人才培養應重視并加強計算醫學研究院學科建設?,F有的模型對現實情況的模擬仍然是不充分的,在找到能夠定義虛擬世界與經驗世界之間聯系的工具,尤其是計算機仿真模型的有效性仍然是困難。隨著基因組學、醫學成像、診斷技術和轉化醫學方面的不斷發展,人工智能的深度融合,共性服務、共性平臺、公共設施的不斷完善,將為我們開發癌癥、遺傳疾病和傳染性疾病的診斷工具和新療法創造了可能性。計算醫學作為關鍵的融合手段,將構建人體“數字孿生”,實現精準健康維護,讓個性化醫療照進現實。IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式37
119、1 Bukowski R,Schulz K,Gaither K,et al.Computational Medicine,Present and the Future:Obstetrics and Gynecology PerspectiveJ.American Journal of Obstetrics and Gynecology,2020,224(1).2 Winslow,Raimond L.,et al.Computational medicine:translating models to clinical care.Science translational medicine 4.
120、158(2012):158rv11-158rv11.3 https:/med.nyu.edu/departments-institutes/computational-medicine/EB/OL.4 Zhi Xie,“Computational Medicine”,Current Molecular Medicine 2020;20(6).5 https:/ 張思瑋.計算醫學:跑在超算上的醫學 N.中國科學報,2020-03-02(003).7 http:/ https:/cordis.europa.eu/project/id/7331619 https:/cordis.europa.eu/
121、project/id/825111EB/OL.10 https:/app.dimensions.ai/details/grant/grant.7158985EB/OL.11 http:/projectreporter.nih.gov/project_info_description.cfm?aid=9484172EB/OL.12 http:/gtr.rcuk.ac.uk/project/58247AB2-5469-42E7-9AA4-A2371737FB85EB/OL.13 http:/projectreporter.nih.gov/project_info_description.cfm?a
122、id=9885552EB/OL.14 http:/gtr.rcuk.ac.uk/project/5EB25D84-92E1-47A9-B31B-A8CBC98DD105EB/OL.15 https:/gtr.ukri.org/projects?ref=MR/L016311/1EB/OL.16 https:/cordis.europa.eu/project/id/846636EB/OL.17 https:/gtr.ukri.org/projects?ref=ES/T012986/1EB/OL.18 Winslow R,Trayanova N,Geman D,et al.Computational
123、 Medicine:Translating Models to Clinical CareJ.Science translational medicine,2012,4:158rv11.19 吳仲樂.數字腦計算解剖學方法及 GPU 技術應用的研究 D.東南大學,2005.20 呂婷.數字人體研究及其應用 J.中國組織工程研究,2010,014(048):9041-9045.21 National Library of Medicine.The Visible Human ProjectEB/OL.https:/www.nlm.nih.gov/research/visible/visible_h
124、uman.html.22 Kim J Y,Chung M S,Hwang W S,et al.Visible Korean human:another trial for making serially sectioned imagesC.Medical Imaging:Visualization,Image-guided Procedures,&Display,2002.23 Jin S P,Min S C,Hwang S B,et al.Visible Korean human:improved serially sectioned images of the entire bodyJ.I
125、EEE Transactions on Medical Imaging,2005,24(3):352-360.24 張紹祥.中國數字化可視人體研究進展 J.中國科學基金,2003,17(001):4-7.25 Raimond L.Winslow et al.Computational Medicine:Translating Models to Clinical Care.JSci Transl Med 4,158rv11(2012).26 http:/simvascular.github.io/EB/OL.27 Hester R,Brown A,Husband L,et al.HumMod:
126、A Modeling Environment for the Simulation of Integrative Human PhysiologyJ.Frontiers in Physiology,2011,2:12.28 Christ B,Dahmen U,Herrmann K-H,Knig M,Reichenbach JR,Ricken T,Schleicher J,Schwen LO,Vlaic S and Waschinsky N.Computational Modeling in Liver Surgery.J Front.Physiol.2017:(8:906).參考文獻IMIT白
127、皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式3829 Lander E S,Linton L M,Birren B,et al.Initial sequencing and analysis of the human genomeJ.2001.30 Venter J C,Adams M D,Myers E W,et al.The sequence of the human genomeJ.science,2001,291(5507):1304-1351.31 Needleman S B,Wunsch C D.A general method applicable to
128、the search for similarities in the amino acid sequence of two proteinsJ.Journal of molecular biology,1970,48(3):443-453.32 Smith T F,Waterman M S.Identification of common molecular subsequencesJ.Journal of molecular biology,1981,147(1):195-197.33 Altschul S F,Gish W,Miller W,et al.Basic local alignm
129、ent search toolJ.Journal of molecular biology,1990,215(3):403-410.34 Stanke M,Waack S.Gene prediction with a hidden Markov model and a new intron submodelJ.Bioinformatics,2003,19(suppl_2):ii215-ii225.35 Snyder M P,Gingeras T R,Moore J E,et al.Perspectives on ENCODEJ.Nature,2020,583(7818):693-698.36
130、Bernstein B E,Stamatoyannopoulos J A,Costello J F,et al.The NIH roadmap epigenomics mapping consortiumJ.Nature biotechnology,2010,28(10):1045-1048.37 International HapMap 3 Consortium.Integrating common and rare genetic variation in diverse human populationsJ.Nature,2010,467(7311):52.38 1000 Genomes
131、 Project Consortium.A global reference for human genetic variationJ.Nature,2015,526(7571):68.39 Alipanahi,B.,Delong,A.,Weirauch,M.T.&Frey,B.J.Predicting the sequence specificities of DNA-and RNA-binding proteins by deep learning.Nat.Biotechnol.33,831838(2015).40 Zhou,J.&Troyanskaya,O.G.Predicting ef
132、fects of noncoding variants with deep learning-based sequence model.Nat.Methods 12,931934(2015).41 Eraslan G,Avsec,Gagneur J,et al.Deep learning:new computational modelling techniques for genomicsJ.Nature Reviews Genetics,2019.42 Mahmud,M.;Kaiser,M.;Hussain,A.;Vassanelli,S.Applications of Deep Learn
133、ing and Reinforcement Learning to Biological Data.IEEE Trans.Neural Netw.Learn.Syst.2018,29,20632079.43 Cao,C.;Liu,F.;Tan,H.;Song,D.;Shu,W.;Li,W.;Zhou,Y.;Bo,X.;Xie,Z.Deep Learning and Its Applications in Biomedicine.Genom.Proteom.Bioinform.2018,16,1732.44 Rav,D.;Wong,C.;Deligianni,F.;Berthelot,M.;An
134、dreu-Perez,J.;Lo,B.;Yang,G.Z.Deep Learning for Health Informatics.IEEE J.Biomed.Health Inform.2017,21,421.45 Jones,W.;Alasoo,K.;Fishman,D.;Parts,L.Computational biology:Deep learning.Emerg.Top.Life Sci.2017,1,257274.46 Angermueller,C.;Prnamaa,T.;Parts,L.;Stegle,O.Deep learning for computational biol
135、ogy.Mol.Syst.Biol.2016,12,878.47 Min,S.;Lee,B.;Yoon,S.Deep Learning in Bioinformatics.Brief.Bioinform.2016,18,851869.48 Alvarado-Daz,W.;Lima,P.;Meneses-Claudio,B.;Roman-Gonzalez,A.Implementation of a brain-machine interface for controlling a wheelchair.In Proceedings of the 2017 CHILEAN Conference o
136、n Electrical,4 Electronics Engineering,Information and Communication Technologies(CHILECON),Pucon,Chile,1820 October 2017;pp.16.49 Benjamin H.Kann,Ahmed Hosny,Hugo J.W.L.Aerts,Artificial intelligence for clinical oncology.JCancer Cell,Volume 39,Issue 7,2021,Pages 916-927.50 Charron O,Lallement A,Jar
137、net D,Noblet V,Clavier JB,Meyer P.Automatic detection and segmentation of brain metastases on multimodal MR images with a deep convolutional neural network.Comput Biol Med.(2018)95:4354.doi:10.1016/pbiomed.2018.02.004IMIT白皮書2021 年 07月 第21期計算醫學:數智時代的醫學發展新范式3951 Pella A,Cambria R,Riboldi M,Jereczek-Fo
138、ssa BA,Fodor C,Zerini D,et al.Use of machine learning methods for prediction of acute toxicity in organs at risk following prostate radiotherapy.Med Phys.(2011)38:285967.doi:10.1118/1.358294752 賴麗娜,周小青,鄭彩杏.精準醫學影響下的中醫計量診斷模型探討 J.環球中醫藥,2021,14(7):1263-1266.53 吳碩,王培基,謝迭來,et al.鼻腔鼻竇精細化建模及其在精準手術設計中的應用展望 J
139、.臨床耳鼻咽喉頭頸外科雜志,2020,34(10):952-954.54 顧兆偉,張立忠,劉曉峰,et al.抗癌藥物作用預測計算方法的研究現狀與展望 J.生物信息學,2020,18(01):16-21.55 https:/www.bme.jhu.edu/research/research-areas/EB/OL.56 https:/compmed.ucla.edu/clinical-scienceEB/OL.57 https:/compmed.ucla.edu/basic-scienceEB/OL.58 https:/www.medicine.umich.edu/dept/computational-medicine-bioinformaticsEB/OL.59 https:/www.med.cam.ac.uk/computational-medicine/EB/OL.60 https:/