1、中國AI制藥企業白皮書丨2023/11中國中國AI制藥企業白皮書制藥企業白皮書White Paper on Chinese AI Pharmaceutical Enterprises成都高投生物醫藥園區管理有限公司藥融云數字科技(成都)有限公司總編輯:王中健2023年11月30日2023中國AI制藥企業白皮書丨2023/11免責聲明免責聲明DISCLAIMER本報告基于本公司(藥融云數字科技(成都)有限公司)及其研究人員認為可信的公開資料和文獻,反映了研究人員的研究觀點,結論不受任何第三方的授意或影響。但本公司對這些信息的真實性、準確性、可靠性和完整性不作任何保證,且本報告中的資料、意見、預測
2、均反映報告初次公開發布之前的判斷,可能會隨時調整。本公司可在不發出通知的情形下對本報告所含信息做出修改,讀者應當自行關注相應的更新或修改。本報告所有的信息或觀點僅作為讀者的參考,不構成任何投資、法律、會計或稅務的建議,也不構成任何廣告或要約。在任何情況下,本公司不對任何人因使用本報告中的內容所致的損失承擔任何責任。本報告相關的知識產權歸本公司所有。未經本公司事先授權,任何人不得對本報告進行任何形式的翻譯、發布或復制。如需引用,應注明出處為“藥融云數字科技(成都)有限公司”以及“中國AI制藥企業白皮書”名稱,且不得對本報告進行有悖原意的刪節或修改。如需聯系本公司,請聯系:。2中國AI制藥企業白皮
3、書丨2023/11編制說明編制說明作為近年來技術變革的重要力量,AI在生物醫藥領域展示了極大的應用潛力。國家發改委2022年發布的“十四五”生物經濟發展規劃提出,要利用云計算、大數據、人工智能等信息技術,對治療適應癥與新靶點驗證、臨床前與臨床試驗、產品設計優化與產業化等新藥研制過程進行全程監管,實現藥物產業的精準化研制與規?;l展。隨著AI浪潮席卷全球,生物制藥也被視為大模型有望率先落地的場景之一?;诖?,2023年10月,成都高投生物醫藥園區管理有限公司聯合藥融云數字科技(成都)有限公司,共同編寫了中國AI制藥企業白皮書,希望為業界廠商、政府機構等相關方提供有益思考,共同推動產業高質量發展。
4、由于時間倉促,水平所限,我們的工作還有不足之處。下一步,我們還將廣泛采納各方面的建議,進一步深入相關研究,持續完善白皮書內容,在已有版本的基礎上,適時修訂發布新版。3出 品 方:總 編 輯:副總編輯:責任編輯:執行主編:副 主 編:編寫專家:版面設計:2023年11月藥融云數字科技(成都)有限公司成都高投生物醫藥園區管理有限公司王中健肖海波 戴祁 江丹張禎杰王婷賴慶剛 李亞玲 楊建云王婷 衡星 黃镕 梁崇晟陳悅中國AI制藥企業白皮書丨2023/114中國AI制藥企業白皮書丨2023/115中國AI制藥企業白皮書丨2023/11目目 錄錄第一章第一章 人工智能(人工智能(AI)制藥行業概覽)制藥
5、行業概覽人工智能的基本概念AI制藥是AI產業化中重要的應用場景AI制藥行業發展歷史AI制藥行業配套政策分析AI制藥行業投融資現狀分析第二章第二章 AI+藥物發現藥物發現AI助力藥物發現階段概覽AI助力藥物靶點發現與驗證AI驅動藥物分子設計、優化AI輔助藥物分子篩選第三章第三章 AI+臨床前研發臨床前研發AI助力藥物臨床前研發概覽AI輔助藥物理化特性預測AI輔助藥物劑型設計AI助力藥物ADMET性質預測AI+臨床前研發國內企業布局第四章第四章 AI+臨床研發臨床研發AI助力新藥臨床試驗概覽AI助力受試者招募管理AI助力預測臨床試驗效果AI助力臨床試驗數據管理AI賦能藥物注冊申報第五章第五章 AI
6、+藥物生產及商業化藥物生產及商業化AI賦能藥物生產支持AI賦能藥物市場開拓與商業化AI逐步應用于藥物警戒領域第六章第六章 AI制藥行業總結及未來展望制藥行業總結及未來展望現狀分析及展望上市企業商業化模式全球主要AI制藥上市企業091011131416162334383839404246505357596165677073746中國AI制藥企業白皮書丨2023/11英文縮寫英文全稱中文譯文AIArtificial Intelligence人工智能AIDDArtificial IntelligenceDrug Discovery&DesignAI制藥CADDComputer-aided Drug
7、Design計算機輔助藥物設計SBDDStructure-based Drug Design基于結構的藥物設計HTSHigh-throughput Sequencing高通量測序MLMachine Learning機器學習DLDeep Learning深度學習RLReinforcement Learning強化學習TLTransfer Learning遷移學習NLPNatural Language Processing自然語言處理GANGenerative Adversarial Networks生成對抗結構RNNRecurrent Neural Network循環神經網絡VAEVariati
8、onal Autoencoder變分自編碼器SMILESSimplified Molecular Input Line Entry System分子反應的線性符號DTIDrug Targets Interactions 藥物-靶標相互作用GPTGenerative Pre-Trained Transformer生成式預訓練Transformer模型CSPCrystal Structure Prediction晶型預測ADMETAbsorption、Distribution、Metabolism、Excretion、Toxicity藥物吸收,分配,代謝,排泄和毒性QSARQuantitative
9、 structure-Activity Relationship定量結構活性關系PKPharmacokinetics藥代動力學PLMProtein Language Model蛋白質語言模型報告縮略詞中英文對照表報告縮略詞中英文對照表7中國AI制藥企業白皮書丨2023/11第一章人工智能(AI)制藥行業概覽018中國AI制藥企業白皮書丨2023/11人工智能(Artificial Intelligence,AI),是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做
10、出反應的智能機器。人工智能是一個廣泛的領域,包括專家系統、多智能體系統、進化計算、模糊邏輯、機器學習、知識表示、推薦系統、自然語言處理系統和計算機視覺等多個方面。其中,機器學習技術是應用最廣泛的一種技術,具體包括以下幾種方法:監督式學習、無監督式學習、半監督學習、集成學習、深度學習、強化學習、回歸分析、分類聚合、量度學習、因果關系等。各類機器學習技術在各個領域都有廣泛的應用,推動了人工智能的發展和應用。人工智能作為新一輪產業變革的核心驅動力,將進一步釋放歷次科技革命和產業變革積蓄的巨大能量,并創造新的強大引擎,重構生產、分配、交換、消費等經濟活動各環節,形成從宏觀到微觀各領域的智能化新需求,催
11、生新技術、新產品、新產業、新業態、新模式,引發經濟結構重大變革,深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。人工智能專家系統多智能體系統進化計算模糊邏輯機器學習監督式學習無監督式學習半監督學習集成學習深度學習強化學習回歸分析分類聚合量度學習因果關系知識表示推薦系統自然語言處理系統計算機視覺圖表1 實現人工智能的主要技術匯總11整理自藥融咨詢 人工智能的基本概念人工智能的基本概念9中國AI制藥企業白皮書丨2023/11AI制藥(AIDD)是指利用AI技術在藥物研發、藥物設計、藥物篩選、臨床試驗和藥物生產等各個環節中應用的制藥領域。AI在藥物研發中可以通過數據挖掘、機器學習和深度
12、學習等技術,加速藥物發現和設計過程,提高研發效率和成功率。AI還可以在藥物篩選中幫助挑選出具有潛在療效的候選藥物,降低研發成本和時間。在臨床試驗中,AI可以幫助優化試驗設計、招募適合的患者群體,并提供數據分析和預測,加快藥物上市進程。此外,AI還可以應用于藥物生產中的質量控制、流程優化和智能化管理等方面,提高藥物的生產效率和質量。靶點蛋白發現靶蛋白結構預測藥物結構設計藥物合成路線設計藥物-蛋白相互作用預測理化性質預測生物活性預測晶型預測劑型開發毒性預測臨床試驗設計受試者篩選智能注冊平臺臨床結果預測生產工藝優化質量保證和控制藥物安全警戒藥物發現臨床前研發臨床開發上市后智能化管理圖表1 AI技術在
13、藥品全周期中的主要應用AIDD主要優化環節隨著AI技術的發展,AI技術基本實現了藥物研發與市場化全流程的覆蓋,特別是在藥物發現和臨床前階段取得了顯著進展。藥物發現和臨床前研發階段是AIDD的主要優化環節,也是AI制藥企業主要的研發及商業化方向。利用AI技術,企業能夠在藥物發現和臨床前研發階段,節約大量濕試驗成本與時間成本,并實現高通量篩選,助力更多新靶點的發現與“老藥新用”的適應癥拓展。未來AI技術將持續發展,相信能夠在藥品臨床開發、上市后生產與商業化等方面更進一步。AI制藥是制藥是AI產業化中重要的應用場景產業化中重要的應用場景10中國AI制藥企業白皮書丨2023/11 AI制藥行業發展歷史
14、制藥行業發展歷史05001,0001,5002,0002,5003,0003,5004,0004,5005,0005,5006,0006,5007,00019801982198419861988199019921994199619982000200220042006200820102012201420162018202020222024全球AI制藥相關論文發表數量中國AI制藥相關論文發表數量1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 2016 2018 2020 20220246
15、810縱觀AIDD行業的發展,主要分為3個時期:1956年1981年的技術積累期,該時期是相關概念的早期構想階段,但由于技術限制未能成功實施;1981年2012年計算機輔助藥物設計(CADD)研發時期,CADD的虛擬篩選,可用于尋找有希望成藥的苗頭化合物進行藥物開發,但CADD是藥物發現過程的支持部門,而不是核心部門。CADD僅縮短藥物發現時間,受限于工藝優化、臨床、注冊等環節,新藥數量并未出現激增。圖表2 FDA CDER批準新藥數量統計NDABLA總計圖表1 AIDD行業發展歷程11 數據來源自Web of Science Science Citation Index Expanded 數
16、據庫人工智能概念首次提出(1956年)機器學習技術發展,AI技術水平提升(1970年)1981年CADD正式面世1996年第一款基于SBDD研發的藥物上市2000年CADD軟件已成為藥企必不可少工具2006年深度學習概念提出,AI技術水平進一步提升2012年第一家AI用于藥物研發商業化公司成立2022年AlphaFold能夠測所有已分類蛋白質的3D結構2023年賽諾菲宣布“All In”人工智能和數據科學1981-2012:CADD輔助藥物研發2012-至今:AIDD高速發展2021年全球第一種完全由AI設計和研制藥物進入臨床11中國AI制藥企業白皮書丨2023/112012年至今的AIDD高
17、速發展期,該時期迎來的AI技術的“井噴式”發展,AIDD相關論文數量迎來“指數級”增長,相關技術棧逐步豐富完善。在藥物發現及臨床前研究階段,基于從前的CADD技術,結合人工智能、機器學習和深度學習等技術,可以處理大量的生物數據,從而在藥物開發全過程中減少時間和成本。1 Jayatunga MKP,Xie W,Ruder L,Schulze U,Meier C.AI in small-molecule drug discovery:a coming wave?.Nat Rev Drug Discov.2022;21(3):175-176.2 Paul SM,Mytelka DS,Dunwiddi
18、e CT,et al.How to improve R&D productivity:the pharmaceutical industrys grand challenge.Nat Rev Drug Discov.2010;9(3):203-2143 根據公開資料整理同時,區別于CADD研發時期主要聚焦于藥物發現階段,AI技術逐步應用于藥物開發全流程。如:臨床前研究中的劑型開發、工藝優化等;臨床研究階段的受試者篩選及結果預測;藥物生產過程中的智能化生產管理、生產工藝優化。AIDD行業相對起步較晚,但管線數量逐年增加,頭部AI藥企臨床前研究管線中藥物數量已接近傳統頭部藥企的50%,并已經有多款
19、藥物進入臨床階段。0.00.51.01.52.02.53.03.54.04.55.05.56.06.57.07.58.08.5AIDD企業已進入臨床階段的藥物研發至臨床階段所需時間(年)RLY-1971RLY-4008EXS-21546PHI-101DSP-1181NDI-010976INS018-0555項目開始至專利獲批專利獲批至臨床階段藥物發現到臨床實驗制藥行業平均研發時長2圖表1 AIDD有效減少藥物發現及臨床前研究時間123圖表3 全球TOP20“BIG PHARMA”企業研發管線匯總1圖表2 全球主要24家AIDD企業研發管線數量匯總112中國AI制藥企業白皮書丨2023/11AI
20、DD行業,是在近年才開始嶄露頭角的新興領域,相比傳統制藥行業,它起步較晚。這主要是因為AI技術的發展和應用在醫藥領域的探索相對較新。然而,隨著人工智能技術的迅猛發展和在醫療領域的廣泛應用,AIDD行業正逐漸嶄露出巨大的潛力。盡管AIDD行業發展迅速,但相關的配套政策相對較少。由于AI技術的復雜性和涉及的倫理、法律等問題,政府和監管機構需要時間來理解和評估其潛在影響,以制定相應的政策和法規。美國、歐洲等國家及地區,行業起步較早,經過多年的發展及規劃初版的監管政策于近年才推出。時間政策名稱AIDD相關政策內容2022年1月“十四五”醫藥工業發展規劃以新一代信息技術賦能醫藥研發。探索人工智能、云計算
21、、大數據等技術在研發領域的應用,通過對生物學數據挖掘分析、模擬計算,提升新靶點和新藥物的發現效率。在實驗動物模型構建、藥物設計、藥理藥效研究、臨床試驗、數據分析等環節加強信息技術應用,縮短研發周期、降低研發成本。推進健康醫療大數據的開發應用和整合共享,探索建立統一的臨床大數據平臺,為創新藥研發及臨床研究提供有力支撐。2022年5月“十四五”生物經濟發展規劃信息技術支撐新藥研制。利用云計算、大數據、人工智能等信息技術,對治療適應癥與新靶點驗證、臨床前與臨床試驗、產品設計優化與產業化等新藥研制過程進行全程監管,實現藥物產業的精準化研制與規?;l展。提升制藥裝備的自動化、數字化和智能化水平,發展基于
22、人工智能的藥物結晶、超臨界萃取和色譜分離、固體制劑生產在線檢測、連續培養生物反應器、蛋白質大規模純化、冷鏈儲存運輸等信息化制藥裝備。2022年7月關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見推動人工智能技術成為解決數學、化學、地學、材料、生物和空間科學等領域的重大科學問題的新范式,充分發揮人工智能技術在文獻數據獲取、實驗預測、結果分析等方面作用,重點圍繞新藥創制、基因研究、生物育種研發、新材料研發、深空深海等領域,以需求為牽引謀劃人工智能技術應用場景,融合人工智能模型算法和領域數據知識,實現重大科學問題和發現的研究突破。圖表2 國內AIDD行業相關宏觀政策(含草案)匯總時間
23、部門政策名稱AIDD相關政策內容2023年5月美國FDAUsing Artificial Intelligence Machine Learning in the Development of Drug Biological Products-討論文件涵蓋 AI 和 ML 的當前和潛在用途,包括藥物發現、臨床和非臨床研究、上市后安全性監測和高級藥品上市。2023年7月歐洲EMAReflection paper on the use of Artificial Intelligence(AI)in the medicinal product lifecycle-草案概述在整個藥品生命周期和基于風
24、險的背景下使用AI/ML開發與生產藥物的考量,并針對AI/ML何時可以安全有效地開發、監管藥物以及藥物上市后使用等方面提供了建議。圖表1 國外AIDD行業相關監管政策(含草案)匯總 AI制藥行業配套政策制藥行業配套政策目前,國內AIDD行業相關政策起始于“十四五”時期,主要以政府宏觀政策為主,相應的執行發展政策及監管政策,還需要隨著國內行業逐步深入發展而進行細化、完善。13中國AI制藥企業白皮書丨2023/11各省都緊跟國家政策的方向,因地制宜出臺了各地的特色政策。以AIDD行業產業布局最密集的上海為例:時間政策名稱AIDD相關政策內容2023年5月上海市計算生物學創新發展行動計劃(20232
25、025 年)1.發展人工智能助力的分子動力學和增強采樣算法,開發我國獨立自主的大分子結構預測與設計的算法和軟件,構建大分子結構解析及其互作的分析計算流程和預測模型,構建大分子工程AI設計平臺,指導大分子改造實驗和結構優化。2.發展AI藥物研發的原創性算法、模型與計算平臺,開發小分子藥物大模型和生成算法,建立人工智能增強的抗體藥物和肽類藥物大模型與設計平臺,發展中藥復方藥理藥效預測模型,研發具有協同藥效的現代復方。2023年7月上海市生物醫藥產業數字化轉型實施方案(20232025 年)瞄準研發、生產、流通、管理等產業重點環節,深化數字賦能。到2025 年,推動5個以上人工智能輔助研發藥物進入臨
26、床,實現30 個以上高端智能醫療器械產品獲批上市。深化人工智能技術賦能醫藥創新研發;提升生物醫藥研發生產自動化智能化水平674360296631611911113222018177050100150200250300201820192020202120222023H1全球AI制藥融資事件數全球AI制藥行業融資額(億美元)90.757.8105.2127.249.416.243.023.029.049.031.0020406080100120140201820192020202120229.02023H1中國AI制藥融資事件數中國AI制藥行業融資額(億人民幣)5.9%19.2%69.4%5.5%
27、種子輪初創期成長期成熟期33.1%42.6%23.9%初創期成長期成熟期0.4%其他圖表3 AIDD行業投資策略分布全球融資輪次分布中國融資輪次分布近年來,AIDD行業曾短暫成為投資的熱點,其中2021年行業融資金額達歷史高點,超過290億美元。2022年以來,受資本環境影響,行業投資“熱潮”已經有所退卻,回落至相對穩定水平,預計融資金額將處于下行水平。AIDD資金回報周期長,全球投資者偏好選擇成長期(69.4%)和初創期(19.2%)企業,中國投資者選擇初創期、成長期、成熟期比例分別為33.1%,42.6%,23.9%1。圖表2 AIDD行業投資金額統計分析 AI制藥行業投融資現狀制藥行業投
28、融資現狀141 整理自藥融咨詢,數據來源自藥融云投融資數據庫圖表1 上海市部分AIDD行業產業政策中國AI制藥企業白皮書丨2023/11第二章AI+藥物發現0215中國AI制藥企業白皮書丨2023/11隨著微陣列、RNA-seq和高通量測序(HTS)技術的發展,高校、研究機構及企業實驗室產生大量的生物醫學數據,當代藥物發現也因此進入了生物大數據時代。隨著生物大數據分析,藥物發現研究的重點逐漸轉向靶向藥物發現,即以“基因-藥物-疾病”為中心,通過AI技術分析與疾病高度相關的靶點,發現酶、蛋白質或其他基因產物,以及針對該靶點的小分子。藥物靶點發現策略包括實驗方法、多組學分析方法和AI計算方法。實驗
29、方法受限于通量和成本,而基于AI技術的多組學分析方法和AI計算方法能夠高效、有效地發掘具有潛力成為藥物靶點的分子。多組學分析方法整合生物學數據,揭示疾病關鍵靶點,而AI計算方法利用機器學習和數據挖掘技術篩選化合物庫,加速藥物靶點發現。這些方法在藥物研究和開發中具有重要作用,并在未來發展中將變得更加關鍵。AI助力藥物發現階段概覽助力藥物發現階段概覽圖表1 AI技術通過三方面助力藥物發現階段研發圖表2 AI技術通過三方面助力藥物發現階段研發1AI技術輔助AI技術應用1 Pun,Frank W.,Ivan V.Ozerov,and Alex Zhavoronkov.AI-powered therap
30、eutic target discovery.Trends in Pharmacological Sciences(2023).AI助力藥物靶點發現與驗證助力藥物靶點發現與驗證藥物靶點發現與驗證AI輔助藥物分子設計、優化化合物篩選16中國AI制藥企業白皮書丨2023/11近年來,基于機器學習的算法,特別是深度學習方法,在制藥領域取得了顯著成果并引起了廣泛關注。深度學習,也被稱為深度神經網絡,由多個隱藏層節點組成,通過級聯方式逐步進行數據處理和特征提取。與傳統的機器學習方法相比,近期更加先進的基于深度學習的架構,如生成對抗網絡(GANs)、循環神經網絡和遷移學習技術,在制藥方面廣泛應用,例如新型
31、小分子設計、衰老研究以及基于轉錄數據的藥物藥理預測。此外,利用公開可用的多組學數據和文本挖掘,深度學習還在未滿足臨床需求的疾病方面發揮著重要作用。圖表1 AI技術驅動藥物靶點發現與驗證工作流程1時間研究機構/公司相關論文相關工作及發現2018年AgeXTherapeuticsUse of deep neural network ensembles to identify embryonic-fetal transition markers:repression of COX7A1 in embryonic and cancer cells利用12,000個胚胎和成年細胞的轉錄組數據訓練了一個深
32、度學習集成模型;發現控制胚胎轉變的新靶點COX7A1。2020年利物浦大學/肯特大學Using deep learning to associate human genes with age-related diseases建立了一種基于深度學習的方法,該方法采用新穎的模塊化架構,通過學習從基因或蛋白質特征中檢索的模式,識別與多種年齡相關疾病相關的靶點。2020年云深智藥GCN-MF:Disease-Gene Association Identification By Graph Convolutional Networks and Matrix Factorization提出了一種新的疾病-
33、基因關聯任務的框架,將圖卷積網絡(GCN)和矩陣分解相結合,命名為GCN-MF。借助其幫助,研究者可以捕捉非線性交互并利用測量的相似性。1 Pun,Frank W.,Ivan V.Ozerov,and Alex Zhavoronkov.AI-powered therapeutic target discovery.Trends in Pharmacological Sciences(2023).最新技術舉例 利用多組學數據訓練機器學習/深度學習模型進行靶點發現:17中國AI制藥企業白皮書丨2023/11基于大型語言模型的聊天功能,如微軟的BioGPT和Insilico Medicineiv的C
34、hatPandaGPT,通過對從數百萬論文中提取的大量文本數據進行預訓練,可以將疾病、基因和生物過程聯系起來,從而快速識別疾病發生和進展的生物學機制,并發現潛在的藥物靶點和生物標志物。時間研究機構/公司相關論文/成果相關工作及發現2023年微軟BioGPT:Generative Pre-trained Transformer for Biomedical Text Generation and MiningBioGPT:針對特定領域的生成性Transformer語言模型,在大規模生物醫學文獻上進行了預訓練。文章在六個生物醫學自然語言處理任務上評估了BioGPT,并證明BioGPT在生物醫學文獻
35、上的優勢2023年英矽智能ChatPandaGPTInsilico Medicine 將 ChatGPT 引入其靶點發現平臺 PandaOmic2023年麻省理工學院Contrastive learning in protein language space predicts interactions between drugs and protein targets團隊設計了一種基于大語言模型的AI算法ConPLex,可以利用預先訓練的蛋白質語言模型(PLex),并采用蛋白質錨定的對比共嵌入,超越目前最先進的算法,并嘗試將藥物靶點相互作用(DTI)推進到未知藥物和靶點類型,同時又能區分具有不
36、同結合特征的結構高度相似的藥物候選分子。時間研究機構/公司相關論文相關工作及發現2021年冰洲石生物Molecular modeling with machine-learned universal potential functions展示了神經網絡可用于訓練能量勢函數的通用近似值。通過采用全自動訓練過程,能夠在大規模晶體結構上訓練出平滑、可微分和可預測的勢函數。2021年華盛頓大學David Baker團隊Accurate prediction of protein structures and interactions using a three-track neural network
37、報道了新蛋白結構預測工具RoseTTAFold,其采用了注意力機制使整個DL能夠同時學習到蛋白一級/二級/三級結構不同維度的信息,預測準確率與AlphaFold2不相上下。2022年DeepMindAlphaFold Protein Structure Database:Massively expanding the structural coverage of protein-sequence space with high-accuracy models真正解決了蛋白質三維結構預測的算法困境,大幅度降低了藥物新靶點發現的難度,對于生命科學研究具有革命性的潛在意義。2022年百圖生科Heli
38、xfold-Single:Msa-Free Protein Structure Prediction By Using Protein Language Model As An Alternative提出將大規模蛋白質語言模型(PLM)與 AlphaFold2 優越的幾何學習能力相結合,并開發了新的蛋白結構預測模型 HelixFold-Single 利用機器學習/深度學習模型進行分子建模 大語言模型通過文獻挖掘發現治療發現18中國AI制藥企業白皮書丨2023/11時間研究機構/公司相關論文/成果相關工作及發現2020年英矽智能Molecular Generation for Desired T
39、ranscriptome Changes With Adversarial Autoencoders提出的模型可以產生新的分子結構,可以誘導給定的基因表達變化或在給定分子結構孵育后預測基因表達差異2022年劍橋大學Adversarial generation of gene expression data開發一種基于條件生成對抗網絡的方法,為大腸桿菌和人類生成真實的轉錄組學數據。我們評估我們的方法在幾種組織和癌癥類型的表現“合成數據”是指通過人工生成的數據,它可以模擬真實世界中的模式和特征。借助人工智能算法,能夠創建合成數據,以模擬各種生物數據,從而幫助研究人員探索和分析新藥物的可能。這種方法
40、在實驗數據稀缺或難以獲得的治療領域尤其有價值。舉例來說,在罕見疾病或患者數據有限的情況下,人工智能可以基于現有的知識和模式生成合成數據。然后,我們可以利用這些合成數據來訓練人工智能模型,并識別可能被忽視的潛在治療靶點。計算生物學大模型用于靶點發現時間研究機構/公司相關論文/成果相關工作及發現2023年格拉德斯通研究所Transfer learning enables predictions in network biology基于遷移學習的Transformer模型開發了一個理解基因相互作用的基礎模型 使用AI生成的合成數據進行靶點識別19中國AI制藥企業白皮書丨2023/11AI靶點發現需要
41、大量的生物數據來訓練模型,并需要專業人員對數據進行清洗、預處理,去除冗余和錯誤數據,并對數據進行標準化和格式化。對于AIDD初創企業而言,與大型制藥企業相比,他們面臨著生物實驗場景數據嚴重不足的挑戰。在短時間內難以積累足夠的數據量。因此,AI靶點發現技術在初創企業中具有一定的門檻。國內能夠進行靶點發現的AIDD企業約32家1,主要分布在北京、上海、深圳等地區,具體企業名稱及布局技術領域如下表所示。值得注意的是,AI靶點發現技術具有一定的局限性,靶點發現的企業并非完全利用AI技術:例如,水木未來能夠利用冷凍電鏡技術解析蛋白質結構進而完成靶點的發現;藥物牧場利用IDInvivo+轉座子靶點發現平臺
42、,結合Medchem5人工智能藥物化學平臺在藥物靶點發現上進行開拓。能夠進行靶點發現的AIDD企業主要分為3類:AIDD Biotech企業、具備AI技術的CRO企業、AIDD技術平臺企業。公司名稱公司位置主要技術領域企業類型企業技術/投資背景水木未來北京冷凍電鏡CRO高校/研究所背景英飛智藥北京小分子藥物Biotech/CRO高校/研究所背景百奧智匯北京單細胞測序CRO高校/研究所背景哲源科技北京生命科學Biotech/CRO高校/研究所背景星亢原生物北京大分子藥物Biotech/CRO名校博士創業項目百圖生科北京算法開發技術平臺互聯網巨頭項目普瑞基準北京多組學研發CRO創投基金孵化角井生物
43、北京大分子藥物Biotech資深醫藥專家創業智睿醫藥廣州小分子藥物CRO資深醫藥專家創業西湖歐米杭州蛋白質組CRO高校/研究所背景西湖云谷智藥杭州基因編輯Biotech高校/研究所背景高維醫藥杭州藥物發現Biotech高校/研究所背景呈元科技杭州合成肽新藥研發Biotech創投基金孵化紅云生物南京小分子藥物Biotech高校/研究所背景燧坤智能南京小分子藥物Biotech/CRO高校/研究所背景勁風生物青島TILs療法Biotech高校/研究所背景冰洲石生物上海小分子藥物Biotech名校博士創業項目藥物牧場上海小分子藥物Biotech/CRO資深醫藥專家創業愛信智耀上海藥物研發Biotech
44、資深醫藥專家創業湃隆生物上海小分子藥物Biotech/CRO創投基金孵化圖表1 國內主要布局AI藥物靶點發現與驗證初創企業匯總11 公開資料整理 國內企業布局20中國AI制藥企業白皮書丨2023/11公司名稱公司位置主要技術領域企業類型企業類型科鎂聯上海寡核苷酸藥物Biotech創投基金孵化煥 一生物上海免疫學CRO跨界創業項目新合生物深圳RNA藥物Biotech/CRO名校博士創業項目未知君深圳腸道微生物藥物Biotech名校博士創業項目溪礫科技深圳靶向RNA小分子Biotech創投基金孵化華為云EIHealth深圳算法開發技術平臺互聯網巨頭項目云深智藥深圳算法開發技術平臺互聯網巨頭項目科輝
45、智藥深圳小分子藥物Biotech創投基金孵化予路乾行蘇州分子模擬CRO資深醫藥專家創業科因生物蘇州小分子藥物Biotech創投基金孵化睿健醫藥武漢誘導多能干細胞Biotech資深醫藥專家創業21中國AI制藥企業白皮書丨2023/11 英矽智能英矽智能是一家由生成式人工智能驅動的臨床階段藥物研發公司,通過下一代人工智能系統連接生物學、化學和臨床試驗分析,利用深度生成模型、強化學習、轉換模型等現代機器學習技術,構建強大且高效的人工智能藥物研發平臺,識別全新靶點并生成具有特定屬性分子結構的候選藥物。英矽智能聚焦癌癥、纖維化、免疫、中樞神經系統疾病、衰老相關疾病等未被滿足醫療需求領域,推進并加速創新藥
46、物研發。英矽智能AI靶點發現技術全球領先,具有大量應用實例。自主研發人工智能生物靶點發現平臺 PandaOmics,公司利用該平臺確定了許多此前從未報道過的肌萎縮側索硬化癥(ALS)潛在治療靶點1。藥物牧場藥物牧場成立于2015年,主要利用遺傳學和人工智能技術開發針對乙肝、腫瘤和自身免疫疾病的創新療法。利用IDInvivo+轉座子靶點發現平臺,結合Medchem5人工智能藥物化學平臺在藥物靶點開拓的“卡脖子”領域攻關突破。前者基于轉座子進行基因篩選,在具有完整免疫系統的活體動物中直接發現新藥物靶點;后者利用深度學習技術進行藥物分子的設計。藥物牧場已經發現20余個創新靶點;結合專有的人工智能(A
47、I)藥物發現平臺,公司原創新藥DF-006已經進入I期國際多中心臨床。百圖生科百圖生科是中國首家生物計算技術驅動的生命科學平臺公司,致力于用高性能生物計算和多組學數據技術加速創新藥物和早篩早診等精準生命科學產品的研發。業務將分為兩大階段,第一階段利用前沿AI技術構建完整的生物計算平臺,并與提供新的數據軸和新的數據分析、藥物設計工具的初創企業與研究機構攜手,構建生物計算生態,為生命科學企業和科研用戶提供豐富的工具能力和完整的解決方案。第二階段,將深度參與或主導發起新型精準藥物和精準診斷產品的研發,攜手合作伙伴,研發生命科學產品。百圖生物成果入選美國癌癥研究協會(AACR)2023 年會,研究內容
48、覆蓋全新抗體設計的蛋白結構預測模型、靶點發現2,以及高通量自動化蛋白表達/表征平臺的構建。予路乾行予路乾行是一家以人工智能、量子力學及分子模擬算法為核心技術,通過模擬運算賦能新藥研發的交叉學科技術驅動型生物醫藥公司。公司結合自主創新的AI技術,結合高精度分子動力學模擬核心算法,建立了國際領先的新一代人工智能藥物研發平臺。該AI研發平臺主要針對未解析靶點與高柔性靶點進行高精度結構解析及生理動態過程還原模擬,從而實現難成藥靶點的新藥研發。1 Identification of Therapeutic Targets for Amyotrophic Lateral Sclerosis Using P
49、andaOmics An AI-Enabled Biological Target Discovery Platform2 Identification of Molecular Targets 2/New Nonclinical Models for Targets 國內代表企業22中國AI制藥企業白皮書丨2023/11藥物設計的目標是開發出具有特定性質、符合特定標準的藥物,包括療效、安全性、合理的化學和生物特性以及結構的新穎性。近年來,利用深度生成模型和強化學習算法進行新藥設計被認為是一種有效的藥物發現方法。這種方法能夠繞過傳統基于經驗的藥物設計模式的限制,讓計算機通過自主學習藥物靶點和分
50、子特征,以更快的速度和更低的成本生成符合特定要求的化合物。這種新方法為藥物設計領域帶來了更多的創新和可能性。AI生成模型在全新藥物設計領域具有巨大的優勢,因為它們在生成分子時不需要先驗的化學知識。這些模型可以在更廣闊的未知化學空間中進行搜索,超越現有分子結構的限制,自動設計新的分子結構。在新藥設計中,廣泛使用的深度生成模型包括基于循環神經網絡(RNN)的生成模型、變分自編碼器(VAE)和生成對抗網絡(GAN)等。利用生成模型設計分子的過程具有高度的隨機性,生成的分子在結構上呈現千變萬化,質量也參差不齊。強化學習可以通過微調模型參數進行有針對性的優化,使生成的分子具備特定的藥物分子特性。這種結合
51、生成模型和強化學習的方法為全新藥物設計提供了新的途徑和可能性。圖表1 主要AI生成模型框架示意11 Zeng,Xiangxiang,et al.Deep generative molecular design reshapes drug discovery.Cell Reports Medicine(2022).AI驅動藥物分子設計、優化驅動藥物分子設計、優化 最新技術舉例 AI生成模型在藥物設計領域應用23中國AI制藥企業白皮書丨2023/11時間研究機構/公司相關論文/成果相關工作及發現2017年阿斯利康Molecular de-novo design through deep reinf
52、orcement learning開發了一種基于序列的新藥設計方法REINVENT。研究者從 ChEMBL 數據庫中收集了 150 萬個符合特定要求的分子,并使用這些分子的 SMILES 來訓練RNN 模型,以學習活性分子的特征并生成新分子?;?RNN 的生成模型藥物在先導化合物的優化方面發揮著作用。研究者提出了一種名為“Scaffold-constrainedmolecular generation(SAMOA)”的新分子生成算法,用于解決先導化合物優化問題中的支架約束問題:使用 RNN生成模型生成新分子的 SMILES 序列,然后使用精細采樣程序實現支架約束并生成分子。此外,還應用了一種
53、基于策略的強化學習算法來探索相關的化學空間,并生成與預期相匹配的新分子。時間研究機構/公司相關論文/成果相關工作及發現2019年阿斯利康Deep Reinforcement Learning for Multiparameter Optimization in de novo Drug Design研究者開發了DeepFMPO 框架,能夠從初始先導化合物開始,通過替換部分先導分子片段來修改這些先導分子的結構。這項研究證實了基于 RNN 的生成模型在分子優化領域的廣泛應用。圖表1 RNN分子生成模型主要工作流程1基于RNN的生成模型可以生成具有全新結構的化合物,同時保持與樣本化合物具有相似的生化
54、特性。訓練過程首先利用大型化學數據庫對RNN模型進行訓練,使其學習如何生成正確的化學結構。然后使用強化學習算法對 RNN參數進行微調,使模型能夠將生成的化學結構映射到指定的化學空間。強化學習使基于 RNN 的生成模型能夠生成具有良好藥理特性的新分子,并確保生成分子的結構多樣性。1 Tang,Bowen,John Ewalt,and Ho-Leung Ng.Generative AI models for drug discovery.Biophysical and Computational Tools in Drug Discovery.Cham:Springer International
55、 Publishing,2021.221-243.簡單AI生成模型:基于循環神經網絡(RNN)的生成模型設計藥物分子 簡單生成模型:基于循環神經網絡(RNN)的生成模型的先導化合物優化24中國AI制藥企業白皮書丨2023/11VAE已成為復雜數據分布的無監督學習最流行的方法之一。VAE模型能夠完成小分子的全新設計和肽序列的生成。VAE有許多不同的變體,但其核心架構始終不變(如下圖所示)。VAE的變體主要可以分為SMILES-VAE、Graph-VAE和3Dgrid-VAE三種類型。SMILES-VAE是應用最為廣泛,因為其容易實現,例如英矽智能構建的GENTRL算法。盡管GENTRL生成的分子
56、順利通過實驗驗證,但仍難以保證生成100%驗證的SMILES。Graph-VAE和3Dgrid-VAE能夠解決這些問題,由于3D結構訓練數據有限,目前商業化應用較少。3D技術將對未來的AIDD項目具有巨大價值。圖表1 VAE模型的核心架構1-21 Zeng,Xiangxiang,et al.Deep generative molecular design reshapes drug discovery.Cell Reports Medicine(2022).2 Tang,Bowen,John Ewalt,and Ho-Leung Ng.Generative AI models for drug
57、 discovery.Biophysical and Computational Tools in Drug Discovery.Cham:Springer International Publishing,2021.221-243.進階AI生成模型:基于變分自動編碼器(VAE)的生成模型25中國AI制藥企業白皮書丨2023/11GAN主要由生成器和鑒別器組成,它們相互博弈,互相對抗,通過對抗生成高質量的數據。GAN能夠生成與真實數據分布相似的新樣本,并能夠使用網絡來辨別網絡,刪除不需要的內容。在AIDD領域,GAN 通常與特征學習和強化學習等技術相結合,在蛋白質功能預測、小分子生成等方面發揮
58、了重要作用?;?GAN已經構建多種分子生成模型,如Mol-CycleGAN、ORGANIC、RANC。時間研究機構/公司相關論文/成果相關工作及發現2019年英矽智能藥明康德Deep Reinforcement Learning for Multiparameter Optimization in de novo Drug Design開發了一種深度生成模型-生成式張量強化學習(GENTRL),用于全新小分子設計。GENTRL 可優化合成可行性、新穎性和生物活性。利用該模型 在 21 天內發現了4種DDR1抑制劑。抑制劑在體內/體外實驗均得到驗證。2020年麻省理工學院Hierarchica
59、l Generation of Molecular Graphs using Structural Motifs報道了Graph-VAE相關工作,提出了 JT-VAE,其將在化學上有效的分子子結構視為圖結構中的一個節點,因此可在不顯式加入化學規則的情況下實現分子有效性達到 100%的效果。解決了部分SMILES-VAE算法的局限性。2020年麻省理工學院Multi-Objective Molecule Generation using Interpretable SubstructuresRationaleRL 訓練了一個基于圖的強化學習模型,將預先選擇的分子子圖完成為一個整體分子,該分子具有
60、多種屬性,如針對多個靶點的生物活性(如 GSK3 和 JNK3)、藥物相似性的定量估計和合成可及性。2021年云深智藥A Novel Scalarized Scaffold Hopping Algorithm with Graph-Based Variational Autoencoder for Discovery of JAK1 Inhibitors開發了一種基于圖的變異自動編碼器與高斯混雜隱藏空間(Graph-GMVAE),可以選擇性地從給定的參考化合物中準確生成分子。利用Graph-GMVAE研究者生成了更強效的JAK1抑制劑,并在生化實驗中得到驗證。2023年華為復旦大學Q-Drug
61、:a Framework to bring Drug Design into Quantum Space using Deep Learning提出了一種名為 Q-Drug(藥物的量子啟發優化算法)的分子優化框架,該框架利用量子啟發算法來優化離散二元域變量上的分子時間時間研究機構研究機構/公司公司相關論文相關論文/成果成果相關工作及發現相關工作及發現2017年哈佛大學Optimizing distributions over molecular space.An Objective-Reinforced Generative Adversarial Network for Inverse-de
62、sign Chemistry(ORGANIC)ORGANIC 是著名的分子生成模型,已成為其他模型的比較基準模型。它結合了 GAN 模型和強化學習算法,可以生成新穎有效的分子。2018年英矽智能莫斯科物理技術學院Reinforced Adversarial Neural Computer for de Novo Molecular Design基于生成對抗網絡(GAN)范式和強化學習(RL),研究者開發了 RANC的深度神經網絡(DNN)架構,用于新型小分子有機結構的從頭設計。2020年ArdigenMol-CycleGAN:A generative model for molecular o
63、ptimization研究者開發了Mol-CycleGAN模型,它能生成與原始化合物結構相似度高的優化化合物。在給定一個分子的情況下,Mol-CycleGAN模型會能夠生成結構相似的分子,并對所考慮的屬性值進行優化。進階AI生成模型:基于通用對抗性網絡(GAN)的生成模型26中國AI制藥企業白皮書丨2023/11時間研究機構/公司相關論文/成果相關工作及發現2017年英矽智能Mail.RuThe cornucopia of meaningful leads:Applying deep adversarial autoencoders for new molecule development i
64、n oncology首次將AAE應用于根據確定的參數生成新的分子指紋。AAE 使用二進制指紋向量和分子濃度作為輸入和輸出,使用了 NCI-60 細胞系的檢測數據訓練模型。AAE 用于篩選 PubChem 中的 7200 萬種化合物,并成功篩選出具有潛在抗癌特性的候選分子。2020年英矽智能Entangled Conditional Adversarial Autoencoder for de Novo Drug Discovery構建了一種新的AAE模型,即條件AAE,其能夠基于指定條件(如藥物分子的靶標特異性、溶解性、可合成性等)生成相應的分子。其中,基于長短時記憶網絡(LSTM)分別構建編
65、碼器和解碼器,使用多層的FNN作為判別模型,判斷采樣分子是否符合真實數據分布以及是否具備所需的理化性質,并基于半監督學習方法優化模型。利用該模型成功發現了一種新型JAK3抑制劑。AAE在VAE基礎上增加了判別模型,對采樣分子和真實樣本進行區分,基于對抗的思想訓練生成模型和判別模型,擴展了分子的生成空間,一定程度上彌補了VAE在生成分子時結構新穎性方面的缺陷。強化學習(RL)通過智能體在與環境的交互過程中,不斷優化人工智能模型,以最大限度地提高預期的累積回報。與有監督學習和無監督學習不同,RL可以在不受人類先驗知識和訓練數據束縛的情況下達到驚人的表現,例如最著名的應用是AlphaGo。時間研究機
66、構/公司相關論文/成果相關工作及發現2017年阿斯利康Molecular De-Novo Design through DeepReinforcement Learning首次將RL應用于藥物發現領域,使用強化學習算法對生成的分子進行評分,以微調 RNN 參數,從而生成對特定靶點具有活性的新化合物。這種方法已經應用于幾種不同的分子生成任務。2019年斯坦福大學GoogleOptimization of Molecules via Deep Reinforcement Learning利用化學知識與強化學習技術,提出用于分子優化的框架)MolDQN。MolDQN是第一次在分子生成中使用標準的強化
67、學習框架。通過直接定義添加/缺失原子或化學鍵的分子修飾,MolDQN確保100%的化學有效性。2020年北卡羅來納大學Deep reinforcement learning for de novo drug design.構建了結構演化的增強學習(ReLeaSE)可用于產生針對單個期望性質或多個性質而優化的新型化合物的靶向化學文庫。兩種模型均采用RL方法進行訓練,以使新化學結構的生成偏向具有所需物理和/或生物學特性的化學結構。進階AI生成模型:基于對抗性自動編碼器(AAE)的生成模型設計藥物分子 基于強化學習(RL)的生成模型設計藥物分子27中國AI制藥企業白皮書丨2023/11時間研究機構/
68、公司相關論文/成果相關工作及發現2022年星藥科技中山大學Accelerated rational PROTAC design via deep learning and molecular simulations提出一種新穎的深度生成模型PROTAC-RL,能夠在低資源的化學環境下設計出合理的PROTAC,并且結合深度強化學習使得該模型最終能夠設計出具有良好藥物代謝動力學性質的PROTAC。在短短49天內發現了具有高降解活性及高藥代性能的新型先導化合物并完成濕實驗驗證。2023年上海交通大學De novo drug design by iterative multiobjective dee
69、p reinforcement learning with graph-based molecular quality assessment提出一種新穎的基于質量評估的全新多目標藥物設計方法(QADD),該方法將迭代改進框架與新穎的基于圖的藥物潛力分子質量評估模型相結合。QADD 設計了一個多目標深度強化學習管道,用于迭代生成具有多種所需特性的分子,其中引入了一個基于圖神經網絡的模型,用于對藥物潛力進行精確的分子質量評估,以指導分子的生成。應用 QADD 生成與生物靶蛋白 DRD2 結合的新型分子也證明了該算法的有效性。綜合多種技術的AI藥物分子小分子生成平臺技術成熟并成功在相關工作中應用時間
70、研究機構/公司相關論文/成果相關工作及發現2017年以色列海法理工學院Prototype-Based Compound Discovery Using Deep Generative Models提出了一種分子模板驅動的神經網絡,該網絡結合了 VAE、CNN 和 RNN,可生成與模板分子性質相似的化學結構,同時具有結構多樣性。研究者發現,生成的分子中有效分子的比例顯著提高。2020年英矽智能Chemistry42:An AI-Driven Platform for Molecular Design and Optimization推出用于從頭設計和優化小分子的軟件平臺 Chemistry42,
71、將多種最先進的生成 AI 算法與藥物和計算化學方法連接起來,來生成具有優化特性的新型分子結構。2023年英矽智能Discovery of Potent,Selective,and Orally Bioavailable Small-Molecule Inhibitors of CDK8 for the Treatment of Cancer通過多模態生成式強化學習平臺Chemistry42基于結構生成化學分子的藥物設計方法,成功發現一款有效的、具有選擇性的、口服CDK8抑制劑,有潛力用于癌癥的治療。28中國AI制藥企業白皮書丨2023/11時間研究機構/公司相關論文/成果相關工作及發現2021
72、年華盛頓大學David Baker團隊De novo protein design by deep network hallucination通過深度神經網絡進行全新蛋白質設計。2021年晶泰科技IDEA 研究院基于AI的高通量高精度抗體結構預測模型idealFold(IDEa-xtALpi-Fold)依托晶泰科技自主搭建的 XupremAb下一代抗體發現平臺和 IDEA 研究院的人工智能技術,將先進的 AI 算法與大分子藥物研發專家經驗有機結合,并運用于抗體結構預測中。2022年華盛頓大學David Baker團隊Robust deep learning-based protein sequ
73、ence design using ProteinMPNN開發了一種新的深度學習工具:ProteinMPNN。ProteinMPNN借鑒了圖像識別使用的神經網絡,能夠明確與特定結構相對應的序列,以更加精準、快速地設計蛋白質分子,將設計蛋白質的時間長度從“月”縮短至“秒”。2022年華盛頓大學David Baker團隊Design of protein-binding proteins from the target structure alone實現了在沒有靶蛋白三維結構信息的情況下,設計能與其特定位點結合的蛋白。2023年華盛頓大學David Baker團隊Top-down design o
74、f protein architectures with reinforcement learning 開發了一種基于強化學習的蛋白質設計軟件,并證明了它有能力創造有功能的蛋白質。2023年華盛頓大學David Baker團隊De novo design of protein structure and function with RFdiffusion開發了一種能從頭設計全新蛋白質的深度學習方法RoseTTAFold Diffusion。該方法能生成各種功能性蛋白質,包括在天然蛋白質中從未見過的拓撲結構。2023年百圖生科基于跨模態大模型“xTrimo”開發了AI Generated Pro
75、tein平臺設置了3類功能模塊,分別是Function to Protein Design、Protein to Protein Design,以及Cell to Protein Design目前,國內外的AI藥企主要專注于技術相對成熟的小分子藥物研發,并且已經有多款由AI設計或輔助優化的小分子藥物進入臨床階段。然而,近年來,隨著新藥物形式的興起,布局抗體藥物、核酸藥物、多肽藥物、基因細胞治療藥物、合成生物學等領域的企業比例也在不斷增加。這些新藥物形式帶來了新的治療理念和手段,為疾病的治療提供了更廣闊的前景。AI技術在這些領域的應用也在逐漸發展,為新藥物形式的研發和優化提供支持。隨著技術的進一
76、步發展和應用的推廣,未來可以期待AI在大分子藥物領域的應用為醫藥行業帶來更多的創新和突破。AI技術應用于大分子藥物分子設計29中國AI制藥企業白皮書丨2023/11國內能夠進行藥物分子發現、設計、優化的AIDD企業60余家1,主要分布在北京、上海、深圳、蘇州、杭州等地區,具體企業名稱及布局技術領域如下表所示。國內的藥物分子設計、優化AI發展水平參差,具備藥物分子從頭設計的AI技術的企業數量較少,而大多數企業根據現有數據庫進行/提供藥物發現或“老藥新用”服務。公司名稱公司位置主要技術領域企業類型企業技術/投資背景中大唯信北京小分子藥物CRO/技術平臺高校/研究所背景億藥科技北京小分子藥物Biot
77、ech高校/研究所背景英飛智藥北京小分子藥物Biotech/CRO高校/研究所背景華深智藥北京大分子藥物CRO高校/研究所背景百奧幾何北京大分子藥物Biotech高校/研究所背景康邁迪森北京小分子藥物CRO高校/研究所背景分子之心北京蛋白質設計技術平臺高校/研究所背景星亢原生物北京大分子藥物CRO/Biotech名校博士創業項目深勢科技北京新藥研發CRO/軟件名校博士創業項目域新說北京蛋白質設計技術平臺名校博士創業項目深度智耀北京小分子藥物技術平臺資深醫藥專家創業角井生物北京大分子藥物Biotech資深醫藥專家創業百圖生科北京多組學/抗體技術平臺互聯網巨頭項目望石智慧北京小分子藥物CRO跨界創
78、業項目佩德生物成都多肽藥物技術平臺高校/研究所背景成都先導成都小分子藥物/核酸藥物CRO資深醫藥專家創業智睿醫藥廣州小分子藥物Biotech/CRO資深醫藥專家創業信華生物廣州大分子藥物Biotech/技術平臺資深醫藥專家創業費米子廣州小分子藥物Biotech/CRO跨界創業項目西湖歐米杭州蛋白質組CRO高校/研究所背景西湖云谷智藥杭州基因編輯Biotech高校/研究所背景賽得康生物杭州蛋白藥物Biotech高校/研究所背景高維醫藥杭州藥物發現Biotech高校/研究所背景劑泰醫藥杭州藥物遞送Biotech名校博士創業項目德睿智藥杭州小分子藥物Biotech/CRO資深醫藥專家創業呈元科技杭州
79、合成肽新藥研發Biotech創投基金孵化碳硅智慧杭州藥物研發CRO/技術平臺跨界創業項目圖表1 國內主要布局AI藥物分子發現、設計、優化初創企業匯總11 公開資料整理 國內企業布局30中國AI制藥企業白皮書丨2023/11公司名稱公司位置主要技術領域企業類型企業技術/投資背景索智生物嘉興小分子藥物Biotech資深醫藥專家創業紅云生物南京小分子藥物Biotech高校/研究所背景燧坤智能南京小分子藥物CRO/Biotech高校/研究所背景宇道生物上海變構藥物Biotech/CRO高校/研究所背景尋百會生物上??贵w藥物Biotech高校/研究所背景數因信科上海新藥研發CRO高校/研究所背景圓壹智慧
80、上海小分子藥物Biotech/CRO高校/研究所背景冰洲石生物上海小分子藥物Biotech名校博士創業項目宇耀生物上海分子膠藥物Biotech名校博士創業項目智峪生科上海蛋白質預測技術平臺名校博士創業項目元星智藥上??顾ダ袭a品Biotech名校博士創業項目藥物牧場上海小分子藥物Biotech/CRO資深醫藥專家創業勝普澤泰上海多肽藥物CRO/CDMO資深醫藥專家創業銳格醫藥上海癌癥/免疫藥物Biotech/CRO資深醫藥專家創業湃隆生物上海小分子藥物Biotech/CRO創投基金孵化科鎂聯上海寡核苷酸Biotech創投基金孵化煥一生物上海免疫CRO跨界創業項目萊芒生物深圳CAR-T療法Biot
81、ech高校/研究所背景阿爾法分子深圳新藥研發Biotech高校/研究所背景新樾生物深圳藥物研發Biotech/CRO高校/研究所背景晶泰科技深圳小分子藥物CRO名校博士創業項目新合生物深圳RNA藥物Biotech/CRO名校博士創業項目未知君深圳腸道微生物態Biotech名校博士創業項目智藥科技深圳小分子藥物為主CRO/技術平臺名校博士創業項目星藥科技深圳小分子藥物CRO名校博士創業項目華為云 EIHealth深圳藥物研發技術平臺互聯網巨頭項目云深智藥深圳藥物研發技術平臺互聯網巨頭項目科輝智藥深圳小分子藥物Biotech創投基金孵化雙運生物蘇州小分子藥物CRO高校/研究所背景醫圖生科蘇州藥物研
82、發CRO高校/研究所背景Aureka蘇州大分子藥物Biotech高校/研究所背景阿爾脈生物蘇州小分子藥物CRO/Biotech高校/研究所背景31中國AI制藥企業白皮書丨2023/11公司名稱公司位置主要技術領域企業類型企業技術/投資背景朗睿生物蘇州小分子藥物Biotech資深醫藥專家創業予路乾行蘇州分子模擬CRO資深醫藥專家創業立妙達蘇州小分子藥物Biotech/CRO資深醫藥專家創業科因生物蘇州小分子藥物Biotech創投基金孵化騰邁醫藥蘇州新藥研發CRO創投基金孵化睿健醫藥武漢多能干細胞Biotech資深醫藥專家創業英矽智能香港小分子藥物Biotech/技術平臺資深醫藥專家創業32中國A
83、I制藥企業白皮書丨2023/11云深智藥云深智藥是由騰訊自主研發的AI驅動的藥物發現平臺。該公司開發的iDrug平臺能夠實現小分子的從頭合成?,F有的模型通過對ZINC drug-like中超過680萬個小分子數據進行訓練學習,來達到學習分子空間的目的。目前支持對319個Kinase和52個GPCR靶點進行分子生成。在分子生成這一過程中,騰訊的iDrug平臺的算法能夠針對不同靶點在分子空間中的映射進行針對性采樣,從而生成新的可能對靶點有活性的分子。晶泰科技晶泰科技是一家以智能化、自動化驅動的藥物研發科技公司,為全球生物醫藥企業提供藥物發現一體化解決方案。晶泰科技首創智能計算、智能實驗和專家經驗相
84、結合的藥物研發新模式,致力于打造三位一體的研發平臺,助力客戶縮短藥物研發的周期,提高藥物研發成功率。晶泰科技具備小分子藥物發現技術,基于智能計算、自動化實驗和專家經驗的“三位一體”研究模式,以XtalCryo靶點確證、XcelaHit分子設計、XceptionOp成藥性優化和XcelDev可開發性優化四大技術平臺覆蓋新藥研發從靶點到獲得PCC的完整流程,提供一體化藥物研發服務。此外,晶泰科技具備大分子藥物發現技術,將AI算法與濕實驗進行有機結合擁有從靶點識別到先導抗體藥發現的全流程一體化能力。星藥科技星藥科技是一家從臨床需求出發、以AI為核心技術驅動藥物研發的生物科技公司。星藥致力于使用人工智
85、能驅動藥物研發,布局未成藥、難成藥靶點的藥物研發管線,解決未滿足臨床需求。以“AI驅動的研發管線”和“AI賦能的計算平臺”為雙循環,賦能藥物研發產業。星藥人工智能藥物發現平臺Pyxir使用AI前沿算法,結合計算化學、藥物化學和生物學的工具及經驗,全方位攻克小分子藥物早期研發流程中的疑難問題,快速發現活性高、成藥性好且結構新穎的候選分子。星藥的智能計算平臺M1結合了AI與經典物理學原理,可快速準確地描述分子和蛋白間的相互作用、精確地計算目標藥物分子與特定靶標的結合自由能,突破經典計算模擬方法,達到世界頂尖水平。國內代表企業33中國AI制藥企業白皮書丨2023/11除了傳統的實驗方法,計算機輔助藥
86、物設計(Computer-Aided Drug Design,CADD)自問世以來在藥物研發階段發揮了巨大的作用。藥物-靶標相互作用(DTI)是藥物發現的重要基礎,準確有效的DTI預測能極大地助力藥物研發,加速先導或苗頭化合物發現。計算機模擬DTI并非全新技術,世面已有許多成熟的開源程序或商業化軟件。將AI技術引入CADD中,能夠一定程度提高分子篩選的效率與覆蓋度。近年來基于機器學習/深度學習的預測DTI的方法陸續被報道。以已知化合物的活性和結構信息作為訓練數據,并對數據進行預處理和特征提取,通過選擇合適的機器學習算法進行模型構建和訓練。后續利用已構建的機器學習模型對新化合物進行預測和篩選,并
87、結合化學規則和藥物性質等要求對化合物進行優化和篩選?;跈C器學習/深度學習的藥物-靶標相互作用預測時間研究機構/公司相關論文/成果相關工作及發現2019年弗洛里達大學DeepAtom:a framework for protein-ligand binding affiity prediction構建了DeepAtom模型,用于預測藥物-靶標親和力。除了具備三維CNN模型的各種優勢,DeepAtom模型同時通過深度可分離卷積解決了三維CNN模型參數過多的問題,并利用多個小的卷積核代替單個大卷積核,達到減少參數的同時增加網絡復雜度的目的。該模型表現出較強的預測能力。2020年中國科技大學The
88、cornucopia of meaningful leads:Applying deep adversarial autoencoders for new molecule development in oncology首次提出利用GAN模型預測蛋白質殘基-殘基接觸圖,并在基準測試集上表現出不錯的預測效果。該模型被命名為GANcon,GANcon通過對抗性學習策略訓練生成模型和判別模型,最終能夠生成接近真實數據分布的接觸圖。2021年四川大學Layer-wise relevance propagation of InteractionNet explains proteinligand int
89、eractions at the atom level提出了一種多注意力模塊MATT_DTI,首先通過相對自注意模塊提取藥物的化合物原子間聯系,用CNN模塊分別學習藥物和靶標的隱含信息,最后通過多頭注意力模塊和全連接層提取相互作用信息并給出預測結果。2022年西湖大學廈門大學德睿智藥Pre-Training of Equivariant Graph Matching Networks with Conformation Flexibility for Drug Binding首創研發了能夠刻畫蛋白質構象變化與親和力預測的AI模型ProtMD時間研究機構/公司相關論文/成果相關工作及發現2022
90、年華為上海藥物所PanGu Drug Model:Learn a Molecule Like a Human開發了新的深度學習架構,稱為盤古藥物模型 PanGu Drug Model。它使用圖到序列的不對稱條件變異自動編碼器,可以從兩種表征中適當地描述分子,提高下游藥物發現任務的性能。2023年百圖生科清華大學xTrimoPGLM:Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein百圖生科與清華大學合作開發了一款名為xTrimoPGLM的蛋白質語言模型,該模型的參數量高達1000億
91、,是目前蛋白質領域首個達到這一規模的“通用大模型”。生物醫藥大模型助力藥物分子篩選 最新技術舉例 AI輔助藥物分子篩選輔助藥物分子篩選34中國AI制藥企業白皮書丨2023/11國內能夠進行藥物分子設計、優化的AIDD企業約55家,主要分布在北京、上海、深圳、蘇州、杭州等地區,具體企業名稱及布局技術領域如下表所示。中國AIDD行業起步較歐美等國家略有滯后,雖然并不缺乏新藥管線,但大多數管線僅處于早期研發階段,具有臨床管線的AIDD企業數量較少。由于交叉學科的特性,早期AIDD公司成立后一般需要經歷漫長的團隊建設、平臺完善和技術驗證的時期,自主設計分子并推進到后期臨床的公司鳳毛麟角。除“老藥新用”
92、外,目前國內研發進度進展臨床試驗最快的AI藥物是英矽智能研發的ISM001-055,該藥物的研發進度同樣位于全球前列?,F階段AI藥企普遍數據生產能力和干濕實驗結合能力不足,這限制了新平臺的應用。AI藥企在新治療方式領域同樣面臨數據稀缺性和孤島效應,而且生物藥的數據生產成本更高,兼具不同藥物形式和AI的人才儲備更少,所以未來AI藥企需要持續加強數據資產的挖掘和累積。公司名稱公司位置主要技術領域企業類型企業技術/投資背景中大唯信北京小分子藥物CRO/技術平臺高校/研究所背景水木未來北京技術平臺CRO高校/研究所背景億藥科技北京小分子藥物Biotech高校/研究所背景英飛智藥北京小分子藥物Biote
93、ch/CRO高校/研究所背景華深智藥北京大分子藥物CRO高校/研究所背景百奧幾何北京大分子藥物技術平臺高校/研究所背景超維知藥北京小分子藥物CRO/Biotech高校/研究所背景康邁迪森北京小分子藥物CRO高校/研究所背景分子之心北京蛋白質設計技術平臺高校/研究所背景星亢原生物北京大分子藥物CRO/Biotech名校博士創業項目深勢科技北京新藥研發CRO/技術平臺名校博士創業項目域新說北京蛋白質藥物技術平臺名校博士創業項目深度智耀北京小分子藥物CRO/技術平臺資深醫藥專家創業角井生物北京大分子藥物Biotech資深醫藥專家創業望石智慧北京小分子藥物CRO跨界創業項目佩德生物成都多肽藥物技術平臺
94、高校/研究所背景智睿醫藥廣州小分子藥物Biotech/CRO資深醫藥專家創業信華生物廣州大分子藥物軟件/Biotech資深醫藥專家創業費米子廣州小分子藥物Biotech/CRO跨界創業項目西湖歐米杭州蛋白質組技術平臺高校/研究所背景高維醫藥杭州藥物發現Biotech高校/研究所背景劑泰醫藥杭州藥物遞送Biotech名校博士創業項目德睿智藥杭州小分子藥物Biotech/CRO資深醫藥專家創業呈元科技杭州合成肽Biotech創投基金孵化圖表1 國內主要布局AI藥物分子篩選初創企業匯總11 公開資料整理 國內企業布局35中國AI制藥企業白皮書丨2023/11公司名稱公司位置主要技術領域企業類型企業技
95、術/投資背景碳硅智慧杭州技術平臺CRO/技術平臺跨界創業項目索智生物嘉興小分子藥物Biotech資深醫藥專家創業紅云生物南京小分子藥物Biotech高校/研究所背景燧坤智能南京小分子藥物CRO/Biotech高校/研究所背景宇道生物上海變構藥物Biotech/CRO高校/研究所背景尋百會生物上??贵w藥物Biotech高校/研究所背景數因信科上海新藥研發Biotech高校/研究所背景圓壹智慧上海小分子藥物Biotech/CRO高校/研究所背景冰洲石生物上海小分子藥物Biotech名校博士創業項目宇耀生物上海分子膠藥物Biotech名校博士創業項目智峪生科上海蛋白質預測CRO名校博士創業項目元星智
96、藥上??顾ダ袭a品Biotech名校博士創業項目藥物牧場上海小分子藥物Biotech/CRO資深醫藥專家創業銳格醫藥上海免疫藥物Biotech/CRO資深醫藥專家創業湃隆生物上海小分子藥物Biotech/CRO創投基金孵化阿爾法分子深圳新藥研發Biotech高校/研究所背景新樾生物深圳DEL賦能藥物研發Biotech/CRO高校/研究所背景晶泰科技深圳小分子藥物CRO名校博士創業項目新合生物深圳RNA藥物Biotech/CRO名校博士創業項目未知君深圳腸道微生物藥物Biotech名校博士創業項目智藥科技深圳小分子藥物為主CRO/軟件名校博士創業項目云深智藥深圳新藥研發技術平臺互聯網巨頭項目科輝智
97、藥深圳小分子藥物Biotech創投基金孵化中以海德深圳乙肝藥物Biotech資深醫藥專家創業雙運生物蘇州小分子藥物CRO高校/研究所背景醫圖生科蘇州藥物研發CRO高校/研究所背景Aureka蘇州大分子藥物Biotech高校/研究所背景阿爾脈生物蘇州小分子藥物CRO/Biotech高校/研究所背景朗睿生物蘇州小分子藥物Biotech資深醫藥專家創業予路乾行蘇州技術平臺CRO資深醫藥專家創業立妙達蘇州小分子藥物Biotech/CRO資深醫藥專家創業科因生物蘇州小分子藥物Biotech創投基金孵化騰邁醫藥蘇州藥物研發CRO創投基金孵化睿健醫藥武漢多能干細胞Biotech資深醫藥專家創業英矽智能香港小
98、分子藥物Biotech資深醫藥專家創業36中國AI制藥企業白皮書丨2023/11第三章AI+臨床前研發0337中國AI制藥企業白皮書丨2023/11AI在藥物臨床前研發側重于非臨床藥理學、藥動學和毒理學研究。藥物的物理化學特性及其 ADMET 特性對于藥代動力學和毒理學研究至關重要。候選藥物的不良特性可能導致昂貴的藥物開發階段失敗。利用AI技術通過對候選藥物的相關特性進行早期評估,可以降低臨床研究的失敗率和損失。候選藥物的ADMET特性直接受其物理化學特性的影響,對于藥物成功上市至關重要。例如,藥物分子的溶解度會嚴重影響藥物的制劑方法,而藥物分子在不同pH條件下的ADMET特性則深受其電荷狀態
99、的影響。盡管并非所有具有潛在藥物價值的苗頭化合物最終都能成功上市,但通過對苗頭化合物理化特性的研究,能夠提供大量實驗數據,完善AI預測模型,助力藥物晶型的設計與改良,制劑的設計與優化,并為其他藥物的設計提供經驗與靈感。多晶型現象是一種物質可以存在多種不同晶體結構中的現象,對于化學藥物分子,幾乎所有固體藥物都具有多態性。由于晶型的變化可以改變固體化學藥物的許多物理性質和化學性質。藥物發展史上,存在一些藥物由于晶型問題而導致上市失敗的情況。晶型預測(CSP)是指給定分子的二維結構式通過計算模擬獲得它的所有可能的穩定晶型。晶型預測在制藥工業中具有重要意義。使用AI有效地動態配置藥物晶型可以完全預測小
100、分子藥物的所有可能的晶型,與傳統的藥物晶型研發相比,制藥公司不必擔心缺少重要的晶型。此外,晶型預測技術大大縮短了晶體的發展周期,更有效地選擇了合適的藥物晶型,縮短了開發周期并且降低成本?,F常見的方法或工具有Crystalline Sponge Method、Dimorphite、ChemML等。時間研究機構/公司相關論文/成果相關工作及發現2021年阿斯利康晶泰科技Current State-of-the-art In-house and Cloud-Based Applications of Virtual Polymorph Screening of Pharmaceutical Comp
101、ounds:A Challenging Case of AZD1305AZD1305 實驗中,發現常溫下物理穩定性非常接近的兩種晶型,并借助晶泰科技的晶型預測和穩定性評估技術對該多晶型現象進行系統評估,印證了實驗結果。對于晶型預測技術在輔助實驗解決復雜多晶型篩選問題,幫助研究者快速判斷是否篩選出了在多種條件下最穩定的固體形態等方面提供了積極的建議。2023年默克晶泰科技Effect of Polymer Additives on the Crystal Habit of Metformin HCI晶泰科技通過分子動力學模擬考察了溶劑和添加劑與各個晶面間的相互作用,基于校正吸附能模型定量分析了不
102、同添加劑品種對晶面生長的特異性影響,并成功預測出不同結晶環境中鹽酸二甲雙胍的晶體形態,預測結果與實驗結果高度匹配。AI輔助藥物理化特性預測輔助藥物理化特性預測 AI助力藥物臨床前研發概覽助力藥物臨床前研發概覽 最新技術舉例 AI技術輔助藥物晶型預測38中國AI制藥企業白皮書丨2023/11利用AI技術能夠識別并預測新分子溶解度等理化性質,在確定研發成本或臨床前終止研發至關重要。實驗中測量溶解度存在較大的不確定性,導致測得的溶解度可能被高估?;谖锢砟P偷牡谝恍栽碛嬎泐A測溶解度需要高額的計算成本,可行性較低。利用人工智能技術建立基于物理模型的熱力學溶解度預測流程,實現了輕量級晶型預測技術,這對
103、于預測分子的熱力學溶解度具有重要意義。這些方法可以幫助提高溶解度預測的準確性,加速藥物開發過程,并為決策提供更可靠的依據。時間研究機構/公司相關論文/成果相關工作及發現2023年AbbVie晶泰科技Novel Physics-Based Ensemble Modeling Approach That Utilizes 3D Molecular Conformation and Packing to Access Aqueous Thermodynamic Solubility:A Case Study of Orally Available Bromodomain and Extratermi
104、nal Domain Inhibitor Lead Optimization Series晶泰科技通過分子動力學模擬考察了溶劑和添加劑與各個晶面間的相互作用,基于校正吸附能模型定量分析了不同添加劑品種對晶面生長的特異性影響,并成功預測出不同結晶環境中鹽酸二甲雙胍的晶體形態,預測結果與實驗結果高度匹配。AI技術輔助指導實驗制備新晶型時間研究機構/公司相關論文/成果相關工作及發現2020年南安普敦大學Minimizing Polymorphic Risk through Cooperative ComputationalandExperimental Exploration將最先進的計算晶體結構預
105、測(CSP)技術與廣泛的實驗結晶方法相結合,以了解和探索藥物的晶體結構,并最大限度地降低后期出現意外多晶體的風險。最新技術舉例時間應用相關論文/成果相關工作及算法2022年預測藥物釋放Impact Assessment of the Variables Affecting the Drug Release and Extraction of Polyethylene Oxide Based Tablets.ANN,SVM,回歸樹集合,決策樹2021年開發3D打印片劑A machine learning method for defect detection and visualization
106、in selective laser sintering based on convolutional neural networksANN、自組織映射、RF、SVM和CNN2022年檢測片劑缺陷Real-time coating thickness measurement and defect recognition of film coated tablets with machine vision and deep learningCNN,YOLOv52022年估算崩解速率Disintegration testing augmented by computer Vision techno
107、logyRF,XGBoost,ANN,CNN2022年藥物粒度檢查UV/VIS imaging-based PAT tool fordrug particle size inspection in intact tablets supported by pattern recognition neural networks.模式識別神經網絡 AI輔助藥物劑型設計輔助藥物劑型設計 AI技術輔助藥物熱力學溶解度預測技術39中國AI制藥企業白皮書丨2023/11時間應用相關論文/成果相關工作及算法2021年設計吸入制劑Machine learning approach for carrier sur
108、face design in carrier-based dry powderinhalationRF,XGBoost,LightGBM,SVM,KNN,ANN,CNN2020年改善噴霧劑相容性The application of machine learning algorithms in understanding the effect of core/shell technique on improving powder compactabilitySVM,ANN2022年預測聚集程度A Novel Computational Approach Coupled with Machine
109、Learning to Predict the Extent of Agglomeration in Particulate ProcessesSVM、RF和偏最小二乘回歸2022年估算崩解速率Disintegration testing augmented by computer Vision technologyRF,XGBoost,ANN,CNN2022年檢測膠囊內顆粒缺陷A micro-XRT image analysis and machine learning methodology for the characterisation of multiparticulate caps
110、ule formulations.SVM2017年控制制粒過程Artificial Intelligence Tools for Scaling Up of High Shear Wet Granulation Process神經模糊邏輯與遺傳編程2016年預測粒度分布A Computational intelligence modeling of granule size distribution for oscillating milling.多元線性回歸和遺傳編程2021年預測溶解速率和曲線A novel AI-based computational platform for solid
111、 dispersion formulation design.RF,SVM,LightGBM,XGBoostADMET(藥物吸收,分配,代謝,排泄和毒性研究)是當代藥物設計和藥物篩選中十分重要的方法。臨床試驗的失敗通常是由于藥物的 ADMET 問題,而不是缺乏療效。傳統的ADMET研究非常耗時且昂貴,但同時又是能否成藥一個很重要的條件。AI可提取化合物相關結構特征,評估多個ADMET參數間的關系和趨勢,有效提升ADMET性質預測的準確性。AI在藥物ADMET預測的原理主要基于機器學習算法。這些算法使用了大量已知藥物的ADMET數據來訓練預測模型,并通過預測藥物分子的化學和物理屬性來推測其ADM
112、ET性質。數據的質量和數量是ADMET預測的巨大障礙。大多數預測模型由數百到數千個小型化學數據集組成,無法覆蓋足夠的化學空間。生物活性測定的數據受實驗平臺的影響,容易產生實驗誤差,導致后續的數據管理產生困難。當前數據驅動的ADMET預測研究依賴于文獻衍生數據及公開數據庫,數據量稀缺且數據質量參差不齊。這既考驗公司對數據管理能力,也考驗模型的泛化能力。AI助力藥物助力藥物ADMET 性質預測性質預測最新技術舉例40中國AI制藥企業白皮書丨2023/11時間相關論文/成果預測性質2012年hERG K+channels:structure,function,and clinical signifi
113、cance人乙醚相關基因(hERG)介導的心臟毒性2017年New experimental models of the blood-brain barrier for CNS drug discovery血腦屏障1998年The drug efflux protein,P-glycoprotein,additionally protects drug-resistant tumor cells from multiple forms of caspase-dependent apoptosis滲透性糖蛋白2020年Large-scale evaluation of cytochrome P4
114、50 2C9 mediated drug interaction potential with machine learning-based consensus modeling細胞色素 P4502018年Multi-Descriptor Read Across(MuDRA):A Simple and Transparent Approach for Developing Accurate Quantitative Structure-Activity Relationship Models誘變性2017年ADMET evaluation in drug discovery.Part 17:d
115、evelopment of quantitative and qualitative prediction models for chemical-induced respiratory toxicity呼吸毒性2018年In silico prediction of chemical toxicity for drug design using machine learning methods and structural alerts口服毒性2016年Post-marketing withdrawal of 462 medicinal products because of adverse
116、 drug reactions:a systematic review of the world literature致癌性2018年Multi-descriptor read across(MuDRA):a simple and transparent approach for developing accurate quantitative structure-activity relationship models致突變性2017年ADMET evaluation in drug discovery.Part 17:development of quantitative and qual
117、itative prediction models for chemical-induced respiratory toxicity刺激性2020年Towards deep neural network models for the prediction of the blood-brain barrier permeability for diverse organic compounds經典的前饋反向傳播神經網絡(BPNN)結構和重復雙重交叉驗證(rdCV)方法被結合起來,用于估算血腦屏障滲透率。2019年Modeling physico-chemical ADMET endpoints
118、 with multitask graph convolutional networks神經網絡方法預測了七種不同的 ADMET 特性:logD、溶解度、熔點、膜親和力和人血清白蛋白結合力。從人工智能中受益的藥物發現的關鍵領域之一是ADMET性質預測,通過定量結構活性關系(quantitative structureactivity relationship,QSAR)模型來預測多種性質,從簡單的物理化學性質到復雜的藥代動力學(PK)、藥效學(PD)和毒理學特性。重要的PK端點包括清除率、通透性和穩定性;重要的藥效學端點包括藥物靶標特異性和選擇性;重要的毒理學端點包括細胞色素P450誘導和hE
119、RG抑制等。定量結構活性關系(quantitative structureactivity relationship,QSAR)模型預測ADMET性質41中國AI制藥企業白皮書丨2023/111 公開資料整理時間時間相關論文相關論文/成果成果預測性質預測性質2020年Deep learning based drug metabolites prediction開發了一種 DL 模型來預測藥物代謝物,其準確性優于流行的基于規則的潛在代謝物系統生成方法(SyGMa)2018年Chemi-Net:A molecular graph convolutional network for accurate
120、 drug property prediction冰洲石生物與安進合作,開發Chemi-Net,完全由數據驅動、無需領域知識的深度學習ADME 性質預測方法。AI技術在藥物臨床前研發階段有著廣泛的應用。主要包括晶型預測、劑型設計和藥物ADMET性質預測等,其中能夠完成藥物ADMET性質預測企業數量最多。由于技術發展時間長,相對技術成熟,市面具有多款藥物ADMET性質預測CADD軟件免費開源/商業化軟件,隨著AI技術的發展,相關軟件逐漸添加了AI功能輔助數據的提取與處理,承接相關業務門檻低,因此相關企業數量較多。但多數企業僅停留在對相關軟件的應用,并未有創新的核心算法與技術的拓展。CADD的能力
121、局限于對已有的知識和數據的篩選與優化,相較之下,AIDD能夠充分探索未知的分子結構空間,對更多未知的分子性質進行預測,給藥物研發帶來了顛覆性變革,但AIDD的發展需要高數量、高質量的生物數據作為支撐。目前國內企業的技術重點在于藥物ADMET性質預測,布局晶型預測、劑型設計等方面國內企業數量較少。公司名稱晶型預測劑型設計藥物ADMET性質預測燧坤智能億藥科技西湖歐米醫圖生科阿爾脈生物晶泰科技冰洲石生物劑泰醫藥智峪生科深度智耀智睿醫藥索智生物云深智藥百圖生科科輝智藥費米子碳硅智慧 AI+臨床前研發國內企業布局臨床前研發國內企業布局42中國AI制藥企業白皮書丨2023/11 藥物發現階段/臨床前研發
122、階段國內企業競爭格局AIDD Biotech企業AI技術驅動的CRO企業AIDD技術平臺企業具備臨床階段項目項目處于早期階段無項目披露/僅提供服務圖表1中國主要AIDD行業企業格局1利用AI技術主導或輔助藥物發現及臨床前研發階段是中國AIDD行業企業重點關注的技術,超過90%的行業企業在該方面有所投入?;谛袠I理解,我們將中國AIDD行業的企業主要分為AIDD Biotech企業、具備AI技術的藥企/CRO企業、具備AI技術的藥企/CRO企業、AIDD技術平臺企業(分類不包括引進AI技術的大型制藥企業)。AIDD Biotech企業:即AI技術貫穿于新藥發現全過程的企業,該類企業以新藥管線研發
123、為核心商業模式,此外部分Biotech企業與大型制藥企業開展合作,承接藥物篩選等服務工作。AI技術驅動的CRO企業:該類企業以CRO服務為核心商業模式,該類型公司無研發管線/管線數量較少,主要通過對外提供研發服務作為盈利模式。此外,該類型的公司也通過對外授權/售賣早期管線實現營收。AIDD技術平臺企業:該類企業以軟件工具服務為核心商業模式。1 公開資料整理43中國AI制藥企業白皮書丨2023/11AI新藥研發的三要素是核心生物數據、基礎算力和核心算法,AIDD技術平臺企業基于本身在算法方面的優勢,有望通過提供軟件產品實現商業模式;平臺型研發企業通過與大型藥企/Biotech企業合作,完成項目的
124、積累和自主研發能力邊際的不斷拓寬,在數據積累上會有較大優勢,也有望衍生出AI新藥研發的CRO企業,專注于建立平臺提供服務,為不具備AI新藥前端開發能力的企業提供支持;AI新藥研發最終走的也是新藥研發的邏輯,這也會催生一批在AI藥物管線開發上具有突出能力的Biotech企業。圖表1中國主要AIDD行業與大型制藥企業/Biotech企業合作關系網絡11 公開資料整理44中國AI制藥企業白皮書丨2023/11第四章AI+臨床研發0445中國AI制藥企業白皮書丨2023/11 AI助力新藥臨床試驗概覽助力新藥臨床試驗概覽新藥開發是一個漫長、昂貴、高風險的過程,其中大約一半的時間和投資消耗在臨床試驗階段
125、,而臨床試驗的高失敗率又使其成為新藥研發中最困難的一步。臨床試驗是藥物開發的基石,成功的藥物開發依賴于準確且有效的臨床試驗。據研究,約有90%的藥物會在臨床試驗階段被淘汰,進入臨床期的化合物中,不到三分之一能進入臨床 III 期1,在進入臨床期的化合物中,又有超過三分之一的化合物未能成功獲批上市2。由于、期臨床試驗處于整個藥物開發階段后期,且最復雜的 III 期試驗成本約占整個試驗的 60%,因此,每項失敗的臨床試驗均會造成巨額損失。一篇發表在Nature子刊npj Digital Medicine,關于數字化臨床試驗文章指出,目前傳統臨床試驗存在參與率過低、臨床試驗進展緩慢等問題。在受試者招
126、募、篩選、數據采集和質控等方面的效率低下,會給受試者以及研發企業帶來經濟和時間上的負擔,且延長臨床試驗時間3。圖源:https:/doi.org/10.1016/j.tips.2019.05.005圖表1 藥物研發階段及化合物在各臨床試驗階段成功率1 doi.org/10.1038/nbt.2786 2 doi:10.1093/biostatistics/kxx0693 doi:10.1038/s41746-020-0302-y46中國AI制藥企業白皮書丨2023/11人工智能(artificial intelligence,AI)的發展,為新藥研發帶來了新的技術手段,盡管目前AI技術大多應用
127、于藥物發現及臨床前階段,但在臨床試驗環節,也可以利用ML、自然語言處理等技術輔助臨床試驗設計、患者招募和臨床試驗數據處理等。圖表1 用于臨床試驗設計的AI技術:從方法到結果改善圖源:https:/doi.org/10.1016/j.tips.2019.05.00547中國AI制藥企業白皮書丨2023/11AI臨床試驗方案設計是指利用人工智能技術輔助和優化臨床試驗設計的過程。它利用ML(機器學習)、DL(深度學習)、自然語言處理(NLP)、決策支持系統(DSS)等技術,快速處理同類研究、臨床數據和監管信息,以及讀取臨床試驗等數據,以提供更有效的臨床試驗方案。歐美在臨床階段對AI技術的應用起步較早
128、,主要在應用自然語言處理(NLP)、改進病人分層、簡化臨床試驗的操作流程三個大的層面。通過收到的超過300份AI臨床研究申請,FDA歸納分析并對該技術進行了總結,將AI在臨床階段的應用分成了“六大分析類型”與“九大分析目標”。圖表1 AI在臨床研究中的分析類型及目標AI/ML在臨床研究中的分析類型與目標分析分析類型類型結果預測協變量選擇/混雜調整藥物劑量模型異常檢測圖像/視頻/語音分析RWD表型/自然語言處理(NLP)目標目標藥物發現再利用藥物毒性預測患者富集設計患者風險分層/管理選擇/優化劑量設計服藥依從性/遵循給藥方案合成對照組評估終點/生物標志物上市后監測圖注:1.來源于FDA官網2.藥
129、融咨詢分析整理近年來,AI在臨床研究中不乏成功案例。如:成立于2016年的美國企業Owkin,使用聯邦學習來訓練和開發其機器學習模型,專門用于提高臨床試驗效率,并已經建立了一個高級模型目錄,使他們能夠從成像、基因組學和臨床數據中識別新的生物標志物。Owkin致力于識別具有嚴重疾病進展特征的患者,這些患者可能對開發中的治療反應最好,目前該公司總共籌集了2.54億美元,其中包括賽諾菲、Bpifrance和Mubadala等投資機構。另一家來自劍橋的公司GNS healthcare,成立于2000年,該公司的技術基于各種復雜的數據創建“虛擬患者”,這是一個準確的疾病計算機模型。GNS專注于腫瘤學、免
130、疫學、中樞神經系統和心臟代謝疾病,他們的技術支持更好的病人分層,并能確定哪些病人應該接受一線或二線治療。AI在臨床研究中的分析類型及目標48中國AI制藥企業白皮書丨2023/11 臨床研究AI國內企業布局2022年8月,國家藥品監督管理局藥品審評中心(CDE)連發三項意見稿,支持遠程智能臨床試驗方案的應用和發展,強調在合規且可行的范圍內提高患者參與臨床試驗的便利度、減輕患者參與臨床試驗的負擔,并對數字化、智能化等新技術在臨床試驗中的合規運用進行了細致的規定。而在此前,CDE已下發的2項建議中已強調ePRO在數據采集方面所體現出的高效性、實時性、靈活性、合規性、安全性和其在患者隱私保護等方面所具
131、備的顯著優勢。幾項政策立足“以患者為中心”的理念,接軌國際諸多監管機構對臨床試驗智能化的政策,為中國臨床試驗進一步實現從“紙”到“云”的發展變革提供了方向。緊隨技術發展趨勢,基于國家政策,我國AI+臨床試驗企業迎來發展機遇。據藥融咨詢統計,國內目前涉足AI+臨床企業不多,截至2023.09.01,約16家,可大致分為AI SaaS、AI Biotech、AI CRO以及AI Biotech+CRO 四種商業模式。AI+SaaS白星花科技百奧知西湖歐米耀乘健康AI+CRO普瑞基準零氪科技開心生活科技煥一生物至本醫療深度智耀AI+Biotech科輝智藥哲源科技銳格醫藥AI+CRO/Biotech埃
132、格林醫藥未知君英矽智能圖表1 國內涉足AI+臨床研發主要企業圖注:1.各企業官網2.藥融咨詢分析整理從十六家企業在臨床階段的具體業務類型來看,主要包括:臨床試驗方案設計,如患者篩選/招募等,以及臨床結果預測、臨床試驗數據統計分析。從企業類型來看,可提供AI+臨床試驗企業多為向藥企或CXO企業提供服務的企業,此外,一部分企業實施“雙業態”運營模式,僅在少數特定治療領域內開發自有產品管線,而在大多數治療領域對外提供AI賦能的臨床設計服務。49中國AI制藥企業白皮書丨2023/11患者招募是決定臨床試驗是否成功的關鍵因素之一,臨床試驗的入組標準通常有很嚴格的限制1,研究顯示,大約80%的進展期非小細
133、胞肺癌(aNSCLC)患者不符合臨床試驗的資格標準,導致約86%的臨床試驗由于無法按時招募足夠的受試者而終止2。而大樣本的隨機對照臨床試驗(RCT)是臨床證據的主要來源,但受試者的招募往往因為試驗方案的入組標準嚴格而影響進度。相關研究證明,結合真實世界數據,AI可自動篩選符合入組標準的患者,提高招募效率。AI輔助藥物臨床試驗受試者招募,總體可以看作是利用自然語言處理、機器學習等技術,對不同來源的受試者信息和臨床試驗方案的入組/排除標準進行識別和匹配的過程。Nature發表的一項研究介紹了AI在簡化臨床試驗入組標準方面的價值和應用,通過使用開源的人工智能工具Trial Pathfinder,從腫
134、瘤患者的真實世界數據中學習,來優化入組標準的包容性,該工具可以使用EHR數據模擬臨床試驗,按照不同的入組標準自動整合EHR數據,并分析總體生存風險比率,同時,使用逆概率加權法來調整基線混雜因素和模擬隨機化3。分析結果顯示,許多常見的入組標準,對臨床試驗的結果影響甚微。圖表1 用于臨床試驗設計的AI技術:從方法到改進結果圖源:https:/doi.org/10.1016/j.tips.2019.05.0051 doi/10.1200/jco.2009.27.15_suppl.6538 2 doi:10.1016/j.cct.2018.01.0033 doi:10.1038/s41586-021-
135、03430-54 doi:10.1093/jnci/djad013Trial Pathfinder包括臨床試驗模擬和分析兩部分。在臨床實驗模擬中,Trial Pathfinder將真實世界數據和目標試驗方案(治療和資格標準)作為輸入,根據患者特征、診斷、實驗室值、生物標志物和先前的治療方法,以編程方式對不同的入組標準(從文本中提?。┻M行編碼,并使用傾向評分的加權分析法進行臨床試驗模擬。然后對模擬的治療組進行生存分析,并報告符合條件的患者數和由此產生的風險比。在分析中,Trial Pathfinder將標準的重要性分析與Shapley值相結合,評估了每個納入/排除標準如何影響合格受試者的數量和試
136、驗結果。研究表明,幾個常用的納入/排除標準不會對試驗的總生存期的風險比產生實質性影響,也不會潛在地降低試驗的有效性。此外,一項回顧性分析全面了解了AI在臨床試驗注冊登記中的應用現狀4,并評估該技術篩選患者的準確性,這是第一項評估AI用于癌癥臨床試驗登記的系統性回顧和meta分析。數據顯示,除一個數據集外,所有數據集的準確性、靈敏度和特異性均超過 80%,17個數據集中有 5 個的陽性預測值超過 80%,所有數據集中的陰性預測值均超過 80%,匯總敏感性為 90.5%(95%CI:70.9%-97.4%);總體特異性為 99.3%(95%CI:81.8%99.9%)??偟膩碚f,AI在患者篩選方面
137、的表現似乎與人工篩查持平,且AI擁有更高的效率,可花費更少的時間和資源。AI助力受試者招募管理助力受試者招募管理 最新技術舉例50中國AI制藥企業白皮書丨2023/11目前多家AI制藥企業在助力患者入組的研究上已取得一定成就。如IQVIA、Unlearn、ConcertAI等,ConcertAI 的DTS eScreening采用了機器學習算法LightGBM來開發17個模型,這些模型根據各種標準預測患者參加臨床試驗的資格,包括ECOG評分(癌癥研究中采用的標準衡量標準),使用的其他指標包括癌癥分期、實驗室結果和生命體征,平均預測準確率超過99%。2020年,FDA同意Medidata Syn
138、thetic Control Arm 合成對照組解決方案(“SCA解決方案”)應用于美國臨床階段免疫治療公司Medicenna Therapeutics 公司(“Medicenna”)一項MDNA55治療復發性膠質母細胞瘤的III 期注冊試驗中。在此試驗中,Medidata成功幫助Medicenna在此三期臨床中減少招募了100個對照患者,這也是罕見病試驗首次采用混合外部對照組,也開啟了III期臨床試驗應用混合外部對照組的先河。IQVIA CORE將其數據與機器學習相結合,來進行準確的患者匹配。IQVIA:IQVIA CORE TwinRCT結合了人工智能、數字雙胞胎和創新統計方法,可實現更靈
139、活、更有效的試驗,有助于讓試驗更加以患者為中心,縮短患者的入組時間。Unlearn.AI:TwinRCT 是一種基于機器學習的工具,旨在根據臨床試驗入排標準對患者進行排名。Concert AI:DTS eScreening圖表1 AI制藥企業在臨床試驗患者入組方面的研究成果(舉例)圖注:1.來源于公開信息2.藥融咨詢分析整理 國內企業布局51中國AI制藥企業白皮書丨2023/11國內企業運用AI助力臨床試驗患者招募/入組尚處于起步階段,代表企業包括普瑞基準、埃格林、西湖歐米以及銳格醫藥等。這些企業并非專注于臨床階段或臨床試驗患者招募,而多覆蓋藥物開發多個流程,如科輝智藥,其AI驅動的研發平臺e
140、LEAD是覆蓋研發全流程,AI篩選患者人群是其中一部分。銳格醫藥主要通過自主研發的 rCARD(計算機加速新藥研發)平臺來發現和開發臨床差異化的創新藥物。AI+SaaS西湖歐米:ClinicTalksAI+Biotech銳格醫藥科輝智藥哲源科技AI+CRO零氪科技開心生活科技AI+CRO/Biotech埃格林埃格林哲源科技可進行虛擬臨床試驗,預測響應患者。據哲源科技官網披露,其核心技術包括TWIRIS(生物醫學文獻處理算法-大規模生物醫學知識AI平臺)、DAGG(基因組霰單槍損傷評估算法-細胞功能定量評估AI平臺)、Dpverse(泛癌種功能數字化病人庫MOA虛擬平臺)。在研管線中,為全新機制
141、、全新靶點藥物管線共3條,ZY0001(胰腺癌、小分子)、ZY0002(泛癌種、大分子)、ZY0003(胰腺癌、小分子),均處于藥物合成階段。零氪科技提供第三方服務,主要開展基于精準生命科學解決方案(LinkSolutions)的臨床招募、真實世界研究、數據洞察等服務。其臨床研究招募主要采用機器學習算法將已知的信號通路和藥物靶點庫進行匹配,以預測個性化治療和患者耐藥點的有效性,實現患者對特定臨床試驗的最佳適配性。埃格林是具有從靶點到臨床試驗“端到端”能力的AI賦能創新藥企,埃格林采取自研+對外服務的模式,一方面,從事自有藥品管線的研發,另一方面,對有人工智能研發需求的制藥企業,提供創新藥開發服
142、務與合作。52中國AI制藥企業白皮書丨2023/11 AI助力預測臨床試驗效果助力預測臨床試驗效果鑒于臨床試驗的高失敗率,以及藥物開發的資金密集型性質,制藥公司只能承擔有限數量的項目,因此開發者通常不得不中止一些項目,以支持成功概率更高的藥物進一步開發。對于繼續研發藥物的選擇,目前常用的方法基本上是基于管線上藥物的治療類別,和所處開發階段歷史上其他藥物的監管批準率,結合對項目特定風險因素的非結構化討論和主觀調整,來做出投資決策。對于臨床試驗效果的預測,在藥物開發中一直難以達到。AAPS于2022年一月發表的一篇關于在制藥研發過程中應用機器學習/人工智能預測技術和監管成功概率的文章指出,關于臨床
143、試驗效果預測尚未有經驗證的報告1。但AI技術發展迅速,此后,不少文章研究結果顯示,盡管具有難度,但對于AI臨床試驗結果預測,從技術上看,正在朝著積極的方向前進。1 doi:10.1208/s12248-021-00644-32 doi:10.1002/cpt.3008 3 doi.org/10.1016/j.patter.2022.100445圖表1 HINT:端到端的神經網絡模型其中,Cell Pattern于2022年4月發布了首個臨床試驗結果預測公開數據集,提出了基于深度學習(圖神經網絡)的臨床試驗結果預測方法。作者設計了一種基于圖神經網絡的深度學習方法,可以顯示的模擬不同的臨床試驗因素
144、及其交互關系,從而預測試驗結果,該方法被命名為Hierarchical interaction network(HINT)。HINT 在臨床 I 期、II 期和 III 期的預測中分別獲得了 0.665、0.620和0.847 的 F1 分數。最新技術舉例53中國AI制藥企業白皮書丨2023/11其中,Cell Pattern于2022年4月發布了首個臨床試驗結果預測公開數據集,提出了基于深度學習(圖神經網絡)的臨床試驗結果預測方法。作者設計了一種基于圖神經網絡的深度學習方法,可以顯示的模擬不同的臨床試驗因素及其交互關系,從而預測試驗結果,該方法被命名為Hierarchical interac
145、tion network(HINT)。HINT 在臨床 I 期、II 期和 III 期的預測中分別獲得了0.665、0.620和0.847 的 F1 分數。文章標題文章結論鏈接Reusabilityreport:Evaluatingreproducibility and reusability of a fine-tuned model to predict drug response incancer patient samples可重復使用性報告:評估微調模型的再現性和可重復使用性,以預測癌癥患者樣本中的藥物反應可重復使用性結果表明,在大多數新的臨床環境中,TCRP(細胞系反應預測轉移)仍
146、然是預測臨床前和臨床環境反應的優越方法。結果支持 TCRP 在臨床前和臨床環境中優于已建立的統計和機器學習方法。Doi:10.1038/s42256-023-00688-4Prediction of Clinical Trials OutcomesBased on Target Choice and Clinical TrialDesignwithMulti-ModalArtificialIntelligence基于多模態人工智能靶點選擇和臨床試驗設計的臨床試驗結果預測II 期臨床試驗的預測結果準確率達到79%。Doi:10.1002/cpt.3008Predicting clinical t
147、rial outcomes usingdrug bioactivities through graph databaseintegration and machine learning通過圖形數據庫集成和機器學習使用藥物生物活性預測臨床試驗結果作者提出了一種可以使用生物活性、化合物的物理化學性質、目標相關特征和基于 NLP 的化合物表示來準確地預測試驗結果的機器學習,該模型在預測臨床試驗“是否成果”上表現良好,F1 達0.96。通過分析特征對預測能力,證明了生物活性在預測臨床試驗結果方面具有統計學意義。Doi:10.1111/cbdd.14092用于臨床試驗結果預測的分層交互網絡HINT:Hi
148、erarchical interaction network forclinical-trial-outcome predictions作者提出了分層交互網絡(HINT)來預測臨床試驗結果。暗示在 1,160項 I 期試驗、4,449 項 II 期試驗和3,436 項 III 期試驗中接受了培訓和驗證。它在 627 個 I 期、1,653 個 II 期和 1,140 個 III 期試驗的單獨測試集上分別獲得了 0.665、0.620 和 0.847F1 分數。HINT在大多數指標上明顯優于最佳基線方法。Doi:10.1016/j.patter.2022.100445In Silico Mode
149、l Estimates the Clinical TrialOutcome of Cancer Vaccines計算機模型估計癌癥疫苗的臨床試驗結果CRR(臨床反反應率)取決于廣泛T 細胞反應的誘導,并且當考慮與多個自體 HLA 結合的表位時,可以預測 IRR(免疫反應率)和 CRR。Doi:10.3390/cells10113048圖表1 部分AI預測臨床試驗效果相關文章54中國AI制藥企業白皮書丨2023/11圖表1 用于預測臨床試驗結果的人工智能框架和數據源概覽圖源:Clin Pharma and Therapeutics,First published:22 July 2023,doi
150、:(10.1002/cpt.3008)1 doi:10.1002/cpt.3008 2014年以來,英矽智能長期致力于開發用于II期到III期臨床試驗轉化成功率預測的人工智能模型。英矽智能搭建的高效人工智能藥物研發平臺Pharma.AI,包括PandaOmics、Chemistry42、inClinico三大組成部分,其中inClinico 是一個SaaS模式的在線軟件系統,旨在預測臨床試驗II期至III期的轉化成功率,它整合了多種評分方法、多模態數據源(包括文本、組學、臨床試驗設計和小分子特性)以及生物學背景,并與深度學習模型相結合。2022年11月以來,inClinico以SaaS形式提供
151、服務。國內企業布局英矽智能Pharma.AIinClinico:預測臨床試驗II期至III期的轉化成功率白星花科技Bx-SaaS平臺:聚焦于臨床數據、真實世界以及醫藥科研文獻西湖歐米iTalks Series:西湖歐米AIDD平臺ClinicTalks:藥物臨床試驗分析與結果預測研究方向:蛋白質組學目前,國內可將AI技術用于臨床試驗結果預測企業較少,代表企業包括英矽智能、白星花科技、西湖歐米。2023年8月3日,國內領先的生成式人工智能(AI)驅動的生物醫藥科技公司英矽智能,利用其自主研發的基于Transformer的人工智能臨床試驗預測引擎inClinico,高度準確地預測了多項臨床試驗II
152、期至III期的轉化結果。這項研究成果已發表在 CLINICAL PHARMACOLOGY&THERAPEUTICS上1。55中國AI制藥企業白皮書丨2023/11根據英矽智能發表的論文,inClinico平臺在55,000多項獨特的II期臨床試驗中進行了訓練,并在回顧性、準前瞻性和前瞻性驗證研究中進行了驗證。在準前瞻性驗證中,inClinico 在預測臨床試驗II期至III期的轉化成功率方面的ROC AUC 達到了0.88。在前瞻性驗證中,它對真實世界臨床試驗結果預測的準確率達到了79%。除了成功預測多項臨床試驗II期至III期的轉化結果外,該研究結果還表明,靶點選擇比臨床試驗設計更有可能影響
153、臨床試驗結果預測。此外,論文還展示了inClinico的投資應用,使用了日期標記的虛擬交易組合,展示了35%的9個月投資回報率。以投資為目的的實踐還表明,inClinico 可以為投資者提供技術上的盡職調查見解,并幫助制藥公司確定藥物開發項目的優先次序。Core FeaturesAI模型異構圖形Transformer;基于Transformer模型的Dilbert;Open AI的 GPT4 和 GPT3.5。三個AI引擎:一個用于評分試驗設計、一個用于靶點選擇和一個用于患者符合資格標準,進而產生一個表示任何試驗成功可能性的元分數。訓練數據 ClinicalTrials.gov注冊的超過550
154、00個二期臨床試驗。準確度在準前瞻性驗證中,inClinico 在預測臨床試驗II期至III期的轉化成功率方面的的 ROC AUC 達到了達到了 0.88。在前瞻性驗證中,它對真實世界臨床試驗結果預測的準確率達到了,它對真實世界臨床試驗結果預測的準確率達到了79%。適用場景制藥公司:投資人及金融機構:進行盡職調查,評估小型生物技術公司早期階段的管線,或投注可能最有可能上漲(通常為40%-50%)的股票。圖表1 inClinico用于預測臨床試驗結果的人工智能框架和數據源概覽圖表2 inClinico核心用途和功能2inClinico is a platform for Data-driven
155、multimodal forecast of single clinical trials probability of success(PoS).Predict clinical trials success rateRecognize the weak points in trial designAdopt the best practices in the industryCore Features Scoring of custom trials:compare designs for the clinical trial that are planned and optimize t
156、hem for success Database of historical and ongoing clinical trials:findclinical catalysts that drive pharmaceutical growth,sort them by the PoS,and research the designs of successful trials Clinical Trial Outcome Scores:the ability to analyze performance for individual trials with simple data-driven
157、 metrics for the PoS Comprehensive Report Generation1 來源于公開信息,藥融咨詢整理2 來源自英矽智能官網56中國AI制藥企業白皮書丨2023/11新藥研發是一個數據密集型的工作,雖然過去幾年中AI取得了令人矚目的進展,但研究者們仍然面臨著海量數據的挑戰。如臨床研究數據管理需要包括從研究設計、研究注冊、數據采集、患者隨訪、項目管理、安全預警、數據管理與初步分析的全鏈條管理。單臨床試驗的納入/排除標準可能多達六七十項,而這些標準可能包括實驗室檢查結果、過去的藥物暴露史、藥物反應等。此外,臨床試驗數據的固有復雜性和多樣性面臨著進一步的挑戰。如在腫
158、瘤治療領域,臨床試驗通常包含多方面的設計,包括復雜的組織取樣和分子處理要求。因此,醫療組織必須確保擁有具備經驗豐富的醫護人員,但傳統的數據收集管理存在諸多問題,數據的可靠性、安全性和準確性得不到保證、數據易丟失、數據核查的工作量太大、數據管理的費用過高且過程較為繁瑣等,整個過程會推遲臨床研究進展。改革傳統臨床數據管理模式迫在眉睫。如何完整、及時、高效地采集數據變得尤為重要,人工智能和機器學習工具的使用也應運而生。具體而言,AI在臨床試驗數據管理方面的應用包括數據收集和整合,數據清洗和標準化,數據監測和質量控制,以及數據分析和預測等。目前,在臨床試驗數據管理中,運用AI的主要技術包括:ML(機器
159、學習)、DL以及NLP等。數據收集和整合 AI可以幫助自動化數據收集過程,減少人工輸入錯誤和減輕數據管理人員的工作負擔。通過自然語言處理和圖像識別等技術,AI可以從臨床記錄、實驗室報告和醫學影像等多種數據源中提取和整合數據。數據清洗和標準化 臨床試驗數據通常來自不同的來源,具有不同的格式和標準。AI可以應用于數據清洗和標準化,自動識別和糾正數據中的錯誤和不一致性,確保數據的一致性和準確性。數據監測和質量控制 AI可以幫助監測臨床試驗數據的質量,并提供實時的數據質量指標和異常檢測。通過分析數據的模式和趨勢,AI可以幫助發現潛在的數據問題和錯誤,及時采取糾正措施。數據分析和預測 AI可以應用于臨床
160、試驗數據的分析和預測,幫助研究人員識別潛在的治療效果、副作用和安全性等關鍵指標。AI可以利用機器學習和統計模型,從大規模的數據中發現隱藏的模式和關聯,提供有價值的洞察和預測。近年來AI在臨床試驗數據管理方面已取得一定進展。如:在2023年美國臨床腫瘤學會(ASCO)會議中,Concert AI分享了它如何成功地自動化了一項研究所需的55%的數據,該公司研發的DTS eScreening軟件,是一種基于ML的工具,旨在根據臨床試驗入排標準對患者進行排名;2023年6月13日,領先的臨床數據技術和自動化公司Beaconcure宣布獲得1400萬美元B輪融資,Beaconcure的人工智能平臺Ver
161、ify是與輝瑞聯合開發的,它簡化了臨床試驗數據統計分析過程并使之自動化;此外,生成臨床研究報告(clinical study reports,CRS)是臨床試驗的重要組成部分,通常需要數周或數月,而 NLP處理先驅Yseop于2023年6月推出“Yseop Copilot”,據Yseop,使用該技術自動撰寫CSR有助于將報告撰寫時間平均減少40%。Yseop Copilot采用了預訓練的大型語言模型,并結合了數據到文本(符號AI)和文本到文本(預訓練的開源LLM)技術。1 來源于公開信息,藥融咨詢整理 最新技術舉例 AI助力臨床試驗數據管理助力臨床試驗數據管理57中國AI制藥企業白皮書丨202
162、3/11企業主要技術平臺及應用場景普瑞基準AIBERTAI針對藥物臨床試驗,提供臨床試驗統計分析服務,內容包括分析計劃制訂、數據治理、程序編寫、圖表制作、分析報告撰寫等。除了臨床試驗數據分析標準內容之外,亦可根據客戶需求提供包括多組學數據挖掘在內的探索性分析:在全面剖析現有臨床數據的同時,亦為下一步藥物研發提供方向和依據。耀乘健康Prime Catalog 是耀乘健康科技 AuroraPrime 臨床研究平臺上用于臨床試驗全流程文檔管理的軟件系統?;?NLP 的歸檔目錄推薦功能。至本醫療對話式AI醫療數據臨床分析工具OMSmartData通過結構化的整合進行深度挖掘和全面分析,以對話形式,充
163、分挖掘用戶訴求,智能輸出文字和分析圖表,滿足不同用戶、不同場景的數據需求。深度智耀電子數據采集系統(EDC)臨床數據管理系統臨床數據編程系統提供完整的臨床數據流解決方案,包括數據采集、轉換、編碼、核查等各業務環節。國內,將AI技術應用到藥物開發的臨床及臨床后階段企業較少,在IND階段后,對臨床試驗數據的管理、分析是應用相對較多的場景,主要有普瑞基準、耀乘健康等企業。據公開信息披露:耀乘健康科技AI技術團隊實施了 AuroraPrime 底層架構與 OpenAI 的對接,并著手在多條產品線中實際落地應用場景。包括:Prime Create、Prime Coordinate、Prime Catal
164、og等等。Prime Catalog 是在AuroraPrime 平臺上構建的企業級文檔管理系統,包含了 eTMF、項目公盤等文檔產品,滿足了企業級文檔、項目級文檔和項目 eTMF 多維度的文檔管理訴求。在OpenAI助力下,可結合項目 eTMF 目錄結構以及上傳的文檔名等關鍵信息,在用戶操作過程中智能推薦文檔的歸檔位置等,提升整體文檔管理效率。圖表2 國內將AI應用于臨床試驗數據管理的代表企業及應用場景圖表1 AuroraPrime臨床研究平臺 國內企業布局58中國AI制藥企業白皮書丨2023/11 AI賦能藥物注冊賦能藥物注冊eCTD申報申報CTD(The Common Technical
165、 Document,共同技術文件)是國際公認的文件編寫格式,用來制作向藥品注冊機構遞交的結構完善的注冊申請文件。一共分為五個模塊,模塊一行政管理文件和藥品信息;模塊二通用技術文檔總結;模塊三質量;模塊四非臨床試驗報告;模塊五臨床研究報告。其中,模塊一為區域性要求,具體內容和格式由相應的監管機構規定,模塊二、三、四和五為國際通用要求。電子通用技術文檔(eCTD)是對CTD的一種電子化呈現和管理方式,通過可擴展標記語言(XML)技術將基于CTD文件結構和eCTD技術規范的文件加以組織,并用于藥品注冊申報和審評的一種注冊文件技術格式。eCTD使申報資料編制、申報、受理、審評、全生命周期管理和檔案存儲
166、更加便捷經濟,既保障了資料的申報質量,又提高了審評效率,更重要的是使申報資料的格式、內容及標準要求保持全球通用性和一致性。中國國家藥品監督管理局已自2021年12月29日起全面開展和推進藥品電子通用技術文檔(eCTD)申報,正式打開了eCTD申報時代的大門??梢灶A見,隨著 eCTD 在我國的全面實施,遞交網絡化及驗證自動化、eCTD 4.0 試點以及云數據和 AI 自動化等應用也將逐步落地。質量綜述非臨床綜述質量非臨床試驗報告臨床研究報告臨床綜述臨床研究報告行政文件和藥品信息非臨床文字總結和列表總結目前國內較為典型的是成立于2017年的深度智耀,其自主研發的AI智能系統和相關服務覆蓋制藥研發全
167、鏈條,其中就包含全球注冊申報以及文本智能(醫學寫作、醫學翻譯、eCTD遞交、文檔管理)等各模塊。在臨床研究階段,包括 AI 驅動的藥物警戒系統、注冊事務系統、寫作翻譯系統、臨床數據編程系統等產品。另外,公司的AI 自動翻譯寫作申報系統實現集醫學寫作、醫學翻譯和注冊申報“三位一體”的人機交互自進化平臺,改變以往上述三大環節的割裂狀況,重構了傳統的數據文件整合模式。ARM智能申報系統AI Regulatory Management System注冊申報規劃注冊文檔翻譯文件格式檢查文檔組裝出版文檔驗證提交文檔存檔查詢59中國AI制藥企業白皮書丨2023/11第五章AI+藥物生產及商業化0560中國A
168、I制藥企業白皮書丨2023/11人工智能為藥物生產也提供了許多可能性,包括但不限于優化工藝設計和工藝控制,智能監測和維護,以及趨勢監測以推動持續改進等,使用人工智能來支持藥品生產,可以與其他先進的生產技術一起部署,以實現預期的效益。人工智能是實施工業4.0模式的助推器,可以為生產商帶來一個控制良好、超級連接、數字化的生態系統和醫藥價值鏈。根據 FDA藥品審評和研究中心發布的藥品生產中的人工智能討論稿,AI用于藥物生產可主要分為四個場景,包括工藝設計優化以及工藝放大、高級工藝控制、工藝過程的檢測以及缺陷的檢查、趨勢分析和檢測。目前,AI用于藥物生產尚不成熟,但已取得一些階段性成果。如生物技術公司
169、Pow.bio通過AI+連續發酵平臺,朝著優化和自動化發酵的方向發展,使其既具有成本效益又精簡。Teledyne DALSA開發了一種特殊的盲文視覺檢測系統,該系統使用帶有面掃描攝像頭的VICORE智能視覺系統的形狀陰影技術,以及Sherlock形狀陰影算法,從背景復雜的盲文中獲取對比度較高的3D效果圖像。然后,Sherlock應用預處理程序優化盲文點的殘缺形狀,從而使OCR算法能夠讀取盲文字符,以幫助盲人閱讀藥品說明書。工藝設計優化以及工藝工藝設計優化以及工藝放大放大可以利用ML(機器學習)等人工智能模型使用工藝開發數據生成更快速地確定最佳加工參數或放大工藝,減少開發時間和浪費。高級工藝控制
170、(高級工藝控制(APC)APC允許對生產過程進行動態控制,以達到理想的產出。人工智能方法也可用于開發過程控制,通過使用人工智能與實時傳感器數據相結合,可以預測過程的進展情況。將對生產過程中發生的基本化學、物理和生物轉化的理解與人工智能技術相結合的。工藝過程的檢測以及缺工藝過程的檢測以及缺陷的檢查陷的檢查人工智能方法可用于監測設備,并檢測出與正常性能不同的變化,從而觸發維護活動,減少工藝停工時間。也可用于監測產品質量,包括包裝質量(例如,基于視覺的質量控制,使用包裝、標簽或玻璃瓶的圖像,由基于人工智能的軟件進行分析,以檢測產品的特定質量屬性要求的偏差)。趨勢分析和檢測趨勢分析和檢測人工智能可用于
171、檢查消費者投訴和包含大量文本的偏差報告,以確定集中問題領域并優先考慮持續改進的方向。這提供了識別生產相關偏差的趨勢的優勢,以支持更全面的根源識別。與工藝性能和工藝能力指標相結合的人工智能方法可用于主動監測生產業務的趨勢。這些方法還可以預測觸發糾正和預防行動有效性評估的閾值。1 來源于公開信息,藥融咨詢整理最新技術舉例 AI賦能藥物生產支持賦能藥物生產支持61中國AI制藥企業白皮書丨2023/11在工藝優化設計中,可采用數字孿生技術。工藝數字孿生是物理過程的數字復制,用于更好地理解、分析、預測和優化工藝性能。對于分析以有限的開發數據為特征的制造工藝,數字孿生尤其有用。如:GSK與西門子公司合作1
172、,在中試規模驗證數字孿生技術并獲得成功;奧地利初創公司Novasign開發了基于混合模型的數字孿生系統,運用該系統對大腸桿菌表達超氧化物歧化酶的過程進行優化2,加速發酵過程優化的進程;西門子公司2019年收購PSE公司過程數字化模型軟件平臺gPROMs,用于布局生物過程數字孿生系統。在藥品制造中,可以使用如神經網絡等AI/ML技術,以實時過程數據為輸入,來實現APC。這些方法也可以用于開發能夠預測一個過程是否在一個控制狀態下運行的過程控制,這需要結合實時傳感器數據使用AI/ML工具,包括與生產線的智能監控相結合,以提高現有制造線的效率和產量。對于藥品質控,常常采用機器視覺檢測技術機器視覺檢測技
173、術。在制藥生產過程中,對具有難點的產品進行檢查是一項非常具有挑戰性的工作。如:對于無法完全去除氣泡的高粘度注射液,區別這些氣泡與顆粒存在困難。在達到平衡的檢測水平和誤剔率之前,這些情況通常需要長期進行視覺算法視覺算法開發與優化?!癆I圖像視覺檢測”,其本質是通過基于深度學習的AI算法,對檢測物進行圖像采集,并進行樣本標注、訓練,從而達到對檢測物進行分類決策的目的,將良品與不良品進行分類處理。對于趨勢監控,AI/ML可以被用來輔助審查偏差報告,這些報告通常包含大量的數據或文本,用于分析制造相關的偏差趨勢,聚類問題領域,并優先處理需要主動持續改進的領域。與過程性能(Ppk)和過程能力(Cpk)指標
174、集成的AI/ML方法可以用來主動監控制造操作的趨勢和失控事件,并預測觸發CAPA(糾正和預防措施)有效性評估的閾值。1 Markarian J.Opportunities for digital twins.BioPharm International,2021,34(9):30-33.2 doi:10.1002/biot.202000121圖表1 數字孿生關鍵架構圖源:中國電力科學研究院人工智能應用研究所62中國AI制藥企業白皮書丨2023/11具藥融咨詢統計,目前國內已將AI技術運用于制藥環節企業不多。AI+制藥企業主要包括沃時科技、大灣生物、勝普澤泰,三家企業研究領域有所不同,但在藥物制
175、造上,均主要用于工藝優化。沃時科技聚焦于小分子化合物,在AI+逆合成與工藝場景優化上發力,服務客戶主要為CRO、CDMO企業,幫助這些公司合成分子并在合成工藝上進行優化。大灣生物將AI技術主要應用于生物藥領域,公司已有3個智能化生物工藝開發平臺進入商業化運作階段,包括Klone4.0、AlfaStaX與AlfaMedX。通過AI技術與生物技術,大灣生物進行抗體蛋白類藥物CDMO工作,通過AI技術和生物工藝相結合,開發定點整合高表達細胞株。勝普澤泰致力于多肽藥物的研發和生產服務。該司以大數據與AI驅動的Chemical Space新藥發現技術在瑞士發展近20年,已合作藥企眾多,包括ROCHE、L
176、ONZA、BRACCO、人福藥業、興齊眼藥等。沃時科技沃時科技應用場景:小分子制藥工業場景AI決策平臺聚焦于智能制造和工藝優化智能制造和工藝優化等領域,致力于AI較少涉足的“分子合成”、“工藝設計”、“工藝生產放大”環節等。大灣生物大灣生物應用場景:大分子首創“AI+Bioprocessing”概念,致力于將AI賦能于生物工藝全過程生物工藝全過程。AlfaCell:高產 穩定 定點整合細胞株構建平臺AlfaMedX:智能化培養基開發平臺AlfaOPATM:智能化無篩選培養基開發平臺(細胞株關鍵成分代謝模型)勝普澤泰勝普澤泰應用場景:多肽專注于構建多肽、擬肽以及多肽偶聯藥物(PDC)從新藥發現到
177、工業化生產的一站式AI-CRDMO服務平臺。多肽CDMO:采用固相-液相組合工藝技術和拉曼-紅外工藝過程控制技術,利用AI數據庫找到最優的工藝參數數據庫找到最優的工藝參數,使得每步合成收率達到99.5%,總生產率提高15%,成本降低。國內企業布局63中國AI制藥企業白皮書丨2023/11此外,太倉中科信息技術研究院攜手華為推出智瞐系列智能視覺檢測產品。該產品基于昇騰AI基礎軟硬件平臺,融合遷移學習、數據增強、弱監督檢測等AI模型算法,解決了對泡罩藥品跨產品、跨型號、跨類別的通用檢測難題,為制藥行業打造藥品封裝缺陷檢測的數智化解決方案。智瞐系列智能視覺檢測核心產品包括:A.智瞐 ZMAI 視覺檢
178、測軟件:基于昇思MindSpore AI 框架和MindX深度學習視覺SDK;B.智瞐工業AI視覺檢測平臺:可實現大規模數據的快速訓練和迭代,建立全面的缺陷檢測模型庫;C.智瞐藥品檢測設備及模組:基于昇騰Atlas 300AI推理卡,獨立檢測設備ZMX-100可直接對藥板的正反面包裝缺陷及藥品缺陷進行全方位檢測;獨立視覺檢測模組ZMX-320可加裝在藥品泡罩機上,在高節拍快速檢測的同時實現識別精度的有效提升。圖表1 昇思MindSpozre總體架構圖源:MindSpore官網我國制藥行業年產量高,且種類眾多,膠囊、片劑等在生產及鋁塑封裝過程中不可避免會產生缺粒、凹坑、破損、批號不清等缺陷。在制
179、藥過程中,除生產工藝需要優化外,對于藥品的質檢也具有迫切需求。一些通過人工智能技術提供先進生產力的企業,涉足領域較廣,也包含生命科學領域。如:鎂伽科技、科億科技等,此類企業多為藥企提供產品的缺陷檢測。企業主要技術及應用場景鎂伽科技MEGAPLANT:鎂伽針對藥物發現、化合物合成和工業產品表面缺陷檢測等行業需求,搭建了MegaPlant AI算法平臺,融合了包括小樣本學習、強化學習和圖計算等技術在內的CV與NLP算法??苾|科技為各工業領域提供視覺成像、算法算力及自動控制的AI系統解決方案?;谏疃葘W習的AI圖像視覺檢測融合了AI算法云平臺、邊緣計算技術、嵌入式處理平臺、定制專用相機、光學成像系統
180、、定制化的人機交互系統、遠程運維平臺等技術??蔀樗幤筇峁┊a品的缺陷檢測,如:黑點、裂紋、異物、破損等。64中國AI制藥企業白皮書丨2023/11 AI賦能藥物市場開拓與商業化賦能藥物市場開拓與商業化AI營銷是指利用人工智能技術和算法來輔助和改進市場營銷活動的過程。它結合了大數據分析、機器學習和自然語言處理等技術,通過對海量數據的處理和分析,提供個性化、精準和智能化的營銷解決方案。在AI營銷中,人工智能可以幫助企業實現的目標包括:市場分析和預測、目標受眾定位、個性化營銷和推廣、自動化營銷、客戶關系管理,以及營銷決策支持等1,這些應用可以幫助藥企更好地理解市場和消費者需求,以提供個性化的營銷和推廣
181、。此外,AI在藥物市場開拓中,一個重要的作用為幫助產品定價,確定價格的方法為利用其可模仿人類專家思維的能力,對產品生產后的定價控制因素進行評估2。決定創新和仿制藥價格的因素包括:藥品研發過程中的支出、相關國家的價格監管制度、獨占期的長短、專利到期一年后創新藥的市場份額、參照產品的價格以及定價政策等3。目前已有企業將AI應用到藥品市場開拓與商業化中,如 Intelligence Node、Veeva Systems、Aktana、DeepIntent等等,Node推出的 In competitor 是一個零售競爭情報平臺,可分析競爭對手的定價數據,幫助零售商和品牌商監控競爭對手。在AI藥物市場開
182、拓中,用到的AI技術主要包括:NLP、ML、數據挖掘和大數據分析等。在 ML 中,軟件會分析大量統計數據,如產品開發成本、產品市場需求、庫存成本、制造成本和競爭對手的產品價格等,然后開發出預測產品價格的算法。推薦系統是一種常見的算法模型,用于根據用戶的歷史行為和偏好,為其提供個性化的藥物推薦。這些推薦系統可以基于協同過濾、內容過濾和深度學習等技術進行建模和優化。推薦系統在藥物營銷中,對醫學文獻、患者反饋和社交媒體數據進行文本分類和情感分析是常見的任務。這些任務可以利用機器學習算法,如支持向量機(SVM)、樸素貝葉斯分類器和深度學習模型(如卷積神經網絡和循環神經網絡)來實現。文本分類和情感分析藥
183、物營銷中的預測模型可以用于預測市場需求、藥物銷售量和患者行為等。這些模型可以基于回歸分析、時間序列分析和機器學習算法(如決策樹、隨機森林和梯度提升樹)來構建。預測模型多角度應用于藥物營銷中的市場分析,為市場營銷戰略和策略的制定提供科學合理的參考。聚類分析深度學習模型在藥物營銷中也得到廣泛應用。例如,利用卷積神經網絡(CNN)進行圖像識別,可以用于識別和分類藥物圖像。另外,循環神經網絡(RNN)和變換器模型(Transformer)等也可用于處理序列數據和自然語言處理任務。深度學習模型1 doi:10.3386/w242822 doi.org/10.1016/j.eswa.2008.09.014
184、3 doi.:10.1016/j.jval.2016.03.816最新技術舉例65中國AI制藥企業白皮書丨2023/11 國內企業布局2023年全球經濟不確定性增強,市場承壓、競爭加劇,傳統醫藥營銷模式下,成本高、效率低、轉化差、手段單一所帶來的問題更加凸顯,這也倒逼企業加速轉變營銷模式與技術策略,開辟第二增長曲線。而通過人工智能技術可以更準確地了解患者需求,從而確定更適宜的藥品營銷策略,基于人工智能的分析,也能幫助制藥公司縮短市場反饋周期,從而優化藥品推廣策略等。在此背景下,國內在AI賦能藥物商業化上迎來一定進展,據藥融數據統計,目前國內賦能藥物市場開拓及商業化企業共六家。通過對其服務內容和
185、應用場景進行分類,我們發現,企業提供服務內容大致可分為:與KOL的溝通交流、市場準入策略制定、銷售預測、競品對比以及話術合規。企業服務內容及應用場景百奧知MedAI eMAF解決方案知識圖譜 Knowledge graph學術網絡 Academic NetworkAI賦能市場策略制定,學術推廣。競品主題對比分析,產品優勢主題發現,產品研究熱點發現,客戶溝通材料制作。KOL動態跟蹤和管理。零氪科技Data Insights:數據洞察Digital Marketing:數字化營銷剖析市場狀況和模式,開發定制化數據分析包,闡明患者在疾病發病率高或對該特定療法認識較高的地區之間的分布。優先選擇新藥發布
186、區域。發現不同地區的趨勢,監控特定營銷策略的執行情況。開心生活科技AI賦能真實世界證據的產出為企業進行藥物經濟學研究,制定市場準入策略。云勢軟件SaaS服務商大數據和人工智能套件GeniusDATA智能數據GeniusSALES 銷售預測GeniusMKT 智能營銷GeniusAIDE 智能助理為制藥、醫療器械、動物健康、作物科學、營養保健等行業公司及CRO、醫院等臨床相關機構提供信息自動化管理云端解決方案。銷售市場(一站式SFE管理平臺)為其核心業務環節之一?;鹗瘮抵荂hatbot:醫學對話機器人Social Listening醫/患訴求洞察服務通過聆聽社交媒體收集的指標可幫助企業了解其與競
187、爭對手相比的位置,市場份額和差異特征。亦可通過研究目標藥品與其他藥物的聯用情況,了解藥品使用情況,為延長藥品成熟期周期提供重要指標參考沃豐科技智能知識庫智能溝通智能SCRM智能合規虛擬代表解決方案話術合規流程、增強話術傳達、數據可視化66中國AI制藥企業白皮書丨2023/11藥物警戒(Pharmacovigilance-PV):藥物警戒是與發現、評價、理解和預防不良反應或其他任何可能與藥物有關問題的科學研究與活動。目前,AI已在PV管理中發揮了非常重要的作用。AI,包括ML方法,如自然語言處理和深度學習,可以檢測和提取藥物不良事件的信息,從而使藥物警戒過程自動化,改善對已知和記錄的藥物不良事件
188、的監測。此外,隨著對遠程醫療服務需求的增加,在管理急性和慢性疾病方面,AI可以在檢測和預防藥物不良事件方面發揮作用。以數據智能技術為支撐,健全藥品安全監管體系,是完善健康保障的重要一環。哈佛大學對基于ML的AI的使用進行了范圍審查,檢索了PubMed、Embase、Web of Science和IEEE Xplore數據庫,以識別2000年至2021年9月發表的與ML在藥物警戒中的使用相關的文章,結果顯示,大多數研究(53%)側重于使用傳統統計方法檢測安全信號。在使用較新的ML方法的研究中,61%的研究使用了現成的技術并稍作修改。時間分析顯示,近年來,深度學習等較新的方法使用越來越多。AI的進
189、步尚未完全滲透到藥物警戒領域(盡管最近的研究表明這可能正在改變)。在整個藥物警戒管道中,存在著實施ML方法的機會。FDA將AI應用于PV以提高IVSRs分析的效率和科學價值時間相對較早,除了每年從制藥行業收到的近200萬份FAERS報告外,FDA還將公眾直接提交給其的數十萬份報告處理后傳輸至FAERS數據庫。從對FDA工作進展的描述中可以看出,AI用于PV時,大多數工作都涉及到使用NLP(自然語言處理)從ICSRs敘述中自動提取涉及因果關聯性評價的關鍵性特征,少數工作試圖開發可預測的機器學習(ML)算法,試圖將ICSRs關鍵信息要素提取、整合和分析的人類認知過程自動化。FDA近年來將人工智能應
190、用于藥物警戒活動的主要進展見表:1 中國藥物警戒2023年應用主題具體進展ICSRs關鍵信息提取和分析用NLP提取個例報告中的時間信息人口統計學信息和臨床概念的提取應用NLP和ML總結ICSRs的關鍵特征ICSRs關聯性評價發了用于提取臨床特征的LP和用于定義不良反應判定評價標準(如過敏反應)的機器學習分類用ML預測哪些ICSRs對因果關聯性評價最有價值NLP通過提取臨床數據并使其可視化(如時間性),以支持因果關聯性評價的病例系列分析ML算法,用于識別無法評價的病例報告(例如,包含不充分信息的ICSRs,因此無法支持因果關聯性評價)其他用NLP和統計聚類算法/樹絡分析來識別相似疾病的報告藥品標
191、簽/包裝插頁中提取不良事件并對其進行編碼對ICSRs開發了去除重復報告的算法圖表1 FDA將人工智能應用于藥物警戒的主要進展 AI逐步應用于藥物警戒領域逐步應用于藥物警戒領域67中國AI制藥企業白皮書丨2023/11根據已發布的2022年國家藥品不良反應監測年度報告,2022年,全國藥品不良反應監測網絡收到不良反應報告202.3萬份;1999年至2022年,全國藥品不良反應監測網絡累計收到不良反應報告2085.6萬份1。鑒于每年接受的龐大ICSRs(個例安全性報告)數量,如何處理、分析、評價和利用這些龐大而異構的海量數據,如何更好地利用ICSRs為上市后藥品監管工作服務,是我國藥物警戒(PV)
192、工作的重大挑戰之一。PV系統的兩個主要構成部分包括單個案例處理:即個人不良事件的收集、解讀和報告,以及信號檢測,對AE數據進行持續性的趨勢監測以判斷是否有未知的安全信息會對風險獲益評估結果產生影響。我國在人工智能用于PV上起步較歐美國家晚,但當前,基于真實世界數據和數據智能技術的藥物警戒系統正在重塑我國藥品監管格局。目前國內利用AI技術提供藥物警戒服務的企業約七家左右,這些企業大多集中在北京,且類型均為Saas 服務。除洞悉網絡外,其他公司除藥物警戒外還提供藥物研發生命周期的其他服務。而成立于2016年的洞悉網絡專注醫藥安全,采用“全生命全產業鏈醫藥安全產業數字化SaaS+安全重度垂直服務”的
193、模式,面向醫藥行業,提供覆蓋臨床試驗到上市后全生命周期的藥物警戒及風險管理服務。1 中國藥物警戒2023年2來源于公開信息,藥融咨詢整理企業地址技術平臺及提供服務深度智耀北京Deep-PV依靠自然語言處理技術,實現:個例藥物不良反應/不良事件報告;可疑安全信號檢測;報告自動生成。開心生物科技北京HLT eMediSafe藥物警戒管理系統收集、處理、上報與分析藥品安全相關數據的管理系統核心功能:個例報告處理、各類表格導出、上報與反饋、報告翻譯、年度報告撰寫云勢軟件北京VirgoPV|藥物警戒系統為企業建立藥物安全性數據庫,整合各階段藥物的數據,為企業的數據分析做基礎數據體系。零氪科技北京真實世界
194、研究服務為藥品上市后的安全性和有效性提供等提供真實世界證據愛特曼北京SUSAR報告端到端解決方案針對藥物警戒SUSAR報告處理中涉及的CIOMS翻譯、提取、整理和分發等流程中的問題進行優化,服務藥企應對SUSAR報告site分發環節。北京洞悉網絡SaaS北京HoloxClinical、HoloxPharma、HoloxVaccin、HoloxRWE神州醫療北京為醫藥企業/CRO公司提供采集、管理、上報藥品安全性數據太美醫療科技杭州eSafety藥物警戒系統圖表1 國內AI+藥物警戒企業清單國內企業布局68中國AI制藥企業白皮書丨2023/11第六章AI制藥行業總結及未來展望0669中國AI制藥
195、企業白皮書丨2023/11盡管全球已有多款AI研發藥物進入臨床,且最高進展已到臨床三期,與此同時,有很多利用AI技術研發的藥物進入臨床后失敗,目前尚無AI研發的藥物成功上市。如:2023年 7 月 31 日,日本住友制藥和大冢制藥宣布,其合作在研的ulotaront 藥物的兩項兩項 III 期研究精神分裂癥臨床試驗未能達到主要終點期研究精神分裂癥臨床試驗未能達到主要終點。Ulotaront 是一款利用人工智能技術發現利用人工智能技術發現,具有 5-HT1A 激動劑活性的TAAR1激動劑,目前正在研究用于治療精神分裂癥、廣泛性焦慮癥和重度抑郁癥的輔助治療,并正在考慮其他適應癥。由Exscient
196、ia和日本住友制藥合作開發DSP-1181的藥物,是一種用于治療強迫癥(OCD)的長效血清素5-HT1A受體激動劑,這是全球首個由AI設計的分子,但因臨床I期研究未達標而停止研發。英國頭部AI藥企Benevolent AI公布其治療特應性皮炎的局部泛Trk抑制劑BEN-2293的a期臨床沒有達到次要療效重點,Relay Therapeutics在AACR2023會議上披露了選擇性PI3K抑制劑RLY-2608的臨床數據有效性不佳。Recursion(Nasdaq:RXRX)開發的REC-3599用于治療一種罕見病GM2神經節苷脂沉積癥臨床一期結束后下階段的臨床試驗遲到2年也已停止研發。AI新藥
197、研發技術迎來成果檢閱,多款藥物進入臨床,但尚無藥物成功上市企業名稱/代碼臨床階段藥物類型英矽智能ISM001-055Phase 2 Clinical小分子藥物紅云生物H002Phase 2 Clinical小分子藥物銳格醫藥RGT-075Phase 2 Clinical小分子藥物Exscientia;湃隆生物GTAEXS617Phase 2 Clinical小分子藥物冰洲石生物AC0682Phase 1 Clinical小分子藥物(PROTAC)未知君XBI302Phase 1 Clinical微生物療法未知君LBP01Phase 1 Clinical微生物療法未知君LBP02Phase 1
198、Clinical微生物療法劑泰醫藥MTS004Phase 1 Clinical小分子藥物宇耀生物YY001Phase 1 Clinical小分子藥物睿健醫藥NouvNeu001Phase 1 Clinical 細胞治療銳格醫藥RGT-028Phase 1 Clinical 小分子藥物銳格醫藥RGT-419BPhase 1 Clinical 小分子藥物銳格醫藥RGT-264Phase 1 Clinical 小分子藥物費米子FZ002Phase 1 Clinical 小分子藥物中以海德HDM-8421034Phase 1 Clinical 小分子藥物圖表1 國內借助AI進入臨床階段藥物及進展 現狀
199、分析及展望現狀分析及展望70中國AI制藥企業白皮書丨2023/11全球范圍內,AI制藥均主要集中在藥物發現環節??赡茉蛟谟?,該環節以化學過程為主,研究人員對候選化合物數據的完整性及可重復性、化學穩定性、理論認知度等都有較好的把握,有利于AI建模。但臨床試驗階段有較大不同,是以生物學過程為主,其復雜性在數據和AI建模兩方面帶來巨大挑戰。在數據方面,需要將臨床數據加以結構化處理,而諸如病歷、隨訪記錄目前還很難標準化、數字化;此外,由于涉及患者隱私,目前尚無能充分保障數據安全的有效措施,這也限制了臨床數據的靈活運用。在AI建模方面,化合物與人體靶點的反應過程非常復雜,但目前理論認知還不足,受環境影
200、響因素很大,數據穩定性和可重復性差,所以不利于AI建模,對療效和安全性的影響也難以把控。因此,對于真實可信、覆蓋臨床各環節的完整臨床數據庫,還有較大發展空間。數據是AI的三大核心要素之一,一方面,AI能夠從海量的生物醫藥數據中挖掘出價值點;另一方面,AI藥物研發又普遍受到數據之苦。AI/ML模型本質上是數據驅動的,對用于訓練、測試和驗證的數據的屬性或特征特別敏感,然而數據需要考慮偏見、完整性、隱私和安全、出處、相關性等各種問題。鑒于AI/ML模型本質上是數據驅動的,基于獲取的各種來源的訓練數據不斷升級,這使得模型很容易納入人為偏見,所以,在開發各種AI/ML模型時,應盡一切努力獲取平衡、客觀和
201、高質量的訓練數據集?,F階段,大多數公開數據庫來源于文獻和實驗室數據以及通用數據庫。但目前存在諸多問題,如:由于生成數據的實驗條件和記錄數據的格式或注釋往往不相同,存在數值不一致、數據缺失、誤差等問題,難以被計算機統一識別。且醫藥領域普遍存在“數據孤島”,大多數高質量和核心數據掌握在少數企業中,保密性極強,公開可能性較小,制約了行業的整體向前發展。大型通用數據庫能夠對初始生成模型進行預訓練,用來評估其模型能力。但公開數據集一般質量參差不齊,需要自主進行篩選過濾和標準化。針對不同的場景,基于不同的數據維度與顆粒度進行數據清洗處理,還需要較大的投入。與此同時,從偏差的數據中,亦可挖掘出有價值的信息。
202、2023年8月31日,發表在 NEJM綜述表示:開發醫學人工智能工具的時候,“偏差的數據”,比如人群代表性差的數據、信息缺失的數據等等,也具有其價值,不應該只簡單丟棄或者技術上的“矯正”(特別是有些“矯正”缺乏依據,加劇偏差)。這些“偏差的數據”蘊含著豐富的信息,比如,它們就像“文物/遺跡”一樣,可以反映當時或現在的社會、制度狀態;將來結合創新的人工智能工具,就可以很好的總結這種“數據偏差模式”,幫助人們進一步分析偏差成因,并促進更公平的醫療。AI賦能藥物開發多集中在藥物發現階段,臨床試驗階段應用或為AI帶來新方向AI制藥存在“數據困境”,但并非無法破局71中國AI制藥企業白皮書丨2023/1
203、1AI算法“黑盒”問題是指由于廣泛應用在AI產品上的深度學習等主流算法模型內部結構復雜、運行過程自主性較強且人工無法干預等因素,在數據輸入、模型訓練、結果輸出等方面出現運行機制難以解釋運行機制難以解釋的情況,人工智能的內部工作原理對最終用戶來說是不可見的,導致運行結果無法完全掌控。當人工智能模型是“黑盒”時,很難理解模型是如何得出預測以及建議的。人工智能的可解釋性提供了對人工智能模型內部工作的深入了解,例如有助于預測的潛在因素、特征或模式,并解釋了這些模型的決策過程和輸出。目前深度學習作為AI技術的主要算法之一,其特點是通過大量的訓練數據對模型訓練,最終確保在特定輸入數據下通過“黑盒”運行,得
204、到更加智能、精準的輸出結果。在生命科學行業,人工智能越來越多地被用于在可能危及生命的地方做出具有深遠影響的關鍵決策和預測,如疾病診斷、治療計劃或藥物開發,可解釋性對于確保透明度、可信度和監管合規性至關重要可解釋性對于確保透明度、可信度和監管合規性至關重要。如:浙江大學指出,由于歷史數據的偏差,曾發生過算法對肺炎患者診斷出錯等問題。從產業實踐上看,目前各家科技公司基本利用自身所搜集的有限數據進行測試,各公司宣稱“安全”的AI產品往往具有很多較難發現的安全漏洞。因此,一旦未經充分安全測試的相關產品大范圍應用于醫療/制藥領域,將暗藏錯誤推理、錯誤決策等較大安全隱患。對“黑盒”算法進行更多可解釋性的分
205、析研究,使人工智能模型的輸出更具透明度,如:對于小分子,如果結合自由能的預測,或是基于靶點口袋的分子生成,或是對先導化合物進行優化改造,將微觀物理的信息融入到深度學習框架之中,這個模型就能夠更好地學習到真實的因果關系或物理規律,模型的魯棒性和可靠性也會得到大幅提升?;蛟S會成為未來的主要發展趨勢之一。2023年7月21日,國家衛健委同教育部、公安部、審計署等十部門聯合召開視頻會議,部署開展為期1年的全國醫藥領域腐敗問題集中整治工作。隨后多個省份已發文,跟進集中整治。此次反腐行動力度大,覆蓋范圍廣,強調針對醫藥領域生產、供應、銷售、使用、報銷等重點環節和“關鍵少數”,深入開展醫藥行業全領域、全鏈條
206、、全覆蓋的系統治理。在此背景下,醫藥行業對于藥品學術推廣及市場營銷等的合規性要求愈加嚴格,而傳統質檢難以全面覆蓋銷售推介和客戶服務交流的內容,存在極大的合規風險。但智能質檢可提供通話記錄全量質檢,不遺漏任何違規項,如過度承諾、詢問藥量等,在醫療反腐大背景下可能迎來一定的市場機會。此外,在藥物市場開拓中,AI技術輔助營銷可以及時向醫生提供專業醫學內容,幫助醫生提高專業知識儲備、滿足研究需求等。集采、醫療反腐背景沖擊下,AI+市場營銷迎來新機遇“黑盒”算法帶來安全風險,突破其不可解釋難題意義顯著72中國AI制藥企業白皮書丨2023/11企業名稱上市時間技術領域上市地區臨床管線數量臨床管線治療領域2
207、022年營收(億美元)AbCelleraBiologics2020年12月抗體藥物發現、藥物篩選美國AI-CRO4.85Absci Corp2021年7月分子生成與優化(SoluPro)美國AI-CRO0.06Benevolent AI2022年4月靶點發現、分子生成與優化(Benevolent Platform)荷蘭1特異性皮炎(已宣布失?。?.21C4X Discovery2007年1月基于基因組的靶點發現(Taxonomy3)、分子生成與優化(Conformetrix)英國1神經系統疾病0.04Exscientia2021年10月靶點發現、分子生成與優化、ADMET性質預測、臨床預測(C
208、entaurAl)美國5腫瘤神經系統疾病炎癥0.27Erasca2021年7月藥物發現(OPRA)美國4腫瘤(臨床管線為引進)0.09Evaxion Biotech2021年2月癌癥個性化治療靶點發現(ObsERV)美國2腫瘤-Icosavax2021年7月蛋白質分子設計美國3疫苗0.01Landos Biopharma2021年2月靶點發現、精準醫療(LANCE)美國1克羅恩病-Recursion Pharmaceuticals2021年4月靶點發現、表型篩選(Recursion Operating System)美國4腫瘤微生物感染0.40Relay Therapeutics2020年7月
209、分子動力學模擬、藥物篩選(ZebiAI)美國3腫瘤0.01Roivant Sciences2021年10月分子動力學模擬、蛋白質降解深度學習模型美國1炎癥0.55Schr dinger2020年2月分子動力學模擬、分子生成與優化、性質預測美國1腫瘤1.81Syntekabio2019年12月藥物發現(DeepMatcher)韓國0-0.36Valo Health2021年6月靶點(生物標記物)發現、藥物篩選、分子優化、臨床預測(Opal Platform)美國3腫瘤、心血管疾病-圖表1 全球AI制藥上市企業信息匯總縱觀全球上市的AI制藥公司,從業績上講,盈利能力較低,年度營收過億的企業僅有2家
210、。鑒于目前尚未有真正意義上的AI藥物上市,AI制藥行業目前商業模式主要分為:AIDD相關軟件銷售/技術平臺授權:該模式毛利率極高,但技術門檻高且集聚效應強,市場規模優先且少數頭部企業幾乎實現壟斷,通過該模式實現盈利企業數量較少,如Schr dinger;轉移研發風險的CRO模式:幫助企業完成藥物發現工作,收取授權費。相較于創新藥物研發,變現難度相對低,回款周期較短,是多數企業的選擇,如AbCellera Biologics;自行承擔研發失敗的風險的合作/項目轉讓:通常采取里程碑式付款,目前首付款比例有下降的趨勢;“財務投資+項目管理”模式:低價買入藥企閑置的臨床管線,減少研發成本,后續自行研發
211、藥物,如RoivantSciences、Erasca 上市上市AI制藥企業商業化模式制藥企業商業化模式73中國AI制藥企業白皮書丨2023/11AbCellera Biologics,主營抗體發現和開發平臺AbCelera,專門設計用于解決傳統抗體發現的障礙,以更高的精度和速度找到最佳的臨床候選藥物,更快地到達診所和患者。借助平臺,公司搜索范圍廣泛的不同抗體,快速選擇最有效和可開發的先導物,并通過授權、交易先導化合物及建立合作伙伴,開發優化的解決方案實現盈利。公司與40個合作伙伴簽訂超174個項目合同,其中149個項目包括里程碑和版稅。Exscientia是全球具有代表性AI驅動的制藥企業,采
212、取和外部企業合作形式,共同推進研發管線,利用廣泛合作沉淀更多的數據支持其算法模型進行迭代和優化。Exscientia利用已開發的人工智能平臺進行自動化藥物的研發指導,利用大數據和機器學習方法,根據已有藥物研發數據自動設計的小分子化合物,并根據藥效、ADMET等條件對化合物進行評估和篩選,對篩選出來的化合物進行實驗檢測,并反饋到AI系統中進行篩選。Exscientia內部管線專注于腫瘤領域的藥物開發,而合作管線則側重于其他治療領域。Schr dinger 成 立 于 1990 年,是 AI 制 藥 領 域 中 的 明 星 企 業。Schr dinger的核心技術平臺是物理計算平臺,即基于物理學的
213、預測方法和機器學習技術,為預測模型、數據分析、合作等提供整合差異化解決方案,以加速藥物發現。Schr dinger采取“軟件營收+新藥研發”的布局,與預營收模式的藥企相比,具備客戶穩定且毛利率極高的分子模擬技術及相關軟件銷售兜底(全球TOP 20藥企均為其客戶,且使用時間超10年),而與AI平臺公司相比,其新藥研發業務更具潛力。Valo Health成立于2019年。Valo的Opal平臺能夠通過分析人類數據,發現專有的新分子、遺傳標記和疾病之間的未知關聯。Opal是一個完全集成的、組件化的、端到端的藥物開發平臺,采用云計算和人類數據。這個計算平臺由于減少了藥物開發過程的成本、持續時間和失敗次
214、數而使其更加高效。C4X Discovery是一家藥物發現公司,將AI技術與尖端的藥物發現技術相結合,有效地發現世界領先的創新藥物。公司致力于發現和開發小分子藥物,治療免疫炎癥性疾病,以高效地發現世界領先藥物。同時,C4X Discovery與國內外制藥公司合作(如阿斯利康、Horizon、成都先導等),致力于開發出更好、更安全、更有效的藥物。全球主要全球主要AI制藥上市企業制藥上市企業AbCellera BiologicsExscientiaSchr dingerValo HealthC4X Discovery74中國AI制藥企業白皮書丨2023/11Recursion Pharmaceut
215、icals,是一家利用計算機視覺技術處理細胞圖像并分析細胞特征以評估患病細胞的藥物后反應結果的公司。利用成像技術和AI技術進行高通量的細胞模型實驗。公司致力于在數百種疾病的細胞模型中測試數千種候選藥物,最終找出不同疾病對應的新藥。Relay Therapeutics是一家以分子動力學模擬見長的AI藥物發現公司,旨在將蛋白質結構和運動的深刻理解應用于藥物發現。該公司將基因組數據、計算科學以及實驗科學深度融合,致力于改變藥物發現的過程。Roivant Sciences成立于2014年,專注孵化創新藥企。Roivant旗下現擁有12家子公司涉獵AI制藥、數據整合與分析、免疫療法等新興技術。Roiva
216、nt Sciences成立AI+CRO子公司VantAI,主要為大藥企提供從頭藥物設計、靶點預測、蛋白降解劑的計算設計和優化等服務。收購蛋白降解公司Oncopia Therapeutics,形成子公司之間的協同布局。同時創辦新公司Psivant Therapeutics搭建計算物理驅動的藥物設計平臺。Icosavax成立于2017年,主要利用華盛頓大學蛋白質設計研究所授權的類病毒顆粒技術,搭建技術平臺用于新型高效疫苗的發現。VLP平臺技術旨在實現復雜病毒抗原的多價、基于粒子的呈遞,這將誘發對特定病毒的保護。Icosavax的產品線包括針對呼吸道合胞病毒(RSV)、人類偏肺病毒(hMPV)和嚴重
217、急性呼吸道綜合癥冠狀病毒2(SARS-CoV-2)的候選疫苗。Erasca是一家開發RAS/MAPK途徑驅動的癌癥療法的生物技術公司,其目標是開發新一代抗癌藥物,徹底治愈癌癥。Erasca采用了一種模式診斷方法,通過小分子治療藥物、大分子治療藥物和蛋白質降解劑,選擇性地、有效地抑制或降解RAS/MAPK途徑中的關鍵信號節點。OPRA(腫瘤模式識別算法)是Erasca專有的人工智能藥物發現平臺,它利用機器學習等先進的計算工具,通過闡明新穎的腫瘤生物學和創新策略來加速藥物發現。Evaxion成立于2008年,公司使用免疫學、生物信息學和機器學習方法,來發現和開發針對感染和癌癥的有效疫苗。Evaxi
218、on的兩個平臺PIONEER和EDEN可以預測、排列和優化表位和抗原。EDEN能快速準確地揭示新的抗原,而PIONEER則能識別引發自然保護性免疫反應的變異蛋白質表位。Recursion PharmaceuticalsRelay TherapeuticsRoivant SciencesIcosavaxErascaEvaxion Biotech75中國AI制藥企業白皮書丨2023/11藥物名稱公司名稱臨床階段藥物類型治療領域REC-2282CereXis Phase 3 Clinical 小分子藥物腫瘤RLY-4008Relay Therapeutics Phase 2 Clinical 小分子
219、藥物腫瘤BEN-2293BenevolentAIPhase 2 Clinical 小分子藥物特應性皮炎OPL-0401Valo HealthPhase 2 Clinical 小分子藥物視網膜病變BPM31510BERGPhase 2 Clinical 小分子藥物腫瘤ISM001-055英矽智能Phase 2 Clinical 小分子藥物特發性肺纖維化BMF-219Biomea FusionPhase 2 Clinical 小分子藥物腫瘤H002紅云生物Phase 2 Clinical 小分子藥物腫瘤RGT-075銳格醫藥Phase 2 Clinical 小分子藥物糖尿病GTAEXS617Exs
220、cientia;湃隆生物Phase 2 Clinical 小分子藥物腫瘤gaboxadolHealxPhase 2 Clinical小分子藥物神經系統疾病REC 4881Recursion PharmaceuticalsPhase 2 Clinical小分子藥物腫瘤REC-994Recursion PharmaceuticalsPhase 2 Clinical小分子藥物腫瘤NDI-034858Nimbus Therapeutics(交易至武田制藥)Phase 2 Clinical小分子藥物銀屑病NDI-101150Nimbus TherapeuticsPhase 2 Clinical小分子藥物
221、腫瘤IVX-A12IcosavaxPhase 2 Clinical疫苗微生物感染OPL-0301Valo HealthPhase 1 Clinical 小分子藥物心血管疾病/腎損傷Valo-C1Valo HealthPhase 1 Clinical 小分子藥物腫瘤INDV-2000IndiviorPhase 1 Clinical 小分子藥物藥物成癮EXS-21546ExscientiaPhase 1 Clinical 小分子藥物腫瘤PHI-101Pharos iBioPhase 1 Clinical 小分子藥物腫瘤RLY-1971Relay TherapeuticsPhase 1 Clinic
222、al 小分子藥物腫瘤SNX-281Silicon therapeuticsPhase 1 Clinical 小分子藥物腫瘤SGR-1505Schr dingerPhase 1 Clinical 小分子藥物腫瘤RLY-2608Relay TherapeuticsPhase 1 Clinical 小分子藥物腫瘤REC-163964Recursion PharmaceuticalsPhase 1 Clinical 小分子藥物微生物感染DSP-0038ExscientiaPhase 1 Clinical 小分子藥物神經系統疾病BPM31543BERGPhase 1 Clinical 小分子藥物藥物成癮
223、AC0682冰洲石生物Phase 1 Clinical 小分子藥物(PROTAC)腫瘤XBI302未知君Phase 1 Clinical 微生物療法腫瘤LBP01未知君Phase 1 Clinical 微生物療法潰瘍性結腸炎LBP02未知君Phase 1 Clinical 微生物療法糖尿病MTS004劑泰醫藥Phase 1 Clinical 小分子藥物假性延髓情緒圖表1 全球AI制藥企業臨床管線匯總176中國AI制藥企業白皮書丨2023/11藥物名稱公司名稱臨床階段藥物類型治療領域YY001宇耀生物Phase 1 Clinical 小分子藥物腫瘤NouvNeu001睿健醫藥Phase 1 Cl
224、inical 細胞治療神經系統疾病RGT-028銳格醫藥Phase 1 Clinical 小分子藥物內分泌與代謝RGT-419B銳格醫藥Phase 1 Clinical 小分子藥物腫瘤RGT-264銳格醫藥Phase 1 Clinical 小分子藥物腫瘤FZ002費米子Phase 1 Clinical 小分子藥物疼痛HDM-8421034中以海德Phase 1 Clinical 小分子藥物微生物感染IVX-121IcosavaxPhase 1 Clinical 疫苗微生物感染1 紅字表明該企業為國內AI制藥企業77中國AI制藥企業白皮書丨2023/11企業名稱合作企業名稱交易/合作時間交易合作
225、內容潛在交易金額預付款輝瑞PostEra2022年1月合作建立AI實驗室,以腫瘤藥物/新冠藥物為初期研究重點2.48億美元1300萬美元CytoReason2022年9月獲得CytoReasonAI技術平臺和疾病模型的使用授權+1項商業合作協議1.1億美元2000萬美元股權投資默克Iktos2023年3月戰略投資1550萬歐元1550萬歐元Exscientia2023年9月合作開發小分子藥物項目5.94億美元數百萬美元Benevolent AI2023年9月合作開發小分子藥物項目6.74億美元2000萬美元艾伯維Anima2023年1月合作開發小分子mRNA藥物項目5.82億美元4200萬美元
226、羅氏Relay Therapeutics2020年12月口服小分子SHP2變構抑制劑全球獨家許可7億美元7500萬美元Recursion2021年12月約40個新藥項目合作120+億美元1.5億美元Tempus2022年11月獲取Tempus AI臨床試驗設計平臺+患者數據庫使用權/7000萬美元Celgene(2019年BMS收購)Exscientia2019年3月合作開發PKC-藥物項目/2500萬美元BMSSchr dinger2020年11月5個新藥項目合作27億美元5500萬美元Exscientia2022年合作開發免疫學和炎癥藥物項目+AI平臺使用費用/1500萬美元Evotec2
227、022年3月利用 EVO panOmics和EVO panHunter以及基于AI/ML的藥物平臺開發新藥50億+美元2億美元Owkin2022年6月使用AI平臺設計心血管疾病臨床試驗1.8億美元8000萬美元Exscientia2022年1月合作開發15款腫瘤或免疫相關的小分子新藥52億+美元1億美元賽諾菲Owkin2021年11月獨家投資+合作開發4種癌癥新療法2.7億+美元1.8億美元天演藥業2022年3月利用AI技術設計并開發4種單抗/雙抗藥物25億美元1750萬美元Atomwise2022年8月合作開發5個靶點相關的藥物10.2億美元2000萬美元英矽智能2022年11月達成戰略研發
228、合作12億美元2150萬美元百圖生科2023年10月基于百圖生科生命科學大模型,合作開發生物藥物發現新模型10億+美元1000萬美元阿斯利康Scorpion Therapeutics2022年1月合作開發針對難以靶向的癌蛋白藥物/7500萬美元GSKTempus2022年10月續簽Tempus AI臨床試驗設計平臺+患者數據庫使用權/7000萬美元圖表1 全球AI制藥企業大宗項目合作交易178中國AI制藥企業白皮書丨2023/11企業名稱合作企業名稱交易/合作時間交易合作內容潛在交易金額預付款武田Anima2021年3月合作開發針對早期亨廷頓病mRNA藥物項目10.5億美元1.2億美元Evoz
229、yne2022年4月合作開發用于4種罕見病靶點的蛋白質藥物4億美元/Nimbus Therapeutics2023年2月收購1款AI設計用于治療銀屑病的臨床階段藥物60億美元40億美元禮來Anima2018年7月合作開發針對多款未公開靶點藥物10.5億美元4400萬美元Genesis2022年5月利用Genesis的AI藥物發現平臺,發現針對5個靶點的新療法6.7億美元2000萬美元Schr dinger2022年10月1個未公開靶點的藥物發現及分子優化4.25億美元/晶泰科技2023年5月晶泰科技利用其特有的小分子藥物發現平臺研發首創新藥,填補未滿足的臨床用藥需求2.5億美元/安斯泰來Dyn
230、oTherapeutics2021年12月合作開發功能優化的新型AAV衣殼載體用于基因療法16億美元1800萬美元默沙東Saama2021年11月收購Saama公司多數股權,支持其開發其AI和其他技術產品4.3億美元/Absci Corp2022年1月生物制造酶的定制及3款藥物合作開發6.1億美元/安進Generate Biomedicines2022年1月合作開發5款藥物19億美元5000萬美元Exelixis英矽智能2023年9月USP1抑制劑ISM3091全球獨家許可協議/8000萬美元未披露Benevolent AI2014年6月合作開發2個阿爾茨海默氏癥新藥項目8億美元4億美元Recursion PharmaceuticalsCyclica2023年6月收購AI生物科技初創公司Cyclica4000萬美元4000萬美元Valence2023年6月收購AI生物科技初創公司Valence4750 萬美元4750 萬美元BioNTechInstaDeep2023年1月收購AI技術公司InstaDeep3.62億英鎊3.62億英鎊圖表1 全球AI制藥企業大宗項目合作交易179