《醫藥生物行業AI+新藥研發系列報告(一):人工智能賦能新藥研發降本增效潛力巨大-250212(34頁).pdf》由會員分享,可在線閱讀,更多相關《醫藥生物行業AI+新藥研發系列報告(一):人工智能賦能新藥研發降本增效潛力巨大-250212(34頁).pdf(34頁珍藏版)》請在三個皮匠報告上搜索。
1、 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 Table_Info1 醫醫藥生藥生物物 Table_Date 發發布時布時間:間:2025-02-12 Table_Invest 優優于于大勢大勢 首次覆蓋 Table_PicQuote 歷史收益率曲線 Table_Trend漲跌幅(%)1M 3M 12M 絕對收益 7%-10%-1%相對收益 3%-4%-17%Table_Market 行業數據 成分股數量(只)477 總市值(億)55995 流通市值(億)27056 市盈率(倍)37.17 市凈率(倍)2.46 成分股總營收(億)24972 成分股總凈利潤(億)1583 成分股資
2、產負債率(%)38.75 Table_Report 相關報告 安泰科技:四大業務板塊協同發展,非晶合金有望成為新增長點-2024.11.12 錫業股份:全球精錫產量第一,有望受益于錫價上漲-2024.10.15 Table_Author 證證券分析師券分析師:趙宇趙宇天天 執業證書編號:S0550524020002 13127688932 Table_Title 證券研究報告/行業深度報告 AI+新藥研發新藥研發系系列列報告報告(一一):人人工工智能智能賦賦能新能新藥藥研發研發,降,降本本增增效潛效潛力力巨大巨大 報報告摘告摘要:要:Table_Summary 新藥開發是一個新藥開發是一個復雜
3、復雜的過的過程,程,面臨研發時間面臨研發時間長、長、研研發綜合成功率低,發綜合成功率低,研研發平均成本不斷增加發平均成本不斷增加等挑等挑戰。戰。開發一種新藥從最初的想法到最終產品的推出,大致可分為藥物發現、臨床前研究、臨床研究和上市四個階段。近年來,新藥研發中位時間長期保持在 10 年以上,臨床階段研發綜合成功率整體處于較低水平。此外,獲批新藥數量增長緩慢,研發支出快速增長,導致新藥研發效率維持低位,開發新藥的 3 年滾動平均成本已增加至 37.2 億美元。2024 年諾貝爾化學獎或為年諾貝爾化學獎或為新藥研發指明方向,新藥研發指明方向,人工人工智能有望在新藥研發智能有望在新藥研發領域發揮關鍵
4、作用。領域發揮關鍵作用。大衛貝克開發了計算機方法創造以前不存在的蛋白質,戴米斯哈薩比斯和約翰江珀利用人工智能從氨基酸序列中預測蛋白質的三維結構,人工智能在上述研究成果中均占據重要地位。目前,深度學習是機器學習新的研究方向,相關算法近年來發展迅速,有望持續開拓在新藥研發領域的應用。藥物開發主要涉及幾藥物開發主要涉及幾個階個階段,包括靶點識別、段,包括靶點識別、藥物藥物發現、臨床前研究發現、臨床前研究、臨床試驗、臨床試驗、監管批監管批準和上準和上市后監測,市后監測,人工智人工智能在新能在新藥研發各個階段均有藥研發各個階段均有應用潛力:應用潛力:(1)靶點確認:靶點確認:人工智能通過使用公開獲取的組
5、學數據和文本數據或合成數據,應用多種靶點選擇標準,提高新靶點和新療法的開發效率,從而改變藥物發現的過程。(2)化合物的虛擬化合物的虛擬篩選和篩選和從頭設計:從頭設計:SBDD 產生候選藥物的方法主要包括虛擬篩選和分子生成。虛擬篩選在 CADD 中起到關鍵作用,人工智能可提高其效率。人工智能推動 AIDD 快速發展,驅動藥物從頭設計。(3)ADMET 預測:預測:藥代動力學性質和毒性問題是影響新藥研發的關鍵因素?;谌斯ぶ悄艿?ADMET 預測可以在藥物研發的早期階段及時發現導致化合物難成藥的重要特征,在藥物的篩選、開發和評價過程中發揮著重要作用。(4)化學合成化學合成:化學合成是小分子藥物發現
6、的瓶頸之一。人工智能助力CASP,有望使合成階段加速以及減少新分子實體合成的失敗。此外,自動化合成與設計、測試和分析技術相結合形成設計-制造-測試-分析(DMTA)循環,深度學習使 DMTA 循環的效率顯著提高。(5)菌群標菌群標志物發現:志物發現:人工智能從高維、復雜的菌群數據中識別出更精確的菌群標志物,進而提高疾病預測和診斷的準確性。(6)藥物再利用藥物再利用:人工智能能夠從龐大復雜的數據中挖掘出信息和規律,已成為藥物再利用的有效工具,可加快研發速度,降低研發成本。主要方法包括基于網絡的模型、基于結構的方法和機器/深度學習方法。(7)臨床試驗:臨床試驗:人工智能可以幫助優化患者隊列選擇,為
7、患者招募提供幫助并改善患者監測,從而輔助臨床試驗設計。風險提示:風險提示:AI 在新藥研發領域的應用不及預期的風險;AI 賦能的新藥臨床試驗進展不及預期的風險;“黑盒”問題導致模型輸出結果難以解釋的風險。-20%-10%0%10%20%30%2024/22024/52024/82024/11醫藥生物滬深300 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 2/34 醫醫藥生藥生物物/行業行業深度深度 目目 錄錄 1.新新藥研發藥研發面臨面臨研發時研發時間長、間長、研發研發綜合成綜合成功率低功率低,研,研發平均發平均成本不成本不斷增斷增加等加等挑戰挑戰.4 2.2024 年諾貝爾化學
8、獎揭曉年諾貝爾化學獎揭曉,AI+新藥研發或成新藥研發或成未來發展方向未來發展方向.10 2.1.2024 年年諾貝諾貝爾化爾化學獎聚學獎聚焦蛋焦蛋白質,白質,人工人工智能起智能起到關到關鍵作用鍵作用.10 2.2.深深度學度學習作為習作為人工人工智能和智能和機器機器學習新學習新的研的研究方向究方向,近,近年來發年來發展迅展迅速速.13 3.人工智人工智能賦能新藥研發各能賦能新藥研發各個階段,個階段,AI+新藥研新藥研發潛力巨大發潛力巨大.16 3.1.人人工智工智能輔助能輔助藥物藥物靶點確靶點確認認.16 3.1.1.實驗法根據親和力、實驗法根據親和力、化學化學遺傳學和比較分析來遺傳學和比較分
9、析來確認確認靶點靶點.17 3.1.2.多組學數據與人工智多組學數據與人工智能算能算法結合的靶點識別方法結合的靶點識別方法前法前景廣闊景廣闊.20 3.1.3.人工智能驅動靶點識人工智能驅動靶點識別,別,有望提高新靶點的開有望提高新靶點的開發效發效率率.20 3.2.人人工智工智能賦能能賦能化合化合物的虛物的虛擬篩擬篩選和從選和從頭設頭設計計.21 3.2.1.虛擬篩選在虛擬篩選在 CADD 中起到中起到關鍵作用,人工智能關鍵作用,人工智能可提可提高其效率高其效率.24 3.2.2.人工智能快速發展,人工智能快速發展,AIDD 憑借更高效率獲得關注憑借更高效率獲得關注.24 3.3.人人工智工
10、智能加速能加速 ADMET 預測預測.25 3.4.人人工智工智能助力能助力 CASP,提,提高化高化學合成學合成效率效率和成功和成功率率.26 3.5.人人工智工智能在菌能在菌群標群標志物發志物發現領現領域展現域展現出潛出潛力力.27 3.6.人人工智工智能已成能已成為藥為藥物再利物再利用的用的有效工有效工具具.28 3.7.人人工智工智能通過能通過多種多種方式助方式助力臨力臨床試驗床試驗成功成功.29 4.總結與總結與展望展望.32 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 3/34 醫醫藥生藥生物物/行業行業深度深度 圖表目圖表目錄錄 圖圖 1:新藥研發大致:新藥研發大致
11、可分可分為藥物發現、臨床前為藥物發現、臨床前研究研究、臨床研究和上市四、臨床研究和上市四個階個階段段.4 圖圖 2:2024 年,年,FDA 批準藥物數量批準藥物數量 50 款款.6 圖圖 3:15 款新藥聚焦癌癥款新藥聚焦癌癥,占,占 2024 年年 FDA 獲批新藥數量獲批新藥數量 30%.6 圖圖 4:2023 年,美國創新年,美國創新活性物質從首次專利活性物質從首次專利申請申請或臨床試驗到獲批的或臨床試驗到獲批的時間時間為為 13.3 年年.7 圖圖 5:2023 年,研發綜合年,研發綜合成功率升至成功率升至 10.8%,但整,但整體仍處于較低水平體仍處于較低水平.7 圖圖 6:199
12、1 年至今,年至今,獲批新獲批新藥數量增長緩慢,藥數量增長緩慢,研發支研發支出快速增長,出快速增長,開發開發新藥的新藥的 3 年滾動平均成本已年滾動平均成本已增加增加至至 37.2億美元(假設研發支億美元(假設研發支出與出與新藥獲批之間存在新藥獲批之間存在 5 年滯年滯后)后).8 圖圖 7:近年來新藥研發:近年來新藥研發效效率下降速度趨緩,未率下降速度趨緩,未來或來或繼續好轉(假設研發繼續好轉(假設研發支出支出與新藥獲批之間存在與新藥獲批之間存在 5 年滯后)年滯后).9 圖圖 8:2024 年諾貝爾化學年諾貝爾化學獎授予大衛獎授予大衛貝克、戴米斯貝克、戴米斯哈薩比斯和約翰哈薩比斯和約翰江珀
13、江珀.10 圖圖 9:使用大衛:使用大衛貝克的貝克的 Rosetta 程序開發的蛋白質程序開發的蛋白質.11 圖圖 10:AlphaFold2 蛋白質蛋白質結構預測工作流程結構預測工作流程.12 圖圖 11:人工智能可分為機:人工智能可分為機器學習等七類器學習等七類.13 圖圖 12:深度學習是機:深度學習是機器學器學習新的研究方向習新的研究方向.14 圖圖 13:人工智能在新藥研:人工智能在新藥研發各個階段均有應用發各個階段均有應用潛力潛力.16 圖圖 14:靶點識別的方法包:靶點識別的方法包括實驗法、多組學法括實驗法、多組學法和計和計算法三類算法三類.17 圖圖 15:基于親和力的靶點:基
14、于親和力的靶點確認方法屬于確認方法屬于“以藥找靶以藥找靶”.18 圖圖 16:siRNA 可干擾基因可干擾基因表達并用于靶點的發表達并用于靶點的發現與現與驗證驗證.19 圖圖 17:SILAC 是靶點識別是靶點識別中最常用的定量蛋白中最常用的定量蛋白質組質組學方法學方法.19 圖圖 18:基于:基于 NGS 的多組的多組學方法可用于靶點發學方法可用于靶點發現和現和驗證驗證.20 圖圖 19:人工智能利用多種:人工智能利用多種數據,加快藥物靶點數據,加快藥物靶點的選的選擇與確認擇與確認.21 圖圖 20:SBDD 藥物篩選新藥物篩選新技術占據主要地位技術占據主要地位.23 圖圖 21:SBDD
15、產生候選藥產生候選藥物的方法主要包括虛物的方法主要包括虛擬篩擬篩選和分子生成選和分子生成.23 圖圖 22:虛擬篩選在:虛擬篩選在 CADD 中起到關鍵作用中起到關鍵作用.24 圖圖 23:人工智能驅動藥物:人工智能驅動藥物從頭設計,產生新的從頭設計,產生新的類藥類藥化合物化合物.25 圖圖 24:ADMET 性質是衡性質是衡量化合物是否能成藥量化合物是否能成藥的關的關鍵因素鍵因素.26 圖圖 25:人工智能推動化學:人工智能推動化學合成效率的提高和有合成效率的提高和有機化機化合物自動合成的實現合物自動合成的實現.27 圖圖 26:人工智能為菌群標:人工智能為菌群標志物的發現提供全新志物的發現
16、提供全新視角視角.28 圖圖 27:人工智能驅動藥物人工智能驅動藥物再利用,加速藥物發再利用,加速藥物發現流現流程程.29 圖圖 28:臨床試驗是新藥研:臨床試驗是新藥研發過程中成本最高、發過程中成本最高、耗時耗時最長且成功率較低的最長且成功率較低的階段階段.30 圖圖 29:人工智能可用于臨:人工智能可用于臨床試驗設計以提高效床試驗設計以提高效率并率并降低成本降低成本.31 表表 1:新藥研發各環:新藥研發各環節及節及說明說明.4 表表 2:常見的機器學:常見的機器學習算習算法類型及特點法類型及特點.13 表表 3:深度學習算法:深度學習算法近年近年來發展迅速來發展迅速.14 表表 4:不同
17、小分子藥:不同小分子藥物篩物篩選技術對比選技術對比.21 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 4/34 醫醫藥生藥生物物/行業行業深度深度 1.新藥研新藥研發面臨研發時間長、發面臨研發時間長、研發研發綜合成功率低,綜合成功率低,研發研發平均成平均成本不斷本不斷增加等增加等挑戰挑戰 開發一種新藥從最初開發一種新藥從最初的想的想法到法到最終產品的推出最終產品的推出是一是一個復雜的過程,個復雜的過程,大致可分大致可分為藥物為藥物發現、發現、臨床前研臨床前研究、究、臨臨床床研究和上市四個階段研究和上市四個階段。其中,藥物發現主要環節包括藥物靶點的選擇與確認、苗頭化合物的篩選、先導
18、化合物的發現和候選藥物的選定;臨床前研究主要環節包括化學制造和控制、藥代動力學/藥效動力學、安全性藥理、毒理和制劑開發;臨床研究主要環節包括 I 期臨床、II 期臨床和 III 期臨床;上市主要環節包括 IV 期臨床和上市后再審批。圖圖 1:新藥研發大致:新藥研發大致可分可分為藥物發現、臨床前為藥物發現、臨床前研究研究、臨床研究和上市四、臨床研究和上市四個階個階段段 數據來源:AIDD Pro 公眾號、東北證券 表表 1:新藥研發各:新藥研發各環環節及節及說明說明 階段階段 環節環節 說明說明 藥物發現藥物發現 藥物靶點的選擇與確認 靶點是一個寬泛的術語,它可以適用于一系列生物體,比如蛋白質、
19、基因和 RNA。所有的藥物分子都是通過與靶點結合來引起生物反應的,一個好的靶點需要是有效的、安全的、臨床可行且有商業價值的,最重要的是要具有“可藥性”。因此,開發新藥最重要的步驟之一就是靶點的選擇和確認。苗頭化合物的篩選 選定藥物作用的靶點后,需要找到對該靶點有作用的化合物。苗頭化合物是指對特定靶標或作用環節具有初步活性的化合物。先導化合物的發現 獲得大量苗頭化合物后,需要確定化合物作為研究對象。一般從多個苗頭化合物中,決策出活性最好的一個(或幾個)作為先導化合物用于繼續深入研究。先導化合物是已經通過多次實驗驗證、的確 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 5/34 醫醫藥
20、生藥生物物/行業行業深度深度 具有一定生理藥理活性、可用作進一步深入研究的化合物,是后續大量工作的起點。候選藥物的選定 確定先導化合物后,需要進行先導優化使其更安全更有效。該過程在遺傳毒性模型和動物行為學模型中對先導化合物進行檢測,得到的活性數據可以結合化合物結構得到初步的構效關系(SAR)分析,分析結果可以繼續指導后續的化合物結構優化。先導優化后找到的分子即為候選藥物,性質已基本達到期待藥物效果。臨床前研究臨床前研究 化學制造和控制 藥物開發的第一步是原料藥合成工藝研發,這是一個不斷改進、完善的過程。第一批提供的原料藥主要用于毒理研究,速度越快越好。隨著項目的推進,工藝部門會根據需要設計全新
21、合成路線,開發合理生產工藝來滿足從 I-III 期臨床用藥與商業化的需求;制劑部門會不斷完成處方工藝研究,開發出商業化的制劑工藝。藥代動力學/藥效動力學 了解藥物在動物體內的吸收、分布、代謝、排泄(ADME),指導臨床研究以何種形式給藥(口服、吸入、針劑),給藥頻率與劑量。安全性藥理 證明該化合物針對特定目標疾病具有生物活性,同時評估藥物對療效以外的作用,比如可能的副作用,尤其是對心血管、呼吸、中樞神經系統的影響。毒理 毒理研究種類較多,包括急性毒性、亞急性毒性、慢性毒性、生殖毒性、致癌性、致突變性等。制劑開發 制劑開發是藥物研發的一個重要環節,隨著項目推進,給藥方式和處方研究會越來越全面。臨
22、床研究臨床研究 I 期臨床 主要目標是研究產品的安全性和耐受性,如果可能的話,還會調查其最大耐受劑量、藥代動力學和藥效學。II 期臨床 I 期臨床研究確定安全的情況下,II 期臨床在目標疾病患者中測試新藥。由于 II 期臨床的探索性和患者特異性,藥物在患病狀態的人體內的作用方式與健康人體內是不同的,因此其成功率較低。II期臨床的結果有助于確定一個藥物是否可以科學地和商業地進行到 III 期臨床。III 期臨床 更多患者接受更多劑量、更長時間的治療,其目標是評估藥物在長期治療期間(6 個月到 1 年以上)的安全性。上市上市 IV 期臨床 研究藥物在經歷上市后更長期治療后的安全性,并從臨床終點的角
23、度確認療效。這一階段研究還會涉及到藥物配伍使用的研究、藥物使用禁忌等。上市后再審批 藥物正式上市銷售后,還必須定期向相關部門呈交有關資料,包括該藥物的副作用情況和質量管理記錄,目的是重新審核新藥上市審批中的有效性和安全性。數據來源:AIDD Pro 公眾號、東北證券 近年來,基因編輯、靶向蛋白質降解、抗體偶聯、核酸遞送等技術的發展,推動新藥研發向創新程度高、臨床優勢突出、臨床價值顯著等方向發展。2024 年,年,美國食美國食品藥品管理局品藥品管理局(FDA)藥藥品評價與研究中心共品評價與研究中心共批準批準 50 款新藥,款新藥,包括 34 款新分子實體和 16 款生物制品,相較于 2023 年
24、的 55 款小幅下降,高于過去十年平均值 46.5款。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 6/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 2:2024 年年,FDA 批準藥物數量批準藥物數量 50 款款 數據來源:2024 FDA approvals、東北證券 2024 年,美國年,美國 FDA 批準批準上市的上市的 50 款新藥覆蓋多種款新藥覆蓋多種適應證,其中適應證,其中 15 款聚焦癌款聚焦癌癥,癥,占占 2024 年批準新藥數量年批準新藥數量 30%。除此之外,皮膚病和血液病分別有 6 款新藥獲批,心血管病有 5 款新藥獲批。其他治療領域,如肝病、傳染病、罕見
25、病等新藥獲批數量較少,均未超過 3 款。圖圖 3:15 款款新藥聚焦癌癥新藥聚焦癌癥,占,占 2024 年年 FDA 獲批獲批新藥數量新藥數量 30%數據來源:2024 FDA approvals、東北證券 盡管獲批新藥數量高盡管獲批新藥數量高于過于過去十年平均值,去十年平均值,但新藥但新藥研發研發中位時間中位時間仍仍保持在保持在10年以年以上上。根據 IQVIA Institute for Human Data Science,從公司首次申請專利或開始臨床試驗到新藥上市的時間,可以代表研發過程的效率。2023 年,美國創新活性物質的中位時間為 13.3 年,高于 2022 年的 11.4 年
26、,略高于前 9 年的平均值 13 年。從過去十年維度來看,美國創新活性物質從首次專利申請或臨床試驗到獲批的時間均保持在 10 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 7/34 醫醫藥生藥生物物/行業行業深度深度 年以上,且自 2020 年以來整體呈現小幅增長趨勢,意味著新藥研發過程的效率小幅降低。圖圖 4:2023 年,年,美國創新美國創新活性物質從首次專利活性物質從首次專利申請申請或臨床試驗到獲批的或臨床試驗到獲批的時間時間為為 13.3 年年 數據來源:IQVIA Institute for Human Data Science、東北證券 獲批新藥數量維持高位獲批新藥數量
27、維持高位,研發綜合成功率研發綜合成功率躍升至躍升至 10.8%但仍但仍偏低偏低。根據 IQVIA Institute for Human Data Science,在 2022 年研發綜合成功率降至 5.9%的 10 年低點后,由于 I 期臨床、III 期臨床和監管提交成功率的提高,研發綜合成功率在 2023 年躍升至 10.8%。具體來看,2023 年 I 期臨床成功率上升至 48%,II 期臨床成功率基本穩定在 39%左右,III 期臨床成功率上升至 66%,監管提交成功率上升至 87%。雖然2023年研發綜合成功率較2022年大幅提升,但仍低于2010-2019年平均值13.16%。圖圖
28、 5:2023 年年,研發綜合,研發綜合成功率升至成功率升至 10.8%,但整,但整體仍體仍處于處于較低水平較低水平 數據來源:IQVIA Institute for Human Data Science、東北證券 根據The pharmaceutical productivity gap Incremental decline in R&D efficiency despite transient improvements,每年市值排名前 200 的上市制藥公司的研發支出合計占市場披露研發支出的 90%以上,作者選取該數據并考慮年度市場份額波動和通貨膨脹,以確保分析的全面性和一致性,獲批新藥
29、數量則選取 FDA 公布的數據。研究結果表明,假設研發支假設研發支出與新藥獲批之間存出與新藥獲批之間存在在 5 年滯后,年滯后,則則開發新開發新藥的藥的 3 年滾動年滾動平均成本平均成本已已從從 1998 年的年的 7.2 億美元增加到億美元增加到 2023 年的年的 37.2 億美元。億美元。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 8/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 6:1991 年至今,年至今,獲批新獲批新藥數量增長緩慢,藥數量增長緩慢,研研發支發支出快速增長出快速增長,開發新開發新藥藥的的 3 年滾動年滾動平均成本已平均成本已增加增加至至 37.2億美元
30、億美元(假設(假設研發支研發支出與出與新藥獲批新藥獲批之間存在之間存在 5 年滯年滯后后)數據來源:The pharmaceutical productivity gap Incremental decline in R&D efficiency despite transient improvements、東北證券 新新藥藥研研發發效效率率下下降降速速度度趨趨緩緩,工工藝藝創創新新或或為為主主要要原原因因。根據The pharmaceutical productivity gap Incremental decline in R&D efficiency despite transient
31、improvements,新藥研發效率(單位美元研發支出對應的獲批新藥數量)自 2005 年跌破 0.4 后一直處于低位,但近年來下降速度減緩。主要原因可能是旨在提高新藥研發不同階段效率的各種工藝創新,這些創新包括基因組學/蛋白質組學、化學/生物信息學、組合化學和高通量篩選的突破,以及大數據分析、機器學習和人工智能的最新進展。未來,技術創新可能推動研發模式的發展,但相關的挑戰也在加劇。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 9/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 7:近年來近年來新藥研新藥研發效發效率率下降下降速度速度趨緩,未趨緩,未來或來或繼續繼續好轉好轉(假設
32、(假設研發研發支出支出與與新藥獲批新藥獲批之間存在之間存在 5 年年滯后滯后)數據來源:The pharmaceutical productivity gap Incremental decline in R&D efficiency despite transient improvements、東北證券 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 10/34 醫醫藥生藥生物物/行業行業深度深度 2.2024 年年諾諾貝貝爾爾化化學學獎獎揭揭曉曉,AI+新新藥藥研研發發或或成成未未來來發發展展方方向向 2.1.2024 年年諾貝諾貝爾化爾化學獎聚學獎聚焦蛋焦蛋白質,白質,人工人工
33、智能起智能起到關到關鍵作用鍵作用 人工智能在人工智能在 2024 年諾貝爾年諾貝爾化學獎得主化學獎得主的研究成的研究成果中果中均均占據占據重要重要地位地位。大衛貝克開發了計算機方法來實現許多人認為不可能的事情:創造以前不存在的蛋白質;戴米斯哈薩比斯和約翰江珀利用人工智能成功解決了化學家們50多年來一直在努力解決的問題:從氨基酸序列中預測蛋白質的三維結構。圖圖 8:2024 年諾貝爾化學年諾貝爾化學獎獎授予授予大衛大衛貝克貝克、戴米斯戴米斯哈薩比斯和約翰哈薩比斯和約翰江珀江珀 數據來源:The Royal Swedish Academy of Sciences、東北證券 大衛大衛貝克成功利用貝克
34、成功利用 Rosetta 構建全新蛋白質。構建全新蛋白質。大衛貝克 20 世紀 90 年代末開始開發 Rosetta:一款可以預測蛋白質結構的計算機軟件,Rosetta 在 1998 年的 CASP(蛋白質結構預測關鍵評估)比賽中首次亮相并有亮眼表現。這一成功帶來了反向使用該軟件的新想法,即不再在 Rosetta 中輸入氨基酸序列并預測蛋白質結構,而是輸入所需的蛋白質結構并獲得 Rosetta 關于氨基酸序列的建議。事實證明該想法是可行的,研究人員開發出了蛋白質 Top7,Top7 的獨特結構在自然界中并不存在;此外,該蛋白質由 93 個氨基酸組成,比以前使用從頭設計生產的蛋白質都大。在 20
35、20 年CASP 比賽之后,大衛貝克意識到 transformer-based AI 模型的潛力并在 Rosetta 中添加了該模型,這進一步促進了蛋白質的從頭設計。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 11/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 9:使用使用大衛大衛貝克貝克的的 Rosetta 程序開發的蛋白質程序開發的蛋白質 數據來源:The Royal Swedish Academy of Sciences、東北證券 戴米斯戴米斯哈薩比斯和約翰哈薩比斯和約翰江珀利用江珀利用 AlphaFold2 使蛋白質結構預測準確使蛋白質結構預測準確率不率不斷突破。斷突破
36、。戴米斯哈薩比斯是 DeepMind 公司的聯合創始人,該公司于 2014 年被出售給谷歌。兩年后,由于該公司開發的 AlphaGo 人工智能模型擊敗了圍棋世界冠軍,引起了全球的關注。此后,戴米斯哈薩比斯在 2018 年報名參加 CASP 比賽,并憑借 AlphaFold人工智能模型達到了近 60%的蛋白質結構預測準確率(之前準確率最高達 40%)。此后,約翰江珀的加入以及人工智能最新技術的應用使得新版本的 AlphaFold2 蛋白質結構預測準確率不斷突破,2020 年 AlphaFold2 在 CASP 比賽的表現幾乎與 X射線晶體學一樣好。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說
37、明及說明 12/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 10:AlphaFold2 蛋白質蛋白質結構預測工作流程結構預測工作流程 數據來源:The Royal Swedish Academy of Sciences、東北證券 根據界面新聞,前述研究均涉及當今分子生物學的核心研究領域之一蛋白質折疊問題,蛋白質折疊問題就是一維的分子鏈如何正確折疊成特定的三維結構的問題,最終的三維結構將決定蛋白質的功能。如果能從蛋如果能從蛋白質分子的一維分子白質分子的一維分子編碼編碼準確預準確預測出蛋白質分子的三測出蛋白質分子的三維結維結構,構,將對人類了解疾病將對人類了解疾病產產生的原理、生的原理、新藥研
38、發、新藥研發、理理解生命解生命形成的機制產生重要形成的機制產生重要影響影響。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 13/34 醫醫藥生藥生物物/行業行業深度深度 2.2.深深度學度學習作為習作為人工人工智能和智能和機器機器學習新學習新的研的研究方向究方向,近,近年來發年來發展迅展迅速速 人工智能人工智能(AI)通常是指通常是指通過計算機程序或系通過計算機程序或系統來統來呈現人類思維和智能呈現人類思維和智能的技的技術。術。人工智能通過抓取數據中存在的概念和關系,獨立分析學習數據模式從而達到模擬人類思維的目的。根據人工智能:現代方法中的討論,人工智能可分為七類,分別是推理和問題
39、解決、知識表示、規劃和社會智能、感知、機器學習、機器人:運動和操縱以及自然語言處理。圖圖 11:人工智能可分為人工智能可分為機機器學習器學習等七類等七類 數據來源:人工智能在新藥研發中的應用、東北證券 機器學習是人工智能機器學習是人工智能的的一一個子集個子集。根據 NVIDIA,機器學習是訓練機器去學習,以其最基本的形式使用算法來解析數據、學習數據,然后對現實世界中的某些內容做出預測或判斷。根據人工智能在新藥研發中的應用現狀與挑戰,常見的機器學習算法包括決策樹、隨機森林、支持向量機、k-最近鄰算法和樸素貝葉斯分類器等。表表 2:常見的常見的機器學機器學習算習算法類型及特點法類型及特點 算法類型
40、算法類型 算法特點算法特點 決策樹 決策樹是一種將決策流程以樹狀結構清晰表示的機器學習方法,本質上是通過一系列規則對數據進行分類的過程。隨機森林 隨機森林是通過構建多個決策樹對樣本進行訓練并預測的一種分類器,其最終輸出的類別是由每個決策樹輸出的類別的眾數而決定。支持向量機 支持向量機能夠處理小數據集中的高維變量,可以用于分類和回歸問題,但更多用在分類問題上。k-最近鄰算法 k-最近鄰算法是一種用于分類和回歸的無監督學習算法,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一。樸素貝葉斯分類器 樸素貝葉斯分類器是應用最為廣泛的分類算法之一,只需要少量的訓練數據即可估計出一些必要的參數,能夠
41、在許多復雜的條件中取得較好的效果。數據來源:人工智能在新藥研發中的應用現狀與挑戰、東北證券 深度學習是機器學習深度學習是機器學習新的新的研究方向。研究方向。根據 人工智能在新藥研發中的應用進展,機器學習技術包括深度學習,它是一種基于機器學習的方法,利用一種類似于大腦的 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 14/34 醫醫藥生藥生物物/行業行業深度深度 邏輯結構(稱為神經網絡)來識別和區分語音、圖像和視頻等模式。根據先進人工智能技術在新藥研發中的應用,作為機器學習的一個分支,深度學習區別于機器學習的主要是數據量的大小和模型的復雜程度,通常深度學習的模型更復雜且需要更大的數據
42、量。圖圖 12:深度學習是:深度學習是機器學機器學習習新的研究方向新的研究方向 數據來源:NVIDIA 官網、東北證券 深度學習算法近年來深度學習算法近年來發展發展迅速。迅速。根據 先進人工智能技術在新藥研發中的應用,比較前沿的深度學習算法包括卷積神經網絡(CNN)、遞歸神經網絡(RNN)、圖神經網絡(GNN)、生成對抗網絡(GAN)、變分自編碼器(VAE)、擴散模型、Transformer模型等。表表 3:深度學習算法深度學習算法近年近年來發展迅速來發展迅速 算法類型算法類型 算法算法介紹介紹 卷積神經網絡(CNN)CNN 主要用于計算機視覺中處理圖像中數據的像素。在 CNN 中,有卷積層和
43、池化(即子采樣)層,在這些卷積層和池化層之上,通過連接特征映射來學習向量表示,以進行最終的預測。遞歸神經網絡(RNN)RNN 在深度學習算法中主要用于處理序列數據。RNN 在傳統的神經網絡模型基礎上,允許同一隱藏層的神經元之間的連接形成一個有向循環,從而可以使用順序輸入,通常被用于語言處理。圖神經網絡(GNN)GNN 是一種把數據抽象成節點和邊并表示為圖的建模方式。GNN 可以處理節點級(如節點分類)、邊級(如鏈接預測)和圖級(如圖回歸)任務,具有鄰域聚合、池化和讀出操作。生成對抗網絡(GAN)GAN 在生成逼真的合成樣本方面取得了顯著成就。GAN 由生成模型和判別模型組成。生成器旨在從隨機分
44、布中生成新的數據點,而判別器旨在分類生成的樣本是來自訓練數據分布還是來自生成器。變分自編碼器(VAE)VAE 是一類功能強大的概率生成模型。VAE 由一個編碼器和一個解碼器組成,編碼器將高維數據映射到一個低維的連續潛在空間 z。與普通的自編碼器相比,潛在空間被正則化,理想情況下,通過 KL 散度進行組織。除了重構之外,VAE 近似一個概率分布,可以對其進行采樣以生成。擴散模型 擴散模型是一類圖像生成任務模型。擴散模型架構分別由擴散層、隱空間和去噪層組成。與 VAE 或流模型不同,擴散模型是通過固定過程學習,緩慢 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 15/34 醫醫藥生藥生
45、物物/行業行業深度深度 地將隨機噪聲添加到數據中,然后學習逆向擴散過程以從噪聲中構造所需的數據樣本,并且隱空間具有比較高的維度。Transformer 模型 Transformer 模型是強大的語言模型。Transformer 模型由輸入部分、解碼器、編碼器和輸出部分組合而成。數據來源:先進人工智能技術在新藥研發中的應用、東北證券 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 16/34 醫醫藥生藥生物物/行業行業深度深度 3.人工智人工智能能賦能賦能新藥研發各新藥研發各個階段個階段,AI+新藥研新藥研發潛力巨大發潛力巨大 人人工工智智能能在在新新藥藥研研發發各各個個階階段段均均有
46、有應應用用潛潛力力。根據Artificial intelligence in drug development,藥物開發是一個多方面的過程,主要涉及幾個階段,包括靶點識別、藥物發現、臨床前研究、臨床試驗、監管批準和上市后監測。疾病的復雜性、藥物開發過程的復雜性、巨大的化學空間和嚴格的監管要求均導致新藥研發面臨高成本、長周期和低成功率等諸多挑戰,但人工智能的最新進展,包括圖像識別、自然語言處理、計算機視覺等,已證明其在分析復雜的生物系統、確認疾病生物標志物和潛在藥物靶點、模擬藥物靶點相互作用、預測候選藥物的安全性和有效性以及管理臨床試驗等方面具有重要價值。圖圖 13:人工智能在新藥研:人工智能在
47、新藥研發各個階段均有應用發各個階段均有應用潛力潛力 數據來源:Artificial intelligence in drug development、東北證券 3.1.人人工智工智能輔助能輔助藥物藥物靶點確靶點確認認 根據譜度眾合官網,藥物靶點是機體內與特定的疾病過程內在相關,并與藥物直接結合以產生相互作用的生物分子。根據AI-powered therapeutic target discovery,靶靶點點識別識別即即識別識別可被藥可被藥物調物調節以實現治療的正確節以實現治療的正確生物生物分子或細胞分子或細胞通路通路的過的過程,程,目前靶目前靶點點識別識別的方法包括實的方法包括實驗法驗法、多
48、組學法和計算法三類多組學法和計算法三類。其中,實驗法根據親和力、化學遺傳學和比較分析來確認靶點;多組學法通過分析各種組學數據集(如基因組學、轉錄組學、蛋白質組學、表觀基因組學和代謝組學)來預測基因與疾病的關聯;計算法通過使用機器學習或基于結構的方法(包括反向對接、藥效團篩選和結構相似性分析)有效的確認潛在靶點。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 17/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 14:靶點靶點識別識別的方法包的方法包括實驗法、多組學法括實驗法、多組學法和計和計算法三類算法三類 數據來源:AI-powered therapeutic target dis
49、covery、東北證券 3.1.1.實驗法根據親和力、實驗法根據親和力、化學化學遺傳學和比較分析來遺傳學和比較分析來確認確認靶點靶點 (1)基于親和力的基于親和力的方法方法:基于親和力的方法是“以藥找靶”的常用方法,其原理為利用藥物分子與靶點之間的特異性結合,將靶點從復雜的生物樣本中分離出來。根據 GOLDBIO 官網,基于親和力的靶點確認方法流程為:向容器中加入生物樣本,靶蛋白與瓊脂糖珠上的配體結合,未結合的蛋白質被清洗后,再使用洗脫液從配體中釋放靶蛋白。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 18/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 15:基于親和力的靶點基于
50、親和力的靶點確認方法屬于“以藥確認方法屬于“以藥找靶找靶”數據來源:GOLDBIO 官網、東北證券 (2)化學遺傳學化學遺傳學方法方法:化學遺傳學方法通過抑制靶基因表達或編輯靶基因,用于靶點的發現與驗證。以 RNAi 為例,根據 siRNA 藥物在腫瘤靶向治療中的研究進展,RNA 干擾技術(RNAi)是將外源或內源的雙鏈 RNA(dsRNA)導入細胞后引起與dsRNA 同源的靶基因降解,進而抑制靶基因表達的一種技術,其發生依賴 shRNA、miRNA、siRNA 三種 dsRNA。以 siRNA 為例,根據Biotechnological evolution of siRNA molecule
51、s:from bench tool to the refined drug,siRNA 作用機制為:dsRNA或 shRNA 被核酸內切酶 Dicer 切割為 siRNA;siRNA 與 Argonaute-2(AGO2)蛋白結合,該蛋白被認為是 RNA 誘導沉默復合物(RISC)的核心;siRNA 被分離為引導鏈(guide strand)和傳遞鏈(passenger strand),傳遞鏈降解,引導鏈保留下來作為與 mRNA 比對的模板;核酸內切酶切割靶 mRNA,從而起到基因沉默的效果。根據RNAi 在藥物研究中的應用,RNAi 特異高效地抑制基因表達,獲得去基因功能表型,可以確定相應蛋
52、白質的功能并用于靶點的發現與驗證。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 19/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 16:siRNA 可干擾基因可干擾基因表達并用于靶點表達并用于靶點的發的發現與現與驗證驗證 數據來源:Biotechnological evolution of siRNA molecules:from bench tool to the refined drug、東北證券 (3)比較分析方法比較分析方法:SILAC 屬于比較分析方法屬于比較分析方法,是靶點是靶點識別識別中最常用中最常用的定的定量蛋白量蛋白質組學方法。質組學方法。根據Target i
53、dentification of natural medicine with chemical proteomics approach:probe synthesis,target fishing and protein identification,SILAC 為穩定同位素標記法,其識別靶點的流程為:兩個平行的細胞群體在不同的培養基中培養,一個含有正常氨基酸,另一個含有同位素標記的氨基酸(即重氨基酸);經過幾代細胞培養后,兩個群體新合成的蛋白質的分子量產生差異;將探針與同位素標記的細胞一起孵育,將陰性對照與正常細胞一起孵育,將兩組富集的蛋白質合并進行后續鑒定;兩組蛋白質的分子量產生變化,可以
54、利用質譜法比較兩組之間的相對蛋白質豐度,鑒定出特定的靶蛋白。圖圖 17:SILAC 是靶點是靶點識別識別中最常用的定量蛋白中最常用的定量蛋白質組質組學方法學方法 數據來源:Target identification of natural medicine with chemical proteomics approach:probe synthesis,target fishing and protein identification、東北證券 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 20/34 醫醫藥生藥生物物/行業行業深度深度 3.1.2.多組學數據與人工智多組學數據與人
55、工智能算能算法結合的靶點識別方法結合的靶點識別方法前法前景景廣闊廣闊 基于基于NGS的多組學方法可的多組學方法可用于靶點發現和驗證用于靶點發現和驗證,人工人工智能可提供助力智能可提供助力。根據Illumina因美納官方公眾號,新一代測序技術(NGS)是多組學研究不可或缺的底層技術之一,其持續發展推動基于 NGS 的多組學方法整合到藥物開發工作流程的各個階段中。在藥物靶點發現階段,多組學方法可以對“可操作”實體(如大分子、分子功能、途徑)進行無偏差鑒定,這些實體均可以作為現有藥物或新候選藥物的靶點。在藥物靶點驗證階段,多組學方法可用于分析基因功能分子敲除或敲低在轉錄組、表觀基因組和蛋白質組中的表
56、型效應,以驗證靶點開展進一步開發。根據AI-powered therapeutic target discovery,盡管多組學數據提供了多方面的相互關聯的分子信息,包括靜態基因組數據、時空動態表達水平、代謝數據,但確定可操作的治療靶點仍然充滿挑戰,將多組學數據與人工智能算法結合的靶點識別方法正獲得關注,被認為具有廣闊的應用前景。圖圖 18:基于:基于 NGS 的多組的多組學方法可用于靶點發學方法可用于靶點發現和現和驗證驗證 數據來源:Illumina 因美納官方公眾號、東北證券 3.1.3.人工智能驅動靶點識人工智能驅動靶點識別,別,有望提高新靶點的開有望提高新靶點的開發效發效率率 通過使用
57、公開獲取的組學數據和文本通過使用公開獲取的組學數據和文本數據數據,深度學習已被用于疾病的研究。,深度學習已被用于疾病的研究。根據AI-powered therapeutic target discovery,人工智能根據特定指示,使用多個模型 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 21/34 醫醫藥生藥生物物/行業行業深度深度 對靶點進行優先級排序,這些模型利用了多種公開獲取的組學數據和文本數據。組學數據包括基因組學、轉錄組學、蛋白質組學、表觀基因組學和代謝組學,這些數據提供了關于改變的信號通路、分子相互作用和蛋白質相互作用的信息。文本數據從資金報告、專利、出版物和臨床試驗
58、中檢索。在靶點優先級排序中,可以應用多種靶點選擇標準來提煉靶點清單以與特定的研究目標保持一致,這些選擇標準包括疾病與靶點之間的因果關系、發展現狀(臨床試驗階段、配體/化合物可獲得性)、可藥性(蛋白質定位、治療方法、蛋白質結構可獲得性)、毒性(基因重要性、組織特異性、涉及細胞過程)、創新性等。人工智能的應用有望加快藥物靶點的選擇與確認,顯著減少靶點確認和驗證所需的時間和成本,提高新靶點和新療法的開發效率,從而改變藥物發現的過程。圖圖 19:人工智能:人工智能利用多種利用多種數據,數據,加快藥物靶點加快藥物靶點的選的選擇與確認擇與確認 數據來源:AI-powered therapeutic tar
59、get discovery、東北證券 人人工工智智能可能可用于用于創創建合建合成數成數據據并并據此據此進行進行靶靶點點識別識別。根據AI-powered therapeutic target discovery,合成數據是指模擬現實世界模式和特征的人工生成數據。通過利用人工智能,可以創建合成數據來模擬各種生物場景,以解決一些治療領域試驗數據稀缺或難以獲得和數據不平衡或有偏等問題。因此,人工智能的應用有望幫助發現復雜疾病的新靶點和新通路,為應對復雜疾病做出重大貢獻。3.2.人人工智工智能賦能能賦能化合化合物的虛物的虛擬篩擬篩選和從選和從頭設頭設計計 苗頭化合物是指對特定靶標或作用環節具有初步活性
60、的化合物。根據小分子藥物篩選技術研究現狀及其應用進展,隨著生命組學、系統生物學、結構生物學等新興學科以及高性能計算、大數據分析、人工智能等信息技術深度融入藥物研發,小分子藥物篩選新技術伴隨著藥物的發現正在不斷更新和拓展,在基于已知活性在基于已知活性化合化合物物(Known)的藥物發現和的藥物發現和高通量篩選高通量篩選(HTS)等傳等傳統篩選技術的基礎上,統篩選技術的基礎上,基基于結構于結構的藥物發現的藥物發現(SBDD)、基于片段的藥物發現基于片段的藥物發現(FBDD)、DNA 編碼化合物庫編碼化合物庫(DEL)、)、蛋白降解靶向聯合體蛋白降解靶向聯合體(PROTAC)等藥物篩選新技)等藥物篩
61、選新技術應運而生。術應運而生。表表 4:不同小分子藥不同小分子藥物篩物篩選技術對比選技術對比 技術技術 原理原理 優點優點 缺點缺點 Known 對已知化合物進行修飾或改造。技術成熟,研發成本低,技術要求低。篩選效率低,耗時長,較難研發出原創性成果,容易陷入專利陷阱。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 22/34 醫醫藥生藥生物物/行業行業深度深度 HTS 以分子水平和細胞水平的實驗方法為基礎,以微板形式作為實驗工具載體,以自動化操作系統執行試驗過程,以靈敏快速的檢測儀器采集實驗結果數據,運用計算機對實驗數據進行分析處理,并以相應的數據庫支持運轉。主流篩選方法,高度標準化
62、,技術要求較低,篩選速度快,靈敏度高,自動化程度高,特異性強,所需樣品量小。成本較高,耗時較長,分子多樣性受制于化合物篩選庫,較難處理某些復雜靶點的篩選。SBDD 以配體和靶點的三維結構出發,以分子識別為基礎而進行的藥物設計方法。利用 CADD 等技術,成本較低,可從少量化合物篩選獲得先導化合物,顯著提高發現命中率,可直接預測受體和配體的結合能力。需要受體完整的三維立體結構,僅考慮受體和配體的結合強度而不能預測藥效,速度相對較慢。FBDD 利用 NMR、SPR、X-ray 以及TSAs 等方法篩選出與靶蛋白具有相互作用的小分子弱活性片段,然后基于其結構信息對活性片段進行優化,得到具有更高活性的
63、先導化合物。片段庫的收集、維護和篩選比化合物庫更加容易,篩選命中率高,篩選速度快,可以實現對復雜靶點的篩選,篩選和優化后的先導化合物活性和選擇性更高。技術門檻要求較高,對純化蛋白的需求量較大,片段經過結構優化后得到的先導化合物可能與片段分子結合位點不同,對篩選所需檢測手段的靈敏度要求較高。DEL 基于組合化學和 DNA 技術的藥物篩選方法,對化合物進行DNA編碼構建 DEL,將靶蛋白和 DEL進行親和篩選,得到與靶蛋白親和力強的集合,利用高通量測序確定編碼對應的化合物分子,重新合成不帶 DNA 標簽的化合物,活性驗證及結構優化后得到先導化合物。庫容量巨大,分子多樣性好,對靶標蛋白需求量少、效率
64、高、成本低。技術要求較高,DNA編碼標簽以及組合化學增加了篩選的復雜性和不確定性,需要進一步開發和優化與 DNA 相容的化學反應,對于難以表達的靶點或者活細胞體系等功能性靶點篩選較為困難。PROTAC 利用 UPS 原理設計的一種雙功能小分子,中間的連接體一端連接可靶向目標蛋白的配體,另一端連接 E3 泛素連接酶配體分子,將靶向蛋白募集到 E3 泛素連接酶進行泛素化標記,通過UPS 將其降解??梢园邢蜣D錄因子、支架蛋白和非酶蛋白等對于傳統小分子藥物“無成藥性”的蛋白,催化劑量即可發揮作用,低耐藥性,高選擇性。水溶性、穩定性、口服生物利用度、血管穿透能力需進一步提高,存在脫靶毒性的風險。數據來源
65、:小分子藥物篩選技術研究現狀及其應用進展、東北證券 目前目前 SBDD 等新策略在新等新策略在新藥研發領域發揮越來藥研發領域發揮越來越重越重要的作用。要的作用。根據小分子藥物篩選技術研究現狀及其應用進展,通過對2022年至今在Journal of Medicinal Chemistry期刊上發表的文章進行分析統計,結果發現基于 HTS、SBDD、FBDD、DEL 和PROTAC 的應用占比分別約為 17.4%、51.2%、19.5%、4%和 6.3%。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 23/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 20:SBDD 藥物篩選新藥物篩
66、選新技術技術占據主要地位占據主要地位 數據來源:小分子藥物篩選技術研究現狀及其應用進展、東北證券 SBDD 產生候選藥物的方產生候選藥物的方法主要包括虛擬篩選法主要包括虛擬篩選和分和分子生成。子生成。根據英特爾官網,計算機輔助藥物設計(CADD)是以量子力學和分子生物學為基礎,借助基于計算機的分子圖形學、分子建模技術與虛擬高通量篩選等關鍵技術,來了解、模擬和預測藥物與靶標分子之間的作用,并篩選、設計和優化藥物所需的化合物,SBDD 屬于CADD。根據Deep Lead Optimization:Leveraging Generative AI for Structural Modificati
67、on和Learning on topological surface and geometric structure for 3D molecular generation,由于 SBDD 模擬蛋白質如何與小分子相互作用來產生生物效應,因此被認為在產生候選藥物方面更為有效,主要方法包括:虛擬篩選:通過對化合物庫進行評估和排名,選擇最有前景的化合物進行后續的實驗驗證;分子生成:通過設計新的化學實體,超越現有化合物庫的局限性,擴展化學空間。圖圖 21:SBDD 產生候選藥產生候選藥物的方法主要包括虛物的方法主要包括虛擬篩擬篩選和分子生成選和分子生成 數 據 來 源:Deep Lead Optimi
68、zation:Leveraging Generative AI for Structural Modification、東北證券 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 24/34 醫醫藥生藥生物物/行業行業深度深度 3.2.1.虛擬篩選在虛擬篩選在 CADD 中起到中起到關鍵作用,人工智能關鍵作用,人工智能可提可提高其效率高其效率 人工智能可以有效提人工智能可以有效提高高關關鍵環節鍵環節虛擬篩選虛擬篩選的的效率效率。根據CADD,AI and ML in drug discovery:A comprehensive review,從化學數據庫中選擇有前景的化合物的計算機方法
69、被稱為虛擬篩選,可以被認為是高通量篩選(HTS)等實驗生物評估方法對應的計算方法。根據An artificial intelligence accelerated virtual screening platform for drug discovery,RosettaVS 是一種高度精確的基于結構的虛擬篩選方法,用于預測對接姿勢和結合親和力,該方法被整合到一個新的開源人工智能加速虛擬篩選平臺中并用于藥物發現。該平臺在七天內針對兩個無關靶點 KLHDC2 和 NaV1.7,分別發現 7 個和 4 個苗頭化合物,證明了人工智能可以加速新藥發現和藥物設計的進程。圖圖 22:虛擬篩選虛擬篩選在在 C
70、ADD 中中起到關鍵作用起到關鍵作用 數據來源:Role of computer-aided drug design in modern drug discovery、東北證券 3.2.2.人工智能快速發展,人工智能快速發展,AIDD 憑借更高效率獲得關注憑借更高效率獲得關注 人工智能人工智能推動推動 AIDD 快速快速發展發展,可視為可視為 CADD 的演的演進與補充。進與補充。根據英特爾官網,近年來,人工智能輔助藥物開發技術(AIDD)憑借更高的研發效率、更為自動化及智能化的運作方式與流程、更短耗時與更低成本獲得空前關注,可視為 CADD 的演進與補充。CADD 對專業人員與傳統實驗手段還
71、較為依賴,主要是輔助專家的工作,智能化程度不足,也缺乏自主學習與進化的能力;AIDD 采納了更智能、更自動化、請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 25/34 醫醫藥生藥生物物/行業行業深度深度 更能減少人工介入和人力投入的 AI 算法,因此大大節省時間和成本。根據AIDD與 CADD 提升藥物成功率的思考,人工智能技術被引入藥物設計領域時,藥學家們主要采用神經網絡直接應用于藥物分子的生成,即基于網絡的分子生成模型,依賴于神經網絡學習分子的各種屬性,進而生成新的化合物。根據Artificial intelligence in drug development,在人工智能驅動
72、藥物從頭設計的過程中,可使用不同化合物、靶點和藥物-靶點相互作用的數據庫來訓練人工智能模型,如生成對抗網絡(GAN)、遞歸神經網絡(RNN)、變分自編碼器(VAE)等,這些模型產生新的分子,隨后對其化學有效性、合成可行性和類藥性進行評估,最終鑒定出新的類藥化合物。圖圖 23:人工智能人工智能驅動藥物驅動藥物從頭設計從頭設計,產生新的,產生新的類藥類藥化合物化合物 數據來源:Artificial intelligence in drug development、東北證券 3.3.人人工智工智能加速能加速 ADMET 預測預測 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 26/34
73、醫醫藥生藥生物物/行業行業深度深度 人工智能加速人工智能加速 ADMET 預測,預測,有望降低研有望降低研發成本發成本。根據殷賦科技官方公眾號,在新藥研發的過程中,大部分化合物會因為種種原因最終無法成為藥物,在這些因素中,藥代動力學性質和毒性問題造成的失敗率高達 50%,是影響新藥研發的關鍵因素。藥代動力學主要研究體內藥物濃度隨時間變化的規律,涉及 ADME 等方面,即藥物在體內的吸收(Absorption)、分布(Distribution)、代謝(Metabolism)和排泄(Excretion)過程。ADME 決定了藥物在體內的生物利用度、作用時間長短和所需劑量大小。除此之外,毒性(Tox
74、icity)與藥代動力學也密切相關,通常與 ADME 結合起來考慮,即 ADMET。根據基于人工智能技術的 ADMET 性質預測研究,ADMET 預測主要包括基于描述符的方法、基于分子圖的方法和基于 SMILES 的方法,其可以在藥物研發的早期階段及時發現導致化合物難成藥的重要特征,如生物利用度低、藥代動力學不理想、藥物相容性差等,在藥物的篩選、開發和評價過程中發揮著重要作用。圖圖 24:ADMET 性質是衡性質是衡量化合物是否能成藥量化合物是否能成藥的關的關鍵因素鍵因素 數據來源:殷賦科技官方公眾號、東北證券 3.4.人人工智工智能助力能助力 CASP,提,提高化高化學合成學合成效率效率和成
75、功和成功率率 人人工智工智能推動能推動化學合化學合成效率成效率的提的提高和有高和有機化合機化合物自動物自動合成合成的實現的實現。根據Artificial intelligence in drug development和人工智能在新藥研發中的應用進展,化學合成是小分子藥物發現的瓶頸之一,是一項技術性很強、耗時費力的任務,計算機輔助合成規劃(CASP)和有機化合物自動合成可以幫助提高效率。CASP 被用作通過逆向合成分析確定反應路線的工具,主要任務包括逆向合成、提供正向反應的條件和反應預測,人工智能的快速發展有望使合成階段加速以及減少新分子實體合成的失敗。此外,有機化合物自動合成是化學相關領域的
76、前沿技術,自動化合成與設計、測試和分析技術相結合形成的自動化藥物發現過程稱為設計-制造-測試-分析(DMTA)循環,深度學習使 DMTA 循環的效率顯著提高。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 27/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 25:人工智能推動化學:人工智能推動化學合成效率的提高和有合成效率的提高和有機化機化合物自動合成的實現合物自動合成的實現 數據來源:Artificial intelligence in drug development、東北證券 3.5.人人工智工智能在菌能在菌群標群標志物發志物發現領現領域展現域展現出潛出潛力力 人工智能人工智
77、能輔助輔助識識別別出出更更精精確確的的菌菌群群標標志志物物,提提高高疾疾病病預預測測和和診診斷斷準準確確性性。根據Exploring the frontier of microbiome biomarker discovery with artificial intelligence和中國科學院官網,菌群標志物作為微生物群落在健康與疾病狀態下的特定生物分子或代謝產物,對于疾病的早期診斷和預防具有重要意義。傳統的菌群標志物識別方法主要依賴于統計方法如 t-test、ANOVA 等,對菌群數據進行分析并識別豐度差異的微生物種類或功能基因。但菌群測序數據存在大量噪聲干擾及菌群數據的稀疏性、高維性和組
78、成性等特征,對基于菌群豐度的標志物識別和挖掘帶來了挑戰。人工智能通過特征選擇和模型訓練,能夠識別出與疾病表型具有顯著關聯的菌群特征,挖掘出基于差異豐度分析和共現網絡分析所無法發現的潛在模式和復雜的相互作用,從高維、復雜的菌群數據中識別出更精確的菌群標志物,進而提高疾病預測和診斷的準確性。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 28/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 26:人工智能為菌群標人工智能為菌群標志物的志物的發現發現提供全新提供全新視角視角 數據來源:Exploring the frontier of microbiome biomarker discov
79、ery with artificial intelligence、東北證券 3.6.人人工智工智能已成能已成為藥為藥物再利物再利用的用的有效工有效工具具 人工智能可用于藥物人工智能可用于藥物再利再利用以加速藥物發現流用以加速藥物發現流程。程。根據人工智能在藥物再利用治療新型冠狀病毒感染研究中的應用及問題分析,藥物再利用是發掘現有藥物在原有適應證之外的新用途,比開發新藥更快,成本更低。人工智能能夠從龐大復雜的數據中挖掘出信息和規律,已成為藥物再利用的有效工具,可加快研發速度,降低研發成本。人工智能應用于藥物再利用的方法可分為:基于網絡的模型:強調藥物與疾病間關聯性的識別,以揭示藥物的潛在治療機制
80、;基于結構的方法:通過藥物和靶點間結構相互作用的分析實現精確篩選;機器學習/深度學習方法:利用復雜非線性數據的多維度處理進行候選藥物預測。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 29/34 醫醫藥生藥生物物/行業行業深度深度 圖圖 27:人工智能人工智能驅動驅動藥物藥物再利用再利用,加速藥物發,加速藥物發現流現流程程 數據來源:人工智能在藥物再利用治療新型冠狀病毒感染研究中的應用及問題分析、東北證券 3.7.人人工智工智能通過能通過多種多種方式助方式助力臨力臨床試驗床試驗成功成功 臨臨床床試試驗驗是是新新藥藥研研發發過過程程中中成成本本最最高高、耗耗時時最最長長且且成成功功率
81、率較較低低的的階階段段。根據Artificial Intelligence for Clinical Trial Design,新藥開發是一個漫長、昂貴、高風險的過程,其中大約一半的時間和投資消耗在臨床試驗階段,而臨床試驗的高失敗率又使其成為新藥研發中最困難的一步。僅有 40%左右的化合物可以進入 II 期臨床;進入 II 期臨床的化合物中,大約 1/3 能進入 III 期臨床;進入 III 期臨床的化合物中,大約 2/3 可以獲批上市;上述數據意味著約有 90%的化合物會在臨床試驗階段被淘汰。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 30/34 醫醫藥生藥生物物/行業行業深度
82、深度 圖圖 28:臨床試驗是新藥研:臨床試驗是新藥研發過程中成本最高、發過程中成本最高、耗時耗時最長且成功率較低的最長且成功率較低的階段階段 數據來源:Artificial Intelligence for Clinical Trial Design、東北證券 除了在藥物發現及臨除了在藥物發現及臨床前床前階段階段的大量應用的大量應用,人工智人工智能在臨床試驗階段可能在臨床試驗階段可用于用于臨床試臨床試驗設計、患者招驗設計、患者招募和臨床試驗數據處理等募和臨床試驗數據處理等。根據Artificial Intelligence for Clinical Trial Design,每項臨床試驗都對招
83、募患者的適用性、資格等提出要求,因此在規定時間內完成招募存在較大挑戰,也是臨床試驗延遲的主要原因:86%的臨床試驗未按時完成患者招募,近 1/3 的 III 期臨床試驗因患者招募問題失敗。人工智能可以幫助優化患者隊列選擇,為患者招募提供幫助并改善患者監測。(1)患者隊列選擇:患者隊列選擇:臨床試驗通常不是為了在普通人群的隨機樣本中證明治療的有效性,因此需要對患者進行生物標志物的驗證并據此進行臨床試驗富集。人工智能可通過以下方式來增強患者隊列選擇:減少人群異質性:識別具有特定特征的患者;預后富集:選擇更有可能具有可測量臨床終點的患者;預測富集:確定更可能對治療做出反應的人群。(2)患者招募患者招
84、募:試驗資格標準很大程度上決定了患者是否被認為適合并有資格參加臨床試驗,但試驗資格標準在數量和醫學術語方面的復雜性通常使患者難以理解和評估自己的資格。人工智能可用于自動分析電子病歷和臨床試驗資格數據庫,匹配特定患者和臨床試驗,并將這些匹配推薦給醫生和患者。(3)患者監測患者監測:為提高臨床試驗的成功率,患者必須在整個臨床試驗過程中遵守程序和規則,并收集所有用于監測受試藥物影響的數據,但經常出現的患者推出臨床試驗導致臨床試驗的延誤和大量額外成本。人工智能可通過以下方式來改善患者監測:疾病日記:人工智能與可穿戴技術相結合,自動連續收集患者數據并實時分 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及
85、說明及說明 31/34 醫醫藥生藥生物物/行業行業深度深度 析,形成疾病日記;推出風險預測:人工智能可根據患者行為,動態預測特定患者的退出風險。圖圖 29:人工智能可用于人工智能可用于臨臨床試驗床試驗設計以提高效設計以提高效率并率并降低成本降低成本 數據來源:Artificial Intelligence for Clinical Trial Design、東北證券 請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 32/34 醫醫藥生藥生物物/行業行業深度深度 4.總結與總結與展望展望 綜上所述,新藥研發是一個漫長、昂貴、高風險的過程,人工智能的快速發展有望在靶點確認、藥物開發、臨床
86、前研究、臨床試驗等新藥研發的各個環節發揮作用,提高研發效率,縮短研發時間,節約研發成本。目前,國內外眾多企業已在 AI+新藥研發領域進行布局,本系列報告的第二篇將從市場角度對人工智能在新藥研發中的應用進行詳細解讀,并分析其面臨的挑戰及拓展的邊界。風險提示:風險提示:AI 在新藥研發在新藥研發領域的應用不及預期領域的應用不及預期的風的風險;險;AI 賦能的新藥臨床試賦能的新藥臨床試驗進驗進展不及預期的風險;展不及預期的風險;“黑盒黑盒”問題導致模型輸出”問題導致模型輸出結果結果難以解釋的風險。難以解釋的風險。請請務必閱讀務必閱讀正文后正文后的聲明的聲明及說明及說明 33/34 醫醫藥生藥生物物/
87、行業行業深度深度 研研究團隊簡究團隊簡介:介:Table_Introduction 趙宇天:上海財經大學本科,澳大利亞國立大學碩士,2022 年加入東北證券。分分析師聲明析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格,并在中國證券業協會注冊登記為證券分析師。本報告遵循合規、客觀、專業、審慎的制作原則,所采用數據、資料的來源合法合規,文字闡述反映了作者的真實觀點,報告結論未受任何第三方的授意或影響,特此聲明。投資投資評級說評級說明明 股票 投資 評級 說明 買入 未來 6 個月內,股價漲幅超越市場基準 15%以上。投資評級中所涉及的市場基準:A 股市場以滬深 300 指數為市場基準,
88、新三板市場以三板成指(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的)為市場基準;香港市場以摩根士丹利中國指數為市場基準;美國市場以納斯達克綜合指數或標普 500指數為市場基準。增持 未來 6 個月內,股價漲幅超越市場基準 5%至 15%之間。中性 未來 6 個月內,股價漲幅介于市場基準-5%至 5%之間。減持 未來 6 個月內,股價漲幅落后市場基準 5%至 15%之間。賣出 未來 6 個月內,股價漲幅落后市場基準 15%以上。行業 投資 評級 說明 優于大勢 未來 6 個月內,行業指數的收益超越市場基準。同步大勢 未來 6 個月內,行業指數的收益與市場基準持平。落后大勢 未來 6 個月內
89、,行業指數的收益落后于市場基準。請務必閱讀正文后的聲明及說明請務必閱讀正文后的聲明及說明 34/34 醫藥生物醫藥生物/行業深度行業深度 重要聲明重要聲明 本報告由東北證券股份有限公司(以下稱“本公司”)制作并僅向本公司客戶發布,本公司不會因任何機構或個人接收到本報告而視其為本公司的當然客戶。本公司具有中國證監會核準的證券投資咨詢業務資格。本報告中的信息均來源于公開資料,本公司對這些信息的準確性和完整性不作任何保證。報告中的內容和意見僅反映本公司于發布本報告當日的判斷,不保證所包含的內容和意見不發生變化。本報告僅供參考,并不構成對所述證券買賣的出價或征價。在任何情況下,本報告中的信息或所表述的
90、意見均不構成對任何人的證券買賣建議。本公司及其雇員不承諾投資者一定獲利,不與投資者分享投資收益,在任何情況下,我公司及其雇員對任何人使用本報告及其內容所引發的任何直接或間接損失概不負責。本公司或其關聯機構可能會持有本報告中涉及到的公司所發行的證券頭寸并進行交易,并在法律許可的情況下不進行披露;可能為這些公司提供或爭取提供投資銀行業務、財務顧問等相關服務。本報告版權歸本公司所有。未經本公司書面許可,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的,須在本公司允許的范圍內使用,并注明本報告的發布人和發布日期,提示使用本報告的風險。若本公司客戶(以下稱“該客戶”)向第三方發送本報告,則由該客戶獨自為此發送行為負責。提醒通過此途徑獲得本報告的投資者注意,本公司不對通過此種途徑獲得本報告所引起的任何損失承擔任何責任。Table_Sales東北證券股份有限公司東北證券股份有限公司 地址地址 郵編郵編 中國吉林省長春市生態大街 6666 號130119 中國北京市西城區錦什坊街 28 號恒奧中心 D 座100033 中國上海市浦東新區楊高南路 799 號200127 中國深圳市福田區福中三路 1006 號諾德中心 34D 518038 中國廣東省廣州市天河區冼村街道黃埔大道西 122 號之二星輝中心 15 樓510630