《智慧芽:2025年Deepseek在藥企研發領域的本地化部署和應用場景報告(33頁).pdf》由會員分享,可在線閱讀,更多相關《智慧芽:2025年Deepseek在藥企研發領域的本地化部署和應用場景報告(33頁).pdf(33頁珍藏版)》請在三個皮匠報告上搜索。
1、Deepseek在藥企研發領域的本地化部署和應用場景智慧芽生物醫藥2025年03月目錄Deepseek-R1在藥企的本地化部署02芽仔與Deepseek-R1對接03AI融入智慧芽生物醫藥產品04大模型的發展階段和deepseek01智慧芽LS-GTM2資料來源:中文大模型基準測評2024年度報告(2025.01.08)大模型的發展階段智慧芽LS-GTM3基礎能力:進入推理模型階段,躋身全球第一梯隊推理能力躍升:DeepSeek大模型核心技術突破,實現復雜推理任務的精準處理與高效執行,覆蓋多模態場景應用。國際競爭力對標:模型綜合性能躍居全球第一梯隊,技術指標與國際頂尖水平(如GPT系列、Cla
2、ude等)直接對標,奠定國產大模型的行業標桿地位。加分項:開源、低成本、國產化Deepseek出圈引爆全行業的原因?智慧芽LS-GTM4打破壟斷:R1版以低成本和開源特性打破以往頭部企業壟斷局面。價格優勢:DeepSeek-R1的API定價僅為行業均價的1/10,推動了中小型企業低成本接入AI,對各個行業產生了積極影響。創新:重新定義了芯片和算力對大模型的影響。Deepseek的三種使用方式:在 軟 件 系 統 中 調 用 官 方AP I、模 型 微 調、直 接 使 用。資料來源:AI肖睿團隊,北京大學-DeepSeek原理與落地應用Deepseek對行業產生巨大影響智慧芽LS-GTM5目錄D
3、eepseek-R1在藥企的本地化部署02芽仔與Deepseek-R1對接03AI融入智慧芽生物醫藥產品04大模型的發展階段和deepseek016資料來源:AI肖睿團隊,北京大學-DeepSeek原理與落地應用Deepseek-R1在藥企的本地化部署智慧芽LS-GTM7個人部署:Ollma 框架適合個人用戶私有化本地部署,但在多用戶并發場景下 性能衰減明顯。企業部署:推薦使用Transformers 來快速驗證模型能力,使用 vLLM 框架借助PagedAttention技術實現 24倍于 Transformers的吞吐量實現大模型的高效推理,針對不同企業場景,則提供不同的企業級部署方案。其
4、他方式:近期出現的KTransformer s、Unsloth 等多套低成本動態量化模型的DeepSeek 部署解決方案。目前暫不夠成熟。vLLM部署簡單,更適合中小型企業做大模型推理部署,對于大型企業,可以使用配置較為復雜的Tensor RT框架。資料來源:AI肖睿團隊,北京大學-DeepSeek原理與落地應用Deepseek-R1在藥企的本地化部署智慧芽LS-GTM8DeepSeek R1模型就成了很多應用場景下的當務之急。受限于DeepSeekR1 671B(6710億參數)的模型規模,通常情況下部署Deepseek R1滿血版模型需要1200G左右顯存(考慮百人內并發情況),需要雙節點
5、8卡H100服務器才能運行(總成本約在260萬-320萬左右),即便是INT4半精度下,也至少需要490G顯存,需要單節點8卡H100服務器才能運行。為了實現低成本DeepSeek R1模型的高性能部署,目前大多數方案都采用了犧牲模型推理速度的策略。使用CPU+GPU混合推理的方式,將一部分推理計算轉移到CPU上,降低GPU的負載。由于CPU并不適合深度學習計算,導致模型整體推理速度較慢。Deepseek-R1滿血版模型部署方案智慧芽LS-GTM9資料來源:AI肖睿團隊,北京大學-DeepSeek原理與落地應用Deepseek-R1部署方案簡介智慧芽LS-GTM10目錄Deepseek-R1在
6、藥企的本地化部署02芽仔與Deepseek-R1對接03AI融入智慧芽生物醫藥產品04大模型的發展階段和deepseek011112Deepseek出圈引爆全行業:仍有幻覺問題,例如出現專利號需要查證13為什么需要RAG?MM生物醫藥知識中臺模型平臺內部數據管線數據新聞數據臨床數據專利數據文獻數據RAGSOTNER關系識別OCSR自研數據自有數據M應用平臺藥物交易追蹤專利追蹤一鍵生成競品報告自動ASCO會議總結自動醫學寫作protocol文獻、專利助手構建路徑.智能知識平臺的組成標準字典表流病數據1415芽仔與Deepseek-R1對接智慧芽LS-GTM16資料來源:https:/hiro-
7、ID:3wzm),提取A鏈,移除水分子,作為起點。通過與GROMACS Copilot對話,要求其搭建體系,構建小分子力場、建立復合物拓撲、溶解、平衡等步驟后,進行1ns的正式模擬。對軌跡移除PBC,根據蛋白質進行旋轉平移對齊,最后輸出RMSF,并且對RMSF進行分析?;谘孔?,可以連貫地完成這個過程。分子設計場景:智能體agent一鍵式生成分子動力學模擬圖19資料來源:https:/hiro- 告訴芽仔生物醫藥你的角色,有利于芽仔理解你的處境,更好的判斷你的需求 為芽仔提供必要的上下文信息,讓它能夠更準確地理解和執行任務。具體、簡潔的指令更有利于AI執行;引導最后的回答參考了智慧芽數據庫矩陣
8、,包括新藥數據庫、bio、chemical、專利數據庫等;可添加重要細節,如風格、字數、日期等限定。我是藥企藥效試驗項目管理;需要評估狼瘡性試驗的各種動物藥效試驗的優勢和劣勢,為評估臨床前治療狼瘡性腎炎的藥物的藥效提供參考;請詳細分析狼瘡性試驗的各種動物藥效試驗模型,并參考智慧芽新藥和專利數據庫;請根據最新的數據來分析;舉例問問題的技巧智慧芽LS-GTM26資料來源:https:/hiro- Lab】AI提效專利工作30AI分析專利的創新點由AI進行研發情報、技術方案、新材料等搜索AI完成技術問答和簡單檢索,通過關鍵詞或技術問題查找方案AI釋放Eureka的創新潛力智慧芽LS-GTM31智慧互
9、聯,決策加速https:/ https:/ https:/hiro-https:/https:/https:/關于智慧芽生物醫藥藥智慧芽生物醫藥作為行業的創新先鋒,精心構建了由Synapse新藥情報庫、Bio生物序列數據庫、Chemical化學結構數據庫和Hiro-LS芽仔生物醫藥四大核心產品組成的綜合SaaS產品矩陣,同時提供數據服務串聯各維度數據,組成綜合數據服務平臺。這一平臺旨在為生物醫藥領域的全產業鏈條提供全面、精確、實時且遵循統一標準的全生命周期數據服務,以支持行業內的科研、開發、生產和商業決策。通過運用前沿的大數據和人工智能技術,結合生物醫藥領域專家的深入洞察和嚴格審核,智慧芽生物
10、醫藥實現了對產業鏈數據的高效集成和精準處理。我們的生物醫藥產品系列已經建立了一個全球范圍內的實時數據更新機制,能夠從廣泛的網絡資源中提取關鍵的原始數據,確保為生物醫藥行業的各個環節提供全面、深入的數據支持和解決方案。免責聲明:本報告版權歸智慧芽所有,本報告數據主要取自智慧芽新藥情報庫、已公開的資料及論文文獻,由于數據源泄露、統計周期差異以及搜索方法的不同,報告中的數據可能存在一定誤差,故僅供參考。如由此引發的商業損失,本報告將不承擔任何責任。報告意見反饋: 1000004963(6)/Users/cuimeili/Downloads/Frame 1000004960(4).pngFrame 1
11、000004960(4)/Users/cuimeili/Downloads/Frame 1000004969(1).pngFrame 1000004969(1)Frame 1000004962(3)/Users/cuimeili/Downloads/Frame 1000004970.pngFrame 1000004970啟發人類勇于創新Inspire humanity to innovate人人創新時刻連接Democratizeinnovation助力智慧成就創新Amplify intelligence,Achieve innovation連接創新突破邊界Connecting innovation Breaking Boundaries