《甲子光年:2025年DeepSeeK開啟AI算法變革元年報告(16頁).pdf》由會員分享,可在線閱讀,更多相關《甲子光年:2025年DeepSeeK開啟AI算法變革元年報告(16頁).pdf(16頁珍藏版)》請在三個皮匠報告上搜索。
1、2025DeepSeek開啟AI算法變革元年出品機構:甲子光年智庫研究團隊:宋濤、劉瑤、翟惠宇、何偉康、小麥發布時間:2025.021、人工智能的發展已到戰略拐點圖1:技術革命的周期性示意圖第五階段技術能力產業發展醞釀期構造范式新產品、新產業、新技術體系接連出現并持續更新技術大爆炸第四階段第三階段第二階段新產品、新產業的爆炸性增長和迅速創新新技術體系和新基礎設施接連出現并探索商業化范式創新和市場潛力的全面擴張產業范式的顛覆式創新擴張新產品和新產業接近成熟,已經構建獨立的技術體系AI所處位置成長期產業化成熟期第一階段用得上新技術用得好新技術看得到新技術看得懂新技術中國式新技術 經過近七十年的發展
2、,人工智能自出現至今其核心能力一直在提升,到如今已經成為覆蓋感知、認知、決策、學習、執行、社會協作能力,未來還會向符合人類情感、倫理與道德觀念的智能機器邁進。發展到現在,人工智能的技術能力已經到了一個拐點,即從技術能力驅動向需求應用驅動轉型的關鍵時期。隨著技術能力的提升,技術進化引發經濟進化,從舊范式抵達新范式。如今人工智能的發展已經處于從第三階段向第四階段過渡的時期。人工智能的能力成長歷程已經足夠長,到了尋找需求的戰略拐點。2、算力拐點:DeepSeek的出現,意味著算力效率拐點顯現DeepSeek通過優化算法架構,顯著提升了算力利用效率,打破了算力至上的傳統認知1.E+021.E+041.
3、E+061.E+081.E+101.E+122011201220132014201520162017201820192020202120222023202420252026訓練算力(petaFLOPs)AlexNetTransformerBERT-LargeGPT-3 175B(davinci)Megatron-Turing NLG 530BPaLM(540B)GPT-4Gemini UltraGLM-130BBaichuan2-13BBaichuan2-7BLlama 2-70BClaude 2o1GPT-4oDeepSeek-R1-671BDeepSeek-R1-Distill-Qwen-
4、32BDeepSeek-R1-Distill-Qwen-1.5B2、算力拐點:DeepSeek的出現,意味著算力效率拐點顯現DeepSeek通過重新設計AI Infra,驗證“性價比”訓練路徑DeepSeekDeepSeek-R1R1少多GPU數量模型效果低高DeepSeekDeepSeek-R1R1的效果示意:更少的GPUGPU(或其他AIAI芯片)帶來同樣的效果備注:該圖僅為示意,不代表實際情況下具體數量與效果的對比*該圖為無編碼基礎分析師通過DeepSeek R1協作利用python編碼生成DeepSeek-R1的驚艷之處是通過重新設計訓練流程、以少量SFT數據+多輪強化學習的辦法,在提
5、高了模型準確性的同時,也顯著降低了內存占用和計算開銷。DeepSeek-R1提供了一種低成本訓練的方法,而不是說只能通過低成本來進行訓練。反而通過優化,DeepSeek-R1 可能實現了算力與性能的近似線性關系。每增加一張 GPU,模型推理能力可穩定提升,無需依賴復雜的外部監督機制。這一特性直接驗證了“算力即性能”的 Scaling Law,為AI芯片市場及AI Infra市場提供了明確的增量需求邏輯。3、數據拐點:AI基礎大模型的參數量迎來拐點2025年發布的大模型,都具有低參數量的特征,為本地化部署到AI終端運行提供了可能2018年6月2018年10月2019年2月2019年7月2020年
6、6月2021年12月2023年2024年圖:AI預訓練模型的參數規模呈現走勢Llama3-400B-InTraining 4萬億新版BERT4810億GPT-31750億Facebook94億GPT-215億BERT-Large3.4億StableLM M61750億2024年之前,最大參數量一直在增長GPT-11.17億DeepSeek-R1-671B,6710MiniMax-Text-01,4560MiniMax-VL-01,4560DeepSeek-R1-Distill-Qwen-32B,320Phi-4,140DeepSeek-R1-Distill-Qwen-1.5B,152025年1
7、月2025年1月2025年1月2025年1月2025年1月2025年1月2025年發布的大模型開始分化為兩極高參數量低參數量4、技術路徑的循環:算法創新再次成為新的突破點AI技術創新一直在圍繞核心三要素在動態循環,2025年再次進入算法創新階段圖:每年AI技術創新發展的方向圍繞三要素迭代展開算力、數據、算法的三角創新體系,在動態循環之中再次進入算法創新階段。2022年:算法創新為主,ChatGPT發布,引發Transformer架構的風潮迭起2023年:數據創新為主,數據合成、數據標注等成為高質量數據集建設的熱點方向2024年:算力創新為主,算力邁向超萬卡時代,算力運營商等產業新物種誕生202
8、5年:再次進入算法創新階段2022年時間2025年2024年2023年AI技術成熟度?算法創新數據創新算力創新算法創新未來核心三要素的創新循環5、算法變革元年:DeepSeek的推理模型開啟算法變革的元年R1-zero完全基于RL(強化學習)進行訓練,以第三階段為主,通過自我學習來提高性能圖2:DeepSeek聚焦的訓練過程核心在第三階段圖1:傳統AI基礎大模型的訓練過程三個階段都注重第一階段訓練監督策略模型第二階段訓練獎勵模型(RM)第三階段強化學習優化模型數據集中隨機抽取問題使用PPO模型生成回答RM模型給出質量分數基于質量分數優化PPO模型參數循環迭代出新模型數據集中隨機抽取問題生成多個
9、不同的回答標注答案排名順序排序結果數據來訓練獎勵模型RM模型給出高質量回答的分數數據集中隨機抽取問題生成多個不同的回答標注高質量答案用標注好的數據來微調模型收集演示數據并訓練有監督策略收集比較數據并訓練獎勵模型采用PPO強化學習算法針對獎勵模型來優化策略第一階段訓練監督策略模型第二階段訓練獎勵模型(RM)第三階段強化學習訓練模型 GRPO算法對比分析,提升訓練效率 冷啟動數據建立基礎的推理框架 推理導向的強化學習 利用訓練得到的檢查點來收集新的監督訓練數據 全場景強化學習 蒸餾賦予小型模型推理能力收集演示數據并訓練有監督策略收集比較數據并訓練獎勵模型采用GRPO算法,通過對比分析方式針對獎勵模
10、型來進行優化核心創新點5、算法變革元年:DeepSeek的推理模型開啟算法變革的元年DeepSeek-R1的訓練流程:通過RL強化LLM的推理能力 R1-zero完全基于RL(強化學習)進行訓練,未使用任何監督訓練或人類反饋,能夠通過自我學習來提高性能。R1是在 R1-zero 的基礎上,通過少量冷啟動數據進行微調,提高了輸出質量和可讀性。DeepSeek-R1的訓練過程 除了基于Transformer架構的算法創新之外,非Transformer架構的新算法也成為近期新出現的重點發展方向。一種新架構模型LFM(Liquid Foundation Model),超越了同等規模的Transform
11、er模型如Llama 3.2。它用的是一種液態神經網絡(LNN),其計算單元植根于動態系統理論、信號處理和數值線性代數。其小巧便攜的特性使得它能夠直接部署在手機上進行文檔和書籍等分析。因此,甲子光年智庫判斷,2025年將是算法變革的元年。未來最適合人類使用的大模型,可能會是非Transformer架構的算法模型。6、算法變革的第二條路徑:非Transformer架構的算法模型圖:LFM架構模型性能超越同等規模的Transformer模型活躍參數數量MMLU-Pro測試分數1B2B3B7B 8B14B27B70B100B102030405060Llama 3.2 1BSmolLM 27BDanu
12、be21 8B Phi-2 3BPhi-1.5Gernma2 2.6BLlama3.2 3BPhi-3.5 3.8BLlama3.1 8BMistral 7BMixtral 47B A13BQwen2 57B A14BGemma2 27BLlama3.1 70BJamba1.5 52B A12BRene Cartesia1.3BStable LM 21.6BRWKV6 1.6BRecurrent Gemma2 2.7BLFM 1.3BLFM 3BLFM 40B MoE(A12B)LFMTransformerRNNHybrid6、算法變革的第二條路徑:非Transformer架構的算法模型AI終
13、端推動端側模型和端側算力需求增加,小參數量模型需求爆發推動算法變革到來中心云終端側邊緣云5GAIAIAI PC智能汽車人形機器人AI手機XR等便攜戴設備3 21 31 38 57.0 190.4 338.8 471.2 8.1%54.7%74.6%80.3%5.0%16.0%28.0%38.0%202320242025E2026EAI PCAI 手機AIPC占比AI手機占比AI處理重心正向端側轉移,催生小語言模型的需求爆發圖1:AI處理重心向端側轉移圖2:2023-2026年中國AIPC出貨量及占比(百萬臺)2024年AI終端已經開始爆發7、算法變革推動AI超級產品蘊生:2024城頭變幻大王旗
14、,2025年AI超級應用開始出現,DAU達2161萬圖:過去13個月中各月AI產品訪問量最高的產品數據走勢圖文心一言文心一言文心一言百度文庫百度文庫百度文庫百度搜索 AI豆包豆包豆包-500050010001500200025001月2月3月4月5月6月7月8月9月10月11月12月25年1月TOP1訪問量(M)360AI搜索豆包DeepSeek2161萬DAU 2024年的AI超級應用的頭把交椅處于不斷變動之中。甲子光年智庫統計匯總了近13個月中訪問量最高的產品訪問量數據,發現第一名的AI產品是處于不斷變動狀態的,可以用一句話來形容,那就是城頭變幻大王旗?;旧厦總€季度的頭把交椅都會發生變化
15、。2025年的開年,DeepSeek用短短二十天的時間就實現了DAU2161萬的數據,超過了ChatGPT發布之初的數據表現,已經成為AI超級應用。8、算法變革推動AI普惠應用DeepSeek的模型實現AI時代的“小米模式”,實現技術和價格的雙重普惠 如果說Transformer的應用標志著基礎模型時代的開始(基礎模型的龐大規模和應用范圍突飛猛進),可以稱為AI技術的“iPhone時刻”;那么DeepSeek從建立之初的“價格屠夫”模式就贏得了開發者市場的關注,可以看作是AI時代的“小米模式”。0.40.952.584.234.24.75.220102011201220132014201520
16、162010-2016年 中國智能手機出貨量(億臺)小米第一代手機(小米手機1)于2011年8月發布,定價1999元。在出貨量增長和價格體系兩方面實現重構:高性能+低價格小米1 1代手機相同點DeepSeekDeepSeek R1R1直接挑戰了國際品牌(如三星、HTC)的高價策略(3000-4000元)挑戰高價策略直接挑戰OpenAI的閉源技術模式及OpenAI O1的價格策略(O1正式版需要200美元/月)將高性能智能手機推向大眾市場受眾群體擴大,普惠開發者讓更多中國普通用戶使用推型模型,中文語言能力較海外更強,同時具有極強的代碼及數學能力小米1 1代手機相同點DeepSeekDeepSee
17、k R1R1帶動京東方(屏幕)、舜宇光學(鏡頭)、比亞迪電子(代工)等本土供應鏈企業技術升級,降低全行業制造成本成本重構,打破資源壟斷訓練效率提升與推理成本壓縮,帶動一系列本土AI infra建立產業生態(如硅基流動與華為云聯合提供解決方案)小米通過紅米系列覆蓋下沉市場,移動互聯網應用服務更多樣人群推動垂直場景、長尾應用爆發從“科技巨頭試驗”走向“千行百業剛需”,構建更多元的開發生態短期影響長期影響8、算法變革推動AI普惠應用DeepSeek的“高性價比”有望解鎖具身智能的理解與推理 DS不僅在推理模型上實現了突破,在多模態方面也保持了進步,并于近日開源發布了Janus-Pro多模態模型?;?/p>
18、算法工程方面的優化,DS能夠實現性價比更高的模型推理能力(價格低、效率高、性能強、可部署在端側平臺),DS有望以強大的推理能力和多模態感知能力,重塑機器人交互與決策,同時通過低成本、高效率的解決方案,加速具身智能的普及與應用。DeepSeek的性價比&效率優勢,有望加速具身智能技術發展普及DS Janus-Pro-多模態感知理解的引擎自主決策通過強化學習自主探索,發展出復雜的推理能力實現機器人自主規劃任務和解決復雜問題的能力鏈式思考鏈式思考能力:幫助機器人在執行任務時分解步驟,進行邏輯推理,從而更可靠地完成目標不針對特定任務,追求通用推理能力適應不同具身場景通用性低成本訓練冷啟動訓練減少了對大
19、量標注數據的依賴,降低數據成本,并解決了R1-zero的可讀性問題多模態融合感知圖像生成編碼器解耦能夠有效融合視覺和語言信息,使得機器人可以理解復雜的場景描述和人類指令可生成高質量的圖像,對虛擬環境建模、仿真測試等具有重要意義。視覺編碼方法解耦,對不同的任務進行優化,例如同時提升感知能力和生成能力緩解多模態理解和生成任務之間的沖突DS R1-推理能力的基石降低訓練成本降低推理成本以較低的成本訓練出高質量的模型加速研發速度、加速迭代速度、降低開發門檻性能更強的中小模型蒸餾更低的計算成本在真實硬件上運行端側平臺部署、提升反應速率、降低計算能耗低成本和高效率對于實現規?;瘧煤蜕虡I化至關重要8、算法
20、變革推動AI普惠應用推理成本的顛覆性降低,將會推動C端產品的大多數應用場景進入實際落地階段網站創建直播帶貨3D交互內容生成聊天機器人數字孿生音樂生成海報設計藥物研發商品展示語音識別輔助治療文本摘要歸納智能助教語音合成視頻拍攝與制作數字人文案創作陪護聊天機器人繪畫設計搜索引擎翻譯辦公文本改寫/擴寫新聞采編編程與代碼自動生成游戲內容生成智能客服人像美顏科研學術知識問答金融交易分析師研究報告生成劇本創作圖:甲子星空坐標系生成式AI在C端應用場景的商業潛力評估X NPS值Y滿意度光年象限星團象限星辰象限星云象限側重商業落地側重產品效率提升側重產品體驗待重塑產品備注說明:1.滿意度:一個用來衡量個人或組
21、織對特定產品、服務、經驗或事件的滿意程度的指標。當使用體驗大于預期時會獲得滿意感。2.NPS值:凈推薦值,是評估用戶口碑的一種方式。評估用戶/客戶向朋友、其他人推薦公司的產品或服務的可能性的指標。大模型的價格正在快速下降,而開放權重也在加速,并為開發者提供更多選擇。OpenAI 的 o1 每輸出 100 萬令牌收費 60 美元,而 DeepSeek-R1 只需 2.19 美元。這將近 30 倍的價差,讓算力成本不再是模型門檻,正在讓基礎模型層“平民化”。推理成本的顛覆性降低,將會推動C端產品在大多數應用場景得到落地。會讓原本因為預算不足、用戶意愿不足的一些場景具備商業化落地的可能,這些場景大多
22、都是在星云象限和星團象限內的場景,會推動這些沒有商業化落地的場景走向商業化。推動這些場景從星云象限或星團象限向光年象限邁進。9、全球AI科技競爭進入G2時代DeepSeek將成為特朗普制定人工智能政策的重要參考,預示著AI進入G2競爭時代2025年1月23日,剛就任的美國總統特朗普簽署了一項行政命令,廢除了拜登政府“有害的”人工智能政策,要求一個跨部門小組在6個月內為“人工智能行動計劃”(Artificial Intelligence Action Plan)。DeepSeek的出現和美國政商各屆的反應將成為特朗普政府制定計劃的重要參考。拜登政府關于安全、可靠和可信地開發和使用人工智能的行政命
23、令2023年10月,拜登總統簽署了關于安全、可靠和可信地開發和使用人工智能的行政命令,該行政命令的目的是確保AI技術的發展既能促進創新,又能有效地應對技術帶來的潛在風險。該行政令也是美國迄今為止最全面的人工智能監管原則,標志著美國政府在定義AI監管和問責制方面的關鍵一步。主要內容和目標:加強AI安全性和可靠性;保護隱私和數據安全;消除AI中的偏見和歧視;促進AI的可解釋性和透明度;確保AI技術的創新和競爭力;跨部門合作與國際合作;AI的國家安全考量;監管和監督機制;社會影響評估。主要特點:該行政令要求AI開發者在公開發布任何可能引發風險的AI系統之前,必須根據國防生產法向政府提交安全測試報告。
24、意在通過政府主導的方式,全面規范人工智能的開發與應用。此外,該行政令明確提出了推動AI安全性和透明性的重要措施。規定了各機構制定測試人工智能系統的標準和指標、人工智能模型的安全測試、責任追究機制、算法透明度要求,并納入了限制偏見和歧視的條款,體現對隱私和公平的保護的強監管立場。特朗普政府在人工智能領域的計劃和對華反制措施(待定)調動企業力量發展人工智能:相比拜登政府堅持通過政府干預進行對人工智能監管,特朗普政府更傾向于依靠企業和資本的力量發展人工智能,特朗普會通過發動和建立“企業家朋友圈”,搭建起從基礎層、中間層到應用層的“四梁八柱”。限制對美國人工智能大模型使用:美國政府等相關部門高度懷疑中
25、國大模型“竊取”了美國大模型企業的技術和訓練成果。擴大對芯片的出口管制:一方面,擴大對英偉達芯片對華出口限制,英偉達對中國的部分“特供型號”有望加入限制名單;另一方面,加強對新加坡等轉運國和部分芯片貿易公司的調查和限制。限制中國大模型應用:來自中國的大模型應用將被加入限制名單,有望被從美國及其盟國的APP Store下架,目前,DeepSeek已經被愛爾蘭、意大利等美國的追隨國下架,未來可能進一步擴大。智庫院長宋濤微信stgg_6406THANKS謝謝北京甲子光年科技服務有限公司是一家科技智庫,包含智庫、媒體、社群、企業服務版塊,立足于中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,致力于推動人工智能、大數據、物聯網、云計算、AR/VR交互技術、信息安全、金融科技、大健康等科技創新在產業之中的應用與落地聯系咨詢合作關注甲子光年公眾號