《計算機行業:DeepSeek沖擊全球AI產業格局看好國產算力與AI應用-250224(16頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業:DeepSeek沖擊全球AI產業格局看好國產算力與AI應用-250224(16頁).pdf(16頁珍藏版)》請在三個皮匠報告上搜索。
1、DeepSeek沖擊全球沖擊全球AI產業格局,看好國產算力與產業格局,看好國產算力與AI應用應用分析師:李杰登記編號:S05005210700012025年02月24日證券研究報告證券研究報告 增持(維持)增持(維持)目 錄一、DeepSeek的算法工程創新二、DeepSeek沖擊全球AI產業格局三、看好算力與應用環節2四、投資建議與風險提示gZgWrQnPtQnRtObRcM7NsQqQsQtOfQqQsQiNnPnR8OqQyRvPtOpNuOoMoM一、DeepSeek的算法工程創新3 幻方量化擁有近10年的二級市場量化交易經驗,是國內罕見的使用大模型做量化交易的公司;2021年已投資1
2、0億元配置了超過1萬張英偉達A100;2023年5月,AI團隊獨立,成立DeepSeek,2023年11月,推出了首個開源通用大語言模型DeepSeek LLM,2024年5月,推出了DeepSeek V2,使用了MOE架構,并在架構層面進行了創新,從而大幅提高了推理效率,成本大幅降低,在國內引發價格戰。4圖圖 1 1 DeepSeek發展歷程發展歷程資料來源:運營在觀察、湘財證券研究所 DeepSeek V3論文中提到的550美元成本,是指訓練成本,不包括前期實驗成本、薪資支出以及服務器購置等成本,與之相比,Claude 3.5 Sonnet的訓練成本為幾千萬美元;根據SemiAnalysi
3、s的分析,DeepSeek的總服務器成本為16.29億美元/年,總支出為25.73億美元/年。5圖圖2 2 DeepSeek總成本估計總成本估計資料來源:SemiAnalysis、湘財證券研究所 得益于訓練成本的大幅下降,以及算法的優化,DeepSeek的推理成本也大幅下降;DeepSeek的推理價格大約是GPT-4o的1/30。6圖圖3 3 DeepSeek與競品對比與競品對比資料來源:SemiAnalysis、湘財證券研究所 DeepSeek在算法工程方面作出了大量創新,這些創新大幅降低了訓練成本,并取得了優異的訓練效果。7技術理論的提出方技術理論的提出方哪些企業在大規模實踐哪些企業在大規
4、模實踐MoE (混合專家模型)架構1991年首次被麻省理工大學、多倫多大學雅各布斯、諾蘭、辛頓三位學者在論文本地專家的自適應混合(Adaptive mixtures of local experts)中提出。2017年谷歌在Transformer模型中最早引入MoE層2023年法國Al創業公司Mistral Al最早大規模開源MoE模型。2024年5月DeepSeek發布V2時較早使用了MoE架構。字節跳動的豆包2024年6月大規模部署MoE模型,阿里的通義2024年3月發布小參數MoE 模型,2025年1月發布大參數MoE模型Qwen2.5-MaxMLA(多頭潛在注意力)機制DeepSeek
5、 2024年5月最先在DeepSeek-V2發布的論文中提出。該注意力機制在MHA(Multi-Head Attention)多頭注意力機制的基礎上進行優化創新。目前僅有DeepSeek在V2/V3兩款模型中大規模使用了這一技術FP8(8位浮點數)混合精度訓練2022年首次被英偉達、Arm 和英特爾聯合提出,它們共同發表了論文深度學習的FP8 格式(FP8 Formats for Deep Leaming)。2023 年微軟曾開發開源的FP8-LM FP8混合精度框架2022年-2023年,亞馬遜AWS、微軟Azure、谷歌云均支持FP8數據格式的模型訓練。但由于美國科技公司普遍不缺算力,且F
6、P8訓練會增加訓練的復雜度,因此這一技術并未被深入探索。傳統上,大模型訓練使用32位浮點數(FP32)格式來做計算和存儲,這能保證精度,但計算速度慢、存儲空間占用大。DeepSeek則構建了FP8 混合精度訓練框架,根據不同的計算任務和數據特點,動態選擇FP8或 FP32 精度來進行計算,把訓練速度提高了50%,內存占用降低了40%強化學習訓練1961年首次被普林斯頓大學明斯基(Marvin Minsky)在論文邁向人工智能的步驟Steps Toward Artificial Intelligence提出。OpenAI 2024年9月發布o1模型時使用了這一技術強化學習技術在大型科技公司的日常
7、業務中被大規模使用。強化學習訓練模型的做法,谷歌DeepMind、OpenAl o1進 行了闡釋。2024年下半年之后,業內普遍認為,大模型性能提升的重要技術方向是強化學習。DeepSeek更上層樓,推出新的強化學習算法GRPO(Group Relative Policy Optimization 組相對策略優化),在顯著降低計算成本的同時,還提高了模型的訓練效率圖圖4 4 DeepSeek的主要創新點的主要創新點資料來源:財經、湘財證券研究所二、DeepSeek沖擊全球AI產業格局8 促使海外廠商反思傳統的AI發展路徑,開始重視算法的優化;崛起為全球主要AI玩家之一。9圖圖5 5 DeepS
8、eek的亮點的亮點資料來源:峰瑞資本、湘財證券研究所 DeepSeek幾乎將其所有研究成果都直接開源,打破了OpenAI o1系列模型的壟斷地位,后續開源模型有望超越閉源模型引領行業發展;DeepSeek讓中國AI產業擺脫了追隨者的角色,成為AI創新玩家,提升了國內AI產業甚至科技產業的信心。10圖圖6 6 大模型排名榜單大模型排名榜單資料來源:財經、湘財證券研究所三、看好算力與應用環節11 大量應用需求云廠商資源利用率提升;DeepSeek降低了算力卡門檻;阿里巴巴稱,未來三年,集團在云和AI基礎設施投入預期將超越過去10年總和;看好國產算力需求,包括昇騰系服務器制造、國產算力芯片、液冷、超
9、級電容、存儲等需求。12圖圖7 7 服務器產業鏈服務器產業鏈資料來源:富果研究部、湘財證券研究所 DeepSeek降低了大模型訓練門檻以及推理調用價格,有望推動優質AI應用的繁榮;DeepSeek降低了端側小模型部署門檻,有望推動端側AI應用發展。13圖圖8 8 iMA界面界面資料來源:騰訊、湘財證券研究所四、投資建議與風險提示1415投資建議:DeepSeek降低了算力卡門檻,阿里巴巴有望引領國內新一輪AI算力資本開支周期;DeepSeek降低了大模型訓練門檻以及推理調用價格,有望推動優質AI應用的繁榮;DeepSeek降低了端側小模型部署門檻,有望推動端側AI應用發展。我們建議關注AI算力
10、和AI應用,給予電子行業“增持”評級。風險提示:AI算力資本開支不及預期;AI應用開發不及預期。湘財證券投資評級體系(市場比較基準為滬深湘財證券投資評級體系(市場比較基準為滬深300 300 指數)指數)重要聲明重要聲明湘財證券股份有限公司經中國證券監督管理委員會核準,取得證券投資咨詢業務許可。本研究報告僅供湘財證券股份有限公司的客戶使用。本公司不會因接收人收到本報告而視其為客戶。本報告由湘財證券股份有限公司研究所編寫,以合法地獲得盡可能可靠、準確、完整的信息為基礎,但對上述信息的來源、準確性及完整性不作任何保證。湘財證券研究所將隨時補充、修訂或更新有關信息,但未必發布。在任何情況下,報告中的
11、信息或所表達的意見僅供參考,并不構成所述證券買賣的出價或征價,投資者應自主作出投資決策并自行承擔投資風險,任何形式的分享證券投資收益或者分擔證券投資損失書面或口頭承諾均為無效。本公司及其關聯機構、雇員對使用本報告及其內容所引發的任何直接或間接損失概不負責。投資者應明白并理解投資證券及投資產品的目的和當中的風險。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎抉擇。在法律允許的情況下,我公司的關聯機構可能會持有報告中涉及的公司所發行的證券并進行交易,并可能為這些公司正在提供或爭取提供多種金融服務。本報告版權僅為湘財證券股份有限公司所有。未經本公司事先書面許可,任何機構和個人不得以任何形式翻
12、版、復制、發布、轉發或引用本報告的任何部分。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“湘財證券研究所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。如未經本公司授權,私自轉載或者轉發本報告,所引起的一切后果及法律責任由私自轉載或轉發者承擔。本公司并保留追究其法律責任的權利。分析師聲明分析師聲明本人具有中國證券業協會授予的證券投資咨詢執業資格并注冊為證券分析師,以獨立誠信、謹慎客觀、勤勉盡職、公正公平準則出具本報告。本報告準確清晰地反映了本人的研究觀點。本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收到任何形式的補償。買入:買入:未來6-12 個月的投資收益率領先市場基準指數15%以上;增持:增持:未來6-12 個月的投資收益率領先市場基準指數5%至15%;中性:中性:未來6-12 個月的投資收益率與市場基準指數的變動幅度相差-5%至5%;減持:減持:未來6-12 個月的投資收益率落后市場基準指數5%以上;賣出:賣出:未來6-12 個月的投資收益率落后市場基準指數15%以上。