《電子設備行業深度研究-AI系列報告(01):AGI驅動算力芯片增長國產芯片加速替代-250216(42頁).pdf》由會員分享,可在線閱讀,更多相關《電子設備行業深度研究-AI系列報告(01):AGI驅動算力芯片增長國產芯片加速替代-250216(42頁).pdf(42頁珍藏版)》請在三個皮匠報告上搜索。
1、 電子設備業深度研究 AI系列報告01AGI驅動算力芯w增長,國產芯w速替代 2025 年 02 o 16 日 00投資投資要要11 AGI 在 ChatGPT 按Q了鍵,它能像人類般處理多種復g任,突破單一任限制,p望p知識型作者的業革命=2 Scaling Law 作一范式的基q規則,揭示了模型性能P模型參數量1數據量等因素在冪律s系,直接導算力的需求呈指數P升2尤w是 25 各類用n落地,AI 理側需求規模更,算力增長勢確立2海外 CSP 廠商 24 前O季度資q開支度維持高O,要源自于 AI n看到商品W和_W能力,預計算力行業將投資驅走U用驅的段2 GPU 芯w在 AI 和理中x備勢
2、,是目前流的架構,續理s比升過程中,原廠基于性能1pq1競等方面考慮會n大ASIC 的采購比例2英_達憑借硬和網等方面的綜合勢,目前s據行業的領Y地O,預計續競勢能夠維持2但是理百花齊的過程中,英_達和 GPU 的斷地O會小幅收縮,部V定制W芯w廠的產品和營收經表明一勢2 在算力需求增長和技術供給漸緩的背景Q,Y封裝的值大幅增,_給中 AI 芯w廠供了追的契機223,美發a了多次針 AI 芯ww產業鏈的限制施,一n升了產W的緊性和必要性2預計 25 產芯w單t性能n達到或超英_達 A800 的時候,理側的 AI 產W率p望得到升,w中g騰1寒o紀表的龍頭廠商將得一定場份額2 00配置配置建建1
3、1 薦 AI 需求升過程中算力芯ww配套產業鏈機會,要包括芯w產W1理芯w1自研 ASIC 芯w1Y封裝等V方U,建s注寒o紀1海Z信o1_豐技1生益電子1滬電股份1通富微電1拓荊技1芯源微1V易創等o的2 00風險風險示示11 AI 發展O預期2產業處于發展初期,要依賴大型技企業和家投資,行業發展度緩會大幅影響產業鏈需求和度2 技術n緩2產業依賴于技術n的度,緩會影響pqQ降曲線和產品商業W能力,而導行業整體需求Q滑2 中美摩擦劇2美多次限制中 AI 相s芯ww產業鏈口,限制中企業海外,摩擦和限制一n劇會影響相s行業需求和供給2 強強于大于大維持 東東方方富證富證xx研究研究所所 證x分析師
4、李亮 證書編S1160524100007 相相對對指指數表數表 相關研究相關研究:配X美算力硬方向1關注 CES帶來的端側 AI 機會;2025.01.07:新型大模型持續迭代,國內政策大力扶持算力P數據產業;2024.12.31:AI 創新動云&端共振P,自領域向卡脖子節攻堅;2024.12.27:豆包視覺模型引爆 AI 眼鏡,存儲乘勢而P;2024.12.26:5G 規模W應用p望迎來速;2024.11.26-7.18%5.88%18.95%32.02%45.08%58.15%2/194/196/198/1910/1912/19電子設備 滬深300 挖挖掘掘值值 投資投資r長r長 業研究/
5、電子設備/證x研究報告 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 2 Table_yemei 電子設備業深度研究電子設備業深度研究 ll文目文目錄錄 1.AGI1.AGI 驅算力增長,驅算力增長,Scaling Scaling LawLaw 走U理走U理.5 1.1.A1.1.AGIGI 產業發展,OpenAI 引領技術革.5 1.1.1.AGI 心在于泛W能力.5 1.1.2.Transformer 架構 AGI 理論發展.6 1.1.3.ChatGPT p最快用,AGI l式走U實.7 1.1.4.o1 改革大模型研發方U,大模型升潛力.9 1.2.1.2
6、.ScaScaling Lawling Law 引領算力增長,大模型n入引領算力增長,大模型n入理理時時.10 1.2.1.Scaling Law 指引算力投資.10 1.2.2.AI 用n落地,理需求ns據流.13 1.2.3.算力需求測算相s于參數和數據量.14 1.3.1.3.海外海外 CSPCSP 廠商維持高廠商維持高度投資,h度投資,h AIAI 增長潛增長潛力大力大.14 1.3.1.AI 業增長,CSP 資q開支意愿烈.14 1.3.2.AI 競P升家層面,h AI x備增長潛力.16 2.2.英_達憑借英_達憑借 GPUGPU 搶s搶s AIAI 芯w高,自研芯w高,自研 AI
7、SCAISC 潛力潛力大大.18 2.1.G2.1.GPUPU 勢明顯,勢明顯,AISCAISC n獲得場份額n獲得場份額.18 2.1.1.AI 芯w要求高并行計算1大內帶寬和P耗.18 2.1.2.GPU 是 AI 芯w的流架構.18 2.1.3.理時 ASIC 增長潛力大.20 2.2.2.2.英_達領Y勢明顯英_達領Y勢明顯,硬構筑競壁,硬構筑競壁壘壘.21 2.2.1.英_達 AI 芯w迭.21 2.2.2.英_達硬城河高.23 2.2.3.英_達s率領Y,數據中心持續高增.24 2.3.C2.3.CSPSP 廠商自研廠商自研 AIAI 芯w芯w勢,供鏈勢,供鏈極擴極擴產需求產需求.
8、25 2.3.1.自研 AI 芯w性能表O差.25 2.3.2.合作廠商 AI 營收高增,廠商指引長期 AISC s比 50%.26 2.3.3.AISC 供鏈中 PCB 需求升,配套廠商極擴產.27 3.3.摩爾定律緩和易摩摩爾定律緩和易摩擦劇,產芯w擦劇,產芯w.28 3.1.3.1.摩爾定律緩制單摩爾定律緩制單t性能,Y封裝t性能,Y封裝要性要性增增.28 3.1.1.COWOS 封裝升 AI 芯w性能.28 3.1.2.Y封裝產難度小于前道,心備材料亟待突破.30 3.2.3.2.易摩擦態勢劇,易摩擦態勢劇,AIAI 芯w產W經形pr芯w產W經形pr識識.31 3.2.1.23 芯w法
9、案升 AI 芯w限制施.31 3.2.2.24 芯w法案增 HBM 芯w限制施.32 3.2.3.家和地方策碼扶持產芯w.33 3.3.3.3.產芯w性能n追產芯w性能n追英_達,理時英_達,理時能性升能性升.34 3.3.1.產芯w算力性能x備o A800 能力.34 3.3.2.g騰打全產業解決方案,全面o英_達.35 3.3.2.寒o紀AI 芯wY行者,聚焦端算力,拐將.38 4.4.投資建投資建.40 5.5.風險示風險示.41 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 3 Table_yemei 電子設備業深度研究電子設備業深度研究 表目表目錄錄 表
10、表 1 1AIAI 發展程發展程.6 表表 2 2TransformTransformerer 架架構原理構原理.6 表表 3 3TraTransformnsformerer 中中O大O大 AttentionAttention 機制機制.7 表表 4 45 5 y注用戶突y注用戶突破破 100100 萬萬.8 表表 5 5ChatGPTChatGPT 原理原理.8 表表 6 6全球生p式全球生p式 AIAI 計算計算場規模預測場規模預測.9 表表 7 7MedQA MedQA P多個模P多個模型性能的比較V析型性能的比較V析.9 表表 8 8帕帕累累托托前前沿沿在在 MedQAMedQA 基基
11、準準測測試試PP顯顯示示準準確確性性PP總總 API API pq的s系pq的s系.10 表表 9 9Scaling LScaling Lawsaws 原理原理.10 表表 1010多模態多模態 Scaling LawScaling Law.11 表表 1111算力需求算力需求升升.11 表表 1212New New OpenAI OpenAI o1 o1 Long Long ThinThinking king Time=Time=Creates Creates a a N New ew W Way ay to to ScaleScale.12 表表 1313AIAI 大模型大模型算力增長情況
12、算力增長情況.12 表表 1414大模型o來算力大模型o來算力增長限制情況增長限制情況.12 表表 151520242024 1010 oo AIAI 產品全球總榜情況產品全球總榜情況.13 表表 1616大模型度調用大模型度調用量情況量情況.13 表表 1717中人智能中人智能服服器作負載預測,器作負載預測,20222022-2027E2027E.13 表表 1818TransforTransformer mer 每每一次前U播模型參一次前U播模型參數測數測算算.14 表表 1919海外四大海外四大 CSPCSP 廠廠商V季度資q開支商V季度資q開支.15 表表 202020232023 全
13、球算全球算力規模力規模.16 表表 2121hh AIAI a局情a局情況況.17 表表 2222中算力規模中算力規模情況情況.17 表表 2323模型中模型中 62%62%的開銷在h的開銷在h(Weights)(Weights)和梯度和梯度(Gradien(Gradient)t)通信中通信中18 表表 2424使用英_達使用英_達 AllAllReducReduce e 技術,負載技術,負載比例比例.18 表表 2525流流 AIAI 芯wV芯wV類情況類情況.19 表表 2626GPU vs CGPU vs CPUPU 的的架構架構.19 表表 272720242024 P半P半中人智能芯
14、w中人智能芯w場份場份額額.20 表表 28282021202620212026 各類各類 AIAI 芯ws率芯ws率.21 表表 2929英_達發展英_達發展.22 表表 3030英_達要的英_達要的 AIAI 算力芯w迭情況算力芯w迭情況.23 表表 3131英_達的英_達的 AIAI 群硬技術架構群硬技術架構.24 表表 3232英_達的英_達的 CUDACUDA 架構架構.24 表表 3333英_達數據中心英_達數據中心V季度營收情況百V季度營收情況百萬美萬美元,元,%.25 表表 3434Trn2Trn2 芯wP芯wP NVIDIANVIDIA 和和 GoogGooglele 的產品
15、比的產品比性能P比性能P比.26 表表 3434博通博通 XPUXPU 豐富豐富的的 IPIP a局a局.26 表表 3535博通定制芯w博通定制芯w度度.26 表表 3636marvellmarvell 數據中心業長期規劃數據中心業長期規劃.27 表表 3737marvell marvell 20242024 3 3 季度數據中心業情季度數據中心業情況況.27 表表 343420232023-2022028 8 全球多層全球多層 PCPCB B 產值均復合產值均復合增長率預測用領增長率預測用領域域.27 表表 3838硬算力峰值P硬算力峰值P內帶寬內帶寬.29 表表 3939COWOSCOW
16、OS-S S 的封裝結構的封裝結構.29 表表 4040COWOSCOWOS-L L 的的封裝結構封裝結構.29 表表 4141COWOSCOWOS 的藝流的藝流程程.29 表表 4242Y封裝要Y封裝要序備節廠序備節廠商梳商梳理理.30 表表 4343Y封裝要Y封裝要序材料節廠序材料節廠商梳商梳理理.31 表表 4444流流 AIAI 芯w相芯w相s參數情況s參數情況.31 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 4 Table_yemei 電子設備業深度研究電子設備業深度研究 表表 4545HBMHBM 和和 GDDR5GDDR5 的性能比的性能比.32
17、 表表 4747英_達各英_達各 GPUGPU 的的 HBMHBM 用量情況用量情況.33 表表 484820222022 中中 AIAI t競格局t競格局.34 表表 4949內外要算力內外要算力芯w參數比芯w參數比.34 表表 5050g騰計算產業生g騰計算產業生態態.35 表表 5151 CANNCANN 架構架構.36 表表 5252 g騰服g騰服.36 表表 5353g思g思 MiMindSporendSpore 框架框架.36 表表 5454g騰計算產品系g騰計算產品系列列.37 表表 5555 Atlas 900Atlas 900 SuperClu SuperClusterste
18、r 群群.38 表表 5656寒o紀產品譜系寒o紀產品譜系.38 表表 5757MLUMLU 架構情況架構情況.39 表表 5858寒o紀基礎寒o紀基礎系統系統.39 表表 5959寒o紀寒o紀/預預付款季度情況萬元付款季度情況萬元.40 表表 6060要s注o的p要s注o的p值比較表截值比較表截 20252025 1 1 oo 1313 .41 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 5 Table_yemei 電子設備業深度研究電子設備業深度研究 1 1.AGIAGI 驅驅算力算力增長增長,ScalingScaling LawLaw 走走UU理理 1 1
19、.1.1.A.AGIGI產業發展,OpenAI 引領技術革 1.1.1.AGI 心在于泛W能力 AGI 是Artificial General Intelligence=的縮寫,s通用人智能2它是一種xp廣泛智能能力的人智能,能夠像人類一理解1學1理并解決各種O類型的復g問,而O局限于特定的1預Y定好的任,如單純的像識別或者Q棋2在多個領域和任中展類似人類的認知靈活性和適性2 P統 AI 相比,在任范圍1學方式1智能表1通用性等方面p較大差_ 1 任范圍統 AI 要是弱人智能Narrow AI,側于特定任2 例如,統的像識別 AI 精準地判斷照w中的物體是貓是狗,但它無法完pw他類型的任,如文
20、q翻譯或金融數據V析2 系統是針某一特定領域的問行計和的,w能力局限在預Y定義好的任范圍內2AGI 是通用人智能,目o是像人類一x備廣泛的智能,能夠處理各種各的任2 它在O的任領域之間靈活W換,比如Y行文q創作,接著解決復g的數學問,然像行創意性的修改等,而O限于特定的任類型 2 學方式統 AI 的學方式較固定和局限2通常是通過大量特定任的數據行,學到特定的模式2例如,圾郵V類的 AI 會通過大量o圾郵和非圾郵的q數據,學識別郵中的特來判斷郵是否圾郵2 它的學要是基于特定的數據和預Y定的算法結構,缺O靈活性和類型知識的自獲能力2 AGI 被期望能夠更接人類的方式學2 它O僅大量的數據中學,能夠
21、通過少量的示例行_納理,甚能夠自探索的知識領域 3 智能表統 AI 在w擅長的特定任中表色,但缺O通用性和靈活性2例如,語音識別 AI 能夠很好地將語音轉換文_,但如果讓它理解段文_的深層含義并行邏輯理來回答復g問,就會顯得力O心2 它的智能要體在特定任的高效處理P,而Ox備綜合的智能表2AGI 則能夠表類似人類的綜合智能2 它理解語言的含義1 行邏輯理1 解決復g問1創的內容等多種智能行 4 適性和通用性統 AI 境W和任的適性較差2一遇到超w范圍的任或者數據特發生較大W,統 AI 的性能能會急劇Q降2AGI xp很的適性和通用性2它能夠在O的境和任Q快調整自的知識和策略來2 就像人類在O的
22、境和任中找到解決問的方法一,AGI _該能夠適簡單到復g1 知到o知的各種情況,并能夠靈活地用w智能來解決問2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 6 Table_yemei 電子設備業深度研究電子設備業深度研究 表表 1 1A AI I 發發展展程程 資料來源daniellejwilliams 研究團隊,東方富證券研究所 1.1.2.Transformer 架構 AGI 理論發展 2017 google 的機器翻譯團隊在 NIPS P發表了Attention is all you need=的文章,xp開創性的論文述了 Transformer Tran
23、sformer 的心概念和架構的心概念和架構計計,摒了統的循神經網RNN和卷神經網CNN中常的序計算方式,統序列模型在處理長序列時在統序列模型在處理長序列時在梯度梯度失和梯度爆等問失和梯度爆等問,而而TransTransformerformer 架構通過引入注意力機制來解決架構通過引入注意力機制來解決問問,實了更好的建模能力和并行計算效率,自然語言處理領域帶來了大革2 表表 2 2T Tr ransformeransformer 架架構原構原理理 資料來源阿,東方富證券研究所 w心結構包含編碼器和解碼器n部V 編碼器編碼器EncoderEncoder負接收并處理輸入數據,如文q子中的單詞序列2
24、 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 7 Table_yemei 電子設備業深度研究電子設備業深度研究 首Y通過輸入嵌入層將單詞射高維U量,隨O置編碼層添單詞O置信o,于捕捉序列序s要2s鍵的多頭自注意力層則計算序列內各單詞間的注意力V數,模擬單詞間的s聯程度,多個頭并行處理O視角捕捉豐富語義,經和規范W層穩定數據,前饋神經網層一n非線性特,n將輸入數據轉換深層次的特表示2 解解碼碼器器DecodeDecoder r在生p任中發揮作用,如文q翻譯或生p回答2它p輸嵌入PO置編碼,之的遮多頭自注意力層在時確保生pQ一詞僅依賴生p部V,避免信o泄露2多頭注意
25、力層整合編碼器信oP解碼器自身輸入,讓生p過程能UV利用全局語境,最前饋神經網層生p輸序列中的單詞2 注意力機制是注意力機制是 TransformerTransformer 架構的心p部V架構的心p部V2它通過計算輸入序列中每個O置Pw他O置之間的s聯程度,而每個O置V配O的h2種h表示了OO置之間的要性,使得模型能夠更好地捕捉序列中的s聯信o2注意力機制要包括自注意力和多頭注意自注意力和多頭注意力力n個s鍵概念,前者用于捕前者用于捕捉捉輸入序列內部的s聯輸入序列內部的s聯,者用于處理O輸入者用于處理O輸入序列序列之間的s聯之間的s聯2 自注意力機制通過將輸入序列的每個O置作查詢1鍵和值來計算
26、注意力h2x體而言,它通過計算查詢P鍵的相似度得到注意力V數,并將注意力V數P值相乘得到h和表示2,每個O置都通過Pw他O置的交來獲全局信o,并每個O置的h是據輸入序列的內容態計算的2 多頭注意力機制通過并行地行多個自注意力計算,而捕捉O的s聯模式2每個注意力頭都學到了O的特表示,通過將多個注意力頭的輸行拼接和線性換,得到更豐富的特表示2多頭注意力機制在高模型性能的時,增了模型于O特的建模能力2 表表 3 3T Transformerransformer 中中O大O大 AttentionAttention 機制機制 資料來源極_,東方富證券研究所 1.1.3.ChatGPT p最快用,AGI
27、l式走U實 2022 11 o 30,OpenAI 人智能聊y原型 ChatGPT,迅在社交媒體P走紅,短短 5 y,注用戶數就超過 100 萬,23 1 opo活突破 1 億,20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 8 Table_yemei 電子設備業深度研究電子設備業深度研究 pP最快增長最快的者用,o志著 AGI l式走U實2 表表 4 45 5 yy注注用用戶戶突破突破 1 10000 萬萬 資料來源機器之心信o服,東方富證券研究所 GPT 系列模型的基q思路是讓 AI 在海量的數據P通過文_PQ文接,而掌握基于前文內容生p續文q的能力2種方法O需
28、要人類o注數據,只需要供一段話的P文并遮QQ文,然將 AI 生p的文qPQ文內容行比來 AI2ChatGPT 是在 GPT3.5 模型的基礎P行W的,作 GPT 系列的第O,GPT3.5 在萬億詞匯量的通用文_數據P行了,幾N完p自然語言處理的大部V任,例如完形填空1閱理解1語義斷1機器翻譯1文章生p和自問答等2 表表 5 5ChatChatGPTGPT 原理原理 資料來源OPENAI 官網,東方富證券研究所 Bloomberg Intelligence 告指,生p式 AI 場規模將 2022 的400 億美元,增長 2032 的 1.3 萬億美元,復合增p望達到 46%2預計到 2032,生
29、p式 AI 將s IT 硬1服1廣告支和游o場支的12%,但預計 2024 一比例僅p 3%2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 9 Table_yemei 電子設備業深度研究電子設備業深度研究 表表 6 6全全球球生p生p式式 A AI I 計算計算場場規模規模預預測測 資料來源Bloomberg Intelligence,IDC 數據,東方富證券研究所 1.1.4.o1 改革大模型研發方U,大模型升潛力 OpenAOpenAI I o1 o1 模型系列的模型系列的o志著P之前的o志著P之前的 GPT GPT 模模型的大轉型的大轉2 P GPT O,
30、o1 模型是使用W學 RL 技術行的,使它們能夠在生p輸之前思考=2o1 并O依賴復g的示程技術,而是在模型的過程中直接融入了理能力2微研究表明,o1-preview 模型s便在沒p任何示的情況Q,_能在多個|療基準測試中超了使用 Medprompt 的 GPT-42o1的心勢在于w原生理機制2模型能夠在生p最答案之前行自理,一過程O僅高了理的準確性,使得模型能夠在面復g問時展更靈活和全面的能力2種能力的內置,使得 o1 能夠超統的示依賴方法,尤w是在|療領域類需要深度理的用中,展更大的性能2 表表 7 7MedQA MedQA PP多多個模個模型性型性能能的的比較比較VV析析 資料來源微官網
31、,東方富證券研究所 但是微的研究_表明,管 o1-preview 在理能力P表色,準確率_比 GPT-4o 高了幾個百V,但w所需的計算資源和行pq大幅增,尤w是在處理大規模數據時,pq的升非常顯著2 準確率 88%升到 96%,20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 10 Table_yemei 電子設備業深度研究電子設備業深度研究 pq增 100 倍2一數據展示了高性能模型帶來的pq效益h衡2在追求更高準確率時,pq會顯著增,于 AI 產品的開發人員來說是一個要的決策因素2 表表 8 8帕帕累累托前托前沿沿在在 M Me ed dQ QA A 基基準準測
32、試測試PP顯示顯示準準確性P確性P總總 API API pqpq的的s系s系 資料來源微官網,東方富證券研究所 1 1.2 2.ScScalialingng La Law w 引引領算領算力增力增長,大長,大模型模型n入n入理時理時 1.2.1.Scaling Law 指引算力投資 2020,OpenAI 發a的論文:Scaling Laws for Neural Language Models;xp程碑意義2篇論文通過大量的實驗,系統地研究了神經語言模型性能P模型大小1數據大小用于的計算量之間的s系2心發是因素之間在冪律s系,s模型大小1數據大小或計算量增時,模型的性能會按冪律高2 Scal
33、ing Law 的在促使研究人員O斷探索的模型架構1算法和方法,更好地利用規模效來升模型性能,是 AGI 目前的黃金規則2 表表 9 9Scaling LawsScaling Laws 原理原理 資料來源OpenAI2020:Scaling Laws for Neural Language Models;,電子發燒,東方富證券研究所 Scaling Law O僅適用于語言模型,適用于w他模態跨模態的任2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 11 Table_yemei 電子設備業深度研究電子設備業深度研究 表表 1010多多模模態態 ScalingSca
34、ling L Lawaw 資料來源OpenAI 2020:Scaling Laws for Neural Language Models;,東方富證券研究所 Scaling Law 揭示了模型性能P模型參數量1數據量等因素在冪律s系2隨著人智能模型O斷發展,了追求更高的性能和更準確的結果,研究人員和企業O斷擴大模型的規模2大型語言模型的參數量最初的幾千萬增長到如的數千億甚更高2種模型規模的快增長直接導算力的需求呈指數P升2 表表 1111算算力力需求需求升升 資料來源Shiqiang Zhu 等 Intelligent Computing 2023:Intelligent Computing:
35、The Latest Advances,Challenges,and Future;,東方富證券研究所 針針 ScaScalingling LaLaw w 的持續的持續性論劇性論劇2支持 Scaling Law 到頭的認 1邊效益遞減邊效益遞減隨著模型參數量1數據量和計算量的O斷增,模型性能的升幅度漸小2就像 OpenAI 的研究中,模型規模達到一定程度,繼續擴大規模,所帶來的性能升經O顯著,而會導pq大幅P升,包括計算資源的耗1時間pq能源耗等,經o和效率的角度來看,種投入產比的降P意味著 Scaling Law 漸失去了w原p的勢 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文
36、后各項聲明項聲明 12 Table_yemei 電子設備業深度研究電子設備業深度研究 2數據瓶頸數據瓶頸高量的數據獲難度來大2一方面,實世界中的數據雖然海量,但符合模型要求1o注準確xp表性的數據t相p限2一方面,隨著模型數據量的需求O斷增,數據的收1整理和o注作得愈發困難和昂2u淵棟到,模型離人類就難獲得的數據,數據量達到一定程度,很難找到足夠多的數據來一n模型性能的升,p了制 Scaling Law 繼續發揮作用的要因素 3架構P算法的局限架構P算法的局限目前的模型架構和算法在面超大規模的模型和數據時,能在一q性的限制2s使O斷增模型的參數量和數據量,如果架構和算法q身無法p效利用資源,_
37、難實性能的持續突破2例如,一研究發,某模型在擴展到一定規模,會梯度失或爆等問,影響模型的和W效果,表明單純依靠 Scaling Law 而O改架構和算法,模型性能的升將面臨瓶頸2 英_達依然支持英_達依然支持 ScalingScaling LawLaw22在英_達的電話會P,黃仁勛表示基礎模型預的 Scaling 然p效 2他指 OpenAI 的 o1 模型所依賴的 測試時間擴展=能會在英_達o來的業中發揮更大的作用,w 最人t奮的發展之一=和 的擴展定律=,認 o1 表了人智能行業改模型的方法,并竭全力U投資者保證,英_達一W做好了UV準備2黃仁勛的言論P微 CEO 納德拉的一,s并沒p看到
38、人智能 Scaling Law 遇到障礙,相了測試時計算的縮定律2 表表 1212N Ne ew w O Op pe en nA AI I o o1 1 L Lo on ng g Thinking Thinking TimeTime=C Cr re ea at te es s a a N Ne ew w W Wa ay y t to o S Sc ca al le e 資料來源英_達官網,東方富證券研究所 據 Epoch AI 研究表明,過去多大模型端一直沿著 45 倍每升的度前,預計到 2030 大模型少p 1000 倍升的空間2 表表 1313AIAI 大模型大模型算力增長情況算力增長情況
39、 表表 1414大模型o來算力大模型o來算力增長限制情況增長限制情況 資料來源EPOCH AI研究機構,東方富證券研究所 資料來源EPOCH AI研究機構,東方富證券研究所 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 13 Table_yemei 電子設備業深度研究電子設備業深度研究 1.2.2.AI 用n落地,理需求ns據流 A AI I 用經n入用經n入態勢態勢,理理側側需求s需求s比會比會持續升持續升2據 AI 產品榜的統計,202410o全球要的AI產品均實了增長,全球總榜前 20 微的 copilot 增最快 87.57%,w次是 Perplexity
40、 25.53%2大模型的 API調用量_在持續升,10 o_明顯P了一個,表明各類 AI 用經n在入常作生活中2 表表 151520242024 1010 oo AIAI 產品全球總榜情況產品全球總榜情況 表表 1616大模型度調用大模型度調用量情況量情況 資料來源AI產品榜_,東方富證券研究所 資料來源OpenRouter官網,東方富證券研究所 英_達 2024 第四季度電話會露,2023 數據中心中理業創的營收s比 40%,預計一s比o來將p所升2IDC 數據顯示,在中,2023 P半作負載的服器s比達到 49.4%,預計全的s比將達到 58.7%2隨著模型的完善Pp熟,模型和用產品n入投
41、產模式,處理理作負載的人智能服器s比將隨之攀升2IDC 預計,到 2027,用于理的作負載將達到 72.6%2 2 表表 1717中中人人智智能服能服器器作負作負載載預測預測,20222022-2 20 02 27 7E E 資料來源浪潮,IDC 數據:2023-2024 中人智能計算力發展評p告;,東方富證券研究所 58.4%41.3%67.7%68.8%70.5%72.6%41.6%58.7%32.3%31.2%29.5%27.4%0.0%20.0%40.0%60.0%80.0%100.0%202220232024E2025E2026E2027E理 20172017 敬敬請閱讀本請閱讀本報
42、告k報告k文后各文后各項聲明項聲明 14 Table_yemei 電子設備業深度研究電子設備業深度研究 1.2.3.算力需求測算相s于參數和數據量 據 OpenAI 在 2020 發表的:Scaling Laws for Neural Language Models;論文,算力需求算力需求要包含和理要包含和理n大n大部V部V2 部V,OAI 給了一個經驗式 6 w中C表示預所需的算力,N是模型的參數量,B每n耗的 token 批量,S是預需要的迭次數,系數 6 是在前U播中,需要將 wP輸入節相乘,并將w添到語言模型的計算的輸節中1 次乘法和1 次法,在計算損失 w 的梯度時,需要p好 2 次
43、,在用損失的梯度更參數 w 時,需要p好 2 次,的原因是無論 bias vector addition,layer normalization,residual connections,non-linearities,是 softmax,甚是 attention 的計算都O是s算力的要因素,最s鍵的是 Transformer 中的矩算2 表表 1818T Transformerransformer 每一每一次次前前UU播播模型模型參參數測數測算算 資料來源OpenAI:Scaling Laws for Neural Language Models;,東方富證券研究所 相的,理部V就是一個簡單
44、的前U播,因m理算力計算式 2 w中C表示理所需的算力,N是模型的參數量,B token 總量,v于實用中理任的需求并非始處于穩狀態,能會在某特定時間段或場景Q突發的高峰2例如,在電商促銷活期間,大量用戶時使用智能服系統行咨詢,基于人智能的服理服了極高的并發請求2m時,系統需要x備足夠的算力來高峰需求,確保服的流暢性和響度,因m場會增一個峰值倍數S2 1 1.3 3.海外海外 CSCSP P 廠商廠商維持維持高高度投資度投資,hh AIAI 增長增長潛力大潛力大 1.3.1.AI 業增長,CSP 資q開支意愿烈 A AI I 經開始產生一定經o經開始產生一定經o回,尤w是回,尤w是在類在類用用
45、和搜廣之中2和搜廣之中2微1谷歌1meta1applovin1Palantir 等最均展喜展2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 15 Table_yemei 電子設備業深度研究電子設備業深度研究 微表示 AI 驅的轉型l在改每個角色1職能和業流程的作1作和作流程,戶的增長和營桿2Azure Arc 在在各個行業擁p超過 39,000 戶,包括 American Tower1CTT1LOral,比增長超過 80%2借 Microsoft 365 Copilot1Copilot Studio 和 Agents 在的 Autonomous Agents,A
46、I 業轉型構建了端到端系統,超過 100,000 家經使用了 Copilot Studio,比增長了 2 倍多,Copilot 企業戶比增長了 55%2 谷歌在搜索和計算等業領域的人智能投資開始結回2Alphabet lO斷大在人智能方面的研發投入,在個快發展的領域POpenAI 等t手展開競2利用 AI xp的長視頻中生p了多W的視頻1像和文q內容,使網站流量增了 80%,量高了 2.7 倍,促了銷售增長2AI 搜索 MAU 超過了 10 億,w_W率P統業大相27個 MAU 超過 20 億的產品都在使用 Gemini 模型2 Meta表示o活超過5億,Facebook P的使用時長增了 8
47、%,在 Instagram P的使用時長增了 6%2P個o,超過 100 萬廣告使用q們的 Gen AI x創建了超過 1500 萬廣告2 AppLovin 表示w AI 驅的 Axon 2.0 廣告引擎,力廣告率升,p業增長的要催W劑2旗Q的程序W廣告交易全球用戶超過 15 億,通過p AppLovin SDK,將廣告P全球 15 億手機備和 6 萬款移用緊密接,廣告供更廣泛的廣告覆蓋和更高的投回2 Palantir 表示 24 3 季度美商業業比增長 54%1.79 億美元,美府業比增長 40%3.2 億美元,表示業增長要_于滿足了美府和商業戶人智能的堅定需求,w收入中p 4.99 億美元
48、 70%來自美戶2 海外海外 C CSPSP 資q開支意愿資q開支意愿烈烈,投資度持續維投資度持續維持高持高OO22微1谷歌1馬1meta 等在最均展很的投資意愿224 3 季度合計資q開支達 588.6 億美元,比增長 59%,比增長 11%2 表表 1919海海外外四大四大 C CSPSP 廠商廠商VV季季度資度資qq開支開支 資料來源Choice 馬1微1谷歌1臉書的深度資料,東方富證券研究所 -20%-10%0%10%20%30%40%50%60%70%010000200003000040000500006000070000聯網四頭馬1微1谷歌1Facebook合計資q支百萬美元 比軸
49、 比軸 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 16 Table_yemei 電子設備業深度研究電子設備業深度研究 1.3.2.AI 競P升家層面,h AI x備增長潛力 算力p各極算力p各極搶s搶s的戰略制高的戰略制高22算力是信o產業的要p部V,是衡量一個家數_經o發展水,實經o社會數_W轉型1適技革命和產業革的s鍵指o2算力競直表算力規模和算力s比的競,中信o通信研究院數據顯示,截 2023 全球計算備算力規模1397EFlops,q計算備算力規模達到 435EFlops,全球s比OV之一,增 50%2中信o通信研究院數據顯示,全球算力s比方面,美1中
50、1q1德1英 1拿大的算力s比V別 32%126%15%14%13%13%,美1中算力規模O列前n2 表表 202020232023 全全球算球算力規力規模模 資料來源開數據中心委員會,東方富證券研究所 hh AI AI l在t,o來l在t,o來增長潛力較大增長潛力較大2h AI 是指一個家在人智能領域擁p自的技術1數據和基礎施,能夠獨立地行人智能技術的研發1用和監管2它調家在人智能戰略層面的自性,包括算法開發1模型1數據管理硬支持等各個節都O外部的過度制2來多的家將h AI 升到家戰略高度,如美1 歐盟1 中1 q等,都在紛紛制定相s戰略規劃和策2 2 o,英_達創始人黃仁勛在世界府峰會直言
51、,每個家都該建立自的h AI=2英_達官網發a的聞稿顯示,黃仁勛經V別P拿大1法1印度1q1馬來西1坡1南等領導人行了會談2據O完全統計,和英_達行h AI=合作的家包括坡1印度1印度|西1馬來西1q1德1法1荷q1阿聯酋1沙特阿拉o2 hAI=通常V多期目投資,投資n 5 億-10 億美元2q府建立hAI=,U銀等O家q電信營商投資了 7.4 億美元2銀計劃 2025 前要投資 9.6 億美元建立家智算中心2印度府和幾家大型企業l在行多個超過 10 億美元的英_達 AI 芯w采購計劃2該管理層在 2024 一季度電話會P披露,2024 h AI=業將英_達帶來 100 億美元營收,預計s 2
52、4 數據中心營收的 9%2而在 2023,該業收入零2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 17 Table_yemei 電子設備業深度研究電子設備業深度研究 表表 2121hh A AI I a局a局情情況況 家家 建建方方 部部署方案署方案 美 Oracle A100/H100 搭建美府 坡 坡電信 Singtel H100 升家超算中心,在東南建節能 AI 廠 q 銀 1 KDDI 1 Sakura Ineternet 516G 用構建生p式 AI 和 AI 廠網,開發語大模型 印度 塔塔1信實業1瑞萊 采購 GH200 芯w搭建只算中心,定制印地
53、語 AI 大模型 法 伊利特團 127 個 DGX H100 系統,1016 個 H100 芯w 西q Team IM1Oracle 采購英_達芯w建q地 阿聯酋 阿聯酋電信1Oracle 采購英_達芯wr建h 意大利 瑞士電信 采購英_達 AI 芯w建超算中心,定制開發意大利語大模型 資料來源經g志,東方富證券研究所 IDC 預測,2022 中通用算力規模達 54.5 EFLOPS,智能算力規模達259.9EFLOPS,預計到 2027 通用算力規模將達到 117.3 EFLOPS,而智能算力規模將達到 1117.4EFLOPS22022-2027 期間,中智能算力規模復合增長率達 47.1
54、%,期通用算力規模復合增長率 16.8%2 表表 2222中中算力算力規規模情況模情況 資料來源浪潮,IDC 數據:2023-2024 中人智能計算力發展評p告;,東方富證券研究所 050010001500200020202021202220232024202520262027通用算力FP16)智能算力FP16 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 18 Table_yemei 電子設備業深度研究電子設備業深度研究 2 2.英英_達_達憑憑借借 G GPUPU 搶s搶s A AI I 芯芯w高w高,自自研研 A AISCISC 潛力大潛力大 2.2.1 1
55、.G.GPUPU 勢明顯勢明顯,A AISISC C n獲得n獲得場場份額份額 2.1.1.AI 芯w要求高并行計算1大內帶寬和P耗 了處理大規模的深了處理大規模的深度學度學模型,模型,芯w廠商芯w廠商需要研需要研發xp更高并行計算發xp更高并行計算能能力1更大內帶寬和力1更大內帶寬和更P更P耗的算力芯w耗的算力芯w2 首Y是高性能計算高性能計算能力2大模型包含海量的參數,過程到復g的矩算1張量算等2像 Transformer 架構中的多頭注意力機制,需要算力芯wp大的浮算能力,特別是 FP32單精度浮數和 FP16半精度浮數算性能2 GPT 需要芯w能夠快處理大規模的矩乘法,大量的參數更和梯
56、度計算,而模型收斂2 w次是高高并并行行處處理理能力2大模型的數據量極大,了縮短時間,需要時處理多個任或數據塊2算力芯w支持多線程1多處理技術,像 GPU形處理器p數千個計算心,能夠并行地執行大量計算任2 者是高帶寬和大容高帶寬和大容量量儲儲2在過程中,頻繁的數據寫是必O少的2算力芯w需要P內之間p高帶寬的接,快地和儲模型參數1梯度等數據2時,芯w自身_需要p一定的緩容量來暫中間數據,減少外部儲的問延2 最,要求芯wp良好的能耗比良好的能耗比2因大模型是一個長時間1高能耗的過程,秀的能耗比降Ppq2 表表 2323模模型型中中 62%62%的開銷在h的開銷在h(Weights)Weights)
57、和梯度和梯度(Gradient)(Gradient)通信中通信中 表表 2424使用英_達使用英_達 AllAllReducReduce e 技術,技術,負載負載比例比例 資料來源Mengdi Wang 等2019 IEEE International Symposium on Workload Characterization(IISWC):Characterizing Deep Learning Training Workloads on Alibaba-PAI;,東方富證券研究所 資料來源Mengdi Wang 等2019 IEEE International Symposium on
58、Workload Characterization(IISWC):Characterizing Deep Learning Training Workloads on Alibaba-PAI;,東方富證券研究所 2.1.2.GPU 是 AI 芯w的流架構 A AI I 芯w要包含芯w要包含 C CPU/GPU/PU/GPU/FPGA/FPGA/ASICASIC 等幾類等幾類2 CPU/GPU 是最流的產品,FPGA1ASIC 表的 AI 芯w基于統芯w架構,某類特定算法或者場景行 AI 計算_sp一地O,p比較前沿性的研究,例如類腦 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后
59、各項聲明項聲明 19 Table_yemei 電子設備業深度研究電子設備業深度研究 芯w1構通用 AI 芯w等但距離大規模商用p較長距離 2 表表 2525流流 A AI I 芯w芯wVV類情類情況況 資料來源中院物理所_,東方富證券研究所 CPU1GPU1FPGA1ASIC 是目前 AI 計算過程中最流的四種芯w類型,他們的要別體在計算效率1能耗和靈活性P面2 CPUCPUCPU 是馮依曼架構Q的處理器,遵循Fetch(指)-Decode(譯碼)-Execute(執行)-Memory Access()-Write Back(寫回)=的處理流程2在執行計算任過程中,數據需要Y獲并入 RAM,然
60、解碼獲得指,然在 ALU 計算模塊計算,最將計算結果返回 RAM2整個流程更調制和決策,在并行計算效率Pp較大升空間2 GPUGPU GPU 采用并行架構,減少了大量數據預和決策模塊,超過 80%部V算單元,x備較高性能算度2相比較Q,CPU 僅p 20%算單元,更多的是邏輯單元,因m CPU 擅長邏輯制P串行算,而 GPU 擅長大規模并行算2GPU 最作深度學算法的芯w被引入人智能領域,因w良好的浮計算能力適用于矩計算,相比 CPU xp明顯的數據吞T量和并行計算勢2但是,GPU _在一定的限制2在深度學算法中,和斷是n個O的段2 GPU 在段效率非常高,但在行單個輸入的斷時,并行計算的勢并
61、O能完全發揮來2 表表 2626GPU vs CPGPU vs CPU U 的架構的架構 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 20 Table_yemei 電子設備業深度研究電子設備業深度研究 資料來源英_達官網,東方富證券研究所 FPGAFPGAField Programmable Gate Array是在 PAL 編程列邏輯 1GAL通用列邏輯等編程器的基礎P一n發展的產物2它是作_用p電路ASIC領域中的一種半定制電路而的,既解決了定制電路的O足,又克服了原p編程器門電路數p限的缺2FPGA 能夠時實數據并行和任并行計算,在處理特定用時能夠顯著升效
62、率2P通用 CPU 相比,通用 CPU 能需要多個時鐘周期才能完p特定算,而 FPGA 通過編程電路,直接生p_用電路,就能在僅耗少量甚一次時鐘周期的情況Q完p算2v于 FPGA xp編程靈活性高1開發周期短并行計算效率高等特,FPGA 的用場景非常廣泛,遍a航空航y1 汽車1|療1 廣播1測試測量1電子1業制等熱門領域2 ASICASIC(Application Specific Integrated Circuit)芯w是_用p電路,是針用戶特定電子系統的需求,計1制的_p用程序芯w,w計算能力和計算效率據算法需要行定制,是固定算法最W計的產物2定制W特性高 ASIC 的性能耗比,尤w在高
63、性能1P耗和移用方面xp明顯勢2然而,缺包括定制W程度較高1計周期長1算法依賴性高和擴展性差等2來來多的開始采用 ASIC 芯w行深度學算法,w中表最突的是 Google 的 TPU2 TPU 比時期的 GPU或 CPU 均 1530 倍,能效比升 3080 倍2相比 FPGA,ASIC 芯wx備更P的能耗P更高的計算效率2但是 ASIC 研發周期較長1商業用風險較大等O足_使得只p大企業或背靠大企業的團隊愿意投入到它的完整開發中2 G GPUPU 然是目前最流的然是目前最流的 A AI I 芯w芯w2IDC 統計顯示,2023,中芯w的場規模達到 140 萬張,w中 GPU ts據 85%的
64、場份額2 2024 P半,中芯w的場規模達超過 90 萬張,w中 GPU ts據 80%的場份額2 表表 27272 2024024 PP半半中中人人智能智能芯芯ww場場份額份額 資料來源IDC 數據,東方富證券研究所 2.1.3.理時 ASIC 增長潛力大 ASICASIC o來增長潛力較大o來增長潛力較大2TrendForce 研究顯示,CPU1GPU P ASIC 芯w在 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 21 Table_yemei 電子設備業深度研究電子設備業深度研究 2026 AI 場規模的比將達 33134126,w中 ASIC 芯w場p
65、長最快2 表表 282820212021 20262026 各類各類 A AI I 芯芯wwss率率 資料來源TrendForce 研究機構,東方富證券研究所 理側理側 A ASICSIC x備獨特的x備獨特的勢勢2首Y,性能勢層面,ASIC 芯w針特定的人智能任行了定制W計,能夠實高度并行計算,ASIC 芯w的架構和計使w在執行特定任時,能夠較P的耗供較高的性能2于大規模的 AI 數據中心和邊緣計算備來說,降P耗O僅意味著營pq的降P,能高備的穩定性和靠性,使w更適合長時間1 大規模的理任2 w次,pq效益層面,雖然 ASIC 芯w的初始計和開發pq較高,但隨著生產規模的擴大,單Opq會漸降
66、P2場 ASIC 芯w的需求增,大規模生產使得芯w的制pq1封裝測試pq等大幅Q降,而在pqP更x競力,ASIC 芯w在理任中的能效比高,能夠較P的能耗完p相的計算任,降P了電力pq2m外,w穩定性高,減少了因硬故障導的維pq和停機時間,一n高了整體的pq效益2 者,技術發展方面,隨著人智能算法的O斷發展和p熟,一常用的算法和模型被固W到 ASIC 芯w的硬電路中,實了算法P硬的深度融合2種W方式能夠一n高芯w的性能和效率,使w在特定的理任中表更色,而促了 ASIC 芯w的用和s比升,O斷創的硬架構計使得 ASIC 芯w能夠更好地適O類型的 AI 理任2 最,在場競層面,英_達目前一家獨大,產
67、業h過高,CSP 原廠均在大力研發和采用自的產品,而削弱英_達的行業地O2 2.2.2 2.英_英_達領達領Y勢Y勢明顯明顯,硬構硬構筑競筑競壁壘壁壘 2.2.1.英_達 AI 芯w迭 英_達 1993 v黃仁勛等O人創,1995 發a第一個流多能芯w NV1,1999 行業首個顯示形處理單元 GeForce 256,開啟 GPU 時2m,英_達憑借技術勢在游o顯t領域O斷發展,p行業領導者22016 英_達轉型人智能計算,w GPU 相s產品 AI 發展供 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 22 Table_yemei 電子設備業深度研究電子設備業深
68、度研究 大算力支持,了 AI 的快發展,尤w在大模型等方面發揮要作用,如英_達p全球 AI 芯w行業的領軍企業2 表表 2929英英_達發達發展展 資料來源智 AGI _,神問學_,東方富證券研究所 英_達 AI 端算力芯w經了多個更迭 Tesla2008,NVIDIA 第一個實統一著色器模型的微架構2經y型G80,采用電90納米藝制程,并實個第一=Fermi 架構2010,NVIDIA GPU 是初 G80 來最大的飛躍,是第一個完整的 GPU 計算架構2Fermi 架構p 30 億個晶體管,電 40nm 藝制程,512 個 CUDA 內,每個 CUDA 心每個時鐘周期執行一個浮數或整數指,
69、采用第O流式多處理器 SM,512個 CUDA 心V 16 個 SM,每個 SM p 32 個 CUDA 內,實了 IEEE 754-2008 浮o準,單精度和精度算術供了融合乘FMA指 Kepler 架構2012,采用電 28nm 藝制程,整體架構PFermi 保持一性,但思路減少 SM 單元數,增 CUDA 內數,SM改 SMX,Kepler 架構中每個 SM 單元的 CUDA 內數 Fermi 架構的 32 個增 192 個 Maxwell 架構2014,是Y前 Kepler 架構的升x,采用電 28nm 藝制程,SM 全計 SMM妙地模仿了 4 個 Fermi架構 SM 單元 2x2
70、排列方式,每 SMM 單元的 CUDA 心數減少,但每個 SMM 單元擁p更多的邏輯制電路,便于精確制 Pascal 架構2016,采用電 16nm 藝制程,p 1500億個晶體管,首個了深度學而計的 GPU,支持所p流的深度學計算框架2s鍵技術包括 NVIDIA NVLink 高技術1HBM2第 3D 堆p式高帶寬內1依靠 Async shaders 硬層面完整實 AsyncCompute1支持 DirectX 12Feature Level 12_1 Volta 架構2017,第一 TensorCore,采用電 12nm 藝制程,p 210 億個晶體管,配備 640 個 Tensor 心,
71、每供超過一 125teraFLOPs 的深度學效能,比P一 5 倍P 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 23 Table_yemei 電子設備業深度研究電子設備業深度研究 Turing 架構2018,第 TensorCore,采用電 12nm藝制程,p 186 億個晶體管,引入_門用于Z線追蹤的 RT 心,高達每 10 Giga Rays 的度Z線和聲音在 3D 境中的播行計算,是初 G80 來最大的飛躍2Turning 配備全的Tensor Core,每供高達 500 萬億次的張量算,極大 AI增能2基于 Turing 的 GPU 搭載型流多處理器(
72、SM)架構,支持高達 16 萬億次浮算,時能夠并行執行 16 萬億次整數算 Ampere 架構2020,采用電 7nm/O 8nm 藝制程,p 540 億個晶體管,采用突破性創技術,_性計算時計,在各種規模Q能實色的,顯著增 CUDA 心數量,高每個 SM 的計算能力,整體性能得到大幅度升 Hopper 架構2022,采用電 4nm 藝制程,p 800 億個晶體管,采用突破性創技術 H100 Tensor Core GPU 供力支持,通過 Transformer 引擎 TensorCore 技術的發展,在 AI 模型,Hopper Tensor Core 用混合的 FP8 和 FP16 精度,
73、大幅 Transformer 模型的 AI 計算,并P Transformer 引擎和第四 NVIDIA NVLink 相結合,使 HPC 和 AI 作負載的實數量升2第 MIG 能,MIG 技術支持將單個 GPU V七個更小完全獨立的實例,一n支持各種作負荷 Blackwell 架構2024,Blackwell 架構的 GPU p 2080 億個晶體管,采用電 4NP 藝,NVIDIA w實在十萬億參數模型P的 AI 和實時 LLM大語言模型理2 表表 3030英英_達達要要的的 A AI I 算算力力芯芯w迭w迭情況情況 資料來源搜狐,網界,東方富證券研究所 2.2.2.英_達硬城河高 英
74、_達在人智能領域的a局堪全面,w系統系統和網1和網1硬和硬和O大支柱,構建了深厚的技術城河2在計算芯w方面,Nvidia 擁p CPU1GPU1CPU-CPU/CPU-GPU SuperChip 等全面的a局在超節網層面,Nvidia供了 NVLink 和 InfiniBand n種定制W網在群網方面,Nvidiap基于 Ethernet 的交換芯w和 DPU 芯wa局2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 24 Table_yemei 電子設備業深度研究電子設備業深度研究 表表 3131英英_達的達的 A AI I 群硬群硬技技術架術架構構 資料來源搜
75、狐,R思汽車研究,東方富證券研究所 英_達在英_達在 CUDACUDA并行編程并行編程模型模型P的戰略P的戰略眼Z持眼Z持續堅持,續堅持,是如是如形p形p硬合生態的最心硬合生態的最心壁壘壁壘2CUDA最初的計算統一備架構是 16 英_達創立的_p的并行計算和用程序編程接口 API,它允許使用某類型的形處理單元行通用處理2CUDA 包含 CUDA 指架構ISA GPU 內部的并行計算引擎,采用通用并行計算架構,使 GPU 能夠解決復g計算問,相較 AMD 采的通用 OpenCL 而言,并行計算能力高 10-200倍O等2 英_達通過十余迭擴U形p豐富的函數1 API 指1 x鏈1用程序等,開發者
76、好程度更高2CUDA 只針 NVIDIA 的 GPGPU,通過一的境才能讓 NVIDIA 的產品能夠實最大限度的2 表表 3232英英_達的達的 CUDACUDA 架構架構 資料來源英_達官網,東方富證券研究所 2.2.3.英_達s率領Y,數據中心持續高增 憑借累的競憑借累的競勢勢,英_達幾N斷了目前英_達幾N斷了目前 A AGIGI 場的算力芯w供場的算力芯w供2據半導體V析 TechInsights 研究告,英_達在 2023 數據中心 GPU 量方面得了爆式增長,總計量 376 萬塊,相比于 2022 的264 萬塊增長了超百萬塊2在數據中心 GPU 場領域依然是N斷性的霸 201720
77、17 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 25 Table_yemei 電子設備業深度研究電子設備業深度研究 地O,場份額P 2022 的水相,98%2 2024 3 季度s FY3Q25數據中心營收達到 308 億美元,較P一季度增長 17%,較P期增長 112%2Blackwell 芯w全面投產,并在第O季度U戶交付了 1.3 萬個 GPU 品,w中包括U OpenAI 交付的首批 Blackwell DGX 程品,l式生產計劃于第四季開始,預計 2026 將供O求2m外,H200 產品在q季度銷量顯著增長,w計算業收入 276 億美元,比增長 132%,比增長 22
78、%2網業收入 31 億美元,比增長 22%,比Q降 15%,增長要來自人智能z網Spectrum-X 端到端,雖收入比Q降,但需求O斷增長2 表表 3333英英_達數達數據據中心V中心V季季度度營收營收情情況況百百萬美萬美元,元,%資料來源Choice 英_達-深度資料-營業構p,東方富證券研究所 2.2.3 3.C.CSPSP 廠廠商自商自研研 A AI I 芯芯ww勢勢,供,供鏈鏈極擴極擴產產需求需求 2.3.1.自研 AI 芯w性能表O差 伴隨理側需求的增伴隨理側需求的增,各各家家C CSPSP廠廠_在_在自自研產品和比例的升2研產品和比例的升2谷歌很就開始投入 AI 芯w的研發,w的張
79、量處理單元TPU是_門機器學定制的芯w2TPU 在理方面表色,通過W硬架構和指,能夠高效地處理神經網模型的理任2 微自 2019 來一直在 Athena 芯w研發目,目v微 CEO 薩蒂納德拉Satya Nadella牽頭,_大語言模型的和理而計2Athena 目前lv一小群微和 OpenAI 員行測試,初芯w能基于電 5nm 藝2 馬的 AWS 了 Trainium 和 Inferentia 芯w,w中 Inferentia 芯w要用于 AI 理任2 在2024 re:Invent大會P,AWSaTrainium2l式用,w性能比第一產品升 4 倍,在極短的時間內基礎模型和大語言模型2Trn
80、2 每個芯w大概 500w,僅需要風冷散熱,單芯w的 BF16 浮算力 650TFLOPS,大 H100 的 60%,內 96GB HBM3e,內帶寬43%80%167%162%97%79%35%55%71%83%61%31%11%14%171%279%409%427%154%112%0%50%100%150%200%250%300%350%400%450%05000100001500020000250003000035000數據中心營收百萬美金 YOY 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 26 Table_yemei 電子設備業深度研究電子設備業深度研
81、究 和 H100 持2 表表 3434TrnTrn2 2 芯wP芯wP N NV VI ID DI IA A 和和 GoogleGoogle 的的產品產品比性能比性能PP比比 資料來源CDCC _,Semianalysis 研究機構,東方富證券研究所 Meta 計劃第一自研 AI 芯w MTIA,該芯w采用電 7nm 藝量產,行頻率 800MHz,TDP 僅 25w,INT8 整數算能力 102.4TOPS,FP16 浮算能力 51.2TFLops2 2.3.2.合作廠商 AI 營收高增,廠商指引長期 AISC s比 50%博通首執行官 Hock Tan 在 2024 9 o表示,的超大規模戶
82、繼續擴大w AI 群,基于m博通P調了 2024 AI 收入預期 120 億美元,m前預期 110 億美元2預計 2024 結時,AI 支熱潮帶來的 AI 相s營收規模將sw半導體業營收的 35%,高于m前預測的 25%2博通開發了 3.5D XDSiP=的技術,在一個封裝備中p超過 6000 方毫米的硅w和多達 12 個高帶寬內堆p,Pl面背方法相比,該技術在密度和率效率方面p顯著改,能實大規模 AI 的高效1P耗計算,預計將于 2026 2 o開始生產2據道,OpenAI l在P博通合作開發一款型人智能芯w,_門用于 AI 模型的理過程,方在P電行磋商,計劃 2026 v電m款芯w2 表表
83、 3535博博通通 X XPUPU 豐富豐富的的 I IP P a局a局 表表 3636博博通通定制定制芯芯w度w度 資料來源博通官網,東方富證券研究所 資料來源博通官網,東方富證券研究所 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 27 Table_yemei 電子設備業深度研究電子設備業深度研究 在最一季度的業績說明會P,博通預計 20202727 場定制款場定制款 AIAI 芯w芯wASICASIC 的需求規模的需求規模 600600 億億 900900 億美元億美元2而,在 AI 芯w方面,博通pn家額外的超戶,預計戶將在 2027 之前帶來收入2長期來
84、說,博通的CEO Hock Tan 預言 o來o來 50%50%的的 AI AI FlFlopsops算力算力都都會是會是 ASICASIC,甚甚 CSPCSP超超大規模計算產商大規模計算產商內部內部自用自用 100%100%都將是都將是 ASICASIC=2 Marvell 2024 第O季度數據中心產品中的 AI 定制芯w銷售額比翻倍達到 11 億美元,s總收入的比例達 73%,數據中心業收入創高,該業p收入的要獻者2馬供定制 AI 芯w,如 Trainium 芯w量產,Inferentia 芯w預計 2025 開始生產2谷歌供 Axion 芯w等產品,Axion 芯w量產2P微合作的 M
85、aia-2 芯w預計到 2025 開始交付2預計到 2026 AI 芯w業銷售額將達到 25 億美元,并計劃到 2028 能夠獲得數據中心芯w場 25%的份額,將帶來超過 400 億美元的收入2 表表 3737marvellmarvell 數數據據中心中心業業長期長期規規劃劃 表表 3838marvellmarvell 20242024 3 3 季度季度數數據中據中心心業業情情況況 資料來源marvell 官網,東方富證券研究所 資料來源marvell 官網,東方富證券研究所 2.3.3.AISC 供鏈中 PCB 需求升,配套廠商極擴產 AIAISCSC 心的心的 A AI I 服器服器會升會
86、升 P PCBCB 的值量的值量 AI 服器是采用_構形式的服器,在_構方式P據用的范圍采用O的合方式,如 CPU+GPU1CPU+TPU1CPU+w他的t等2據 Prismark 預p,2023 全球服器儲用PCB場規模82億美元,到2028p望增長138億美元,復合增長率高達 11%,po來 PCB 用領域中p長能最的板塊2在技術層面,人智能服器采用的 PCB 技術一般包含 20 28 層的多層架構,超過統服器 12-16 層的 PCB 2AI 服器所使用的 PCB 難度顯著高于常規服器,單機值量大幅升,行業帶來的增長,而帶整個行業的技術n2 表表 393920232023-2028202
87、8 全球全球多多層層 PCBPCB 產產值值均均復復合增長合增長率率預預測測用領用領域域 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 28 Table_yemei 電子設備業深度研究電子設備業深度研究 資料來源PCBworld _,Prismark 研究機構,東方富證券研究所 內領Y的內領Y的 P PCBCB 廠商_在廠商_在擴U相產能擴U相產能滿足滿足戶需求戶需求生益電子表示,緊抓 AI1高性能計算機等領域相s產品研發,目前經p開發了包括馬在內的多家服器戶,AI 配套的板t目均經入量產段2在 12 o告,投資 14 億元人民_用于智能算力中心高多層高密電路板,
88、計劃產 25 萬方米的高多層高密印制線路板,w中第一期計劃產 15 萬方米,第期計劃產 10 萬方米,滿足t領域高端印制電路板的中長期需求2滬電股份 2024 前O季度購買固定資產1無形資產和w他長期資產支付的金達到 13.1 億元,相較于 2023 前O季度比升 149%,顯示擴產的極性2時,告投資 43 億元,用于人智能芯w配套高端印制電路板擴產目,計劃產 29 萬方米人智能芯w配套高端印制電路板2w中第一段計劃產 18 萬方米高層高密度層板第段計劃產 11 萬方米高層高密度層板2q目全部實施完p,預p增營業收入 48 億元人民_2w中第一段實施完p,預p增營業收入 30 億元人民_,扣除
89、總pq用和銷售稅金的利潤總額 5.58 億元人民_考慮所得稅,稅率 15%計算,凈利潤 4.7 億元人民_第段實施完p,預p增營業收入 18 億元人民_,扣除總pq用和銷售稅金的利潤總額 3.35 億元人民_考慮所得稅,稅率 15%計算,凈利潤 2.85 億元人民_2 3.3.摩摩爾定爾定律律緩和緩和易摩易摩擦擦劇,劇,產產芯w芯w 3 3.1.1.摩爾摩爾定律定律緩制緩制單t單t性能,性能,YY封裝封裝要性要性增增 3.1.1.COWOS 封裝升 AI 芯w性能 Y封裝突破摩爾定Y封裝突破摩爾定律,律,COWOS 內墻挑戰內墻挑戰2隨著摩爾定律漸失效,封裝在升芯w能效的作用愈發要2在過去的十
90、,CPU 和 GPU 的計算能力增了 60,000 倍,但 DRAM 內帶寬和帶寬t僅增了 100 倍和30 倍2 v于硬計算效率P內帶寬率差距來大,vm形p 內墻=,拖累計算效率2解決內墻象,開發者通過Y封裝的方式拉計算單元P內的距離,m升通信效率2 目前英_達擇采用 COWOS 技術,將 GPU 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 29 Table_yemei 電子設備業深度研究電子設備業深度研究 P高帶寬內HBMp,p效的縮短了計算中心P內之間的距離,升通效率2在大模型需求O斷升的背景Q,Y封裝場需求在O斷增2據研究機構 DIGITIMES Res
91、earch 表示,端 AI 器需求旺盛,2025 全球 CoWoS 類似封裝產能的需求或將增長 113%2 表表 4040硬硬算力算力峰峰值P內值P內帶帶寬寬 資料來源Yole 研究機構,東方富證券研究所 COWOS 產能產能緊缺p緊缺p限限制制 AI 芯w產芯w產量量的s鍵因素的s鍵因素22COWOS 藝VCOWOS-R1COWOS-S1COWOS-L O種方案2他們之間的要別在于中層方案差_2w中,COWOS-R 采用Va層RDL構中層,實 SoC P HBM的,實_構p2COWOS-S 擇硅wU中層2在 COWOS-L 中,使用中層和q地硅 LSI 芯w行晶粒間,并使用 RDL 層行電源
92、和信輸2英_達在 H 系列所采用的 COWOS-S 封裝方案,在的GB200 芯w,英_達采用 COWOS-L 的封裝方式2藝難度來看,COWOS 作 2.5D 封裝技術的一種,要將多個p源芯wp在硅中層P2 w心藝流程到中層的晶圓等前道序,因m該技術要v晶圓廠掌握2目前電擁p全球大部V的 COWOS 產能,在 AI 芯w需求旺盛的背景Q,COWOS 產能的緊缺是限制 AI 芯w產量的要瓶頸2 表表 4141COWOSCOWOS-S S 的的封封裝結裝結構構 表表 4242COWOSCOWOS-L L 的的封封裝結裝結構構 資料來源電官網,東方富證券研究所 資料來源電官網,東方富證券研究所 C
93、OWOS按照藝流程VCOWPOS2 w中COW指的是Chip on Wafer,指的是將芯wP中層通過 uBump 行接,并通過部填U2OS 流程中是將 COW 中制備完p晶圓P載板相接2 表表 4343COWOSCOWOS 的的藝流程藝流程 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 30 Table_yemei 電子設備業深度研究電子設備業深度研究 資料來源 J.Lau 等:Redistribution layers(RDLs)for 2.5D/3D IC integration;International Journal of Microcircuits&
94、Electronic Packaging,2014,東方富證券研究所 3.1.2.Y封裝產難度小于前道,心備材料亟待突破 Y封裝要性凸顯Y封裝要性凸顯,q,q極研發Y極研發Y封裝封裝藝藝據微網道,電自 11 o 11,中斷U中大戶供采用 7 納米更Y藝制程的 AI 芯w2面復g的海外境,q封測極拓展Y封裝藝研發2通富微電面U高端處理器等產品領域持續投入,持續發力服器場大尺高算力產品,5nm14nm13nm 品研發2長電技的 XDFOI Chiplet 高密度多維_構p系列藝按計劃入穩定量產段2 COWOS1HBM 表的Y封裝,是 AI 芯w制節中心值增量部V2 Y封裝制過程中,要較多用到了 T
95、SV1Bumping1減薄1鍵合1RDL等藝,增量序_P游備材料節帶來了的增長機會2前內技術均處于期段,無論是制1封測節是P游備材料節均處于O斷突破過程中2 表表 4444YY封裝封裝要序要序備備節節廠廠商梳商梳理理 要藝要藝 心序心序 備備 全球要廠商全球要廠商 大廠商大廠商 TSV 深硅蝕 蝕備 AMAT1Lam1TEL X方_創1中微 電鍍沉銅 電鍍備 AMAT1Lam Research1Ebara1ASMP 盛美P海 CMP 拋Z CMP 備 AMAT1Ebara _海清 測試 CP 測試 FT 測試 探針 TEL1東精密1惠特技1旺矽技 矽電股份1長技 測試機 Advantest1T
96、eradyne 長技1_峰測1精智達1精測電子 V機 Cohu1Advantest1Epson 長技1金海通 Bumping PVD PVD 備 AMAT1Evatec X方_創 曝Z Z備 ASML1Nikon1Canon1Orbotech P海微電子1芯碁微裝 研磨減薄 研磨減薄備 DISCO1東精密 _海清1中電1Z力技等 W割劃w 劃w機 DISCO1東精密 Z力技1大族激Z等 臨時鍵合解鍵合 臨時鍵合機 EV Group 芯源微等 堆疊鍵合 TC-NCF/TC Bonder HANMI1Besi 等 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 31 T
97、able_yemei 電子設備業深度研究電子設備業深度研究 MR-MUF 混合鍵合 混合鍵合機 EV Group1Besi1SUSS 拓荊技等 塑封 塑封備 TOWA1ASMPT 文一技1耐裝備 資料來源各官網告,東方富證券研究所 注部V藝所用序p合,如 TSV1RDL1Bumping 中均用到曝Z1蝕1電鍍等,僅列示一次,O復列示2 表表 4545YY封裝封裝要序要序材料材料節節廠廠商梳商梳理理 材料材料 全球要廠商全球要廠商 大廠商大廠商 封裝基板 欣t1Ibiden1O電機等 t森技1深南電路等 塑封料 Q電木1立Wp1Namics 等 _海誠1衡所_威等 Z材料 TOK1JSR1杜邦1
98、信1東等 艾森股份1鼎龍股份1力材等 電鍍液 杜邦1石原等 艾森股份1P海1力材1安技等 前驅體 默克1法液空1SK 等 克技等 半導體膠帶 Nitto1OW學1LINTEC1Denka 等 德邦技 固晶1粘結材料 Henkel1立Wp 德邦技1_海誠等 部填U膠 Namics1Henkel1立Wp等 _海誠1德邦技1鼎龍股份等 拋Z材料 杜邦1Cabot 等 安技1鼎龍股份等 靶材 礦1東曹等 江豐電子等 資料來源各官網告,東方富證券研究所 3.3.2 2.易易摩擦態摩擦態勢劇勢劇,A AI I 芯w芯w產產W經W經形p形pr識r識 3.2.1.23 芯w法案升 AI 芯w限制施 芯w法案升
99、限制多芯w法案升限制多款高款高性能算力芯w_銷性能算力芯w_銷售售22023 10 o 17,登府更了針人智能AI芯w的口管制規定,計劃阻k英_達等U中口Y的 AI 芯w2據最的規則,英_達包括 A800 和 H800 在內的芯w_口都將禁2 要增O內容 w一,把性能密度作口管制o準2禁k中售行度超過300teraflopss每計算 300 萬億次算的數據中心芯w2行度在150-300teraflops 的芯w,如果性能密度超過每方毫米 370 gigaflops十億次計算,_會被禁k銷售2 w,Y芯w口許范圍擴大到 40 多個家2w目的是,kYAI 芯ww他家輾轉入中2 wO,21 個家了芯
100、w制備的許要求,并擴大了禁k入家的備清單2 m在限制中的 14 納米QY芯w的制能力2 表表 4646流流 A AI I 芯w芯w相相s參s參數數情情況況 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 32 Table_yemei 電子設備業深度研究電子設備業深度研究 資料來源Semianalysis 研究機構,東方富證券研究所 3.2.2.24 芯w法案增 HBM 芯w限制施 期,美增期,美增 H HBMBMHigh Bandwidth Memory,企一n限制內,企一n限制內 A AI I芯w的發展2芯w的發展22024 12 o 2,據美商部業P安全局BIS
101、發a的文,q次規 BIS 繼續大人智能產業特別要的 HBM 芯w實施的限制施,包括將高性能 HBM 芯w如 HBM3 更Y類型納入管范圍1置性能閾值例如,如果內帶寬密度超過 2GB/方毫米,則將觸發許要求 2管 HBM 到o格管,但在某情況Q然在例外,如果 HBM P邏輯芯wr封裝,邏輯芯w的要能是計算而非儲,則 HBM 能O單獨到口限制2某r封裝p電路_被排除在 3A090.c 的制范圍之外,外,規_特定符合許例外的場景時允許wl???,包括要求最用戶和最母O得O于中澳門 1內帶寬密度要小于每每方毫米3.3GB,時擔心通過V銷商轉移等因素要求必v一封裝計商行采購,s確保時必知道封裝計商等2 H
102、BM s高帶寬儲,一款型的 CPU/GPU 內芯w2HBM 屬于形 DDR 內的一種,xp高帶寬1高容量1P延時PP耗等勢2 它將多個 DDR 芯w堆疊在一,每層 Die 通過 TSV 穿硅通孔技術實P邏輯 Die 接,P GPU 封裝合p,通過增帶寬1擴展內容量p DDR 合列,實小尺P高帶寬1高輸度的兼容,而減少內和儲解決方案所帶來的延2在 AI 大模型理過程中,HBM 快數據處理度,因m更適用于 ChatGPT 等高性能計算場景2 表表 4747HBMHBM 和和 GDDRGDDR5 5 的性的性能能比比 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 33
103、Table_yemei 電子設備業深度研究電子設備業深度研究 資料來源 半導體產業縱橫_,東方富證券研究所 目目前前流流 AIAI 芯芯ww都都使使用用 HBMHBM,一,一 GPUGPU 配配多多 H HBMBM22XpeaGPU 露,B100 GPU 的n個計算芯w將接到8個8-Hi HBM3e顯堆p,總容量192GB2AMD 經供了 192GB 的相容量,并在w Instinct MI300 GPU P搭載了 8 個HBM3 芯w2 表表 4848英英_達各達各 GPUGPU 的的 HBMHBM 用量情況用量情況 資料來源 英_達開信o,Trendforce 研究機構,東方富證券研究所
104、3.2.3.家和地方策碼扶持產芯w 前,前,家和地方都在家和地方都在極制定策1極制定策1大投入,大投入,z激和引導算力產業z激和引導算力產業發發展展22023 10 o 8,業和信oW部等部門發a:算力基礎施高量發展行計劃;12 o 23,家發展改革委1家數據局發a:數_經o促r富裕實施方案;,調要快全一體W算力網建,彌合域數_鴻溝=12 o 25,家發展改革委等部門發a:s于深入實施東數西算=程 快構建全一體W算力網的實施意;2要,將一nq算力產業高量發展,經o高量發展供要支撐2多地_了針性策2例如,四省發改委印發:四省算力基礎施高量發展行方案(20242027);,到 2027,算力總規模
105、達到 40eflops,w中智能算力s比OP于 60%,大規模智能計算中心達到 15 個 2河南省人民府發a:河南省算力基礎施發展規劃(20242026);,計劃到 2026,算力規模超過 120eflops,智算1超算等高性能算力s比超過 90%,形p 10 個P算力規模達到 e 的大型算力中心2 內前內前A AI I芯w采購芯w采購英英_達_達,產W得到產W得到明確明確策扶持策扶持2 據 IDC 數據,2022 中 AI t量 109 萬張,w中英_達在中 AI 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 34 Table_yemei 電子設備業深度研究電子
106、設備業深度研究 t場份額 85%,_s率 10%,百度s率 2%,寒o紀和燧原技均 1%2:生p式人智能服管理暫行法;鼓生p式人智能算法1框架1芯w配套等基礎技術的自創,鼓采用安全信的芯w11x1算力和數據資源2地方層面,X經開于服企業采購產算力芯w企業相s產品,并在經開算力調度P架外供服的,給購買合中的實采購產智算芯w服器部V金額最高 10%的補,每個目累計O超過 1000 萬元2 表表 49492 2022022 中中 AIAI tt競競格格局局 資料來源IDC 數據,東方富證券研究所 3 3.3.3.產產芯w芯w性能性能n追n追英英_達,_達,理理時時能性能性升升 3.3.1.產芯w算力
107、性能x備o A800 能力 口禁帶產銷口禁帶產銷售增售增,內算力x備,內算力x備oo A A800800 的能力的能力22023,中芯w的場規模達到 140 萬張2技術角度來看,GPU ts據 85%的場份額品牌角度來看,中q土人智能芯w品牌的量超過 20萬張,s整個場份額的 14%2用于理的人智能芯ws據了 67%的場份額2內算力t在迭,g騰 910 例,基于自研_達芬奇架構 3D Cube 技術,半精度FP16算力達到 320TFlops,整數精度INT8算力達到 640Tops,而英_達 A100 的 FP16 tensor core 峰值性能 312TF/624TF,INT8 tens
108、or core 峰值性能 624Tops/1248Tops2因m,半精度和整數精度的算力數據來看,g騰 910 的 FP16 算力略高于英_達 A100,而 INT8 算力則是英_達 A100 的n倍,在算力一s鍵指oP,g騰 910 表了較的競力2 表表 5050內內外外要要算力芯算力芯ww參參數數比比 品牌品牌 NVIDIANVIDIA NVIDIANVIDIA NVIDIANVIDIA 寒寒o紀o紀 _海思海思 海海Z信oZ信o ff侖芯侖芯 英_達,85%_,10%f侖芯,2%寒o紀,1%燧原技,1%w他,1%20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明
109、35 Table_yemei 電子設備業深度研究電子設備業深度研究 處理器 A100 PCIe A800 80GB PCIe H20 SXM 思元 370-X8 g騰 910B 深算一 邏輯心數 6912CUDA cores 6912CUDA cores 9338CUDA cores 多 性多 4096 64 CUs)-微架構 Ampere Ampere Hopper MLUarch03 達芬奇-XPU-R 算力 19.5 TFLOPS 19.5 TFLOPS 44 TFLOPS 96TFLOPS 256 TFLOPS-128 TFLOPS FP32 FP32 FP32 FP16 FP16-F
110、P16 內大小 40/80GB 80GB 96GB 48GB 32GB 32GB 32GB HBM 類型 HBM2 HBM2E HBM3 LPDDR5 HBM2/2E HBM2 GDDR6 內帶寬 2039GB/S 2TB/S 4.0TB/S 614.4 GB/s 2TB/S 2014GB/S 512GB/S TDP 400W 250W 400W 250W 310W 350W 120W 藝節 7nm 7nm 5nm 7nm 7nm 7nm 7nm 聯技術 NVLink Gen 3:600GB/s,PCIe 4.0 x16 NVLink Gen 3:400GB/s,PCIe 4.0 x16 NV
111、Link Gen 4:900GB/s,PCIe 5.0 x16 MLU-Link 200 GB/S;PCIe 4.0 x16 HCCS 392 GB/sPCIe 5.0 x16 PCIe 4.0 x16 PCIe 4.0 x16 資料來源_官網1英_達官網1寒o紀官網1海Z股說明書1網開信o,東方富證券研究所 3.3.2.g騰打全產業解決方案,全面o英_達 g騰計算產業是基于g騰系列HUAWEI Ascend處理器和基礎構建的全p AI 計算基礎施1 行業用服,包括g騰系列處理器1 系列硬1CANNCompute Architecture for Neural Networks,_構計算架構
112、1AI 計算框架1 用使能1 開發x鏈1 管理維x1 行業用服等全產業鏈2 表表 5151gg騰騰計算計算產產業生態業生態 資料來源_官網,東方富證券研究所 g騰芯w基于自研的達芬奇架構研發而p,xp高性能1P耗的特2g騰的 AI 算力備豐富,涵蓋了智能邊緣硬1中心理硬1中心硬 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 36 Table_yemei 電子設備業深度研究電子設備業深度研究 1開發者套等多個產品形態,n芯w覆蓋四大用場景,能夠滿足O戶在O場景Q的算力需求,w場拓展供了p力支撐2 表表 5252 CANNCANN 架構架構 表表 5353 g騰g騰服
113、服 資料來源_官網,東方富證券研究所 資料來源_官網,東方富證券研究所 g騰了類似 CUDA 的 AI 框架和生態,g思 MindSpore 是一種適用于端邊場景的型開源深度學/理框架2 MindSpore 供了好的計和高效的執行,在升數據學家和算法程師的開發體驗,并Ascend AI 處理器供原生支持,硬W2 表表 5454gg思思 MindMindSporeSpore 框架框架 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 37 Table_yemei 電子設備業深度研究電子設備業深度研究 資料來源_官網,東方富證券研究所 g騰 AI 產品包含和理產品,形態多
114、,滿足戶各種需求2 表表 5555gg騰騰計算計算產產品系列品系列 產產品系列品系列 產產品型品型 Atlas A2 系列產品 Atlas 800T A2 服器1Atlas 900 A2 PoD 群基礎單元1Atlas 200T A2 Box16 _構子框 Atlas 系列產品 Atlas 800 服器型90001Atlas 800 服器型90101Atlas 900 PoD型90001Atlas 900T PoD Lite1Atlas 300T t型 90001Atlas 300T Pro t型9000 Atlas 800I A2 理產品 Atlas 800I A2 理服器 Atlas 理系
115、列產品 tAtlas 300I Pro 理t1Atlas 300V 視頻解析t1Atlas 300V Pro 視頻解析t1Atlas 300I Duo 理t 模塊Atlas 200I SoC A1 心板 邊緣服器Atlas 500 Pro 智能邊緣服器支持插入 Atlas 300I Pro 理t1Atlas 300V 視頻解析t1Atlas 300V Pro 視頻解析t使用 中心理服器Atlas 800 理服器型3000或 Atlas 800 理服器型3010支持插入 Atlas 300I Pro 理t1Atlas 300V 視頻解析t1Atlas 300V Pro 視頻解析t1Atlas 3
116、00I Duo 理t使用 Atlas 200I/500 A2 理產品 Atlas 500 A2 智能小站1Atlas 200I DK A2 開發者套1Atlas 200I A2 模塊 Atlas 200/300/500 理產品 Atlas 200 AI 模塊1Atlas 300I 理t型30001Atlas 300I 理t型3010Atlas 500 智能小站1Atlas 200 DK 開發者套 資料來源_官網,東方富證券研究所 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 38 Table_yemei 電子設備業深度研究電子設備業深度研究 群方面,_全聯接大會
117、2023 P,_常董1ICT 基礎施業管理委員會任1 企業BG總裁汪濤l式發a了全架構的g騰AI計算群Atlas 900 SuperCluster,支持超萬億參數的大模型2群采用了全的_河 AI 智算交換機 CloudEngine XH16800,借w高密的 800GE 端口能力,n層交換網s實 2250 節相于 1.8 萬張t超大規模無收斂群網2群時使用了創的超節架構,供高達 200PFLOPSFP16 的算力,大大升了大模型能力2m外,發揮_在計算1網1儲1能源等領域的綜合勢,器1節1群和業全面升系統靠性,將大模型穩定性y升到o2 表表 5656 Atlas 900 SupeAtlas 9
118、00 SuperClusterrCluster 群群 資料來源 _官網,東方富證券研究所 3.3.2.寒o紀AI 芯wY行者,聚焦端算力,拐將 寒o紀p立于 2016,_注于人智能芯w產品的研發P技術創,供邊端一體1硬1理融合1x備統一生態的系列W智能芯w產品和W基礎系統2產品1邊1端=,全鏈路直a局2但是在經了多場開拓和易制裁,n聚焦端產品2 表表 5757寒寒oo紀產紀產品品譜系譜系 資料來源寒o紀官網,東方富證券研究所 寒o紀的 MLU 硬是面U AI 用的領域_用處理器,針 AI 算法的 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 39 Table_ye
119、mei 電子設備業深度研究電子設備業深度研究 計算特性和特性,計了高效的指1流水線1算部和部2P通用處理器相比,MLU 硬在處理 AI 任時p更高的性能1靈活性和能效比2MLU 硬針 AI 中O特的數據流計_用的數據通路和算部,實了O的數據流之間的隔離時U暴露了靈活的wP儲空間問能,高了處理效率2最一 MLUarch03 架構采用一張量算單元,內置 Supercharger 模塊大幅升各類卷效率采用全的多算子硬融合技術,在融合的基礎P大幅減少算子執行時間wP通帶寬是P一 MLUarch02 的 2 倍1wPr緩容量最高是 MLUarch02 的 2.75 倍全 MLUv03 指,更完備,更高效
120、U前兼容2 表表 5858M MLULU 架架構構情況情況 資料來源電子程,IT 之家,東方富證券研究所 寒o紀p自的一套o英_達的p,o CUDA C 的編程語言 BANG C,o CuDNN CuBLAS 的算子 CNNL,o NCCL 的通信 CNCL,o TensorRT 的理引擎 MagicMind,o cuda-gdb 的調試器 cngdb 等等2 表表 5959寒寒oo紀基紀基礎礎系系統統 資料來源寒o紀官網,東方富證券研究所 2023 是人智能大模型大爆發的一2寒o紀持續行大模型的W和適配作,Y開發了 BangTransformer 大模型Va式理引擎,20172017 敬敬請
121、閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 40 Table_yemei 電子設備業深度研究電子設備業深度研究 CNDeepspeed/Megatron-LM 大模型Va式引擎,大模型理P性能預px1V析x精度V析x等大模型相sp,時基于思元370 等系列產品,P LLaMa 系列1BLOOM 系列1GLM 系列1Stable Diffusion1T5,內的百1千象等大模型行了廣泛的適配和驗證,性能_,并支持自然語言處理1視1多模態等多種場景的大模型用2 2024 第O季度營業收入 1.21 億元,比增長 284.59%,顯示業的快擴張態勢,要得益于持續的場拓展力,通過W產品a局1升服
122、量等方式,吸引了更多戶2截O季度p,達到 10.15 億元,較P半p暴增 331.18%,創高,意味著o來場需求p較好預期,l在極備料生產,續業增長做準備2預付款達 8.54 億元,較P半p增長 54%,創高,表明UP游供商單,產業鏈的掌力和資源調配能力較,_體了wo來業發展信心2 表表 6060寒寒oo紀紀/預付款預付款季季度度情況情況萬元萬元 資料來源Choice-深度資料-資產負債表,東方富證券研究所 4 4.投投資建資建 薦 AI 需求升過程中算力芯ww配套產業鏈機會,要包括芯w020040060080010001200(萬元)預付款(萬元)20172017 敬敬請閱讀本請閱讀本報告k
123、報告k文后各文后各項聲明項聲明 41 Table_yemei 電子設備業深度研究電子設備業深度研究 產W1理芯w1自研 ASIC 芯w1Y封裝等V方U,建s注寒o紀1海Z信o1_豐技1生益電子1滬電股份1通富微電1拓荊技1芯源微1V易創等o的2 表表 6161要要s注s注oo的p值的p值比比較較表表截截 2022025 5 1 1 oo 1313 碼碼 AIAI 相s業相s業 值值 億元億元 EPSEPS元元/股股 PEPE倍倍 股股元元 評評 2023A2023A 2024E2024E 2025E2025E 2023A2023A 2024E2024E 2025E2025E 688256.SH
124、 寒o紀-U AI 芯w 3001.51-2.07-1.18-0.07/719.00 o評 688041.SH 海Z信o AI 芯w 3333.10 0.54 0.81 1.15 265.56 176.23 124.55 143.40 o評 688629.SH _豐技 高背板接器 169.88 0.17 0.20 0.46 216.76 180.11 79.61 36.85 o評 688183.SH 生益電子 PCB 319.75-0.03 0.36 0.82/106.60 46.61 38.44 o評 002463.SZ 滬電股份 PCB 779.34 0.79 1.37 1.90 51.1
125、5 29.66 21.38 40.63 增持 002156.SZ 通富微電 Y封裝 412.63 0.11 0.57 0.81 247.18 47.71 33.54 27.19 o評 688072.SH 拓荊技 Y封裝備 401.45 3.54 2.48 3.74 40.75 58.08 38.59 144.24 o評 688037.SH 芯源微 Y封裝備 157.22 1.82 1.20 1.87 42.98 64.96 41.90 78.23 o評 603986.SH V易創 儲 DRAM 782.67 0.24 1.71 2.52 491.04 68.99 46.70 117.85 o評
126、 資料來源Choice-股票數據p器,東方富證券研究所o評預測數據來自 Choice 一預期 5 5.風風險險示示 AI 發展O預期2產業處于發展初期,要依賴大型技企業和家投資,行業發展度緩會大幅影響產業鏈需求和度2 技術n緩2產業依賴于技術n的度,緩會影響pqQ降曲線和產品商業W能力,而導行業整體需求Q滑2 中美摩擦劇2美多次限制中 AI 相s芯ww產業鏈口,限制中企業海外,摩擦和限制一n劇會影響相s行業需求和供給2 20172017 敬敬請閱讀本請閱讀本報告k報告k文后各文后各項聲明項聲明 42 Table_yemei 電子設備業深度研究電子設備業深度研究 東方富證x股份p東方富證x股份p
127、限公限公以Q簡稱本公以Q簡稱本公=xp中國證監會核準xp中國證監會核準的證的證x投資咨詢業資格x投資咨詢業資格 分析師申明分析師申明 作者xp中國證x業作者xp中國證x業會會授予的證x投資咨詢授予的證x投資咨詢執業執業資格或相的_業勝資格或相的_業勝任能任能力,力,保證報告所采用的數保證報告所采用的數據均來據均來自合規自合規渠道,渠道,分析邏輯基分析邏輯基于作者的職業理解,于作者的職業理解,本報本報告清晰準確地映了告清晰準確地映了作者作者的研究點,的研究點,力求獨立1力求獨立1客和客和公k,結論O任何公k,結論O任何第O第O方的授意或影響,特方的授意或影響,特l聲l聲明2明2 投資建議的評級標
128、準投資建議的評級標準 報告中投資建議所涉報告中投資建議所涉及的及的評級分股票評級和評級分股票評級和業業評級評級另p說明的除外另p說明的除外 22評級標準報告發_評級標準報告發_日后日后3 3到到1212個o內的相對場表個o內的相對場表,也即以報告發_日也即以報告發_日后的后的3 3到到1212個o內的公股個o內的公股或業指數相對同或業指數相對同期相期相關證關證x場代表性指數的x場代表性指數的漲跌漲跌幅作基準2幅作基準2w中w中A A股股場以滬深場以滬深300300指數基準指數基準新O板場以O板r新O板場以O板r指指針對針對議轉讓標的議轉讓標的或O板做或O板做指數指數針對做轉讓標針對做轉讓標的的
129、基準基準香香港場以港場以恒生指數基準恒生指數基準美國美國場以標場以標普普500500指數基準2指數基準2 股票評級股票評級 買入相對同期相關買入相對同期相關證x證x場代表性指數漲幅場代表性指數漲幅15%15%以以PP 增持相對同期相關增持相對同期相關證x證x場代表性指數漲幅場代表性指數漲幅介于介于5%5%15%15%之間之間 中性相對同期相關中性相對同期相關證x證x場代表性指數漲幅場代表性指數漲幅介于介于-5%5%5%5%之間之間 減持相對同期相關減持相對同期相關證x證x場代表性指數漲幅場代表性指數漲幅介于介于-15%15%-5%5%之間之間 賣出相對同期相關賣出相對同期相關證x證x場代表性指
130、數跌幅場代表性指數跌幅15%15%以以P2P2 業評級業評級 強于大相對同期強于大相對同期相關相關證x場代表性指數證x場代表性指數漲幅漲幅1 10%0%以P以P 中性相對同期相關中性相對同期相關證x證x場代表性指數漲幅場代表性指數漲幅介于介于-10%10%10%10%之間之間 弱于大相對同期弱于大相對同期相關相關證x場代表性指數證x場代表性指數跌幅跌幅1 10%0%以P2以P2 免聲明免聲明 本研究報告由東方本研究報告由東方富證富證x股份p限公v作x股份p限公v作及在中及在中_人人民民共共和和國國香港香港和澳和澳門門特特別別政政區區11灣灣省除省除外外發_2發_2 本研究報告僅供本公本研究報告
131、僅供本公的的客戶使用2本公O客戶使用2本公O會因會因接收人收到本報告而接收人收到本報告而視w視w本公的然客戶本公的然客戶22 本研究報告是基于本本研究報告是基于本公公認靠的目前已認靠的目前已公開公開的信息撰寫,的信息撰寫,本公力求本公力求但O保證該信息的準但O保證該信息的準確性確性和完整和完整性,性,客戶也O應該認該客戶也O應該認該信息是準確和完整的2信息是準確和完整的2同同時,時,本公O保證文中本公O保證文中點或陳述O會發生任點或陳述O會發生任何何更,更,在在O同時期,O同時期,本公發出本公發出P本報告所載資料1P本報告所載資料1意意及測O一致的報告2及測O一致的報告2本本公會適時更新s們公
132、會適時更新s們的研的研究,究,但但能會因某些規定而能會因某些規定而無法無法做到2做到2除了一些定除了一些定期出x期出x的報告之外,的報告之外,絕大絕大多數研多數研究報告是在分析師認究報告是在分析師認適適的時的時候O定期地發_2候O定期地發_2 在任何情況Q,在任何情況Q,本本報告中報告中的信息或所表述的意的信息或所表述的意并并O構r對任何人的投O構r對任何人的投資建資建議,議,也沒p考慮到也沒p考慮到個別客個別客戶特殊戶特殊的投資目標1的投資目標1狀況或狀況或需需求2求2客戶應考慮客戶應考慮本報告本報告中的任何意或建議中的任何意或建議是否是否符合w特定狀況,符合w特定狀況,若p必若p必要應尋要
133、應尋求_家意2求_家意2本報告所載本報告所載的資料1的資料1工x1工x1意及意及測只提供給客戶作參測只提供給客戶作參考之考之用,用,并非作或被視出并非作或被視出售或購售或購買證x或w他投資標買證x或w他投資標的的的的邀請或向人作出邀請邀請或向人作出邀請22 本報告中提及的投資本報告中提及的投資格格和值以及這些投資和值以及這些投資帶來帶來的收入能會波動的收入能會波動22過去過去的表并O代表未來的表并O代表未來的表的表,未未來的回報也無法保證來的回報也無法保證,投投資者能會損失本金資者能會損失本金22外外匯匯率波動p能對匯匯率波動p能對某些某些投資的值或格或投資的值或格或來自來自這一投這一投資的收
134、入產生O良影資的收入產生O良影響2響2 那些涉及期貨1期權那些涉及期貨1期權及w及w它生工x的交易,它生工x的交易,因w因w包括重大的場風險包括重大的場風險,因,因l并O適合所p投資l并O適合所p投資者2者2 在在任何情況Q,任何情況Q,本本公O公O對任何人因使用本報對任何人因使用本報告中告中的任何內容所引致的的任何內容所引致的任何任何損失負任何任,損失負任何任,投資者投資者需自需自承擔風險2承擔風險2 本報告要以電子x本報告要以電子x形式形式分發,分發,間或也會輔間或也會輔以印w以印w品形式分發,品形式分發,所p所p報告x報告x權均_本公所p權均_本公所p22未經未經本公本公事先書面授權,事先書面授權,任任何機構何機構或個人O得以任何形或個人O得以任何形式復式復v1v1轉發或公開傳轉發或公開傳播本報播本報告的全部或部分內容告的全部或部分內容,OO得將報得將報告內容作訴訟1仲告內容作訴訟1仲裁1裁1傳媒所引用之證明或傳媒所引用之證明或依據依據,O得用于營利或用,O得用于營利或用于未于未經允許的w它用途2經允許的w它用途2 如需引用1如需引用1刊發或刊發或轉載本轉載本報告,報告,需注明出處需注明出處東方東方富證x研究所,富證x研究所,O得O得對本報告進任何p對本報告進任何p悖原悖原意的引意的引用1刪節和修改2用1刪節和修改2