《電子行業深度報告:AI系列深度ChatGPT掀起算力潮芯片及服務器上游投資價值凸顯-230403(28頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業深度報告:AI系列深度ChatGPT掀起算力潮芯片及服務器上游投資價值凸顯-230403(28頁).pdf(28頁珍藏版)》請在三個皮匠報告上搜索。
1、證券研究報告行業深度報告電子 東吳證券研究所東吳證券研究所 1/28 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 電子行業深度報告 AI 系列深度:系列深度:ChatGPT 掀起算力潮,芯片及掀起算力潮,芯片及服務器上游投資價值凸顯服務器上游投資價值凸顯 2023 年年 04 月月 03 日日 證券分析師證券分析師 張良衛張良衛 執業證書:S0600516070001 021-60199793 證券分析師證券分析師 馬天翼馬天翼 執業證書:S0600522090001 證券分析師證券分析師 唐權喜唐權喜 執業證書:S0600522070005 證券分析師證券分析師 周高鼎
2、周高鼎 執業證書:S0600523030003 行業走勢行業走勢 相關研究相關研究 技術創新系列深度-蘋果 MR搭載前沿技術,引領產業風向 2023-03-16 充電樁行業高速增長,上游元器件需求彈性提升 2023-03-10 增持(維持)Table_Tag Table_Summary 投資要點投資要點 ChatGPT 爆火,其能力已接近人類水平爆火,其能力已接近人類水平。GPT 升級至四代,模型能力高速提升。2023 年 3 月 15 日,OpenAI 正式官宣了多模態大模型 GPT-4,ChatGPT4 將輸入內容擴展到 2.5 萬字內的文字和圖像,較 ChatGPT能夠處理更復雜、更細微
3、的問題。最新版的 GPT-4 在 ChatGPT 的 GPT-3.5 基礎上主要提升了語言模型方面的能力,并添加了多模態功能,在不同語言情景和內部對抗性真實性評估的表現都顯著優于 GPT-3.5,在各種專業和學術基準上已經表現出人類水平。以搜索引擎和辦公軟件為支點,下游以搜索引擎和辦公軟件為支點,下游應用應用多點開花。多點開花。OpenAI+傳統搜索引擎=AI 智能搜索引擎。ChatGPT 能生成和理解類人類思維方式與上下文聯系的結果,ChatGPT 都對傳統搜索引擎是一種顛覆式進化。Office方面:OpenAI+辦公軟件,以 Office 全家桶與微軟 Teams premium Chat
4、GPT 為例。ChatGPT+Office 三大件 Word、Excel、PowerPoint 可完成從文字創作到可視化全程服務。ChatGPT 可以根據用戶的描述需求自動撰寫文檔內容,縮短文檔的創作時間;根據已形成文檔內容智能推薦文檔格式、排版等;并根據用戶描述制作個性化 PPT,同時智能生成朗讀語言助力 PPT 演示。算力需求帶動算力需求帶動 AI 服務器需求量服務器需求量上漲。上漲。GPT4 作為大型多模態模型支持圖像和文本的輸入,背后是大語言模型的演進與參數量、訓練數據量的指數級增長。GPT4 頻頻下調提問限制次數傳達算力不足信息,大語言模型的快速迭代催生大量算力需求。滿足算力需求依托
5、疊加 AI 服務器數量與提升服務器算力性能兩種途徑,從而支撐大語言模型發揮預期功效。我們率先提出建立推理我們率先提出建立推理/訓練服務器訓練服務器需求需求測算模型:測算模型:1)考慮大語言模型迭代呈現參數量指數級增長趨勢,GPT-4 參數量為萬億,此基礎上我們測算得出 GPT-4 推理發揮預期功效所需服務器數量為推理發揮預期功效所需服務器數量為 6652 臺臺,百萬億參數基礎上,所需服務器數量將上升至 66 萬臺萬臺;2)根據硅谷披露GPT-4 訓練 Token 數 9 萬億,我們測算得出 GPT-4 訓練所需服務器數訓練所需服務器數量為量為 1391 臺。臺。未來隨著大語言模型不斷迭代、GP
6、T 等語言模型滲透率不斷提高,算力時代下服務器呈現基建化趨勢。AI 服務器核心依托高性能芯片服務器核心依托高性能芯片,國產芯片自主發展,國產芯片自主發展潛力大潛力大。AI 芯片中GPU 憑借并行計算具備強大算力,占據 AI 芯片大部分市場;美企英偉達獨占鰲頭,占據 80%GPU 市場。相比英偉達產品,國產芯片性能存在較大差距,仍處于追趕階。受美實體清單影響,高端芯片采購受阻,倒逼國內服務器廠商大力推進國產替代,利好國產芯片自主發展。投資建議投資建議:我們看好算力芯片及服務器需求劇增下相關零組件的成長空間。CPUGPU 等等:寒武紀、景嘉微、海光信息;存儲存儲:江波龍、聚辰股份;電源芯片電源芯片
7、:晶豐明源、杰華特;封測封測:長電科技、通富微電;PCB及其他及其他:深南電路、滬電股份、鼎通科技、裕太微、瀾起科技、工業富聯 風險提示:風險提示:LLM 模型發展不及預期、行業空間測算不及預期、AI 芯片發展不及預期。-20%-17%-14%-11%-8%-5%-2%1%4%7%10%2022/4/62022/8/42022/12/22023/4/1電子滬深300 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 2/28 內容目錄內容目錄 1.ChatGPT 快速迭代,快速迭代,OpenAI 模型演進,下游應用百花齊放模型演進,下
8、游應用百花齊放.5 1.1.GPT 迭代更新,人工智能掀起科技潮。.5 1.2.OpenAI 模型演進,人工智能向應用拓展.6 1.3.Open AI 賦能下游應用,AI+降本增效.7 2.云服務器優化配置算力資源,是主要算力供給方式云服務器優化配置算力資源,是主要算力供給方式.9 3.ChatGPT 引爆算力需求,拉動高端芯片市場擴張引爆算力需求,拉動高端芯片市場擴張.11 3.1.人工智能架構以 AI 芯片為基.11 3.2.GPT 拉動算力提升,帶動高算力芯片市場量價齊升.13 3.3.構建推理/訓練服務器需求計算模型,測算未來空間廣闊.15 4.算力時代凸顯芯片價值,國產芯片仍處追趕階
9、段算力時代凸顯芯片價值,國產芯片仍處追趕階段.19 4.1.AI 服務器依賴高性能芯片供給.19 4.2.主流芯片限制進口,利好國產化芯片自主發展.22 5.標的梳理及投資建議標的梳理及投資建議.23 6.風險提示風險提示.26 RUgUgVUZlZlYtQmPnPbRdN7NsQnNoMpMjMrRrNfQoOtPaQrQrOwMtOnNvPpNqM 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 3/28 圖表目錄圖表目錄 圖 1:GPT-4 和 GPT-3.5 的考試表現.5 圖 2:OpenAI 網站 12-2 月訪問量.5
10、 圖 3:GPT-4 理解圖片含義.6 圖 4:GPT-4 理解圖表中數據的含義并做進一步計算.6 圖 5:AIGC 相關技術場景及成熟度分類.7 圖 6:Meta AI 的 Make-A-Video 根據文字生成視頻.7 圖 7:Satya 宣布 ChatGPT 加入 Azure OpenAI.8 圖 8:Azure OpenAI 全家桶.8 圖 9:ChatGPT+Bing.8 圖 10:Teams Premium ChatGPT 智能回顧.9 圖 11:Teams Premium 生成任務.9 圖 12:云計算系統.9 圖 13:云計算服務模式.9 圖 14:云計算的 IAAS 與傳統服
11、務器資源配置對比.10 圖 15:全球云計算細分市場規模及增速(單位:億美元).11 圖 16:云計算下游應用(單位:億元).11 圖 17:人工智能 IT 技術棧.11 圖 18:CPU 架構及優缺點.12 圖 19:GPU 架構及優缺點.12 圖 20:GPU、FPGA 和 ASIC 芯片對比.13 圖 21:訓練 Transformers 的算力要求.14 圖 22:模型算力預測.14 圖 23:2020-2027 全球 GPU 市場規模(單位:億美元).14 圖 24:2019-2025 中國 AI 芯片市場規模(單位:億元).14 圖 25:推理及訓練所需服務器計算框架.15 圖 2
12、6:the decoder 報告 GPT-4 模型參數數據.16 圖 27:硅谷猜測 GPT-4 訓練數據 Token 量.16 圖 28:推理所需服務器測算.17 圖 29:推理每秒處理 Token 測算.17 圖 30:訓練所需服務器測算.18 圖 31:每秒訓練 Token 測算.18 圖 32:2021 年中國 AI 服務器市場份額.19 圖 33:2021 年全球 AI 服務器市場份額.19 圖 34:GPU 并行計算架構適配 AI 模型建構.20 圖 35:2021 年 H1 中國 AI 芯片市場占比.20 圖 36:2021-2022Q2 全球獨顯 GPU 市場各產商份額占比.2
13、1 表 1:歷代 GPT 表現情況.5 表 2:英偉達主要 GPU 芯片價格.15 表 3:ChatGPT 所需推理服務器數量計算.16 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 4/28 表 4:每秒處理 token 測算過程.17 表 5:GPT-4 訓練所需服務器數量計算.17 表 6:每秒訓練 token 測算過程.18 表 7:主要 LLM 基本信息表.18 表 8:英偉達個芯片性能指標均為世界領先.21 表 9:海內外 GPU 產品性能對比.22 表 10:美國 BIS對向中國出口的先進計算和半導體制造物項實施新的
14、出口管制.22 表 11:國內服務器 CPU、GPU 芯片廠商業務情況.23 表 12:國內服務器內存和硬盤相關廠商業務情況.24 表 13:國內服務器電源芯片相關廠商業務情況.25 表 14:國內封測相關廠商業務情況.25 表 15:服務器其他相關零部件廠商業務情況.26 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 5/28 1.ChatGPT 快速迭代快速迭代,OpenAI 模型演進,下游應用百花齊放模型演進,下游應用百花齊放 GPT-4 是一個大型的多模態模型,相比上一代 ChatGPT 新增了圖像功能,同時具備更精準的語
15、言理解能力。GPT 的升級背后是 OpenAI 的大語言模型的進一步演進,同時帶動下游應用的拓展,涌現出新一批應用場景。1.1.GPT 迭代更新迭代更新,人工智能掀起科技潮。,人工智能掀起科技潮。GPT 升級至升級至四代,模型能力高速提升。四代,模型能力高速提升。ChatGPT 是由 OpenAI 開發的自然語言生成模型,采用 Transformer 神經網絡架構(又稱 GPT-3.5 架構),基于大量的語料庫使用指示學習和人工反饋的強化學習(RLHF)來指導模型訓練。模型可理解并生成對各種主題的類似人類的響應,是 AIGC 技術進展的成果。2023 年 3 月 15 日,OpenAI 正式官
16、宣了多模態大模型 GPT-4,ChatGPT4 將輸入內容擴展到 2.5 萬字內的文字和圖像,較ChatGPT 能夠處理更復雜、更細微的問題。表表1:歷代歷代 GPT 表現情況表現情況 模型 發布時間 參數量 預訓練數據量 Tokens 學習目標 GPT-1 2018 年 6 月 1.17 億 約 5GB 1.3B 結合無監督學習及有監督的微調 GPT-2 2019 年 2 月 15 億 40GB 15B 學習在無明確監督情況下執行多種任務 GPT-3 2020 年 5 月 1,750 億 45TB 499B 結合少樣本學習和無監督學習 GPT-4 2023 年 3 月 待公布 基于規則的獎勵
17、模型 數據來源:OpenAI,Medium,東吳證券研究所 ChatGPT 提供變革性的用戶體驗,用戶數量飆升提供變革性的用戶體驗,用戶數量飆升。ChatGPT 發布后爆火,僅用 5 天時間用戶量便破百萬,推出 2 個月后用戶量破億,訪問量從 1830 萬增長到 6.72 億,成為史上用戶增長速度最快的消費級應用程序。最新版的 GPT-4 在 ChatGPT 的 GPT-3.5 基礎上主要提升了語言模型方面的能力,并添加了多模態功能,可以接受圖像輸入并理解圖像內容,可接受的文字輸入長度也增加到 3.2 萬 token,在不同語言情景和內部對抗性真實性評估的表現都顯著優于 GPT-3.5,在各種
18、專業和學術基準上已經表現出人類水平,為用戶提供變革性的使用體驗。圖圖1:GPT-4 和和 GPT-3.5 的考試表現的考試表現 圖圖2:OpenAI 網站網站 12-2 月訪問量月訪問量 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 6/28 數據來源:OpenAI,東吳證券研究所 數據來源:Similarweb、東吳證券研究所 ChatGPT 帶動帶動 AI 潮流,多種相關產品推出潮流,多種相關產品推出。辦公領域,微軟將 GPT-4 整合到 Office應用程序,Teams Premium 中接入 Chat GPT 提供人工智能
19、生成章節和字幕實時翻譯等功能;編程領域中,Viva Sales 將利用 ChatGPT 為電子郵件中客戶問題生成回復建議,Stripe 使用 GPT-4 掃描商業網站并向客戶支持人員提供摘要;軟件領域,Duolingo 將 GPT-4 構建到新的語言學習訂閱層中,國內百度“文心一言”也正式推出,AI 的潮流開的潮流開始遍布國內外多行業。始遍布國內外多行業。1.2.OpenAI 模型模型演進演進,人工智能,人工智能向應用拓展向應用拓展 OpenAI 模型可以完成絕大多數文本和圖像任務,具有成熟的生產力。模型可以完成絕大多數文本和圖像任務,具有成熟的生產力。根據 OpenAI的官方介紹,GPT-4
20、可以接受文本和圖像的信息,并允許用戶指定任何圖像或語言任務,處理超過 25000 個單詞的文本。除了在各種標準考試和不同語言情景下都有突出的表現外,在圖像的處理分析上,GPT-4 能夠直接閱讀并分析帶有圖片的論文,承擔文本、音頻、圖像的生成和編輯任務,并能與用戶一起迭代創意和技術寫作任務,例如創作歌曲、編寫劇本或學習用戶的寫作風格等。圖圖3:GPT-4 理解理解圖片圖片含義含義 圖圖4:GPT-4 理解圖表中數據的含義并做進一步計算理解圖表中數據的含義并做進一步計算 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 7/28 數據來源
21、:OpenAI,東吳證券研究所 數據來源:OpenAI,東吳證券研究所 AIGC 發展改革生產力,已具備多領域應用能力發展改革生產力,已具備多領域應用能力。AIGC 可以利用大量無標注數據進行自監督學習再利用少量的標注數據進行遷移學習,能夠持續生成規模大、質量高、單位成本低的內容,在生產力上具有革命性的增長。在應用方面,按場景分類 AIGC 已經較為成熟地應用于文本和代碼撰寫、圖像識別和生成,在影視、傳媒、電商、C 端娛樂領域規模應用,未來將逐步拓展到視頻和游戲等其他領域,為各個行業和領域的創新和發展提供更多可能性。圖圖5:AIGC 相關技術場景及成熟度分類相關技術場景及成熟度分類 圖圖6:M
22、eta AI 的的 Make-A-Video 根據文字生成視頻根據文字生成視頻 數據來源:量子位,東吳證券研究所 數據來源:OpenAI,東吳證券研究所 1.3.Open AI 賦能賦能下游下游應用,應用,AI+降本增效降本增效 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 8/28 以以 Azure OpenAI 為例為例:AI 技術模型技術模型全覆蓋全覆蓋。AI 技術模型全家桶,包含 GPT4.0 以及后續版本、DALL-E2、Codex、Embeddings 神經網絡、VALL-E、認知學習成長、機器學習等,可實現 4 種用
23、途:1)企業及客戶可利用 Azure OpenAI 全家桶構建自己的大型預訓練 AI 模型;2)利用全家桶對 AI 模型進行數據和參數的微調與提升;3)通過內置全家桶檢測錯誤與潛在風險;4)利用全家桶實現角色訪問控制和企業級云安全合規。圖圖7:Satya 宣布宣布 ChatGPT 加入加入 Azure OpenAI 圖圖8:Azure OpenAI 全家桶全家桶 數據來源:Twitter,東吳證券研究所 數據來源:OpenAI,東吳證券研究所 OpenAI+傳統搜索引擎傳統搜索引擎=AI 智能搜索引擎智能搜索引擎。ChatGPT 能生成和理解類人類思維方式與上下文聯系的結果,而傳統的搜索引擎只
24、是給出網頁的鏈接,需要用戶自己閱讀、點擊和判定。無論是知識的獲取效率、回答問題的深度,還是交互的延展性,ChatGPT 都對傳統搜索引擎是一種顛覆式進化。圖圖9:ChatGPT+Bing 數據來源:Bing,東吳證券研究所 OpenAI+辦公軟件辦公軟件,以,以 Office 全家桶與微軟全家桶與微軟 Teams premium ChatGPT 為例為例。ChatGPT+Office 三大件 Word、Excel、PowerPoint 可完成從文字創作到可視化全程服務。ChatGPT 可以根據用戶的描述需求自動撰寫文檔內容,縮短文檔的創作時間;根據已形成文檔內容智能推薦文檔格式、排版等;并根據
25、用戶描述制作個性化 PPT,同時智能生成朗讀語言助力 PPT 演示。Teams Premium ChatGPT 同樣具有多樣智能服務:1)自動 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 9/28 提供實時翻譯;2)自動生成文本型會議紀要;3)自動記錄發言人員對話和內容;4)根據討論上下文自動生成任務等。圖圖10:Teams Premium ChatGPT 智能回顧智能回顧 圖圖11:Teams Premium 生成任務生成任務 數據來源:O365,東吳證券研究所 數據來源:O365,東吳證券研究所 2.云服務器優化配置算力資源
26、云服務器優化配置算力資源,是主要算力供給方式是主要算力供給方式 云計算屬于分布式計算,滿足云計算屬于分布式計算,滿足各類各類算力需求。算力需求。云計算可以通過網絡“云”將所運行的巨大的數據計算處理程序分解成無數個小程序,再交由計算資源共享池進行搜尋、計算及分析后,將處理結果回傳給用戶,通過這種方式可以實現隨時隨地、便捷地、隨需應變地從可配置計算資源共享池中獲取所需的資源與架構,包括存儲、數據庫、服務器、應用軟件及網絡等,靈活調配計算機相關算力存儲資源。圖圖12:云計算系統云計算系統 圖圖13:云計算服務模式云計算服務模式 數據來源:Wiki,東吳證券研究所 數據來源:CSDN,東吳證券研究所
27、AI 語言模型擴大算力需求,云計算進一步發揮資源優化配置功效。面對 AI 的需求提升,云計算可帶來 4 個方面的提升:1.資源共享和優化:資源共享和優化:云計算允許多個用戶共享同一臺服務器或一組服務器的計算資源。這意味著,與每個用戶都擁有自己的獨立服務器相比,云計算可以通過提高資源利云計算可以通過提高資源利 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 10/28 用率來減少服務器的總數量。用率來減少服務器的總數量。2.彈性可伸縮:彈性可伸縮:云計算服務提供了高度的彈性和可伸縮性,使得用戶可以根據實際需求調整所需的計算資源。在計算
28、需求降低時,用戶可以減少資源使用,從而減少服務器的數量。而在計算需求增加時,用戶可以快速擴展資源,而無需購買新的服務器。3.成本效益:成本效益:云計算通常采用按需付費的模式,用戶只需支付實際使用的計算資源。這種支付模式降低了用戶購買和維護服務器的成本,使得更多企業傾向于使用云計算服務而不是購買自己的服務器。4.更快的創新和部署更快的創新和部署:云計算使得企業能夠更快地開發和部署新的應用程序和服務。這減少了對于購買、配置和維護自有服務器的需求,從而抑制了服務器數量的增長 云計算為云計算為 AI 提供算力支持,實現降本增效。提供算力支持,實現降本增效。由于 ChatGPT 等一系列大規模模型對算力
29、要求較高,廠商自建足夠算力的數據中心需要耗費巨大的成本以及昂貴的后續運維成本,而云計算服務可以有效節省早期支出,并且大規模的算力集群還具有集群優勢以提升計算性能。OpenAI 的 ChatGPT 和其他關鍵 AI 產品依賴于微軟 Azure 云計算服務,通過 Azure 的 HPC、彈性、數據存儲和計算服務來完成模型計算和算法調試,沒有云計算,ChatGPT 的訓練時間將被一再拉長,運用云計算后 GPT-3 等模型的訓練成本下降了80%以上,從首次訓練開銷 1200 萬美元降至 140 萬美元。圖圖14:云計算的云計算的 IAAS 與傳統服務器資源配置對比與傳統服務器資源配置對比 數據來源:頭
30、豹研究院,東吳證券研究所 云算力市場規模持續擴大,下游應用滲透提升。云算力市場規模持續擴大,下游應用滲透提升。云算力市場根據 Gartner 統計,2021 年以 IaaS、PaaS、SaaS 為代表的全球公有云市場規模達到 3307 億美元,增速達 32.5%。其中,IaaS、PaaS、SaaS 市場規模分別同比增長 42.7%、39.3%、23.6%至 916 億美元、869 億美元、1522 億美元。2021 年亞馬遜、微軟、阿里云為全球 IaaS 前三廠商,占據69.54%市場份額,國內廠商阿里云、華為云、騰訊三家合計占全球 17%的市場份額。目前國內游戲、視頻、電商和金融是主要應用領
31、域,醫療、傳統工業和政務領域滲透率逐 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 11/28 步增加。圖圖15:全球云計算細分市場規模及增速全球云計算細分市場規模及增速(單位:億美元)(單位:億美元)圖圖16:云計算下游應用云計算下游應用(單位:單位:億元)億元)數據來源:信通院,東吳證券研究所 數據來源:灼識咨詢,東吳證券研究所 AI 與云計算結合,提升大數據分析計算能力。與云計算結合,提升大數據分析計算能力。AI 與云計算結合有助于通過自動化冗余活動、識別、排序和索引各種類型的數據、管理云中的數據事務、識別整個云存儲基礎設施
32、中的任何故障,幫助改善數據管理,優化管理流程。例如阿里云推出的飛天智算平臺提供公共云和專有云兩種模式,為各類科研和智能企業機構提供強大的智能計算服務,可將計算資源利用率提高 3 倍以上,AI 訓練效率提升 11 倍,推理效率提升 6 倍。云計算的本質是將計算資源進行集中管理和調度,從而滿足不同用戶的需求,而這些計算資源的核心就是服務器服務器。因此,隨著云計算需求的提升,服務器數量的提升也是必然的趨勢。AI 為云計算所帶來的巨大計算量,將直接帶動服務器數量的提升。3.ChatGPT 引爆算力需求,引爆算力需求,拉動拉動高端芯片市場擴張高端芯片市場擴張 3.1.人工智能架構人工智能架構以以 AI
33、芯片為基芯片為基 人工智能人工智能 IT 技術棧分為四層架構,算力是基礎。技術棧分為四層架構,算力是基礎。人工智能架構由芯片層、框架層、模型層和應用層四層架構組成。其中,芯片層主要是指人工智能芯片,為整個架構提供算力基礎支撐;框架層主要包括深度學習訓練和推理框架平臺和數據平臺等;模型層主要是自然語言處理(NLP)、計算機視覺(CV)、音視頻、多模態等各種大模型;應用層則是面向各種應用場景的人工智能專業服務。下游應用體驗的升級需要大模型不斷調優迭代,在深度學習框架內進行大規模模型的訓練和推理,每一次都對芯片提供的算力基礎提出要求,AI 芯片決定了平臺的基礎架構和發展生態。圖圖17:人工智能人工智
34、能 IT 技術棧技術棧 0.00%5.00%10.00%15.00%20.00%25.00%30.00%35.00%050010001500200025003000350020172018201920202021SaaSPaaSIaaS增速0.00%10.00%20.00%30.00%40.00%50.00%60.00%050100150200250300350400游戲電商醫療工業制造業20182023EGAGR 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 12/28 數據來源:甲子光年智庫,東吳證券研究所 AI 芯片主要有芯
35、片主要有 CPU、GPU、FPGA 及及 ASIC,以,以 GPU 為主的并行計算為為主的并行計算為 AI 提供提供了主要生產力了主要生產力 1)CPU(中央處理器)擅長邏輯控制,用于推理及預測。(中央處理器)擅長邏輯控制,用于推理及預測。CPU 主要由 ALU(算術邏輯單元)、CU(控制單元)與 Cache(臨時指令存儲器)構成。其中,ALU 由And Gate(與門)和Or Gate(或門)構成的算術邏輯單元,主要功能是進行二位元的算術運算,約占 CPU 空間 20%;CU 則負責程序的流程管理。CPU 的執行周期是從內存中提取第一條指令、解碼并決定其類型和操作數,執行,然后再提取、解碼執
36、行后續的指令,重復循環直到程序運行完畢。CPU 具備強大的調度、管理與協調能力,但受限于單行運算導致算力較低。2)GPU 圖形處理器,并行計算滿足強大算力需求。圖形處理器,并行計算滿足強大算力需求。在結構方面,與 CPU 相比,GPU 中同樣具備 ALU 與 CU 等架構,但 ALU 數量與體積占比更多,且采用數量眾多采用數量眾多的計算單元和超長流水線,的計算單元和超長流水線,具備高并行結構,通過多核并行計算支撐大算力需求具備高并行結構,通過多核并行計算支撐大算力需求,且擁有更高浮點運算能力,在處理圖形數據和復雜算法方面擁有比 CPU 更高的效率,滿足深度學習領域海量數據運算的需求。但 GPU
37、 管理控制能力弱,無法單獨工作,需由 CPU進行控制調用。圖圖18:CPU 架構及優缺點架構及優缺點 圖圖19:GPU 架構及優缺點架構及優缺點 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 13/28 數據來源:東吳證券研究所繪制 數據來源:東吳證券研究所繪制 3)FPGA 半定制化芯片,無限次編程支持高靈活性。半定制化芯片,無限次編程支持高靈活性。FPGA 稱為現場可編程門陣列,基本結構包括可編程輸入輸出單元和可配置邏輯塊等?;谄浣Y構,用戶可根據自身的需求進行重復編程重組電路,具有高度實時性和靈活性,可以同時進行數據并行和具
38、有高度實時性和靈活性,可以同時進行數據并行和任務并行計算任務并行計算,在處理特定應用時有更加明顯的效率提升,可以實現底層硬件控制操作技術,為算法的功能實現和優化留出了更大空間。4)ASIC 全定制化芯片,高速處理速度疊加低功耗表現全定制化芯片,高速處理速度疊加低功耗表現。ASIC 是為專門目的為設計的集成電路,為實現特定要求而定制的專用 AI 芯片,能夠在特定功能上進行強化,在特定功能上進行強化,具有更高處理速度與更低能耗具有更高處理速度與更低能耗。缺點是研發成本高、前期研發投入周期長,且由于定制化屬性,可復制性一般,缺乏一定靈活性。深度學習算法穩定后,AI 芯片可采用 ASIC設計方法進行全
39、定制,使性能、功耗和面積等指標面向深度學習算法做到最優。圖圖20:GPU、FPGA 和和 ASIC 芯片對比芯片對比 數據來源:艾瑞咨詢,東吳證券研究所整理 3.2.GPT 拉動算力提升,拉動算力提升,帶動高算力芯片市場帶動高算力芯片市場量價齊升量價齊升 ChatGPT 數據量擴張,算力需求持續增加。數據量擴張,算力需求持續增加。歷代 GPT 的參數量呈現指數級增長,ChatGPT 的總算力消耗約為 3640PF-days(每秒計算一千萬億次,需要計算 3640 天);GPT-4 在 ChatGPT 的基礎上增加了圖像、視頻等交互信息類型,內容容量擴大到 2.5 萬字,請務必閱讀正文之后的免責
40、聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 14/28 所需的算力規模遠大于單純的文字交互。OpenAI 首席執行官 Sam Altman 接受公開采訪表示,GTP-5 在 2024 年底至 2025 年發布,它的參數量為 GTP-3 的 100 倍,需要的計算量為 GTP-3 的 200-400 倍。隨著 ChatGPT 的用戶和應用范圍的持續擴大,數據處理的壓力增大,將提出龐大的算力需求。圖圖21:訓練訓練 Transformers 的的算力算力要求要求 圖圖22:模型算力預測模型算力預測 數據來源:英偉達官網,東吳證券研究所 數據來源:Natur
41、e,東吳證券研究所 算力需求帶動算力需求帶動高算力芯片高算力芯片市場,市場,AI 芯片市場規模持續擴張芯片市場規模持續擴張。機器所產生的數據量在 2018 年首次超越人類所創造的數據量,從 2019 年,每年幾乎以倍數的幅度來增加,從 2020 年到 2025 年,全球數據增量將達到 157Zetabytes,5 年 GAGR 高達 89%。龐大的數據增量,必須運用各種具備高速運算的人工智能芯片來過濾、處理分析、訓練及推理,這將持續帶動 AI 芯片,尤其是高算力芯片需求。根據華經產業研究院發布的 2021-2026 年中國 GPU 行業發展監測及投資戰略規劃研究報告,2020 年全球 GPU
42、行業市場規模達 254.1 億美元,預計 2027 年將達到 1853.1 億美元,復合年均增長率 32.82%,GPU市場保持高速增長態勢。同時根據億歐智庫預測,2025 年我國 AI 芯片市場規模將達到1780 億元,2019-2025GAGR 可達 42.9%。圖圖23:2020-2027 全球全球 GPU 市場市場規模規模(單位:億美元)(單位:億美元)圖圖24:2019-2025 中國中國 AI 芯片市場規模芯片市場規模(單位:億元)(單位:億元)254.1337.5448.3595.4790.81050.313951853.10200400600800100012001400160
43、01800200020202021E 2022E 2023E 2024E 2025E 2026E 2027E123.7190.6426.8850.21038.81405.9178002004006008001000120014001600180020002019202020212022E2023E2024E2025E 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 15/28 數據來源:Verified Market Research,東吳證券研究所 數據來源:億歐智庫,東吳證券研究所 AI 風潮席卷,芯片價值量有望提升。風潮席卷,
44、芯片價值量有望提升。AI 技術的蓬勃發展和廣泛應用,導致對高性能計算能力的需求空前旺盛。AI 芯片作為行業的核心組件,其價格也隨之攀升,成為科技產業的新增長點。隨著 AI 模型復雜度的增加和參數量的指數級擴張,對計算能力的要求不斷提高。例如預計在 2024 年底至 2025 年發布的 GPT-5,其參數量將是 GPT-3 的100 倍,所需算力為 GPT-3 的 200-400 倍。由于高性能 AI 芯片在滿足這種日益增長的算力需求方面具有不可替代的作用,算力快速增長需求下,芯片供給的不確定性有望提升芯片價格提升。3.3.構建推理構建推理/訓練服務器需求計算模型,測算未來空間廣闊訓練服務器需求
45、計算模型,測算未來空間廣闊 算力算力緊缺緊缺,ChatGPT 頻繁下調提問限制次數頻繁下調提問限制次數。鑒于使用人數過多,GPT-4 提問上限次數先后從每 4 小時的使用上限從 100 次下調到 50 次,近日 ChatGPT Plus 又一次將GPT-4 提問次數下調至每 3 小時 25 次,同時預告再會繼續下調提問次數。GPT-4 發揮預期效果需服務器數量與發揮預期效果需服務器數量與芯片芯片所提供所提供算力算力支撐支撐。GPT4 推理與運算發揮預期能力所需服務器數量主要依賴于 2 個核心變量,模型參數與訓練模型參數與訓練/推理推理 Token 量量,不考慮GPT4當前回答次數限制與圖像處理
46、功能,在峰值容納一切原則下,計算框架大致如下:推理所需服務器=每秒處理峰值 Token 所需 FLOPS/(一臺服務器提供的 FLOPS*推理下 FLOPS 利用率);訓練所需服務器=規定時長內訓練完所有 Token 所需 FLOPS/(一臺服務器提供的FLOPS*訓練過程 FLOPS 利用率)圖圖25:推理及推理及訓練訓練所需服務器計算框架所需服務器計算框架 表表2:英偉達主要英偉達主要 GPU 芯片價格芯片價格 產品產品 單價(萬元)單價(萬元)產品產品 單價(萬元)單價(萬元)英偉達 V100 16G 3.9 英偉達 A100 40G 6.4 英偉達 V100 32G 英偉達 A800
47、80G 6.2 8.3 英偉達 A100 80G 英偉達 H100 PCle 10.4 25.2 數據來源:Thinkmate,東吳證券研究所 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 16/28 數據來源:東吳證券研究所整理 OpenAI 官方尚未完全公開 GPT4 數據,根據 the Decoder 報告,此次 GPT-4 是模型參數數量為 1 萬億萬億(GPT3 參數為 1750 億);據硅谷猜測,GPT-4 用于訓練數據量為 9萬億萬億 Token。圖圖26:the decoder 報告報告 GPT-4 模型參數數據模
48、型參數數據 圖圖27:硅谷猜測硅谷猜測 GPT-4 訓練數據訓練數據 Token 量量 數據來源:the Decoder,東吳證券研究所 數據來源:Twitter,東吳證券研究所 基于基于英偉達英偉達 A100 進行測算,進行測算,GPT4 發揮預期能力下推理過程所需服務器數量約為發揮預期能力下推理過程所需服務器數量約為6652 臺臺。我們通過單個模型參數單個 token 所需要的 FLOP 次數、模型參數、每秒處理token 數量、服務器所需 GPU 數量(按照 DGX A100 進行測算)、單個 GPU 峰值 FLOP次數以及利用率為 21.6%進行測算,得到推理所需服務器結果。表表3:C
49、hatGPT 所需所需推理推理服務器數量計算服務器數量計算 單個模型參數、單個 Token 需要的 FLOPs*模型參數*每秒處理每秒處理token*單個服務器GPU 數量/單個 GPU FLOPS/FLOPS 利用率/推理推理所需服務所需服務器數量器數量 2 1E+12 1,768,261 8 3.12E+14 21.3%6652 臺臺*OpenAI 論文給出:Transformer 模型推理過程中每 token 計算所需 FLOPs 為 2N,N 為參數數量;*據 the Decoder 報告,GPT-4 模型參數數量為 1 萬億;*一臺英偉達 DGX A100 搭載 8 片 GPU;請務
50、必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 17/28*根據英偉達官網信息:每顆 A100GPU 提供峰值 312 TFLOPS FP16/FP32 混合精度吞吐量。由于 FP16 的開銷較低,混合精度既支持 FLOPS 吞吐量較高,而維持精確結果要求的數值穩定性將是恒定的;*假定模型的訓練 FLOPS 利用率為 21.3%,與訓練期間的 GPT-3 保持一致 數據來源:OpenAI、英偉達、東吳證券研究所測算 其中關鍵假設為每秒處理其中關鍵假設為每秒處理 token 數量數量,其測算過程主要為每日提問人數*每人提問數量*每個問題回
51、答字數,同時按照中英文翻譯比重 1.6:1 為基準,在每個單詞 token 為1.3 前提下計算,得到每秒處理 177 萬 token。且當前數據建立在 GPT4 提問次數受限的現實條件與 OpenAI 網站 2 月份日活數據下,等待GPT4發揮預期功能,開放圖像處理能力,日活、提問數量、回答字數等假設量將迅速增長,所需服務器仍存在增長空間。表表4:每秒處理每秒處理 token 測算過程測算過程 每日提問人數*每人提問數量*每個問題+回答中文字數*中翻英比/每單詞 token*每日秒數/每秒處理 token 36,666,667 10 500 1.6 1.33 86400 1,768,261*
52、根據 Similarweb 統計,OpenAI 網站 2 月總訪問量達 1.1B,平均每天訪問量 36,666,667;*假設每人單日提問為 10 次;*假設每輪問答共生成 500 字;*在一般的中英翻譯文檔中,中文文檔的字數與英文文檔單詞數比例在 1.6:1 左右;*ChatGPT 的 GPT3.5 模型推理的價格約為 0.02 美元/750 個單詞,其中每 1000token 約等于 750 個單詞,即每單詞對應 1.33Token 數據來源:Similarweb,東吳證券研究所測算 圖圖28:推理所需服務器測算推理所需服務器測算 圖圖29:推理每秒處理推理每秒處理 Token 測算測算
53、數據來源:東吳證券研究所整理 數據來源:東吳證券研究所整理 在在 6 個月訓練時間假設下個月訓練時間假設下 GPT4 訓練需要服務器數量為訓練需要服務器數量為 1391 臺臺。同樣根據通過單個模型單 token 所需要的 FLOP 次數、模型參數、每秒處理 token 數量、服務器所需 GPU數量(按照 DGX A100 進行測算)、單個 GPU 峰值 FLOP 次數以及利用率為 46.2%進行測算,得到推理結果。表表5:GPT-4 訓練所需服務器數量計算訓練所需服務器數量計算 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 18/
54、28 單個模型參數、單個 Token 需要的 FLOPs*模型參數*每秒每秒訓練訓練token*單個服務器GPU 數量/單個 GPU FLOPS/FLOPS 利用率/訓練所需服務訓練所需服務器數量器數量 6 1E+12 578704 8 3.12E+14 46.2%1391 臺臺*OpenAI 論文中給出:Transformer 模型推理過程中每 token 的計算 FLOPs 約為 6N,其中 N 為參數數量;*假定模型的訓練 FLOPS 利用率為 46.2%,與在 TPUv4 芯片上進行訓練的 PaLM 模型一致 數據來源:OpenAI、東吳證券研究所測算 測算過程關鍵量仍在每秒訓練測算過
55、程關鍵量仍在每秒訓練 Token 量量,這取決于訓練時間這取決于訓練時間。OpenAI 在 6 至 8 個月之前就開始訓練 GPT-4,在總數 9 萬億 Token 量+6 個月訓練時間假設下,平均每秒訓每秒訓練量練量為為 578,704Token。根據一臺服務器每秒提供的 FLOPS 得出訓練所需服務器數量。表表6:每秒訓練每秒訓練 token 測算過程測算過程 總訓練 Token 量*訓練天數/每日秒數/每單詞 token*每秒處理每秒處理 Token 9E+12 180 86400 1.33 578,704*硅谷稱 GPT4 訓練 Token 量在 5-9 萬億間,假設為 9 萬億;*O
56、penAI 公司自 6-8 月前已開始訓練 GPT4,即訓練天數 30*6=180 天 數據來源:OpenAI、東吳證券研究所測算 圖圖30:訓練所需服務器測算訓練所需服務器測算 圖圖31:每秒訓練每秒訓練 Token 測算測算 數據來源:東吳證券研究所整理 數據來源:東吳證券研究所整理 未來大規模參數模型未來大規模參數模型持續疊加持續疊加算力需求,算力供需缺口亟待高性能芯片算力需求,算力供需缺口亟待高性能芯片補充。補充??紤]過去 5 年中模型參數呈指數增長,LLM(大語言模型)每次迭代都意味著模型訓練量與推理量的指數級增長。隨著算力時代到來,未來對服務器數量與芯片算力均存在巨大需求,市場空間
57、難以探底。表表7:主要主要 LLM 基本信息表基本信息表 模型名稱模型名稱 發布時間發布時間 發布機構發布機構 語言語言 參數規模參數規模 Tokens 規模規模 模型結構模型結構 是否開源是否開源 T5 2019.10 Google 英 13B T5-style GPT-3 2020.05 OpenAI 英 175B 300B GPT-style 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 19/28 LaMDA 2021.05 Google 英 137B 2.8T GPT-style Jurassic 2021.08 AI2
58、1 英 178B 300B GPT-style MT-NLG 2021.10 Microsoft-NVIDIA 中 530B 270B GPT-style ERNIE 3.0 Titan 2021.12 Baidu 中 260B 300B Multi-task Gopher 2021.12 DeepMind 英 280B 300B GPT-style Chinchilla 2022.04 DeepMind 英 70B 1.4T GPT-style PaLM 2022.04 Google 多語言 540B 780B GPT-style OPT 2022.05 Meta 英 125M-175B 1
59、80B GPT-style BLOOM 2022.07 BigScience 多語言 176B 366B GPT-style GLM-130B 2022.08 Tsinghua 中、英 130B 400B GPT-style LLaMA 2023.02 Meta 多語言 7B-65B 1.4T GLM-style GPT-4 2023.03 OpenAI 多語言 1-100T 5-9T GPT-style 數據來源:arXiv,OpenAI,東吳證券研究所 4.算力時代凸顯芯片價值算力時代凸顯芯片價值,國產芯片仍處追趕階段國產芯片仍處追趕階段 4.1.AI 服務器依賴高性能芯片供給服務器依賴高
60、性能芯片供給 算力時代依托算力時代依托 AI 服務器,浪潮信息服務器服務器,浪潮信息服務器蟬聯國內第一。蟬聯國內第一。根據 IDC 最新發布的 中國加速計算市場(2021 年下半年)跟蹤報告,2021 全年浪潮信息 AI 服務器中國市場占有率達 52.4%。自 2017 年以來,浪潮信息已連續 5 年保持中國 AI 服務器市場份額超過 50%,全球范圍內,人工智能服務器市場規模達 156 億美元,約合人民幣 1006 億元,而浪潮信息市場占有率達 20.9%,保持全球市場第一。圖圖32:2021 年中國年中國 AI 服務器市場份額服務器市場份額 圖圖33:2021 年全球年全球 AI 服務器市
61、場份額服務器市場份額 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 20/28 數據來源:IDC,東吳證券研究所 數據來源:IDC,東吳證券研究所 AI 服務器核心服務器核心在于高性能芯在于高性能芯片片。參數規模、訓練數據隨著模型多模態發展呈現量級增長,而消化、處理數據的能力,即算力,才是制約模型發揮與其能力的關鍵因素。在滿足算力的最終訴求下,相較于大量疊加服務器臺數,提升算力芯片性能同樣不可或缺。以英偉達 GPU 芯片 H100SXM 為例,FP16 Tensor Core 算力為 1979TFLOPS,一臺搭載 8 片 H10
62、0SXM 的服務器算力是之前所假設的 GPUA100 服務器 50 倍倍。GPU 占據占據 AI 芯片大類市場,全球應用最為廣泛芯片大類市場,全球應用最為廣泛。AI 芯片在不同領域對于指標的需求不同。訓練過程中,GPU 由于具備并行計算高度適配神經網絡,支持高速解決巨額工作量;推理過程中僅稀疏結構支持一項便能帶來 2 倍性能提升。由于 GPU 可兼容訓練和推理,高度適配 AI 模型構建,在全球 AI 芯片中應用最為廣泛。2021 年中國 AI 芯片市場中,GPU 占比達到 91.9%。據 IDC 數據,預計到 2025 年 GPU 仍將占據 AI 芯片8 成市場份額。圖圖34:GPU 并行計算
63、架構適配并行計算架構適配 AI 模型建構模型建構 圖圖35:2021 年年 H1 中國中國 AI 芯片市場占比芯片市場占比 數據來源:英偉達官網,東吳證券研究所 數據來源:中商情報局、東吳證券研究所 20.9%13.0%9.2%5.8%4.1%4.0%2.9%2.4%1.0%0%5%10%15%20%25%浪潮信息公司1公司2公司3公司4公司5公司6公司7公司8 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 21/28 英偉達英偉達主主要要 GPU 產品技術指標表現領先產品技術指標表現領先,是,是全球全球 GPU 算力芯片算力芯片
64、龍頭。龍頭。英偉達的GPGPU 目前在全球應用最為廣泛,其 GPU 產品的典型代表 V100、A100、H100GPU 分別采用 Volta、Ampere、Hopper 架構。A100GPU,INT8 算力達 624TOPS;H100GPU,INT8 算力達到 1513TOPS。此外,2006 年英偉達發布的 CUDA 平臺是現今全球應用最為廣泛的 AI 開發生態系統。通用 GPU 與 CUDA 生態系統奠定英偉達引領 AI 芯片的根基。當前全球主流深度學習框架均使用 CUDA 平臺,2021-2022 年全球獨立 GPU 市場中英偉達份額基本維持在在 80%左右。表表8:英偉達個芯片性能指標
65、均為世界領先英偉達個芯片性能指標均為世界領先 性能參數 英偉達H100SXM 英偉達H100PCle 英偉達A10080GBPCle 英偉達V100PCle AMD InstinctMI250X FP64 34TFLOPS 26TFLOPS 9.7TFLOPS 7TFLPOPS 47.9TFLPOPS FP32 67TFLOPS 51TFLOPS 19.5TFLOPS 14TFLPOPS 47.9TFLPOPS FP16 Tensor Core 1979TFLOPS 1513TFLOPS 624 TFLOPS/INT8 3958TOPS 3026TOPS 1248TOPS 62TOPS 383
66、TOPS Tensor Core GPU 顯存 80GB 80GB 80GBHBM2 16GBHBM2 128GB GPU 顯存帶寬 3.35TB/s 2TB/s 1935GB/s 900GB/s 3276.8GB/s 最大熱設計功率 高達 700w 300-350w 300W 300W 500W|-560W 制程工藝 TSMC 4nm FinFET TSMC 4nm FinFET TSMC 7nm FinFET TSMC 12nm FinFET TSMC 6nm FinFET 數據來源:英偉達官網,AMD 官網,東吳證券研究所 注:TOPS(tera Operations Per Secon
67、d)、TFLOPS(Floating-point Operations Per Second)分別代表芯片每秒進行多少萬億次定點運算和浮點運算,算力越高,運算速度越快,性能越強。圖圖36:2021-2022Q2 全球獨顯全球獨顯 GPU 市場各產商份額占比市場各產商份額占比 數據來源:Verified Market Research,東吳證券研究所 81%80%83%81%75%79%1%1%19%20%17%19%24%20%0%10%20%30%40%50%60%70%80%90%100%2021Q12021Q22021Q32021Q42022Q12022Q2AMDINTELNVIDIA
68、請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 22/28 服務器同樣依賴芯片供給,把握芯片才能把握算力時代服務器同樣依賴芯片供給,把握芯片才能把握算力時代。Counterpoint 發布的報告顯示,2022 年服務器 CPU 的市場份額中,英特爾占超七成,位列第一,AMD 拿下約兩成,排名第二,兩家美企聯手占據 9 成市場,而浪潮信息需要的 AI 服務器芯片也來自美企英偉達。盡管自 2019 年起,浪潮信息前五大供應商的名字均隱去,但歷史數據顯示,英特爾仍穩坐最大供應商之席。上游芯片高度依賴外部企業成為浪潮信息發展的關鍵制約因素,
69、尤其在美國商務部 3 月份將浪潮列入實體清單后,上游芯片進行國產替代顯得更為緊迫。算力時代背景下,自主掌握高端芯片技術成為兵家必爭之地。4.2.主流芯片限制進口主流芯片限制進口,利好利好國產化國產化芯片自主發展芯片自主發展 海外龍頭海外龍頭壟斷壟斷高端芯片高端芯片技術技術,國產芯片仍處追趕階段。,國產芯片仍處追趕階段。以 GPU 細分賽道來看,目前國內自研 GPU 的領軍企業主要是寒武紀、景嘉微、華為昇騰等,其中成立最早的是景嘉微,主打產品有 JH920 獨立顯卡。行業內專家稱,從產品參數來看,景嘉微的 JH 920 的性能與英偉達在 2016 年發布的 GTX 1050 相仿,雖然僅相差 6
70、 年,但考慮到模型與算力發展之迅速,整體而言國產 GPU 的現狀并不算樂觀,雖然在特殊領域可滿足部分的需求,但是在中高端領域及硬核的算力需求仍存著較長的追趕道路。表9:海內外 GPU 產品性能對比 公司公司 英偉達 景嘉微 寒武紀 沐曦半導體 華為昇騰 昆侖芯 產品產品 H100SXM JM92 系列 思源 370 曦思N100 昇騰 910 昆侖 2 代 AI 芯片 單精度性能單精度性能FP32FP32(TFLOPSTFLOPS)667 1.5 24 640 半精度性能半精度性能FP16FP16(TFLOPSTFLOPS)1979 92 80 320 128 整數運算能力整數運算能力INT8
71、INT8(TOPSTOPS)3958 256 160 640 256 生產工藝(生產工藝(nmnm)7 14 7 7 7 數據來源:各公司官網產品圖,東吳證券研究所數據來源:各公司官網產品圖,東吳證券研究所 主流的主流的 AI 芯片限制進口芯片限制進口,國內國內 AI 產業發展面臨阻礙產業發展面臨阻礙。2022 年 10 月美國對中國半導體進行三方面限制,在 AI 領域限制中國獲取等效 8 Int 600 TOPS 算力的芯片。英偉達針對中國市場推出了符合新規的 A800 芯片,相比 A100 芯片,A800 在搭載 2 個 GPU的 NVIDIA”NVLink”橋接器連接下,互聯標準由 60
72、0GB/s 降為 400GB/s。面臨V100/A100/H100 芯片都進口受限,互聯標準下降,英偉達等頭部企業維持壟斷地位,國產大模型算力需求和國內 AI 產業發展面臨阻礙。表表10:美國美國 BIS對向中國出口的先進計算和半導體制造物項實施新的出口管制對向中國出口的先進計算和半導體制造物項實施新的出口管制 涉及方面 主要限制 限制產品 先進計算芯片 對條件內的先進計算半導體芯片、超級計算機最終用途交易以及涉及3A090 先進計算芯片產品:基礎計算單元算力之和超過 4800TOPS 并且 I/O 傳輸接口的傳輸速率大于 600GB/s 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免
73、責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 23/28 實體清單上某些實體的交易實施了限制性出口管制 4A090 超級計算機產品:具有 100 或以上雙精度(64 位)每秒千萬億次浮點運算,或 200 或以上單精度(32 位)每秒千萬億次浮點運算的集體最大理論計算能力 晶圓加工企業為中國生產加工滿足 3A090、4A090的芯片和計算機產品,先進制程設備 對條件內的半導體制造物項以及某些集成電路(IC)最終用途的交易實施新的管制 新增 ECCN 3B090 編碼,編碼涵蓋 14nm 先進制程下晶圓拋光、光刻、化學刻蝕、薄膜沉積等全流程的設備 新增“最終用途和最終用戶規則”,禁止了滿
74、足以下條件先進制程設備、零部件、元器件、軟件技術的出口:1)用于生產 16/14nm 以下制程的非平面晶體管結構(即 FinFET 和 GAAFeT)邏輯芯片;2)用于生產 128 層或以上 NAND;3)用于生產 18nm 以下制程的 DRAM。從事先進芯片和先進制程的美國實體 美國籍、美國綠卡、美國法律下的法人甚至身處美國的個人/公司都被禁止從事中國境內的先進芯片相關工作。數據來源:BIS,東吳證券研究所 自主可控趨勢下,利好國內服務器供應廠商自主可控趨勢下,利好國內服務器供應廠商。近年來中美之間的貿易摩擦不斷升級,導致雙方在技術領域的競爭愈發激烈。例如美國政府對華為等中國科技企業實施了一
75、系列制裁措施,試圖限制這些企業獲取關鍵技術和先進芯片。這些制裁措施無疑給中國高端芯片產業的發展帶來了巨大壓力。目前自主可控進程中,國內企業在設計、制程、封裝和測試等各個環節取得了顯著進步,部分產品性能已經接近國際先進水平。另一方面,國家和地方政府也在積極出臺各種政策措施,支持芯片產業的創新和發展,培育具有國際競爭力的芯片企業。目前 ChatGPT 引爆的 AI 潮將拉動云服務器數量的增長,其國內相關供應廠商將有望受益于下游 AI+級應用所帶來的算力需求增長,國內云服務器與算力相關廠商有望直接受益。5.標的梳理及投資建議標的梳理及投資建議 我們看好算力芯片及服務器需求劇增下相關零組件的成長空間。
76、我們看好算力芯片及服務器需求劇增下相關零組件的成長空間。CPU、GPU 是服務器最主要的部件是服務器最主要的部件,是衡量服務器性能的首要指標,需具有大數據量的快速吞吐、超強的穩定性、長時間運行等能力,由算力芯片提供算力支持。根據IC Insights 統計,2026 年預計全球 CPU 出貨量達到 29 億顆,市場規模達到 1336 億美元。行業龍頭集中效應顯著,Intel 占據服務器 CPU 市場 80%以上的份額,國內廠商與其技術差距較大,關注重點公司的技術突破進展。表表11:國內服務器國內服務器 CPU、GPU 芯片廠商業務情況芯片廠商業務情況 請務必閱讀正文之后的免責聲明部分請務必閱讀
77、正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 24/28 廠商 主營業務 服務器相關 寒武紀 主要提供各類云服務器/邊緣計算/終端設備中人工智能核心芯片的研發、設計和銷售,主要產品包括云端智能芯片及加速卡、訓練整機、邊緣智能芯片及加速卡、終端智能處理器 IP 及相應的配套軟件開發平臺。云端智能芯片及加速卡產品應用于服務器的 CPU、GPU 中,提供算力支持。景嘉微 業務聚焦于圖形顯控,小型專用化雷達領域的核心模塊及系統級產品,主要產品有初代低功耗 GPU 芯片JM5400、第二代芯片 JM7200 以及新研發的 JM9 系列圖形處理芯片等。GPU 芯片產品已完成與國內主要
78、的CPU 和操作系統廠商的適配,JM9 系列可以應用于人工智能、云計算等高端應用領域,提供算力支持。海光信息 公司主營業務為研發、設計和銷售應用于服務器等計算、存儲設備中的高端處理器,目前擁有海光通用處理器(CPU)和海光協處理器(DCU)兩條產品線。主要產品有 CPU 產品海光系列以及 DCU 產品深海系列。海光 CPU 產品可以應用于高端服務器、數據中心、中低端服務器以及邊緣計算服務器等計算領域中,DCU 產品專門用于為人工智能和深度學習提算力支持。數據來源:公司官網,東吳證券研究所 內存、硬盤內存、硬盤是服務器是服務器中其他的中其他的重要部件,重要部件,內存內存是與是與 CPU 進行通信
79、的橋梁進行通信的橋梁,硬盤是,硬盤是服務器數據的倉庫服務器數據的倉庫。計算機中的所有程序都在內存中執行,服務器的硬盤需要滿足速度快和高可靠性,內存和硬盤都對服務器的性能有較大的影響。據 Yole 統計,存儲器總體市場空間將從 2021 年的 1670 億美元增長至 2027 年的 2630 億美元,年復合增長率為8%。市場呈現呈壟斷競爭格局,DRAM 市場 CR3 超 90%,目前國內廠商與國外的技術,規模等差距較大,自主產品亟待突破。表表12:國內服務器內存和硬盤相關廠商業務情況國內服務器內存和硬盤相關廠商業務情況 廠商 主營業務 服務器相關 江波龍 公司主要從事 Flash 及 DRAM
80、存儲器研發、設計和銷售,提供消費級、工規級、車規級存儲器以及行業存儲軟硬件應用解決方案,目前有嵌入式存儲、固態硬盤、移動存儲及內存條四大產品線。公司的 DDR4RDIMM 內存條、SSD 系列產品可用于服務器中的內存模塊,與服務器中 CPU 直接交換數據。聚辰股份 致力于為客戶提供存儲、模擬和混合信號集成電路產品并提供應用解決方案和技術支持服務,主要有非易失性存儲業務包括 EEPROM 以及 NorFlash 兩條產品線。公司 EEPROM 產品線中標準接口的產品用于服務器的內存模塊,專有的SPDEEPROM 產品應用于服務器內存條的溫度傳感器部分。數據來源:公司官網,東吳證券研究所 電源電源
81、負責各個模塊的供電和電路控制負責各個模塊的供電和電路控制,由電源管理芯片實現。,由電源管理芯片實現。模擬芯片市場呈現國外企業主導的競爭格局,據 IC Insights 數據,21 年中國模擬 IC 市場需求占據全球規模的 43%,為最大需求市場。海外占據主導地位,根據 MPS 預測,MPS 在服務器主板CPU/GPU 電源管理芯片領域可觸及的市場規模達20億美元,但國內廠商的自給率極低,成長潛力可期。請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 25/28 表表13:國內服務器電源芯片相關廠商業務情況國內服務器電源芯片相關廠商業務
82、情況 廠商 主營業務 服務器相關 晶豐明源 公司專注于電源管理和電機控制芯片的研發和銷售,產品覆蓋 LED 照明驅動芯片、AC/DC 電源管理芯片、DC/DC 電源管理芯片、電機控制驅動芯片等。推出的多相數字控制電源管理芯片可用于為服務器中 CPU、GPU、內存和芯片組等供電。杰華特 以虛擬 IDM 為主要經營模式的模擬集成電路設計企業,公司產品分為電源管理芯片和信號鏈芯片兩大類,電源管理芯片產品包括 AC-DC 芯片、DC-DC 芯片、線性電源產品等子類別。公司 DC-DC 芯片產品是服務器中的CPU/GPU/DRAM 等供電和電路控制的核心模塊,公司目前與 Intel 深度合作。數據來源:
83、公司官網,東吳證券研究所 服務器芯片經由封裝形成模塊,進入服務器芯片經由封裝形成模塊,進入整機整機組裝組裝環節環節。根據 Yole 數據預計,2026 年先進封裝全球市場規模 475 億美元,2020-2026ECAGR 約為 7.7%。目前,全球封測產業正逐步向中國大陸轉移,內資企業與外資廠商技術差距持續縮小,中國臺灣、中國大陸和美國占據主要市場份額,同時積極布局 Chiplet 等先進技術。表表14:國內封測相關廠商業務情況國內封測相關廠商業務情況 廠商 主營業務 服務器相關 長電科技 公司在 HPC、存儲類、5G 通信類、消費類、汽車和工業等重要領域擁有行業領先的先進封裝技術(如 SiP
84、、WL-CSP、FC、eWLB 系列等),業務覆蓋高、中、低端半導體封測類型。公司的 2.5/3D 集成技術適用于對集成度和算力有較高要求的 FPGA、CPU、GPU 等芯片的集成封裝,銀線引線類封裝產品可應用于存儲芯片的封裝,是芯片和服務器成品間的中間環節。通富微電 是集成電路封裝測試服務提供商,目前已掌握一系列高端集成電路封裝測試技術,WLCSP、FC、SiP、BGA 基板設計及封裝技術及功率器件等產品已全部實現產業化,具有 FCBGA、FCPGA 等高端封裝技術和大規模量產平臺。公司的 2.5D/3D 封裝平臺和超大尺寸FCBGA 研發平臺可為客戶提供晶圓級和基板級 Chiplet 封測
85、解決方案,適用于服務器高性能計算領域芯片的封測。數據來源:公司官網,東吳證券研究所 服務器其他零部件包括服務器其他零部件包括 PCB、連接器和接口等,成本占比低于、連接器和接口等,成本占比低于 20%。PCB 在高端服務器中的應用主要包括背板、高層數線卡、HDI 卡、GF 卡等,其特點主要體現在高層數、高縱橫比、高密度及高傳輸速率,2016 年以來,中國大陸 PCB 產值規模在全球占比均超 50%。服務器內部通過連接器實現印刷電路板和電子元件之間的連接,根據 Bishop&Associates 數據,2019 年全球連接器公司以歐美和日本企業主導,全球前十連接器廠商市場份額合計為 60.8%,
86、市場集中度較高。請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 26/28 服務器通過接口芯片以實現內外數據交換。目前全球接口芯片龍頭廠商依舊為 TI、美信及凌力爾特等,從 DDR4 世代開始,全球內存接口芯片廠商僅剩瀾起科技、瑞薩(原IDT)和 Rambus 三家廠商。表表15:服務器其他相關零部件廠商業務情況服務器其他相關零部件廠商業務情況 廠商 主營業務 服務器相關 工業富聯 公司是全球領先的高端智能制造及工業互聯網解決方案服務商,主要業務包含云計算、通信及移動網絡設備、工業互聯。產品實現了對云及邊緣計算、工業互聯網、智能家居
87、、5G 及網絡通訊設備、智能手機及智能穿戴設備等數字經濟產業五大類范圍的全覆蓋。公司在云計算服務器出貨量持續全球第一,與全球主要服務器品牌商、國內外 CSP 客戶深化合作,推出新一代云計算基礎設施解決方案,包括模塊化服務器、高效運算(HPC)等,重點解決因 ChatGPT 持續升溫而引發 AIGC 算力井噴需求。深南電路 內資 PCB 領先企業,打造“3-In-One”業務布局,擁有印制電路板、封裝基板、電子裝聯三項業務,在背板、高速多層板、多功能金屬板等高中端 PCB 的加工工藝方面擁有領先技術實力。公司的 PCB 應用于服務器主板、硬盤等部件中,封裝基板覆蓋模組類封裝基板、存儲類封裝基板、
88、應用處理器芯片封裝基板等,應用于服務器中各模塊封裝。滬電股份 公司立足于印制電路板的研發設計和生產制造,現已發展成為印制電路板行業內的重要品牌之一。公司主導產品廣泛應用于通訊設備、汽車、工業設備、數據中心、網通、微波射頻、半導體芯片測試等多個領域。公司的背板、HDI、通孔板、背鉆等產品應用于服務器中的背板等,應用于 EGS 級服務器領域產品已實現規?;慨a,應用于 GPU 等加速模塊類的產品已批量出貨 鼎通科技 公司專注于研發、生產、銷售通訊連接器精密組件和汽車連接器精密組件,具備精密模具設計開發、產品制造一體化能力,直接客戶為安費諾、莫仕和中航光電等連接器模組制造商。公司高速背板連接器用于服
89、務器中單板和背板的連接和信號傳輸,I/O 連接器用于服務器的內外部信號傳輸。裕太微 公司專注于高速有線通信芯片的研發、設計和銷售,是國內以太網芯片龍頭,公司以以太網物理層芯片作為市場切入點,不斷推出系列芯片產品,目前已推出單/多端口百兆、千兆、2.5G 物理層芯片。以太網物理層芯片用于實現以太網協議中的物理層功能,應用于大數據中心和云計算數據中心的局域網中以保證網絡鏈路中數據傳輸的穩定性和快速性。瀾起科技 目前公司的主營業務是為云計算和人工智能領域提供以芯片為基礎的解決方案,目前主要產品包括內存接口芯片、津逮服務器 CPU以及混合安全內存模組,可提供從 DDR2 到DDR4 內存全緩沖/半緩沖
90、完整解決方案。公司內存接口芯片是內存模組的核心器件。內存模組配套芯片產品用于存儲內存模組的相關信息和實現內存模組的電源及溫度管理。數據來源:公司官網,東吳證券研究所 6.風險提示風險提示 1.本文對服務器、芯片需求量等測算是基于自身對于 ChatGPT 使用經驗的前提假設,請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 東吳證券研究所東吳證券研究所 行業深度報告 27/28 存在假設條件不成立或假設出現偏差導致計算結果出現出入。2.AI 服務器滲透率提升低于預期。AI 服務器滲透率提升的速度存在低于預期的風險,主要與企業投資金額,產品產能擴張,以及供給格局有關,以上因素均會導
91、致 AI 服務器發展不及預期。3.AI 應用推廣不及預期。AI 技術在應用推廣的過程可能面臨數據質量、資源限制和技術能力等因素的制約,導致相關企業的 AI 應用存在推廣進度不及預期的風險。免責及評級說明部分 免責聲明免責聲明 東吳證券股份有限公司經中國證券監督管理委員會批準,已具備證券投資咨詢業務資格。本研究報告僅供東吳證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為客戶。在任何情況下,本報告中的信息或所表述的意見并不構成對任何人的投資建議,本公司不對任何人因使用本報告中的內容所導致的損失負任何責任。在法律許可的情況下,東吳證券及其所屬關聯機構可能會持有報
92、告中提到的公司所發行的證券并進行交易,還可能為這些公司提供投資銀行服務或其他服務。市場有風險,投資需謹慎。本報告是基于本公司分析師認為可靠且已公開的信息,本公司力求但不保證這些信息的準確性和完整性,也不保證文中觀點或陳述不會發生任何變更,在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本報告的版權歸本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制和發布。如引用、刊發、轉載,需征得東吳證券研究所同意,并注明出處為東吳證券研究所,且不得對本報告進行有悖原意的引用、刪節和修改。東吳證券投資評級標準:公司投資評級:買入:預期未來 6 個月個股漲跌幅相對大盤在 15%以上;增持:預期未來 6 個月個股漲跌幅相對大盤介于 5%與 15%之間;中性:預期未來 6 個月個股漲跌幅相對大盤介于-5%與 5%之間;減持:預期未來 6 個月個股漲跌幅相對大盤介于-15%與-5%之間;賣出:預期未來 6 個月個股漲跌幅相對大盤在-15%以下。行業投資評級:增持:預期未來 6 個月內,行業指數相對強于大盤 5%以上;中性:預期未來 6 個月內,行業指數相對大盤-5%與 5%;減持:預期未來 6 個月內,行業指數相對弱于大盤 5%以上。東吳證券研究所 蘇州工業園區星陽街 5 號 郵政編碼:215021 傳真:(0512)62938527 公司網址:http:/