《電子行業專題研究:中國如何實現Zettascale計算-230312(17頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業專題研究:中國如何實現Zettascale計算-230312(17頁).pdf(17頁珍藏版)》請在三個皮匠報告上搜索。
1、 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。1 證券研究報告 電子電子 中國中國如何實現如何實現 Zettascale 計算計算 華泰研究華泰研究 電子電子 增持增持 (維持維持)研究員 黃樂平,黃樂平,PhD SAC No.S0570521050001 SFC No.AUZ066 +(852)3658 6000 研究員 張皓怡張皓怡 SAC No.S0570522020001 +(86)21 2897 2228 聯系人 陳鈺陳鈺 SAC No.S0570121120092 +(86)21 2897 2228 聯系人 廖健雄廖健雄 SAC No.S0570122020002
2、+(86)755 8249 2388 聯系人 權鶴陽權鶴陽 SAC No.S0570122070045 +(86)21 2897 2228 行業行業走勢圖走勢圖 資料來源:Wind,華泰研究 2023 年 3 月 12 日中國內地 專題研究專題研究 高性能計算是高性能計算是 AI 發展的基石,架構、工藝、先進封裝是核心技術發展的基石,架構、工藝、先進封裝是核心技術 在今年 ISSCC(國際固態電路會議)上,AMD CEO Lisa Su 提出一個大膽的預測,在以 ChatGPT 為代表的 AI 計算需求的推動下,全球最高性能的計算集群的算力到 2035 年有望和 2022 年比增加 1000
3、倍進入 ZettaScale(每秒 10 的 21 次方浮點運算)時代。并呼吁全行業從工藝工藝,架構架構,先進封裝先進封裝三方面進行創新。我們看到,在美國加強對華出口管制的背景下,中國發展先進工藝先進工藝的路徑中短期受阻。但是,我們認為,通過 1)芯片架構創新及 2)先進封裝,我們仍然能進一步提高計算芯片性能。國內行業方面,我們看到在長電、通富、盛合晶微、華峰測控等在先進封裝領域,寒武紀、海光、燧原、沐曦、芯原等在異構計算(算力芯片、IP)等領域積極布局。需求:需求:AI 成為高性能計算主要需求,成為高性能計算主要需求,OpenAI 的算力已經超過太湖之光的算力已經超過太湖之光 高性能計算主要
4、用于氣候預測等科學計算領域,但隨著 AI 大模型的出現,AI 相關算力需求正成為高性能計算的主要增長點。據 OpenAI,目前大模型訓練所需算力的增速保持 3-4 個月/倍速度增長,遠超摩爾定律 18-24 個月/倍。據微軟 2020 年披露,其服務 OpenAI 的計算集群采用超過 1 萬張 GPU,根據我們測算,其浮點計算能力約相當于我國最先進的超算中心太湖之光,是世界最大的超算中心 Frontier 的 9%。AMD 估計,在 AI 等推動下,世界最高性能超算可能從現在的 Exascale(1018),上升 1000 倍到 2035 年的Zettascale 級(1021)。其能耗或達
5、500MW,逼近一座核電站的輸出功率。路徑路徑#1:異構計算,關注:異構計算,關注 GPU,DPU,存算一體等不同路徑,存算一體等不同路徑 面對先進制程昂貴的成本和日趨接近的物理極限,僅靠工藝改進難以滿足算力膨脹需求。異構計算從計算架構出發,充分利用計算資源的并行分布,將不同制程/架構、不同指令集、不同功能硬件進行組合,成為解決算力瓶頸更為經濟的方式。目前主流異構包括 1)GPU(英偉達/AMD),2)DPU(英偉達子公司 Mallonex),3)存算一體,4)自適應加速器(AMD)等路徑。路徑路徑#2:先進封裝從:先進封裝從 2.5D 走向走向 3D 先進封裝是以一系列通過把采用不同工藝的小
6、芯片相結合,提升芯片互聯密度及通信帶寬,從而能大規模提升芯片性能的技術。AMD 于 2015 年,在業界內率先采用 2.5D Chiplet 設計的芯片,通過把把存儲和計算芯片在平面上連接,大幅提高系統性能。目前業界正向垂直堆疊的 3D 封裝(圖 10)演進。路徑路徑#3:半導體工藝在:半導體工藝在 2026 年進入年進入 1.4nm 時代時代 IMEC 預計全球先進制程工藝將在 2026 年左右進入 1.4nm 時代。當半導體進入 3nm 制程以下時,目前主流的 FinFET 將走向物理極限,新一代的 GAAFET(Nanosheet、Forksheet)將成為主流技術。IMEC 指出,AS
7、ML牽頭的歐洲企業研發的High NA EUV光刻機是半導體工藝進入GAA的關鍵技術。美國出口管制限制,該設備目前無法對中國出口。風險提示:AI 及技術落地不及預期;本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開信息的整理,并不代表本研究團隊對該公司、該股票的推薦或覆蓋。(26)(18)(9)(1)8Mar-22Jul-22Nov-22Mar-23(%)電子滬深300 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。2 電子電子 正文目錄正文目錄 中國如何實現中國如何實現 Zettascale 計算計算.3 AI 正成為高性能計算的最主要需求.3 路徑#1:提升半導體工
8、藝,在 2026 年進入 1.4nm 時代.7 路徑#2:先進封裝從 2.5D 走向 3D.9 路徑#3:異構計算:后摩爾時代,加速實現能源效率提升.11 風險提示.14 qQqRZVdUbZaYvZeXyX8ObPbRsQoOmOsRlOrRmPlOpOpMbRrQoOwMnPsPxNnRmO 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。3 電子電子 中國如何實現中國如何實現 Zettascale 計算計算 AI 正成為高性能計算的最主要需求正成為高性能計算的最主要需求 據 IDC 數據,2021 年全球半導體行業銷售額達到 5559 億美元,同比增長 26.2%,其中包括數
9、據中心用芯片和 PC 用芯片在內的計算,已經超過手機和基站在內的通信,成為半導體最大的終端需求,占比達到 32%的 1779 億美金。計算用芯片,主要產品包括 GPU、CPU、內存、存儲等。圖表圖表1:2021 年全球半導體市場分布(按照終端需求)年全球半導體市場分布(按照終端需求)圖表圖表2:高性能服務器成本結構拆分高性能服務器成本結構拆分(2018 年)年)資料來源:IDC,華泰研究 資料來源:IDC,華泰研究 過去,高性能計算主要用于氣候預測等科學計算領域,根據 TOP500 統計,截至 2022 年11月,全球算力最大的計算集群是 2022年美國發布的Frontier,算力達1102
10、petaFLOPS,是首臺算力達到 ExtaFLOPS(每秒 10 的 18 次方浮點運算)的計算集群,采用 36,922 顆AMD Instinct MI250X GPU 和 9,248 顆 AMD EPYC 64C CPU,主要用于前沿科學研究(例如癌癥研究、藥物發現、核聚變、前沿材料、超高效發動機和恒星爆炸等等)。目前我國最快的超算中心是2016年發布的太湖之光,其算力達93 petaFLOPS,采用40,960顆基于 RISC 架構的申威 SW26010 CPU。根據 TOP500 排名,截至 2022 年 11 月,太湖之光名列全球第六。計算32%通信31%消費電子12%汽車12%工
11、業12%其他1%CPU23.30%GPU27.30%memory25.60%storage2.90%其他20.90%免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。4 電子電子 圖表圖表3:全全球、中國最大超級計算機球、中國最大超級計算機和微軟的和微軟的 AI 計算中心比較計算中心比較(截至(截至 2022 年年 11 月)月)排名排名 最大算力最大算力(PetaFLOPS)國家國家 機構機構 名稱名稱 年份年份 操作系統操作系統 架構架構 CPU 類型類型 數量數量 GPU 類型類型 數量數量 互連互連 制造商制造商 1 1,102 美國 橡樹嶺國家實驗室 Frontier 20
12、22 Linux(HPE Cray OS)HPE Cray EX235a AMD EPYC 64C 9,248 AMD Instinct MI250X 36922 Slingshot-11 HPE 2 442 日本 理化學研究所科學計算中心 Fugaku 2020 Linux(RHEL)Supercomputer Fugaku Fujitsu A64FX 158,976 0 0 Tofu interconnect D Fujitsu 3 309 芬蘭 歐洲高性能計算聯合企業 LUMI 2022 Linux(HPE Cray OS)HPE Cray EX235a AMD EPYC 64C 2,3
13、52 AMD Instinct MI250X 9408 Slingshot-11 HPE 4 174 意大利 歐洲高性能計算聯合企業 Leonardo 2022 Linux BullSequana XH2000 Xeon Platinum 8358 3,456 Nvidia Ampere A100 13,824 Nvidia HDR100 Infiniband Atos 5 148 美國 橡樹嶺國家實驗室 Summit 2018 Linux(RHEL 7.4)IBM Power SystemAC922 IBM POWER9 9,216 Nvidia Tesla V100 27648 Infin
14、iBand EDR IBM 6 94 美國 勞倫斯利弗莫爾國家實驗室 Sierra 2018 Linux(RHEL)IBM Power SystemS922LC IBM POWER9 8,640 Nvidia Tesla V100 17280 InfiniBand EDR IBM 7 93 中國 國家超級計算無錫中心 太湖之光 2016 Linux(RaiseOS 2.0.5)Sunway MPP 申威SW26010 40960 0 0 Sunway NRCPC 8 70 美國 美國國家能源研究科學計算中心 Perlmutter 2021 Linux(HPE Cray OS)HPE Cray
15、EX235n AMD Epyc 7763 na Nvidia Ampere A100 na Slingshot-10 HPE 9 63 美國 英偉達 Selene 2020 Linux(Ubuntu 20.04.1)Nvidia AMD Epyc 7742 1,120 NVidea A100 4480 Mellanox HDR Infiniband Nvidia 10 61 中國 國家超級計算廣州中心 天河-2A 2018 Linux(Kylin)TH-IVB-FEP Intel Xeon E52692 v2 35,584 Matrix-2000 35584 TH Express-2 NUDT
16、 97 美國 微軟、OpenAI-2020 未知 未知 未知 未知 未知 10000 未知 未知 注:我們假設微軟為OpenAI搭建的 10000張GPU訓練集群算力使用英偉達A100,對總算力僅進行簡單測算,不考慮芯片并行的性能損耗,使用 FP64下的 9.7 TFLOPS計算 資料來源:微軟官網,TOP500,華泰研究 但隨著 AI 應用的普及,以及以 ChatGPT 為代表的大模型的出現,AI 相關算力需求正成為高性能計算的主要增長點。當前,大模型一個最最要的特點是,通過不斷增加模型參數和訓練的數據集的規模,來實現更高的預測精度和通用性。根據 OpenAI 統計,目前大模型訓練所需算力的
17、增速保持 3-4 個月/倍速度增長,遠超摩爾定律 18-24 個月/倍。根據微軟 2020 年披露,其服務 OpenAI 的計算集群采用 1 萬超過 1 萬張 GPU。微軟 2020年表示,與進入 TOP500 榜單的超算相比,這一計算集群排名前五。我們假設該集群使用英偉達 A100,經簡略測算,在用于超算的 FP64 雙精度下,其浮點計算能力約相當于我國最先進的超算中心太湖之光,是世界最大的超算中心 Frontier 的 9%。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。5 電子電子 圖表圖表4:大模型對半導體需求增長快于摩爾定律大模型對半導體需求增長快于摩爾定律 資料來源:
18、Nvidia,華泰研究 以目前火熱的 ChatGPT 為例,ChatGPT 主要是由(1)GPT-3.5 大模型,(2)對該大模型進行基于人類反饋的強化學習(RLHF)訓練而來。GPT-3.5 模型未公布細節,但是其前代GPT-3 擁有 1750 億參數,數據集 499B tokens,訓練數據量為 300B tokens。圖表圖表5:ChatGPT 是是 GPT-3.5+基于人類反饋的強化學習基于人類反饋的強化學習 注:GPT-3.5 的參數量、數據量參考 GPT-3 數據 資料來源:OpenAI,華泰研究 AMD 在今年 ISSCC 上指出,目前主流服務器每 2.4 年性能翻番,GPU 單
19、精度浮點每 2.2年性能翻番。按此速度增長至 2035 年,最高性能超算可能從現在的 Exascale(10 的 18次方)上升 1000 倍到 Zettascale 級(10 的 21 次方)。全行業需要努力提高半導體能耗,不然一座 ZettaScale 數據中心的能耗可能達到 500MW,逼近一座核電站的放電能力(按照 CFETR 計劃,DEMO(示范性聚變核電廠)的功率預期為 1GW,也就是大概 1000MW)。Moores Law2x/2yrs201220122013201320142014201520152016201620172017201820182019201920202020
20、20212021202220221001001,0001,00010,00010,000100,000100,0001,000,0001,000,00010,000,00010,000,000100,000,000100,000,0001,000,000,0001,000,000,00010,000,000,00010,000,000,000AlexNetVGG-19Seq2SeqResnetInceplionXceptionResNeXtDemseNet201ELMoMoCo ResNet50Wav2Vec 2.0TransformerGPT-1BERT LargeXLNetMegatron
21、Microsoft T-NLGGPT-3Megatron Turing NLG 530BTraining Compute(PetaFLOPS)Tramsformer275x/2yrsAI model25x/2yrs基于人類反饋基于人類反饋的的強化學習強化學習(RLHF)預訓練大模型(GPT-3.5)基礎模型:Transformer(2017年谷歌提出)模型參數數量:1750億數據集大?。?99B tokens訓練數據量:300B tokens目的:對齊人類價值觀,提供有用、清晰的答案,減少失真或有偏見的輸出方法:微調GPT-3.5通過人類排序訓練獎勵模型通過獎勵模型訓練微調后的GPT-3.5
22、免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。6 電子電子 圖表圖表6:Zettascale 所需能耗接近核聚變所需能耗接近核聚變 資料來源:ISSCC,華泰研究 為了實現 Zetta 計算,AMD 認為全行業可從工藝工藝,架構架構,先進先進封裝三方面進行創新。我們看到,在美國加強對華出口管制的背景下,中國發展先進工藝的路徑中短期受阻。但是,我們認為,通過 1)芯片架構創新及 2)先進封裝,我們仍然能進一步提高計算芯片性能??春?1)長電,通富,盛合晶微,華峰測控,寒武紀,海光,燧原,沐曦,芯原等,芯原等發展機遇。圖表圖表7:實現實現 Zetta 計算的主要技術手段和相關公司計算
23、的主要技術手段和相關公司 主要技術手段主要技術手段 主要產品主要產品 全球全球 中國中國 先進工藝 光刻機 ASML 上海微 半導體生產 TSMC 中芯國際 異構計算 CPU Intel,AMD 海光,飛騰,華為鯤鵬 GPU/AI NVidia,AMD 寒武紀、燧原、沐曦,登臨,天數智芯 DPU Nvidia/Mallonex,Marvell 中科馭數、云豹智能 IP Arm 芯原 先進封裝 設備 泰瑞達 華峰測控 封測生產 日月光、安靠 長電,通富,盛合晶微 先進工藝 光刻機 ASML 上海微 半導體生產 TSMC 中芯國際 資料來源:華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請
24、務必一起閱讀。7 電子電子 路徑路徑#1:提升半導體工藝,在:提升半導體工藝,在 2026 年進入年進入 1.4nm 時代時代 FinFET 走向物理極限,走向物理極限,GAA 接棒先進制程演進。接棒先進制程演進。數字芯片最基本單元是 MOSFET。早期MOSFET 使用平面結構,溝槽寬度越小,漏極到源極距離越小,載流子流動跨越溝道導通時間減小,工作頻率越高。但是,工藝尺寸越低,短溝道效應越明顯,即對溝道控制力不斷減弱。因此,FinFET 結構誕生,閘門被設計成類似魚鰭的叉狀 3D 架構,可于電路的兩側控制電路的接通與斷開。這種叉狀 3D 架構不僅能改善電路控制和減少漏電流,同時讓晶體管的閘長
25、大幅度縮減。當前 FinFET 逐步接近物理極限,為了進一步提高柵極對溝道控制能力,縮小單元尺寸,降低電壓,GAA 柵極環繞結構被開發出來,其柵極在垂直方向被分成幾個條帶 RibbonFET,在其溝道區域,大幅增強對載流子控制,從而實現更好性能,同時也更容易優化工藝。IMEC 預計全球半導體行業將在預計全球半導體行業將在 2024 年進入年進入 GAA 時代。時代。IMEC 預計全球先進制程工藝將在 2023 年大規模量產 3nm,2026 年進入 1.4nm 時代,2032 年進入 0.5nm 時代。16/14nm開始,FinFET 為半導體器件的主流選擇,但進入 3nm 制程以下時,Fin
26、FET 走向極限,基于 FinFET 結構進行的芯片尺寸縮小變得較為困難,GAAFET(Nanosheet、Forksheet)晶體管結構將逐步接棒,強化溝道控制能力。IMEC 指出,ASML 牽頭的歐洲企業研發的High NA EUV 光刻機是半導體工藝進入 GAA 的關鍵環節。0.7nm 之后,IMEC 表示通過器件及材料創新,可使得先進制程繼續演進,逐步進入 0.5nm/0.2nm 時代。受美國出口管制限制,荷蘭目前所有 EUV 光刻機無法向中國出口。圖表圖表8:先進工藝的圖例(從先進工藝的圖例(從 FinFet 架構到架構到 GAA)資料來源:ISSCC,華泰研究 免責聲明和披露以及分
27、析師聲明是報告的一部分,請務必一起閱讀。8 電子電子 圖表圖表9:ASML EUV 光刻機迭代光刻機迭代 資料來源:IEEE,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。9 電子電子 路徑路徑#2:先進封裝從:先進封裝從 2.5D 走向走向 3D 產業將從產業將從 2.5D 逐步走向逐步走向 3D 封裝。封裝。目前行業正從芯片/Chiplet 在平面上通過中介層、硅橋、高密度 RDL 等方式連接的 2.5D 封裝,逐步走向把存儲、計算芯片在垂直維度進行堆疊的3D 封裝。以 AMD 為例,2015 年發布 Fury 旗艦顯卡,通過硅中階層連接 GPU 與 HBM。此后,
28、AMD 推出 3D 封裝架構芯片。2021 年發布的 3D V-Cache 中,基于臺積電 3D Fabric技術,成功將 L3 緩存垂直堆疊,通過 TSV 技術實現互聯,實現整體互聯密度為傳統 2D Chiplet 的 200 倍+。AMD 基于此打造了第三代 AMD EPYC Milan-X 系列處理器。除臺積電外,英特爾(Foveros)、三星(X-Cube)、日月光(VIPack)等均已推出 3D 封裝解決方案。圖表圖表10:先進封裝:從先進封裝:從 2.5D 走向走向 3D 封裝封裝 資料來源:ISSCC,華泰研究 圖表圖表11:臺積電、三星、英特爾臺積電、三星、英特爾 2.5D 封
29、裝到封裝到 3D 封裝技術布局封裝技術布局 公司公司 先進先進封裝技術封裝技術 發布時間發布時間 臺積電 CoWoS(2.5D)2013 InFO(2.5D)2012 TSMC-SoIC(3D)2019 三星 FO(OLO/WLP)2017 I-Cube(2.5D)2018 3D SiP 2019 3D-TSV 2019 X-Cube(3D)2020 英特爾 EMIB(2.5D)2017 Foveros(3D)2018 Co-EMIB 2019 ODI 2019 MDIO 2019 資料來源:臺積電官網,英特爾官網,三星電子官網,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起
30、閱讀。10 電子電子 2021-2027 年年 2.5/3D 封裝市場規模封裝市場規模 CAGR 為為 14%。根據 Yole,2015 年全球先進封裝市場規模為 215 億美元,占整體封裝市場的 39%。2021 年,全球市場規模已達到 375 億美元,占整體封裝市場的 44%。在 HPC、AI、數據中心等應用驅動下,Yole 預計全球先進封裝市場規模將在 2027 年達到 651 億美元,在封裝市場份額提升至 53%,2021-2027 年 CAGR為 9.6%,遠高于同期傳統封裝的 3.3%。從細分市場來看,2021 年 FC(倒裝)、扇入型晶圓級封裝、扇出型晶圓級封裝、2.5/3D 封
31、裝、嵌入式封裝市場規模分別為 263/24/21/66/0.6億美元,Yole 預計嵌入式封裝和 2.5/3D 封裝為未來成長性最高的細分市場,2021-2027 年CAGR 分別為 24%/14%,AI、HPC、數據中心、CIS、3D NAND、MEMS 等應用將驅動2.5/3D 封裝市場增長;汽車、智能手機、醫療等終端市場將驅動嵌入式封裝市場增長。圖表圖表12:2021-2027 先進封裝細分市場規模預測先進封裝細分市場規模預測 資料來源:Yole,華泰研究 長電科技、通富微電等國內公司已在長電科技、通富微電等國內公司已在 2.5D 封裝領域封裝領域實現實現初步突破,未來將逐步進入初步突破
32、,未來將逐步進入 3D 封封裝領域裝領域。2.5/3D 封裝核心在于以微小線寬距和微小中心距的微凸點為特點的高密度中介層互聯,包括 TSV(硅通孔)、RDL(重布線堆疊)、FO interposer(扇出型中介)、嵌入式芯片基板。我們看到國內公司正在相關技術方面取得初步突破。長電科技 2021 年已突破 2022年已突破帶 2.5D 硅通孔 MCM 的大尺寸 FCBGA 技術,并進入小量產。未來其有望在 2.5D封裝領域逐步成熟,并走向 3D 封裝領域。通富微電多層堆疊 NAND Flash 及 LPDDR 封裝實現穩定量產,并于 2022 年完成基于 TSV 技術的 3DS DRAM 封裝開
33、發。圖表圖表13:國內先進封裝主要國內先進封裝主要公司公司梳理梳理 產業鏈環節產業鏈環節 主要上市公司主要上市公司 IP 芯原股份、國芯科技等 封裝設備 光力科技、文一科技等 測試設備 華峰測控、聯動科技、金海通等 封裝代工廠 長電科技、通富微電、華天科技、甬矽電子、晶方科技、盛合晶微等 獨立測試公司 偉測科技、利揚芯片等 封裝基板 興森科技等 資料來源:華泰研究 FC(倒裝)(倒裝),USD 26,267,70.1%扇出型晶圓級扇出型晶圓級封裝封裝,USD 2,137,5.7%扇入型晶圓級扇入型晶圓級封裝封裝,USD 2,398,6.4%2.5/3D封裝封裝,USD 6,607,17.6%嵌
34、入式封裝嵌入式封裝,USD 64,0.2%2021(USD37.4bn)FC(倒裝)(倒裝),USD 42,966,66.0%扇出型晶圓級封扇出型晶圓級封裝裝,USD 3,975,6.1%扇入型晶圓級封扇入型晶圓級封裝裝,USD 3,132,4.8%2.5/3D封裝封裝,USD 14,766,22.7%嵌入式封裝嵌入式封裝,USD 231,0.4%2021(USD65bn)CAGR2021-2027:10%FC(倒裝)倒裝)CAGR2021-2027:9%扇出型晶圓級封裝扇出型晶圓級封裝CAGR2021-2027:11%扇入型晶圓級封裝扇入型晶圓級封裝CAGR2021-2027:5%2.5/3
35、D封裝封裝CAGR2021-2027:14%嵌入式封裝嵌入式封裝CAGR2021-2027:24%免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。11 電子電子 路徑路徑#3:異構計算:后摩爾時代,加速實現能源效率提升:異構計算:后摩爾時代,加速實現能源效率提升 異構集合助推全球計算芯片快速發展。異構集合助推全球計算芯片快速發展。異構計算從后端制造創新出發,充分利用計算資源的并行和分布計算技術,將不同制程和架構、不同指令集、不同功能硬件進行組合,成為解決算力瓶頸更為經濟的一種方式。目前比較常見 AI 芯片異構有以英偉達 Grace Hopper為代表的 CPU+GPU 路線,以 W
36、aymo 為代表的 CPU+FPGA 路線以及以 Mobileye EyeQ5芯片和地平線征程系列為代表的 CPU+ASIC 路線。圖表圖表14:AI 芯片計算范式芯片計算范式 資料來源:AI 芯片:前沿技術與創新未來(張臣雄,2021 年,人民郵電出版社),華泰研究 圖表圖表15:主要異構計算方案主要異構計算方案 公司公司 異構計算方案異構計算方案 代表產品代表產品 應用領域應用領域 英偉達 CPU+GPU Grace Hopper 數據中心 CPU+GPU+ASIC Xavier 智能駕駛 Intel CPU+GPU XPU 數據中心 谷歌 CPU+GPU Google Tensor 智能
37、手機 AMD CPU+GPU APU 數據中心 Apple CPU+GPU M1 智能手機 Mobileye CPU+ASIC EyeQ5 智能駕駛 Waymo CPU+FPGA-智能駕駛 特斯拉 CPU+GPU+ASIC FSD 智能駕駛 資料來源:公司官網,華泰研究 回避先進制程瓶頸,回避先進制程瓶頸,AMD 異構集合計算另辟蹊徑帶來算力突破異構集合計算另辟蹊徑帶來算力突破。2011 年 AMD 率先推出APU(Accelerated Processing Unit,加速處理器)產品,將中央處理器和獨顯核心做在一個晶片上,同時具有高性能處理器和最新獨立顯卡的處理性能。在 CPU+GPU 的
38、異構技術路線上,AMD 相關產品為軟件開發者帶來前所未有的靈活性,能夠任意采用最適合的方式開發新的應用。目前最新的 AMD MI200 系列加速器采用多種解決方案,包括 ATOS BullSequana X410-A5 2U1N2S(雙 CPU+四 GPU)、戴爾 PowerEdge R7525(雙CPU+三 GPU)、技嘉 G262-Z00(雙 CPU+四 GPU)、HPE Cray EX235a(單 CPU+四GPU)等。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。12 電子電子 圖表圖表16:AMD 加速芯片采用加速芯片采用 CPU 與與 GPU 的異構集合的異構集合 資
39、料來源:ISSCC,華泰研究 從從 MI250 到到 MI300:異構異構+先進封裝先進封裝+工藝合力推進計算效率提升工藝合力推進計算效率提升。MI250 加速器是 AMD第一款 ExaScale 百億億次(10 的 18 次方)級別加速卡產品。在芯片架構方面,MI250 由6nm GPU 組成,并采用三種創新架構提升芯片加速性能:1)針對高性能計算和 AI 訓練等特殊領域做了性能的加強,2)采用 Chiplet 級封裝,使得存儲芯片更接近于計算芯片,3)采用傳統的電源管理等芯片來優化能源效率。通過創新的架構,MI250 實現了 HPC 和 AI節點的工作效率 12 倍的提升。而 MI300
40、則采用更為先進的 5nm 工藝制程,并在架構方面實現了全方位的升級:1)采用底部堆疊晶圓與緩存、頂部堆疊 CPU 與 GPU 的 3D 封裝技術,2)在 CPU 與 GPU 之間采用統一的存儲架構來存取數據,解決傳統 CPU+GPU 集成面臨緩存數據無法共享的問題,大大提升運算效率?;诩軜嫷膭撔?、Chiplet 以及 3D 封裝技術,AMD MI300 相較于 MI250 實現芯片性能與能效 8x/5x 的提升,其提升速度大幅領先于業界平均水平 圖表圖表17:3D CPU+GPU 集成實現存儲效率的提升集成實現存儲效率的提升 資料來源:ISSCC,華泰研究 免責聲明和披露以及分析師聲明是報告
41、的一部分,請務必一起閱讀。13 電子電子 國內多核異構計算正當時,目前用在數據中心、自動駕駛偏多國內多核異構計算正當時,目前用在數據中心、自動駕駛偏多。目前國內從事異構計算相關領域的公司包括寒武紀(688256 CH)、海思(未上市)、芯動科技(未上市)、燧原科技(未上市)、天數智芯(未上市)、中科馭數(未上市)、云豹智能(未上市)等,除數據中心外,目前異構計算還多用于智能駕駛領域。面向 L3 級及以上等級自動駕駛車輛,單一芯片難以滿足諸多接口和算力需求,需采用多核異構計算芯片。目前,主流的自動駕駛芯片架構有“CPU+GPU+ASIC”、“CPU+FPGA”和“CPU+ASIC”三種,是針對汽
42、車自動駕駛等級提升帶來數據體量快速膨脹的重要可行解決方案,國內廠商包括華為、地平線等。圖表圖表18:國內異構計算相關領域公司國內異構計算相關領域公司 公司公司 創立時間創立時間 團隊背景團隊背景 代表產品代表產品 產品最新進展產品最新進展 類型類型 主要應用場景主要應用場景 海光信息 2014 年 中科院計算所 海光 3 號,DCU8000 系列 2022年海光三號CPU正式發布并開始貢獻營收 CPU/GPGPU 服務器,工作站 飛騰 2014 年 中國電子 S2500,D2000 2020 年 7 月飛騰發布高效能桌面 CPU 騰銳D2000 CPU 服務器、桌面等 龍芯中科 2001 年
43、中科院計算所 龍芯 3A5000 2022 年 12 月 32 核服務器芯片 3D5000 初樣驗證成功 CPU 桌面、工控等 兆芯科技 2013 年 上海市國資委 開勝 KH-30000 2022 年 10 月發布新一代消費級 CPU“開先KX-6000G”,及數據中心級 CPU“開勝KH-40000”CPU/GPU 桌面 海思 2004 年 華為 鯤鵬 920-7260-CPU/GPU 服務器等 申威 2016 年 捷世智通科技 申威 1621-CPU 超算 景嘉微 2006 年 國防科技大學 JM5400、JM9231 2022 年 5 月,JM9 系列第二款完成流片 GPU 軍用市場、
44、桌面辦公等 芯動科技 2007 年 Imagination、AMD 風華 1 號、風華 2 號 2022 年 8 月,發布風華 2 號 GPU 桌面 PC 等 芯瞳半導體 2021 年 西郵 GenBu01-GPU 嵌入式設備、辦公電腦等 瀚博半導體 2018 年 AMD SV100、SG100 2022 年 9 月,發布 7nm 云端 GPU SG100 GPU 云端推理 摩爾線程 2020 年 英偉達 MTT S60 2022 年 3 月,發布第一代 MUSA 架構 GPU GPU 云端推理、邊緣端 燧原科技 2018 年 AMD 燧思 1.0、燧思 2.0 2021 年 12 月發布第二
45、代推理產品“云燧 i20”GPGPU 云端訓練、云端推理 天數智芯 2015 年 AMD 7nm GPGPU 4Q22 將發布首款云端推理通用 GPU“智鎧 100”GPGPU 云端訓練、云端推理 登臨科技 2017 年 圖芯 Goldwasser-GPGPU 云端訓練、云端推理 壁仞科技 2019 年 商湯科技、AMD BP100 2022 年 8 月壁仞科技發布首款通用GPU BR100,峰值算力超越英偉達 A100 GPU GPGPU 云端訓練、云端推理 沐曦集成電路 2020 年-GPGPU 數據中心、AI 寒武紀 2016 年 中科院 290、370 2022 年下半年推出邊緣端 5
46、90 ASIC 推理、數據中心 云豹智能 2020 年 博通、AMD、英特爾、海思 YB6480 DPU 云計算、數據中心 中科馭數 2018 年 中科院 K1、K2 2022 年 12 月自主研發的第二代 DPU 芯片 K2成功點亮 DPU 數據中心 資料來源:公司官網,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。14 電子電子 圖表圖表19:提及公司表提及公司表 公司公司 代碼代碼 公司公司 代碼代碼 通富微電 002156 CH Mobileye MBLY US 華天科技 002185 CH Marvell MRVL US 興森科技 002436 CH 微軟 M
47、SFT US 景嘉微 300474 CH 英偉達 NVDA US 光力科技 300480 CH 泰瑞達 TER US 聯動科技 301369 CH TSMC TSM US 文一科技 600520 CH 中科馭數 未上市 長電科技 600584 CH 兆芯科技 未上市 晶方科技 603005 CH 云豹智能 未上市 金海通 603061 CH 芯瞳半導體 未上市 海光信息 688041 CH 芯動科技 未上市 龍芯中科 688047 CH 天數智芯 未上市 利揚芯片 688135 CH 天數智芯 未上市 華峰測控 688200 CH 天津飛騰 未上市 寒武紀-U 688256 CH 燧原科技 未
48、上市 國芯科技 688262 CH 盛合晶微 未上市 甬矽電子 688362 CH 申威 未上市 偉測科技 688372 CH 上海微電子 未上市 芯原股份-U 688521 CH 沐曦集成電路 未上市 中芯國際 688981 CH 摩爾線程 未上市 三星 005930 KS 瀚博半導體 未上市 Apple AAPL US 海思 未上市 AMD AMD US 登臨科技 未上市 安靠技術 AMKR US 壁仞科技 未上市 ASML ASML US Waymo 未上市 日月光半導體 ASX US Mellanox 未上市 谷歌 GOOG US Arm 未上市 Intel INTC US 資料來源:
49、彭博,華泰研究 風險提示風險提示 1)AI 技術落地不及預期。雖然 AI 技術加速發展,但由于成本、落地效果等限制,相關技術落地節奏可能不及我們預期。2)本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開信息的整理,并不代表本研究團隊對該公司、該股票的推薦或覆蓋。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。15 電子電子 免責免責聲明聲明 分析師聲明分析師聲明 本人,黃樂平、張皓怡,茲證明本報告所表達的觀點準確地反映了分析師對標的證券或發行人的個人意見;彼以往、現在或未來并無就其研究報告所提供的具體建議或所表迖的意見直接或間接收取任何報酬。一般聲明及披露一般聲明及披露
50、本報告由華泰證券股份有限公司(已具備中國證監會批準的證券投資咨詢業務資格,以下簡稱“本公司”)制作。本報告所載資料是僅供接收人的嚴格保密資料。本報告僅供本公司及其客戶和其關聯機構使用。本公司不因接收人收到本報告而視其為客戶。本報告基于本公司認為可靠的、已公開的信息編制,但本公司及其關聯機構(以下統稱為“華泰”)對該等信息的準確性及完整性不作任何保證。本報告所載的意見、評估及預測僅反映報告發布當日的觀點和判斷。在不同時期,華泰可能會發出與本報告所載意見、評估及預測不一致的研究報告。同時,本報告所指的證券或投資標的的價格、價值及投資收入可能會波動。以往表現并不能指引未來,未來回報并不能得到保證,并
51、存在損失本金的可能。華泰不保證本報告所含信息保持在最新狀態。華泰對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本公司不是 FINRA 的注冊會員,其研究分析師亦沒有注冊為 FINRA 的研究分析師/不具有 FINRA 分析師的注冊資格。華泰力求報告內容客觀、公正,但本報告所載的觀點、結論和建議僅供參考,不構成購買或出售所述證券的要約或招攬。該等觀點、建議并未考慮到個別投資者的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對客戶私人投資建議。投資者應當充分考慮自身特定狀況,并完整理解和使用本報告內容,不應視本報告為做出投資決策的唯一因素。對依據或者使
52、用本報告所造成的一切后果,華泰及作者均不承擔任何法律責任。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。除非另行說明,本報告中所引用的關于業績的數據代表過往表現,過往的業績表現不應作為日后回報的預示。華泰不承諾也不保證任何預示的回報會得以實現,分析中所做的預測可能是基于相應的假設,任何假設的變化可能會顯著影響所預測的回報。華泰及作者在自身所知情的范圍內,與本報告所指的證券或投資標的不存在法律禁止的利害關系。在法律許可的情況下,華泰可能會持有報告中提到的公司所發行的證券頭寸并進行交易,為該公司提供投資銀行、財務顧問或者金融產品等相關服務或向該公司招攬業務。華泰的銷售人員
53、、交易人員或其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。華泰沒有將此意見及建議向報告所有接收者進行更新的義務。華泰的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。投資者應當考慮到華泰及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。有關該方面的具體披露請參照本報告尾部。本報告并非意圖發送、發布給在當地法律或監管規則下不允許向其發送、發布的機構或人員,也并非意圖發送、發布給因可得到、使用本報告的行為而使華泰違反
54、或受制于當地法律或監管規則的機構或人員。本報告版權僅為本公司所有。未經本公司書面許可,任何機構或個人不得以翻版、復制、發表、引用或再次分發他人(無論整份或部分)等任何形式侵犯本公司版權。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并需在使用前獲取獨立的法律意見,以確定該引用、刊發符合當地適用法規的要求,同時注明出處為“華泰證券研究所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。本公司保留追究相關責任的權利。所有本報告中使用的商標、服務標記及標記均為本公司的商標、服務標記及標記。中國香港中國香港 本報告由華泰證券股份有限公司制作,在香港由華泰金融控股(香港)有限公司向符合證券
55、及期貨條例及其附屬法律規定的機構投資者和專業投資者的客戶進行分發。華泰金融控股(香港)有限公司受香港證券及期貨事務監察委員會監管,是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。在香港獲得本報告的人員若有任何有關本報告的問題,請與華泰金融控股(香港)有限公司聯系。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。16 電子電子 香港香港-重要監管披露重要監管披露 華泰金融控股(香港)有限公司的雇員或其關聯人士沒有擔任本報告中提及的公司或發行人的高級人員。芯原股份(688521 CH):華泰金融控股(香港)有限公司、其子公司和/或其關聯公司在本報告發布日
56、擔任標的公司證券做市商或者證券流動性提供者。有關重要的披露信息,請參華泰金融控股(香港)有限公司的網頁 https:/.hk/stock_disclosure 其他信息請參見下方“美國“美國-重要監管披露”重要監管披露”。美國美國 在美國本報告由華泰證券(美國)有限公司向符合美國監管規定的機構投資者進行發表與分發。華泰證券(美國)有限公司是美國注冊經紀商和美國金融業監管局(FINRA)的注冊會員。對于其在美國分發的研究報告,華泰證券(美國)有限公司根據1934 年證券交易法(修訂版)第 15a-6 條規定以及美國證券交易委員會人員解釋,對本研究報告內容負責。華泰證券(美國)有限公司聯營公司的分
57、析師不具有美國金融監管(FINRA)分析師的注冊資格,可能不屬于華泰證券(美國)有限公司的關聯人員,因此可能不受 FINRA 關于分析師與標的公司溝通、公開露面和所持交易證券的限制。華泰證券(美國)有限公司是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。任何直接從華泰證券(美國)有限公司收到此報告并希望就本報告所述任何證券進行交易的人士,應通過華泰證券(美國)有限公司進行交易。美國美國-重要監管披露重要監管披露 分析師黃樂平、張皓怡本人及相關人士并不擔任本報告所提及的標的證券或發行人的高級人員、董事或顧問。分析師及相關人士與本報告所提及的標的證券或發行人并無任何
58、相關財務利益。本披露中所提及的“相關人士”包括FINRA 定義下分析師的家庭成員。分析師根據華泰證券的整體收入和盈利能力獲得薪酬,包括源自公司投資銀行業務的收入。芯原股份(688521 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日擔任標的公司證券做市商或者證券流動性提供者。華泰證券股份有限公司、其子公司和/或其聯營公司,及/或不時會以自身或代理形式向客戶出售及購買華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)。華泰證券股份有限公司、其子公司和/或其聯營公司,及/或其高級管理層、董事
59、和雇員可能會持有本報告中所提到的任何證券(或任何相關投資)頭寸,并可能不時進行增持或減持該證券(或投資)。因此,投資者應該意識到可能存在利益沖突。本報告所載的觀點、結論和建議僅供參考,不構成購買或出售所述證券的要約或招攬,亦不試圖促進購買或銷售該等證券。如任何投資者為美國公民、取得美國永久居留權的外國人、根據美國法律所設立的實體(包括外國實體在美國的分支機構)、任何位于美國的個人,該等投資者應當充分考慮自身特定狀況,不以任何形式直接或間接地投資本報告涉及的投資者所在國相關適用的法律法規所限制的企業的公開交易的證券、其衍生證券及用于為該等證券提供投資機會的證券的任何交易。該等投資者對依據或者使用
60、本報告內容所造成的一切后果,華泰證券股份有限公司、華泰金融控股(香港)有限公司、華泰證券(美國)有限公司及作者均不承擔任何法律責任。評級說明評級說明 投資評級基于分析師對報告發布日后 6 至 12 個月內行業或公司回報潛力(含此期間的股息回報)相對基準表現的預期(A 股市場基準為滬深 300 指數,香港市場基準為恒生指數,美國市場基準為標普 500 指數),具體如下:行業評級行業評級 增持:增持:預計行業股票指數超越基準 中性:中性:預計行業股票指數基本與基準持平 減持:減持:預計行業股票指數明顯弱于基準 公司評級公司評級 買入:買入:預計股價超越基準 15%以上 增持:增持:預計股價超越基準
61、 5%15%持有:持有:預計股價相對基準波動在-15%5%之間 賣出:賣出:預計股價弱于基準 15%以上 暫停評級:暫停評級:已暫停評級、目標價及預測,以遵守適用法規及/或公司政策 無評級:無評級:股票不在常規研究覆蓋范圍內。投資者不應期待華泰提供該等證券及/或公司相關的持續或補充信息 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。17 電子電子 法律實體法律實體披露披露 中國中國:華泰證券股份有限公司具有中國證監會核準的“證券投資咨詢”業務資格,經營許可證編號為:91320000704041011J 香港香港:華泰金融控股(香港)有限公司具有香港證監會核準的“就證券提供意見”業
62、務資格,經營許可證編號為:AOK809 美國美國:華泰證券(美國)有限公司為美國金融業監管局(FINRA)成員,具有在美國開展經紀交易商業務的資格,經營業務許可編號為:CRD#:298809/SEC#:8-70231 華泰證券股份有限公司華泰證券股份有限公司 南京南京 北京北京 南京市建鄴區江東中路228號華泰證券廣場1號樓/郵政編碼:210019 北京市西城區太平橋大街豐盛胡同28號太平洋保險大廈A座18層/郵政編碼:100032 電話:86 25 83389999/傳真:86 25 83387521 電話:86 10 63211166/傳真:86 10 63211275 電子郵件:ht-
63、電子郵件:ht- 深圳深圳 上海上海 深圳市福田區益田路5999號基金大廈10樓/郵政編碼:518017 上海市浦東新區東方路18號保利廣場E棟23樓/郵政編碼:200120 電話:86 755 82493932/傳真:86 755 82492062 電話:86 21 28972098/傳真:86 21 28972068 電子郵件:ht- 電子郵件:ht- 華泰金融控股(香港)有限公司華泰金融控股(香港)有限公司 香港中環皇后大道中 99 號中環中心 58 樓 5808-12 室 電話:+852-3658-6000/傳真:+852-2169-0770 電子郵件: http:/.hk 華泰證券華泰證券(美國美國)有限公司有限公司 美國紐約公園大道 280 號 21 樓東(紐約 10017)電話:+212-763-8160/傳真:+917-725-9702 電子郵件:Huataihtsc- http:/www.htsc- 版權所有2023年華泰證券股份有限公司