《電子行業專題研究:中國如何解決AI算力瓶頸問題-230315(14頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業專題研究:中國如何解決AI算力瓶頸問題-230315(14頁).pdf(14頁珍藏版)》請在三個皮匠報告上搜索。
1、 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。1 證券研究報告 電子電子 中國中國如何解決如何解決 AI 算力瓶頸問題算力瓶頸問題 華泰研究華泰研究 電子電子 增持增持 (維持維持)研究員 黃樂平,黃樂平,PhD SAC No.S0570521050001 SFC No.AUZ066 +(852)3658 6000 研究員 張皓怡張皓怡 SAC No.S0570522020001 +(86)21 2897 2228 聯系人 陳鈺陳鈺 SAC No.S0570121120092 +(86)21 2897 2228 聯系人 廖健雄廖健雄 SAC No.S0570122020002
2、+(86)755 8249 2388 聯系人 權鶴陽權鶴陽 SAC No.S0570122070045 +(86)21 2897 2228 行業行業走勢圖走勢圖 資料來源:Wind,華泰研究 2023 年 3 月 15 日中國內地 專題研究專題研究 算力是制約中國發展大模型的主要瓶頸算力是制約中國發展大模型的主要瓶頸 我們認為算力是制約中國發展以 ChatGPT 為代表的大模型主要瓶頸之一。據 OpenAI,大模型訓練所需算力每 3-4 個月增長 1 倍,增速遠超摩爾定律(18-24 個月/倍)。隨著 GPT-4 等下一代大模型出現,算力需求還有望進一步大幅增長。我們認為美國對華出口限制,主要
3、造成中國先進工藝發展短期受限、國產替代方案或推高大模型訓練成本/時間兩大影響。中國發展高性能計算,應加大在:1)異構計算芯片架構;2)先進封裝方面的投入。我們看到在長電、通富、盛合晶微、華峰、中芯國際等在先進封裝領域,寒武紀、海光、芯原、燧原、沐曦等在異構計算(算力芯片、IP)等領域積極布局。影響影響#1:先進工藝對提升芯片性能至關重要,:先進工藝對提升芯片性能至關重要,中國大陸中國大陸發展短期受限發展短期受限 發展先進制程意義在于持續提升晶體管密度,提升芯片性能、降低功耗。根據 WikiChip,臺積電 5nm 芯片每平方毫米晶體管數量是 10nm 3.3 倍,16nm 5.9 倍,3nm
4、晶體管密度有望比 5nm 提升 70%,性能提升 11%,功耗降低27%。美國限制 16/14nm 及以下先進邏輯工藝技術及設備向中國出口,對中國先進制程短期發展造成較大阻力。進入3nm制程以下,目前主流FinFET將走向物理極限,GAAFET 將成為主流技術,但美國對中國禁售相關 EDA軟件。同時,荷蘭 EUV 及先進 DUV 光刻設備目前均無法對中國出口。影響影響#2:A100 進口限制阻礙大模型發展,國內替代方案或推高成本進口限制阻礙大模型發展,國內替代方案或推高成本 22 年 8 月美國限制英偉達、AMD 對華出口高端 GPU 芯片,盡管后來有替代版本 A800 推出,但由于對高速互聯
5、總線的帶寬做部分裁剪,在使用性能和功耗上面仍與 A100 有部分差距。目前 H100 性能是 A100 的 4.5 倍,而A800 理論性能相比 A100 降低約 1/3,隨著算力需求不斷增加,國內由于A100 以上芯片的進口限制導致大模型訓練時間/成本或顯著提升,客觀上阻礙了我國大模型的發展。因中國企業進行 14nm 以下半導體代工受到技術及設備限制,及美國限制海外代工企業為中國設計企業生產性能超過 A100 的芯片,短期內,中國芯片公司能夠生產超過 A100 的 AI 芯片的難度也較高。路徑路徑#1:異構計算蓬勃發展,關注:異構計算蓬勃發展,關注 GPU,DPU,存算一體等不同路徑,存算一
6、體等不同路徑 面對先進制程昂貴成本和日趨接近物理極限,僅靠工藝改進難以滿足算力膨脹需求。異構計算從計算架構出發,充分利用計算資源并行分布,將不同制程/架構、不同指令集、不同功能硬件進行組合,成為解決算力瓶頸更為經濟的方式。目前主流異構包括 1)GPU(英偉達/AMD),2)DPU(英偉達子公司 Mallonex),3)存算一體,4)自適應加速器(AMD)等路徑。目前中國擁有海光、龍芯、鯤鵬等 CPU 公司,寒武紀、天數、燧原、芯動、登臨等 GPU 公司及云豹智能、中科馭數等 DPU 公司,異構計算正蓬勃發展。路徑路徑#2:先進封裝助力超越摩爾定律,國內公司積極布局:先進封裝助力超越摩爾定律,國
7、內公司積極布局 2.5/3D 等領域等領域 先進封裝是一系列通過把采用不同工藝的小芯片相結合,提升芯片互聯密度及通信帶寬,從而大規模提升芯片性能的技術,實現超越摩爾定律。AMD于 2015 年,在業界內率先采用 2.5D Chiplet 設計的芯片,通過把存儲和計算芯片在平面上連接,大幅提高系統性能,從而實現對英特爾市場地位挑戰。我們看到目前,長電、通富等國內公司在 2.5D/3D、Chiplet 等先進封裝領域布局領先。Chiplet 作為長期趨勢,有望提升芯片測試需求及 IP 可復用性。風險提示:AI 及技術落地不及預期;本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開信息的整理
8、,并不代表本研究團隊對該公司、該股票的推薦或覆蓋。(26)(17)(9)09Mar-22Jul-22Nov-22Mar-23(%)電子滬深300 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。2 電子電子 AI 正成為高性能計算的主要需求正成為高性能計算的主要需求 隨著 AI 應用的普及,以及以 ChatGPT 為代表的大模型的出現,AI 相關算力需求正成為高性能計算的主要增長點。當前,大模型最重要的特點是通過不斷增加模型參數和訓練的數據集的規模,來實現更高的預測精度和通用性。根據 OpenAI 統計,目前大模型訓練所需算力的增速保持 3-4 個月/倍速度增長,遠超摩爾定律 18
9、-24 個月/倍。圖表圖表1:大模型對半導體需求增長快于摩爾定律大模型對半導體需求增長快于摩爾定律 資料來源:Nvidia,華泰研究 根據微軟 2020 年披露,其服務 OpenAI 的計算集群采用超過 1 萬張 GPU。微軟 2020 年表示,與進入 TOP500 榜單的超算相比,這一計算集群排名前五。我們假設該集群使用英偉達 A100,經簡略測算,在用于超算的 FP64 雙精度下,其浮點計算能力約相當于我國最先進的超算中心太湖之光,是世界最大的超算中心 Frontier 的 9%。以目前火熱的 ChatGPT 為例,ChatGPT 主要是由(1)GPT-3.5 大模型,(2)對該大模型進行
10、基于人類反饋的強化學習(RLHF)訓練而來。GPT-3.5 模型未公布細節,但是其前代GPT-3 擁有 1750 億參數,數據集 499B tokens,訓練數據量為 300B tokens。圖表圖表2:ChatGPT 是是 GPT-3.5+基于人類反饋的強化學習基于人類反饋的強化學習 注:GPT-3.5 的參數量、數據量參考 GPT-3 數據 資料來源:OpenAI,華泰研究 Moores Law2x/2yrs20122012201320132014201420152015201620162017201720182018201920192020202020212021202220221001
11、001,0001,00010,00010,000100,000100,0001,000,0001,000,00010,000,00010,000,000100,000,000100,000,0001,000,000,0001,000,000,00010,000,000,00010,000,000,000AlexNetVGG-19Seq2SeqResnetInceplionXceptionResNeXtDemseNet201ELMoMoCo ResNet50Wav2Vec 2.0TransformerGPT-1BERT LargeXLNetMegatronMicrosoft T-NLGGPT-3
12、Megatron Turing NLG 530BTraining Compute(PetaFLOPS)Tramsformer275x/2yrsAI model25x/2yrs基于人類反饋基于人類反饋的的強化學習強化學習(RLHF)預訓練大模型(GPT-3.5)基礎模型:Transformer(2017年谷歌提出)模型參數數量:1750億數據集大?。?99B tokens訓練數據量:300B tokens目的:對齊人類價值觀,提供有用、清晰的答案,減少失真或有偏見的輸出方法:微調GPT-3.5通過人類排序訓練獎勵模型通過獎勵模型訓練微調后的GPT-3.5 qQrQXXcVeUcWvZ9YyXaQ
13、aObRoMmMmOoNjMrRtQjMrQtN7NoOxOwMqRyRvPmMuN 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。3 電子電子 為了實現高性能計算,我們認為半導體行業可從工藝工藝,架構架構,先進先進封裝封裝三方面進行創新。我們看到,在美國加強對華出口限制的背景下,中國發展先進工藝的路徑短期受阻。但是我們認為,通過 1)芯片架構創新及 2)先進封裝,我們仍然能進一步提高計算芯片性能。我們看到長電、通富、盛合晶微、華峰測控、寒武紀、海光、燧原、沐曦、芯原等在積極布局。圖表圖表3:高性能高性能計算的主要技術手段和相關公司計算的主要技術手段和相關公司 主要技術手段主要技
14、術手段 主要產品主要產品 全球全球 中國中國 先進工藝 光刻機 ASML 上海微 半導體生產 臺積電、三星、Intel 中芯國際 異構計算 CPU Intel,AMD 海光,飛騰,華為鯤鵬 GPU/AI NVidia,AMD 寒武紀、燧原、沐曦,登臨,天數智芯 DPU Nvidia/Mallonex,Marvell 中科馭數、云豹智能 IP Arm 芯原 先進封裝 設備 泰瑞達、愛德萬、Besi、Disco 華峰測控、光力科技 封測生產 日月光、安靠 長電、通富、盛合晶微 資料來源:華泰研究 出口限制出口限制使得使得中國大陸先進中國大陸先進制程發展短期受限制程發展短期受限 IMEC 預計全球半
15、導體行業將在預計全球半導體行業將在 2024 年進入年進入 GAA 時代。時代。IMEC 預計全球先進制程工藝將在 2023 年大規模量產 3nm,2026 年進入 1.4nm 時代,2032 年進入 0.5nm 時代。16/14nm開始,FinFET 為半導體器件的主流選擇,但進入 3nm 制程以下時,FinFET 走向極限,基于 FinFET 結構進行的芯片尺寸縮小變得較為困難,GAAFET(Nanosheet、Forksheet)晶體管結構將逐步接棒,強化溝道控制能力。國內設備廠商國內設備廠商在先進工藝領域在先進工藝領域尚存較大差距。尚存較大差距。IMEC 指出,ASML 牽頭的歐洲企業
16、研發的High NA EUV 光刻機是半導體工藝進入 GAA 的關鍵環節。0.7nm 之后,IMEC 表示通過器件及材料創新,可使得先進制程繼續演進,逐步進入 0.5nm/0.2nm 時代。受受出口出口限制限制,荷,荷蘭目前所有蘭目前所有 EUV 光刻機無法向中國出口。光刻機無法向中國出口。根據 ASML 官網,荷蘭政府自 2019 年以來就限制了 EUV 光刻機向中國大陸出口,且目前已擴大至最先進的 DUV 光刻機。國內公司方面,以光刻機為例,上海微電子已攻克 90nm 光刻機,可應用于電源管理、LCD 驅動、WiFi、射頻、各類數?;旌系刃酒a,但 28nm 光刻機尚待突破。中芯國際是中
17、國大陸第一家實現中芯國際是中國大陸第一家實現 14 納米納米 FinFET 量產的集成電路晶圓代工企業量產的集成電路晶圓代工企業,該該產能較產能較為稀缺為稀缺。2022 年 10 月 7 日,美國商務部頒布出口限制新規。本次修訂限制含有美國技術半導體設備和美國人參與:1)128 層或以上 NAND;2)18nm 或以下 DRAM;16/14nm或以下邏輯半導體的建設。中國大陸在先進制程擴產方面面臨較大困難。根據中芯國際招股書及公告,FinFET 工藝(14 納米及以下)已于 2021 年實現月產能 1.5 萬片。公司“12 英寸芯片 SN1”募投項目規劃將 FinFET 產線產能擴充到 3.5
18、 萬片/月。但由于實體清單影響,對中芯國際用于 10nm 及以下技術節點(包括極紫外光技術)的產品或技術,美國商務部會采取“推定拒絕”(Presumption of Denial)的審批政策進行審核,因此該擴產計劃面臨較大不確定性,該產線為國內稀缺的先進制程產能。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。4 電子電子 圖表圖表4:先進工藝的圖例(從先進工藝的圖例(從 FinFet 架構到架構到 GAA)資料來源:ISSCC,華泰研究 圖表圖表5:ASML EUV 光刻機迭代光刻機迭代 資料來源:IEEE,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。5
19、 電子電子 路徑路徑#1:異構計算:后摩爾時代,加速實現能源效率提升:異構計算:后摩爾時代,加速實現能源效率提升 異構集合助推全球計算芯片快速發展。異構集合助推全球計算芯片快速發展。異構計算從后端制造創新出發,充分利用計算資源的并行和分布計算技術,將不同制程和架構、不同指令集、不同功能硬件進行組合,成為解決算力瓶頸更為經濟的一種方式。目前比較常見 AI 芯片異構有以英偉達 Grace Hopper為代表的 CPU+GPU 路線,以 Waymo 為代表的 CPU+FPGA 路線以及以 Mobileye EyeQ5芯片和地平線征程系列為代表的 CPU+ASIC 路線。圖表圖表6:AI 芯片計算范式
20、芯片計算范式 資料來源:AI 芯片:前沿技術與創新未來(張臣雄,2021 年,人民郵電出版社),華泰研究 圖表圖表7:主要異構計算方案主要異構計算方案 公司公司 異構計算方案異構計算方案 代表產品代表產品 應用領域應用領域 英偉達 CPU+GPU Grace Hopper 數據中心 CPU+GPU+ASIC Xavier 智能駕駛 Intel CPU+GPU XPU 數據中心 谷歌 CPU+GPU Google Tensor 智能手機 AMD CPU+GPU APU 數據中心 Apple CPU+GPU M1 智能手機 Mobileye CPU+ASIC EyeQ5 智能駕駛 Waymo CP
21、U+FPGA-智能駕駛 特斯拉 CPU+GPU+ASIC FSD 智能駕駛 資料來源:公司官網,華泰研究 回避先進制程瓶頸,回避先進制程瓶頸,AMD 異構集合計算另辟蹊徑帶來算力突破異構集合計算另辟蹊徑帶來算力突破。2011 年 AMD 率先推出APU(Accelerated Processing Unit,加速處理器)產品,將中央處理器和獨顯核心做在一個晶片上,同時具有高性能處理器和最新獨立顯卡的處理性能。在 CPU+GPU 的異構技術路線上,AMD 相關產品為軟件開發者帶來前所未有的靈活性,能夠任意采用最適合的方式開發新的應用。目前最新的 AMD MI200 系列加速器采用多種解決方案,包
22、括 ATOS BullSequana X410-A5 2U1N2S(雙 CPU+四 GPU)、戴爾 PowerEdge R7525(雙CPU+三 GPU)、技嘉 G262-Z00(雙 CPU+四 GPU)、HPE Cray EX235a(單 CPU+四GPU)等。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。6 電子電子 圖表圖表8:AMD 加速芯片采用加速芯片采用 CPU 與與 GPU 的異構集合的異構集合 資料來源:ISSCC,華泰研究 從從 MI250 到到 MI300:異構異構+先進封裝先進封裝+工藝合力推進計算效率提升工藝合力推進計算效率提升。MI250 加速器是 AM
23、D第一款 ExaScale 百億億次(10 的 18 次方)級別加速卡產品。在芯片架構方面,MI250 由6nm GPU 組成,并采用三種創新架構提升芯片加速性能:1)針對高性能計算和 AI 訓練等特殊領域做了性能的加強,2)采用 Chiplet 級封裝,使得存儲芯片更接近于計算芯片,3)采用傳統的電源管理等芯片來優化能源效率。通過創新的架構,MI250 實現了 HPC 和 AI節點的工作效率 12 倍的提升。而 MI300 則采用更為先進的 5nm 工藝制程,并在架構方面實現了全方位的升級:1)采用底部堆疊晶圓與緩存、頂部堆疊 CPU 與 GPU 的 3D 封裝技術,2)在 CPU 與 GP
24、U 之間采用統一的存儲架構來存取數據,解決傳統 CPU+GPU 集成面臨緩存數據無法共享的問題,大大提升運算效率?;诩軜嫷膭撔?、Chiplet 以及 3D 封裝技術,AMD MI300 相較于 MI250 實現芯片性能與能效 8x/5x 的提升,其提升速度大幅領先于業界平均水平。圖表圖表9:3D CPU+GPU 集成實現存儲效率的提升集成實現存儲效率的提升 資料來源:ISSCC,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。7 電子電子 國內多核異構計算正當時,目前用在數據中心、自動駕駛偏多國內多核異構計算正當時,目前用在數據中心、自動駕駛偏多。目前國內從事異構計算相
25、關領域的芯片公司包括寒武紀(688256 CH)、海思(未上市)、芯動科技(未上市)、燧原科技(未上市)、天數智芯(未上市)、中科馭數(未上市)、云豹智能(未上市)等,除數據中心外,異構計算還多用于智能駕駛領域。面向 L3 級及以上等級自動駕駛車輛,單一芯片難以滿足諸多接口和算力需求,需采用多核異構計算芯片。目前,主流的自動駕駛芯片架構有“CPU+GPU+ASIC”、“CPU+FPGA”和“CPU+ASIC”三種,是針對汽車自動駕駛等級提升帶來數據體量快速膨脹的重要可行解決方案,國內廠商包括華為、地平線等。1)CPU:國產:國產 CPU 產業初具規模,走出三條國產化路線產業初具規模,走出三條國
26、產化路線 國產國產 CPU 沿三條路線走向進口替代,自主化程度存在差異沿三條路線走向進口替代,自主化程度存在差異?!笆濉逼陂g,泰山計劃、863計劃等催生了我國一批 CPU 廠商,經歷 20 年發展,現已形成以龍芯、飛騰、申威等為代表的具備競爭力的國產 CPU 力量。根據內核指令集路線,國產主流 CPU 廠商可分為三類:1)“指令集授權+自研”路線,代表廠商為龍芯和申威,分別基于 MIPS 架構和 Alpha 架構自主研制 LoongArch 指令集和 SW_64 指令集,自主化程度最高。2)“指令集授權”路線,代表廠商為海思和飛騰,兩者已獲得永久性 ARM V8 架構指令集授權,可基于該指令
27、集架構自主改造,擁有較高自主發展權。3)“IP 內核授權”路線,代表廠商為獲得 X86 內核層級授權的兆芯和海光,因擴充指令集形成自主可控指令集難度較大,其自主可控程度較低。圖表圖表10:國產國產 CPU 廠商三大技術路線廠商三大技術路線 資料來源:各公司官網,華泰研究 國內國內 CPU 廠商發展迅猛,各有千秋。廠商發展迅猛,各有千秋。目前,國產 CPU 主要廠商為龍芯、申威、海思、兆芯、飛騰以及海光。在服務器領域,海思、飛騰及海光性能上表現突出,所采用的 ARM、X86 架構擁有完善生態體系,受到市場認可。其中,華為海思具備較大技術領先優勢,鯤鵬 920 產品性能上可媲美 Intel 最先進
28、至強系列 CPU,但受供應問題影響,與飛騰、海光在國內競爭格局尚未定論。桌面 CPU 領域,龍芯與飛騰產品擁有更大市場份額。龍芯由于使用自主架構,應用生態相較匱乏,但產品性價比高且基本性能符合 PC 端要求,因此同樣具備較高競爭力。其 3A5000 與 Intel 于 2017 年推出 i7-7700k 性能相當,可在辦公場景實現完全替代。申威 CPU 產品專用性較高,主要用于超算領域,性能上全球領先。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。8 電子電子 圖表圖表11:國內國內 CPU 相關公司相關公司 公司公司 創立時間創立時間 團隊背景團隊背景 代表產品代表產品 產品最
29、新進展產品最新進展 類型類型 主要應用場景主要應用場景 海光信息 2014 年 中科院計算所 海光 3 號,DCU8000 系列 2022年海光三號CPU正式發布并開始貢獻營收 CPU/GPGPU 服務器,工作站 飛騰 2014 年 中國電子 S2500,D2000 2020 年 7 月飛騰發布高效能桌面 CPU 騰銳D2000 CPU 服務器、桌面等 龍芯中科 2001 年 中科院計算所 龍芯 3A5000 2022 年 12 月 32 核服務器芯片 3D5000 初樣驗證成功 CPU 桌面、工控等 兆芯科技 2013 年 上海市國資委 開勝 KH-30000 2022 年 10 月發布新一
30、代消費級 CPU“開先KX-6000G”,及數據中心級 CPU“開勝KH-40000”CPU/GPU 桌面 海思 2004 年 華為 鯤鵬 920-7260-CPU/GPU 服務器等 申威 2016 年 捷世智通科技 申威 1621-CPU 超算 資料來源:公司官網,華泰研究 2)GPU:國產:國產 GPU 奮起直追,圖像奮起直追,圖像/計算花開兩朵計算花開兩朵 國產國產 GPU 廠商沿圖像廠商沿圖像/計算兩條路徑切入,計算兩條路徑切入,人才、資本共同驅動產品落地。人才、資本共同驅動產品落地。按照功能,GPU可分為圖像處理GPU和通用GPU(GPGPU)。圖像處理GPU側重圖形圖像的渲染,GP
31、GPU則側重處理以人工智能訓練、推理為代表的通用計算任務,前者的軟硬件開發復雜程度高于 GPGPU。我國 GPU 初創公司創始團隊多擁有英偉達、AMD 等國際大廠工作背景,結合自身優勢及階段性定位分別從不同路線切入。當前,國產 GPU 廠商在產品線和生態建設上較國際廠商仍存在較大差距,但在人才和資本的雙重驅動下,國產 GPU 產品落地明顯加快。2021 年 12 月,芯動科技推出 12nm 高性能顯卡“風華 1 號”,填補了國產 4K 級桌面顯卡和服務器級顯卡兩大空白;2022 年 5 月成立僅 1 年的摩爾線程發布首款全功能國產智能顯卡“MTT S60”;2022 年 5 月景嘉微宣布 JM
32、9 系列第二款 GPU 已經完成流片、封裝階段工作,性能有望媲美 GTX 1080。圖表圖表12:國內國內 GPU/ASIC 相關公司相關公司 公司公司 創立時間創立時間 團隊背景團隊背景 代表產品代表產品 產品最新進展產品最新進展 類型類型 主要應用場景主要應用場景 景嘉微 2006 年 國防科技大學 JM5400、JM9231 2022 年 5 月,JM9 系列第二款完成流片 GPU 軍用市場、桌面辦公等 芯動科技 2007 年 Imagination、AMD 風華 1 號、風華 2 號 2022 年 8 月,發布風華 2 號 GPU 桌面 PC 等 芯瞳半導體 2021 年 西郵 Gen
33、Bu01-GPU 嵌入式設備、辦公電腦等 瀚博半導體 2018 年 AMD SV100、SG100 2022 年 9 月,發布 7nm 云端 GPU SG100 GPU 云端推理 摩爾線程 2020 年 英偉達 MTT S60 2022 年 3 月,發布第一代 MUSA 架構 GPU GPU 云端推理、邊緣端 燧原科技 2018 年 AMD 燧思 1.0、燧思 2.0 2021 年 12 月發布第二代推理產品“云燧 i20”GPGPU 云端訓練、云端推理 天數智芯 2015 年 AMD 7nm GPGPU 4Q22 將發布首款云端推理通用 GPU“智鎧 100”GPGPU 云端訓練、云端推理
34、登臨科技 2017 年 圖芯 Goldwasser-GPGPU 云端訓練、云端推理 壁仞科技 2019 年 商湯科技、AMD BP100 2022 年 8 月壁仞科技發布首款通用GPU BR100,峰值算力超越英偉達 A100 GPU GPGPU 云端訓練、云端推理 沐曦集成電路 2020 年-GPGPU 數據中心、AI 寒武紀 2016 年 中科院 290、370 2022 年下半年推出邊緣端 590 ASIC 推理、數據中心 云豹智能 2020 年 博通、AMD、英特爾、海思 YB6480 DPU 云計算、數據中心 中科馭數 2018 年 中科院 K1、K2 2022 年 12 月自主研發
35、的第二代 DPU 芯片 K2成功點亮 DPU 數據中心 資料來源:公司官網,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。9 電子電子 國內國內 GPU 廠商產品盡管與國外廠商仍存在差距,但差距在不斷縮小。廠商產品盡管與國外廠商仍存在差距,但差距在不斷縮小。以國內 GPU 廠商景嘉微為例,公司 2014年發布的 JM5400技術指標相當于ATI于 2003年 3月發布的 M96 芯片,與國外相當技術水平的產品發布時間相差近 11 年;2018 年發布的 JM7200 與 2012 年NVIDIA 發布的 GT640 接近,發布時間相差約 6 年;2021 年發布的 JM
36、9 系列在部分性能上逼近 NVIDIA2016 年發布的 GTX1080,如核心頻率、外存容量、工藝制程等,但考慮到JM9 系列 32 位單精度浮點性能僅為 1.5TFlops,遠低于 GTX1080 的 8.8TFlops,但接近GTX960 的 2.3TFlops,因此華泰計算機估計 JM9系列 NVIDIA的代際差距在 5-6年之間(參考報告:景嘉微:GPU 開啟第二增長曲線,2022/4/5)。隨著在國產替代過程中的技術迭代和人才的流入,我們認為國內 GPU 芯片與海外廠商的差距將不斷縮小。圖表圖表13:景嘉微景嘉微三代主要芯片與海外同類產品參數對比三代主要芯片與海外同類產品參數對比
37、特性 JM5400 ATI M96 JM7200 NVIDIA GeFore GT640 JM9 系列 NVIDIA GeFore GTX960 NVIDIA GeFore GTX1080 工藝 65nm 55nm 28nm 28nm 14nm 28nm 16nm 核心頻率 550MHZ 680/800MHz 1300MHZ 900MHZ 1500MHZ 1127MHZ 1607MHz 外存位寬 128bit 128bit 64bit 128bit-128bit 256bit 外存容量 1GB 512MB 2-4GB 2GB 8GB 2GB/4GB 8GB 像素填充速率 2.2G pixel/
38、s-5.2G pixels/s 7.2G pixels/s 32G pixels/s-資料來源:公司公告,Expreview,華泰研究 3)DPU:不同技術路線滿足用戶差異化需求,國內初創企業加速布局不同技術路線滿足用戶差異化需求,國內初創企業加速布局 DPU 的出現是異構計算的又一里程碑:其本質作用在于承載網絡側專用性的網絡堆棧算法和傳輸協議運算轉移,從而助力其他計算模塊高效處理業務數據。DPU 的主要技術路線包括 FPGA 和 SoC,分別滿足低功耗和高性價比兩類客戶需求。海外市場仍以英偉達、英特爾、博通為主,國內主要 DPU 公司包括云豹智能、中科馭數、云脈芯聯、星云智聯、大禹智芯等,大
39、部分公司已有 DPU 第一代芯片甚至迭代產品量產發布。國內互聯網云服務商也正積極通過自主研發或對外投資的方式布局 DPU 行業。圖表圖表14:國內國內 GPU/ASIC 相關公司相關公司 公司公司 創立時間創立時間 團隊背景團隊背景 代表產品代表產品 產品最新進展產品最新進展 類型類型 主要應用場景主要應用場景 云豹智能 2020 年 博通、AMD、英特爾、海思 YB6480 已完成第一代產品的研發和量產 DPU 數據中心 中科馭數 2018 年 中科院 K1、K2 2022 年 12 月自主研發的第二代 DPU 芯片 K2成功點亮 DPU 數據中心 星云智聯 2021 年 RFMD(威訊聯合
40、半導體),英飛凌等 DPU:D1055AS;智能網卡:N1045XS、N1045XT、N1025XS DPU 產品 D1055AS 已于 2022 年 7 月發布 DPU 數據中心 大禹智芯 2020 年 美團、阿里巴巴、百度等 Parataus1.0、Parataus2.0 2022 年 10 月第二代 DPU 產品發布 DPU 數據中心 云脈芯聯 2021 年 阿里、銳捷 metaFusion-200、metaFusion-500 2022 年 5 月發布首款多場景 RDMA 智能網卡(DPU)產品 DPU 數據中心 芯啟源 2015 年 博通、Marvell Agilio CX/FX/L
41、X 系列 智能網卡、EDA、TCAM 芯片以及 USB IP 產品線 DPU 數據中心 資料來源:公司官網,華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。10 電子電子 路徑路徑#2:先進封裝:先進封裝:助力超越摩爾定律助力超越摩爾定律,國內公司積極布局國內公司積極布局 2.5/3D 等領域等領域 產業將從產業將從 2.5D 逐步走向逐步走向 3D 封裝,先進封裝助力高性能計算芯片實現超越摩爾定律封裝,先進封裝助力高性能計算芯片實現超越摩爾定律。高性能計算領域,先進封裝是超越摩爾定律的一項重要路徑,其能提供更高的系統集成度與芯片連接密度,芯片系統將持續實現性能提升,同時
42、兼顧功耗和面積。目前行業正從芯片/Chiplet 在平面上通過中介層、硅橋、高密度 RDL 等方式連接的 2.5D 封裝,逐步走向把存儲、計算芯片在垂直維度進行堆疊的 3D 封裝。我們看到 2.5D/3D 封裝領域主要方案提供者為:臺積電(3D Fabric 平臺),英特爾(EMIB/Foveros)、三星(3D TSV/X-Cube)、日月光(VIPack)等。圖表圖表15:先進封裝:從先進封裝:從 2.5D 走向走向 3D 封裝封裝 資料來源:ISSCC,華泰研究 長電科技等國內公司已在量產長電科技等國內公司已在量產 2.5D 封裝領域封裝領域實現實現初步突破,未來將逐步進入初步突破,未來
43、將逐步進入 3D 封裝領域封裝領域。2.5/3D 封裝核心在于以微小線寬距和微小中心距的微凸點為特點的高密度中介層互聯,包括 TSV(硅通孔)、RDL(重布線堆疊)、FO interposer(扇出型中介)、嵌入式芯片基板。我們看到國內公司正在相關技術方面取得初步突破。長電科技 2022 年已突破帶 2.5D 硅通孔 MCM 的大尺寸 FCBGA 技術,并進入小量產。未來其有望在 2.5D 封裝領域逐步成熟,并走向 3D 封裝領域。通富微電多層堆疊 NAND Flash 及 LPDDR 封裝實現穩定量產,并于2022 年完成基于 TSV 技術的 3DS DRAM 封裝開發。設備方面,封裝設備國
44、產替代空間廣闊,測試設備長期受益于設備方面,封裝設備國產替代空間廣闊,測試設備長期受益于 Chiplet 等趨勢。等趨勢。當前后道封裝設備主要由 Besi、Disco、K&S 等公司占據,國產化率較低。我們看到光力科技子公司 ADT、LP 及 LPB 可提供涵蓋傳統封裝及先進封裝領域的劃片機產品,大族激光可提供半導體激光切割設備。此外,我們看到 Chiplet 技術可將不同工藝的小芯片集成,提升芯片系統的良率及降低成本,正在成為行業趨勢。我們認為未來成熟的 Chiplet 替代傳統 SoC方案,或將提升模擬、數?;旌系葴y試機需求,華峰測控在積極布局。免責聲明和披露以及分析師聲明是報告的一部分,
45、請務必一起閱讀。11 電子電子 圖表圖表16:國內先進封裝主要公司梳理國內先進封裝主要公司梳理 產業鏈環節產業鏈環節 主要上市公司主要上市公司 IP 芯原股份、國芯科技等 封裝設備 光力科技、文一科技、大族激光等 測試設備 華峰測控、聯動科技、金海通等 封裝代工廠 長電科技、通富微電、華天科技、甬矽電子、晶方科技、盛合晶微等 獨立測試公司 偉測科技、利揚芯片等 封裝基板 興森科技等 資料來源:華泰研究 圖表圖表17:提及公司表提及公司表 公司公司 代碼代碼 公司公司 代碼代碼 通富微電 002156 CH Mobileye MBLY US 華天科技 002185 CH Marvell MRVL
46、 US 興森科技 002436 CH 微軟 MSFT US 景嘉微 300474 CH 英偉達 NVDA US 光力科技 300480 CH 泰瑞達 TER US 聯動科技 301369 CH TSMC TSM US 文一科技 600520 CH 中科馭數 未上市 長電科技 600584 CH 兆芯科技 未上市 晶方科技 603005 CH 云豹智能 未上市 金海通 603061 CH 芯瞳半導體 未上市 海光信息 688041 CH 芯動科技 未上市 龍芯中科 688047 CH 天數智芯 未上市 利揚芯片 688135 CH 天數智芯 未上市 華峰測控 688200 CH 天津飛騰 未上市
47、 寒武紀-U 688256 CH 燧原科技 未上市 國芯科技 688262 CH 盛合晶微 未上市 甬矽電子 688362 CH 申威 未上市 偉測科技 688372 CH 上海微電子 未上市 芯原股份-U 688521 CH 沐曦集成電路 未上市 中芯國際 688981 CH 摩爾線程 未上市 三星 005930 KS 瀚博半導體 未上市 Apple AAPL US 海思 未上市 AMD AMD US 登臨科技 未上市 安靠技術 AMKR US 壁仞科技 未上市 ASML ASML US Waymo 未上市 日月光半導體 ASX US Mellanox 未上市 谷歌 GOOG US Arm
48、未上市 Intel INTC US 資料來源:彭博,華泰研究 風險提示風險提示 1)AI 技術落地不及預期。雖然 AI 技術加速發展,但由于成本、落地效果等限制,相關技術落地節奏可能不及我們預期。2)本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開信息的整理,并不代表本研究團隊對該公司、該股票的推薦或覆蓋。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。12 電子電子 免責免責聲明聲明 分析師聲明分析師聲明 本人,黃樂平、張皓怡,茲證明本報告所表達的觀點準確地反映了分析師對標的證券或發行人的個人意見;彼以往、現在或未來并無就其研究報告所提供的具體建議或所表迖的意見直接或間
49、接收取任何報酬。一般聲明及披露一般聲明及披露 本報告由華泰證券股份有限公司(已具備中國證監會批準的證券投資咨詢業務資格,以下簡稱“本公司”)制作。本報告所載資料是僅供接收人的嚴格保密資料。本報告僅供本公司及其客戶和其關聯機構使用。本公司不因接收人收到本報告而視其為客戶。本報告基于本公司認為可靠的、已公開的信息編制,但本公司及其關聯機構(以下統稱為“華泰”)對該等信息的準確性及完整性不作任何保證。本報告所載的意見、評估及預測僅反映報告發布當日的觀點和判斷。在不同時期,華泰可能會發出與本報告所載意見、評估及預測不一致的研究報告。同時,本報告所指的證券或投資標的的價格、價值及投資收入可能會波動。以往
50、表現并不能指引未來,未來回報并不能得到保證,并存在損失本金的可能。華泰不保證本報告所含信息保持在最新狀態。華泰對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本公司不是 FINRA 的注冊會員,其研究分析師亦沒有注冊為 FINRA 的研究分析師/不具有 FINRA 分析師的注冊資格。華泰力求報告內容客觀、公正,但本報告所載的觀點、結論和建議僅供參考,不構成購買或出售所述證券的要約或招攬。該等觀點、建議并未考慮到個別投資者的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對客戶私人投資建議。投資者應當充分考慮自身特定狀況,并完整理解和使用本報告內容,不應
51、視本報告為做出投資決策的唯一因素。對依據或者使用本報告所造成的一切后果,華泰及作者均不承擔任何法律責任。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。除非另行說明,本報告中所引用的關于業績的數據代表過往表現,過往的業績表現不應作為日后回報的預示。華泰不承諾也不保證任何預示的回報會得以實現,分析中所做的預測可能是基于相應的假設,任何假設的變化可能會顯著影響所預測的回報。華泰及作者在自身所知情的范圍內,與本報告所指的證券或投資標的不存在法律禁止的利害關系。在法律許可的情況下,華泰可能會持有報告中提到的公司所發行的證券頭寸并進行交易,為該公司提供投資銀行、財務顧問或者金融產
52、品等相關服務或向該公司招攬業務。華泰的銷售人員、交易人員或其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。華泰沒有將此意見及建議向報告所有接收者進行更新的義務。華泰的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。投資者應當考慮到華泰及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。有關該方面的具體披露請參照本報告尾部。本報告并非意圖發送、發布給在當地法律或監管規則下不允許向其發送、發布的機構或人員,也并非意圖發送
53、、發布給因可得到、使用本報告的行為而使華泰違反或受制于當地法律或監管規則的機構或人員。本報告版權僅為本公司所有。未經本公司書面許可,任何機構或個人不得以翻版、復制、發表、引用或再次分發他人(無論整份或部分)等任何形式侵犯本公司版權。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并需在使用前獲取獨立的法律意見,以確定該引用、刊發符合當地適用法規的要求,同時注明出處為“華泰證券研究所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。本公司保留追究相關責任的權利。所有本報告中使用的商標、服務標記及標記均為本公司的商標、服務標記及標記。中國香港中國香港 本報告由華泰證券股份有限公司制作,
54、在香港由華泰金融控股(香港)有限公司向符合證券及期貨條例及其附屬法律規定的機構投資者和專業投資者的客戶進行分發。華泰金融控股(香港)有限公司受香港證券及期貨事務監察委員會監管,是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。在香港獲得本報告的人員若有任何有關本報告的問題,請與華泰金融控股(香港)有限公司聯系。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。13 電子電子 香港香港-重要監管披露重要監管披露 華泰金融控股(香港)有限公司的雇員或其關聯人士沒有擔任本報告中提及的公司或發行人的高級人員。芯原股份(688521 CH):華泰金融控股(香港)有
55、限公司、其子公司和/或其關聯公司在本報告發布日擔任標的公司證券做市商或者證券流動性提供者。有關重要的披露信息,請參華泰金融控股(香港)有限公司的網頁 https:/.hk/stock_disclosure 其他信息請參見下方“美國“美國-重要監管披露”重要監管披露”。美國美國 在美國本報告由華泰證券(美國)有限公司向符合美國監管規定的機構投資者進行發表與分發。華泰證券(美國)有限公司是美國注冊經紀商和美國金融業監管局(FINRA)的注冊會員。對于其在美國分發的研究報告,華泰證券(美國)有限公司根據1934 年證券交易法(修訂版)第 15a-6 條規定以及美國證券交易委員會人員解釋,對本研究報告
56、內容負責。華泰證券(美國)有限公司聯營公司的分析師不具有美國金融監管(FINRA)分析師的注冊資格,可能不屬于華泰證券(美國)有限公司的關聯人員,因此可能不受 FINRA 關于分析師與標的公司溝通、公開露面和所持交易證券的限制。華泰證券(美國)有限公司是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。任何直接從華泰證券(美國)有限公司收到此報告并希望就本報告所述任何證券進行交易的人士,應通過華泰證券(美國)有限公司進行交易。美國美國-重要監管披露重要監管披露 分析師黃樂平、張皓怡本人及相關人士并不擔任本報告所提及的標的證券或發行人的高級人員、董事或顧問。分析師及相
57、關人士與本報告所提及的標的證券或發行人并無任何相關財務利益。本披露中所提及的“相關人士”包括FINRA 定義下分析師的家庭成員。分析師根據華泰證券的整體收入和盈利能力獲得薪酬,包括源自公司投資銀行業務的收入。芯原股份(688521 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日擔任標的公司證券做市商或者證券流動性提供者。華泰證券股份有限公司、其子公司和/或其聯營公司,及/或不時會以自身或代理形式向客戶出售及購買華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)。華泰證券股份有限公司、其子
58、公司和/或其聯營公司,及/或其高級管理層、董事和雇員可能會持有本報告中所提到的任何證券(或任何相關投資)頭寸,并可能不時進行增持或減持該證券(或投資)。因此,投資者應該意識到可能存在利益沖突。本報告所載的觀點、結論和建議僅供參考,不構成購買或出售所述證券的要約或招攬,亦不試圖促進購買或銷售該等證券。如任何投資者為美國公民、取得美國永久居留權的外國人、根據美國法律所設立的實體(包括外國實體在美國的分支機構)、任何位于美國的個人,該等投資者應當充分考慮自身特定狀況,不以任何形式直接或間接地投資本報告涉及的投資者所在國相關適用的法律法規所限制的企業的公開交易的證券、其衍生證券及用于為該等證券提供投資
59、機會的證券的任何交易。該等投資者對依據或者使用本報告內容所造成的一切后果,華泰證券股份有限公司、華泰金融控股(香港)有限公司、華泰證券(美國)有限公司及作者均不承擔任何法律責任。評級說明評級說明 投資評級基于分析師對報告發布日后 6 至 12 個月內行業或公司回報潛力(含此期間的股息回報)相對基準表現的預期(A 股市場基準為滬深 300 指數,香港市場基準為恒生指數,美國市場基準為標普 500 指數),具體如下:行業評級行業評級 增持:增持:預計行業股票指數超越基準 中性:中性:預計行業股票指數基本與基準持平 減持:減持:預計行業股票指數明顯弱于基準 公司評級公司評級 買入:買入:預計股價超越
60、基準 15%以上 增持:增持:預計股價超越基準 5%15%持有:持有:預計股價相對基準波動在-15%5%之間 賣出:賣出:預計股價弱于基準 15%以上 暫停評級:暫停評級:已暫停評級、目標價及預測,以遵守適用法規及/或公司政策 無評級:無評級:股票不在常規研究覆蓋范圍內。投資者不應期待華泰提供該等證券及/或公司相關的持續或補充信息 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。14 電子電子 法律實體法律實體披露披露 中國中國:華泰證券股份有限公司具有中國證監會核準的“證券投資咨詢”業務資格,經營許可證編號為:91320000704041011J 香港香港:華泰金融控股(香港)有
61、限公司具有香港證監會核準的“就證券提供意見”業務資格,經營許可證編號為:AOK809 美國美國:華泰證券(美國)有限公司為美國金融業監管局(FINRA)成員,具有在美國開展經紀交易商業務的資格,經營業務許可編號為:CRD#:298809/SEC#:8-70231 華泰證券股份有限公司華泰證券股份有限公司 南京南京 北京北京 南京市建鄴區江東中路228號華泰證券廣場1號樓/郵政編碼:210019 北京市西城區太平橋大街豐盛胡同28號太平洋保險大廈A座18層/郵政編碼:100032 電話:86 25 83389999/傳真:86 25 83387521 電話:86 10 63211166/傳真:8
62、6 10 63211275 電子郵件:ht- 電子郵件:ht- 深圳深圳 上海上海 深圳市福田區益田路5999號基金大廈10樓/郵政編碼:518017 上海市浦東新區東方路18號保利廣場E棟23樓/郵政編碼:200120 電話:86 755 82493932/傳真:86 755 82492062 電話:86 21 28972098/傳真:86 21 28972068 電子郵件:ht- 電子郵件:ht- 華泰金融控股(香港)有限公司華泰金融控股(香港)有限公司 香港中環皇后大道中 99 號中環中心 58 樓 5808-12 室 電話:+852-3658-6000/傳真:+852-2169-0770 電子郵件: http:/.hk 華泰證券華泰證券(美國美國)有限公司有限公司 美國紐約公園大道 280 號 21 樓東(紐約 10017)電話:+212-763-8160/傳真:+917-725-9702 電子郵件:Huataihtsc- http:/www.htsc- 版權所有2023年華泰證券股份有限公司