《科技行業專題研究:AI智算時代已至算力芯片加速升級-240107(66頁).pdf》由會員分享,可在線閱讀,更多相關《科技行業專題研究:AI智算時代已至算力芯片加速升級-240107(66頁).pdf(66頁珍藏版)》請在三個皮匠報告上搜索。
1、科技專題研究2024年01月07日中航證券研究所發布證券研究報告請務必閱讀正文后的免責條款部分行業評級:增持AI智算時代已至,算力芯片加速升級分析師:劉牧野證券執業證書號:S0640522040001股市有風險 入市需謹慎相關報告:AI大模型開啟新一輪大國競爭,半導體戰略地位凸顯半導體行業深度:后摩爾時代新星,Chiplet與先進封裝風云際會核心觀點AI正處史上最長繁榮大周期,生態加速收斂:在進入21世紀以來,在大數據和大算力的支持下,歸納統計方法逐漸占據了人工智能領域的主導地位,深度學習的浪潮席卷人工智能,人工智能迎來史上最長的第三次繁榮期。智算中心的發展基于最新人工智能理論和領先的人工智能
2、計算架構,當前算法模型的發展趨勢以AI大模型為代表,算力技術與算法模型是其中的核心關鍵,算力技術以AI芯片、AI服務器、AI集群為載體。GPU主宰算力芯片,AI信創驅動國產算力發展:得益于硬件支持與軟件編程、設計方面的優勢,CPU+GPU成為了目前應用最廣泛的平臺。AI 分布式計算的市場主要由算力芯片(55-75%)、內存(10-20%)和互聯設備(10-20%)三部分組成。美國已限制對華銷售最先進、使用最廣泛的AI訓練GPU英偉達 A100以及H100,國產算力芯片距離英偉達最新產品存在較大差距,但對信息顆粒度要求較低的推理運算能實現部分替代。提升算力內存帶寬,HBM供不應求:由于ChatG
3、PT的爆火,GPU需求明顯,英偉達也加大對三星和SK海力士HBM3的訂單。2023年10月,SK海力士表示,已經在2023年出售了明年HBM3和HBM3E的所有產量。據Omdia預測,到2025年,HBM市場的總收入將達到25億美元。集成算力與存力,先進封裝產能緊缺:CoWoS封裝技術是目前集成HBM與CPU/GPU處理器的主流方案。臺積電主導全球CoWoS封裝市場。據IDC預測,全球CoWoS供需缺口約20%,2024年臺積電的CoWos封裝產能將較2023年提升一倍,2.5D/3D先進封裝市場規模在2023-2028年將以22%的CAGR高速增長。AI算力對高效電源提出新需求,背面供電技術
4、蓄勢待發:越來越高度化的集成會造成針對加速芯片的電源解決方案越來越復雜,方案需要不同電壓、不同路的多路輸入,這種情況下電壓軌會越來越多。臺積電、三星、英特爾等芯片大廠都在積極布局背面供電網絡技術,為日益復雜的芯片提供高效供電方案,其中英特爾較為領先。建議關注:GPU:海光信息、寒武紀,和未上市的地平線、黑芝麻、摩爾線程;HBM:香農芯創、雅克科技;先進封裝:興森科技、華海誠科、艾森股份;電源芯片:希荻微。風險提示:AI算法、模型存較高不確定性,AI技術發展不及預期;ChatGPT用戶付費意愿弱,客戶需求不及預期;針對AI的監管政策收緊一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂
5、,GPU主宰算力芯片目 錄四、HBM解決GPU內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示AI正處史上最長繁榮大周期資料來源:華為,中航證券研究所人工智能從1956 年被正式提出以來,經歷了數十年的發展歷程。人工智能誕生初期,其研究主要分為三個流派,即邏輯演繹、歸納統計和類腦計算。人工智能研究的三大流派各有優劣勢。類腦計算流派的目標最為宏遠,但在未得到生命科學的支撐之前,難以取得實際應用。歸納演繹流派的思考方式與人類相似,具有較強的可解釋性。由于對數據和算力的依賴較少,歸納演繹流派
6、成為人工智能前兩次繁榮的主角。隨著學界對人工智能困難程度的理解逐漸加深,數理邏輯方法的局限性被不斷放大,并最終在第三次繁榮期中,逐漸讓位于統計學習的“暴力美學”。在進入21世紀以來,在大數據和大算力的支持下,歸納統計方法逐漸占據了人工智能領域的主導地位,深度學習的浪潮席卷人工智能,人工智能迎來史上最長的第三次繁榮期,至今仍未有結束的趨勢。圖:人工智能發展史AI生態加速收斂資料來源:華為,中航證券研究所大模型技術逐步收斂,生態走向聚合,模型更收斂、框架更歸一。為了開發更高性能的 AI大模型需要更強的算力平臺,算力底座技術門檻將提高,未來訓練核心拼集群系統能力。圖:AI技術逐步收斂,生態走向聚合圖
7、:算力底座技術門檻提高智能算力規模將快速增長資料來源:浪潮信息,IDC,中航證券研究所圖:中國通用算力規模及預測(EFLOPS,基于FP64計算)復雜的模型和大規模的訓練需要大規模的高算力支持,這不僅需要消耗大量計算資源,而且對算力的速度、精度、性能也提出更高要求。市場對于更高性能的智能算力需求將顯著提升,智能算力增長速率約通用算力的兩倍。據IDC和浪潮信息測算,2022年中國通用算力規模達 54.5 EFLOPS,預計到2027年通用算力規模將達到117.3 EFLOPS。2022年中國智能算力規模達259.9EFLOPS,預計到2027年將達到 1117.4 EFLOPS。2022-202
8、7年期間,中國智能算力規模年復合增長率達33.9%,同期通用算力規模年復合增長率為16.6%。圖:中國智能算力規模及預測(EFLOPS,基于FP16計算)AI服務器需求旺盛資料來源:浪潮信息,IDC,中航證券研究所圖:全球AI計算服務器市場規模預測(億美元)從感知智能到生成式智能,人工智能越來越需要依賴“強算法、高算力、大數據”的支持。模型的大小、訓練所需的參數量等因素將直接影響智能涌現的質量,人工智能模型需要的準確性越高,訓練該模型所需的計算力就越高。IDC預計,全球人工智能硬件市場(服務器)規模將從2022年的195億美元增長到2026年的347億美元,五年年復合增長率達17.3%;在中國
9、,預計2023年中國人工智能服務器市場規模將達到91億美元,同比增長82.5%,2027年將達到134億美元,五年年復合增長率達21.8%。圖:中國AI計算服務器市場預測(億美元)全國推進算力建設,加大算力投資資料來源:浪潮信息,IDC,政府官網,中航證券研究所圖:國內算力規劃在適度超前的指導思想下,國家正加大對人工智能算力基礎設施的投資。算力基礎設施建設成為一個重要環節,被納入國家新基建范疇。據IDC統計,截至2023年8月,全國已有超過30個城市建設智算中心,總建設規模超過200億。2023年4月上海市推進算力資源統一調度指導意見到2023年,可調度智能算力達到1000 PFLOPS(FP
10、16)以上;到2025年,本市數據中心算力超過18000 PFLOPS(FP32)2023年12月深圳市算力基礎設施高質量發展行動計劃到2025年,通用算力達到14EFLOPS(FP32),智能算力達到25EFLOPS(FP16),超算算力達到2EFLOPS(FP64)。2023年10月算力基礎設施高質量發展行動計劃到 2025 年,計算力方面,全國算力規模超過300 EFLOPS,智能算力占比達到 35%,東西部算力平衡協調發展。算力、存儲、網絡構建智算中心基礎資料來源:國家信息中心智能計算中心創新發展指南,中航證券研究所圖:智算中心算力基礎架構智算中心的發展基于最新人工智能理論和領先的人工
11、智能計算架構,算力技術與算法模型是其中的核心關鍵,算力技術以AI芯片、AI服務器、AI集群為載體,而當前算法模型的發展趨勢以AI大模型為代表。算力芯片主導AI計算市場資料來源:拾象科技,華經產業研究,中航證券研究所AI 分布式計算的市場主要由算力芯片(55-75%)、內存(10-20%)和互聯設備(10-20%)三部分組成。美國已限制對華銷售最先進、使用最廣泛的AI訓練GPU英偉達 A100以及H100,國產算力芯片距離英偉達最新產品存在較大差距,但對信息顆粒度要求較低的推理運算能實現部分替代。GPU占AI服務器成本最高,國產替代重要性凸顯。我們認為,AI訓練芯片受限進一步強調了高制程芯片設計
12、、代工的國產替代緊迫性。算力芯片系統芯片:CPU訓練芯片:GPU、ASIC、FPGA推理芯片云端推理:GPU、ASIC、FPGA邊緣推理:GPU、SoC、Apple Silicon存儲芯片DDR/GDDR/HBMSRAMRRAMMRAM圖:各類型服務器成本結構占比情況提升算力內存帶寬,HBM供不應求資料來源:SK海力士,英偉達,中航證券研究所以ChatGPT為代表的生成類模型需要在海量數據中訓練,對存儲容量和帶寬提出新要求,HBM(High Bandwidth Memory,高帶寬存儲器)成為減小內存墻的優選項。HBM將多個DDR芯片堆疊并與GPU封裝在一起,是一種基于3D堆疊工藝的高附加值D
13、RAM產品。通過增加帶寬,擴展內存容量,讓更大模型、更多參數留在離計算核心區更近的地方,從而減少內存和存儲解決方案帶來的延遲。據Omdia預測,到2025年,HBM市場的總收入將達到25億美元。由于ChatGPT的爆火,GPU需求明顯,英偉達也加大對三星和SK海力士HBM3的訂單。2023年10月,SK海力士表示,已經在2023年出售了明年HBM3和HBM3E的所有產量。圖:HBM3產品結構圖:英偉達使用的HBM帶寬不斷升級(TB/s)集成算力與存力,先進封裝產能緊缺資料來源:semiconductor engineering,中航證券研究所CoWoS封裝技術是目前集成HBM與CPU/GPU處
14、理器的主流方案。在算力芯片性能暴增的時代下,先進封裝產業鏈逐漸的進入高速發展時期。臺積電封裝產能緊缺。臺積電主導全球CoWoS封裝市場,且正在擴大產能,以滿足客戶,尤其是AI芯片領域的需求。英偉達等大客戶增加了對CoWoS封裝的訂單量,AMD、亞馬遜等其他大廠也出現了緊急訂單。據IDC預測,全球CoWoS供需缺口約20%,2024年臺積電的CoWos封裝產能將較2023年提升一倍,2.5D/3D先進封裝市場規模在2023-2028年將以22%的CAGR高速增長。圖:臺積電CoWoS封裝AI算力對高效電源提出新需求資料來源:vicorpower,MPS,中航證券研究所圖:GPU/CPU 峰值電流
15、提升AI算力功耗增長。當代 GPU 有數百億顆晶體管,更好的處理性能是以指數級增長的電源需求為代價的,因此人工智能和機器學習等應用的高性能處理器需要不斷增加功率。據vicorpower,目前的趨勢是處理器的功耗每兩年翻一番,2000A 的峰值電流現在已經很普遍。AI芯片供電架構愈發復雜。越來越高度化的集成會造成針對加速芯片的電源解決方案越來越復雜,方案需要不同電壓、不同路的多路輸入,這種情況下電壓軌會越來越多。圖:AI芯片供電架構日趨復雜算力產業鏈面臨國產化機會和挑戰資料來源:中航證券研究所AI算力芯片處于AI計算的最上游,GPU、HBM、先進封裝等環節需求高增,甚至已出現供不應求的現象。目前
16、算力芯片產業鏈由海外公司主導,在美國制裁中國科技發展,限制半導體技術輸入中國的背景下,AI算力芯片在各環節均存在需求擴張疊加國產替代的雙重增長動力。GPU國外 英偉達、AMD國內 海光信息、寒武紀、龍芯中科、摩爾線程、燧原科技HBM國外 海力士、三星、美光國內 香農芯創(經銷商)、雅克科技(原材料)先進封裝國外 英特爾、三星國內 封裝廠:臺積電、盛合晶微、長電科技、通富微電、甬矽電子 封裝材料:南電、欣興、興森科技、聯瑞新材、生益科技電源管理芯片國外 MPS、德州儀器、ADI國內 希荻微、杰華特、晶豐明源一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂,GPU主宰算力芯片目 錄四、
17、HBM解決GPU內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示AI芯片架構眾多資料來源:億歐智庫,松鼠廠,中航證券研究所圖:AI芯片分類AI芯片根據其技術架構,可分為GPU、FPGA、ASIC及類腦芯片,同時CPU可執行通用AI計算。相較于傳統的中央處理器(CPU),GPU具有并行計算、高效能和高并發等優勢,因此在人工智能、機器學習、數據挖掘等領域得到廣泛應用。AI芯片根據其在網絡中的位置可以分為云端AI芯片、邊緣及終端AI芯片;根據其在實踐中的目標,可分為訓練芯片和推理芯片。云端主
18、要部署訓練芯片和推理芯片,承擔訓練和推理任務,具體指智能數據分析、模型訓練任務和部分對傳輸帶寬要求比高的推理任務;邊緣和終端主要部署推理芯片,承擔推理任務,需要獨立完成數據收集、環境感知、人機交互及部分推理決策控制任務。發展方向一:從通用到專用芯片架構芯片特點代表公司專用性(L1到L5依次增強)CPUCPU的通用架構設計使運行效率受限。當前CPU雖然在機器學習領域的計算大大減少,但是不會被完全取代。英特爾L1GPU目前商用最廣泛的AI芯片,可以執行深度學習和神經網絡任務。GPU主要從事大規模并行計算,比CPU運行速度快,并且比其他專用AI處理器芯片價格低。英偉達、AMDL2DSP僅作為處理器I
19、P核使用。目前基于DSP的設計有一定的局限性,一般都是針對圖像和計算機視覺的處理器IP核芯片,速度較快,成本不高。新思科技、CadenceL3FPGAFPGA具有三大優點:單位能耗比低、硬件配置靈活、架構可調整。但是,FPGA的 使用有一定門檻,要求使用者具備硬件知識。賽靈思、微軟L4TPU/ASIC當前為谷歌公司專用,還不是市場化產品。ASIC芯片不能像FPGA很快改變架構,適應變化,對企業而言成本較昂貴。谷歌L5發展方向二:顛覆經典馮氏架構,采用人腦神經元的結構來提升計算能力TrueNorth模仿人腦神經元和神經突觸的結構,功耗非常低。有可能實現人工智能領域的通用化路徑,但從短期來看,離大
20、規模商業生產還有很遠的距離。IBMGPU與深度學習技術相契合資料來源:知乎,沐曦集成電路,中航證券研究所GPU設計之初用于對圖形進行渲染,需要并行處理海量數據,涉及大量矩陣運算。深度學習依賴于數學和統計學計算,所以圖形渲染與深度學習有著相似之處,這兩種場景都需要處理每秒大量的矩陣乘法運算。GPU擁有數千個內核的處理器,能夠并行執行數百萬個數學運算。因此GPU完美地與深度學習技術相契合。使用GPU做輔助計算,能夠更快地提高AI的性能。GPU成為AI算力核心并行處理能力強計算能效比高大存儲帶寬高浮點運算能力AI算力路線向GPU收斂資料來源:IDC,中國移動通信研究院,中航證券研究所圖:人工智能進入
21、transformer時代大模型的基礎架構向 Transformer 結構收斂。Transformer 結構在圖、文、音多領域表現優異,大量基于 Transformer 結構的大模型涌現。Transformer 模型預訓練由多個堆疊的自注意力層和前饋神經網絡層組成,這種設計使得它在構造大型深度神經網絡時具有巨大優勢。BERT 和GPT 是兩種最知名的基于Transformers 的自然語言處理模型。大模型的發展,使得算法技術路線逐漸統一于Transformer模型,算力芯片技術路線也向適合并行計算的GPU收斂。Transformer 架構具有并行計算的能力,可以同時處理輸入序列的不同部分。在使
22、用分布式計算和GPU并行計算的情況下,Transformer可以更快地訓練和推理大型深度神經網絡。大模型需要大算力和大互聯,對底層GPU支撐規模提出了空前的要求,達到萬卡級別。因此,出于對大模型的訓練需求,市場選擇了GPU作為主流的算力芯片。據IDC,在中國人工智能芯片市場,GPU占有超過80%的市場份額。圖:中國人工智能芯片市場份額CPU+GPU是人工智能異構計算的主要組合形式資料來源:IDC,浪潮信息,中航證券研究所圖:人工智能訓練和推理工作負載選用的計算架構異構計算仍然是芯片發展趨勢之一。異構計算通過在單一系統中利用不同類型的處理器(如CPU、GPU、ASIC、FPGA、NPU等)協同工
23、作,執行特定任務,以優化性能和效率,更高效地利用不同類型的計算資源,滿足不同的計算需求。得益于硬件支持與軟件編程、設計方面的優勢,CPU+GPU成為了目前應用最廣泛的平臺。截至2023年10月,中國市場普遍認為“CPU+GPU”的異構方式是人工智能異構計算的主要組合形式。優點缺點實例FPGA靈活性高、無需取指令、譯碼,執行效率高總體性價比和效率不占優勢。FPGA的大規模開發難度偏高,從業人員相對較少,生態環境不如GPU微軟使用FPGA為Bing搜索智能化進行加速ASIC體積小、功耗低、計算性能高、計算效率高、芯片出貨量越大成本越低算法固定,一旦算法變化就無法使用。目前人工智能算法遠沒有到算法平
24、穩期,ASIC專用芯片如何做到適應各種算法是個最大的問題寒武紀的NPU、地平線的BPU、Google的TPUGPU具有更好的生態環境,可以直接部署在服務器中,方便快速缺乏靈活性英偉達、AMD的GPU堅守CUDA開發生態,奠定英偉達AI王位資料來源:英偉達,中航證券研究所圖:CUDA-X AI 軟件加速庫幫助現代 AI 應用程序加速運行CUDA(Compute Unified Device Architecture,統一計算架構)是由英偉達于2006年所推出的一種軟硬件集成技術,是該公司對于GPGPU的正式名稱。透過這個技術,GPU的計算能力由圖像處理拓展到更廣泛的計算領域。CUDA亦是首次可以
25、利用GPU作為C語言編譯器的開發環境?,F在主流的深度學習框架基本基于CUDA進行GPU并行加速。CUDA推出之前,給GPU編程需要用機器碼深入到顯卡內核才能完成任務,非常困難。英偉達推出CUDA后,把復雜的顯卡編程包裝成了一個簡單的接口,降低了開發難度,為廣大開發人員提供了簡單易學的開發平臺。在英偉達十幾年堅持不懈推廣下,CUDA的高性能運算研究成果陸續在眾多知名期刊發表并獲得認可,并廣泛應用于深度學習、自動駕駛以及其他 AI 領域。堅守CUDA開發生態,奠定英偉達AI王位資料來源:英偉達,中航證券研究所圖:Wintel生態圈CUDA處在軟硬件結合的關鍵位置,是軟件生態的基石。英偉達的競爭對手
26、在軟件方案上缺乏對標CUDA的完整編程和工具鏈,而這些完整的工具鏈需要長時間積累,目前難以繞過CUDA去兼容英偉達的生態,所以CUDA成為了英偉達的堅實壁壘。在PC時代,Wintel(Windows操作系統+英特爾芯片)通過捆綁銷售牢牢把握住對產業下游生產商的控制權,在消費端形成軟硬結合的強大馬太效應,微軟和英特爾在市場獲得巨大優勢。在AI大模型時代,軟硬件協同完善的生態是客戶選擇CUDA的原因,英偉達打造的GPU運算生態系統已擁有龐大的使用群體和客戶粘性,英偉達算力王者的地位仍然穩健。圖:CUDA生態系統Wintel聯盟芯片網絡安全應用軟件中間件數據庫操作系統CUDA生態程序語言和API程序
27、庫資料中心工具GPU硬件GPU應用程序剖析和除錯工具英偉達引領GPU計算潮流資料來源:ifind,中航證券研究所圖:主要算力芯片公司的數據中心業務季度收入(億美元)英偉達“統治”AI算力芯片。隨著人工智能浪潮的興起,給算力芯片行業帶來了新的發展機會。英偉達的 GPU 在 AI 領域軟硬件上都具有顯著的優勢和創新,可以為 AI 計算提供高性能、高并行度、高可擴展性和高能效等特點,滿足大規模數據處理和復雜模型訓練的需求。因此,英偉達的GPU主導了 AI 計算的市場。自2022年底,ChatGPT引爆算力需求以來,英偉達在數據中心的業務收入實現爆發式增長,2023Q2、Q3收入同比增速分別高達171
28、%、285%。英偉達芯片進口受限,國產算力需求迫切資料來源:美國商務部,中航證券研究所圍繞人工智能,美國已發起又一輪針對中國的制裁。2022年9月,美國芯片巨頭英偉達收到美國官方通知,若對中國和俄羅斯的客戶出口兩款高端GPU芯片A100和H100,需要新的出口許可。2023年10月,美國的限制進一步增強,英偉達針對中國市場推出的“特供版”A800 和 H800 芯片遭到出口合規限制。美國商務部長雷蒙多表示,管制目的就是遏制中國獲得先進芯片,從而阻礙中國人工智能和復雜計算機領域的突破。國家層面,如果算力跟不上,則無法進行AI的大規模訓練,將在人工智能競爭中落于下風。產業層面,算力的充足與否,直接
29、決定了擁有AI技術和產品的公司,能否提供長期穩定的服務,從而在這場競爭中擁有先發權。隨著一系列英偉達算力供給縮水動作,使得國內市場上已有的英偉達系列顯卡進一步稀缺,算力一個月內漲價50%甚至100%已是常態。因此,AI算力自主化對于國際科技競爭以及國內AI產業健康發展,都至關重要。圖:美國商務部最新禁令國產算力迎時代機遇資料來源:ifind,中航證券研究所圖:算力公司市場表現情況(截至2023年12月15日)頭部算力公司中,英偉達的強勁業績增長反映了從通用到加速計算和生成式人工智能的廣泛行業平臺轉型。NVIDIA GPU、CPU、網絡、AI 代工服務和 NVIDIA AI Enterprise
30、 軟件都是全速增長的引擎。因此,英偉達被市場高度認可,2023年至今上漲230.8%,盈利和估值水平也顯著優于競爭對手。國產算力上市公司和海外公司技術和產品差距較大,并且在業績端未能體現AI浪潮帶來的增長,但由于人工智能的繁榮得到市場廣泛押注,國內上市公司在估值端享受了本輪AI紅利,股價強勢增長。我們認為,人工智能競賽已經上升至大國競爭的高度,海外高端算力芯片被美國限制向中國出口,國內AI訓練公司轉向國產算力有望形成長期趨勢,所以國產算力將迎發展機遇。2023年度漲跌幅市銷率(TTM)市盈率(TTM)2023前三季度收入同比英偉達230.8%26.6263.2385.5%AMD113.1%10
31、.081,071.82-8.3%英特爾70.9%3.60-115.86-20.8%海光信息84.0%32.70162.983.2%寒武紀165.4%98.81-53.88-44.8%龍芯中科39.1%73.40-208.82-18.5%國產算力蓬勃發展資料來源:IDC,中航證券研究所中國 AI芯片產業逐漸呈現出蓬勃發展態勢。據IDC,2022年應用在數據中心的智能芯片數量超過百萬個,其中本土品牌AI芯片數量已經接近15%的占比,涵蓋品牌超過十余家。國際科技網絡巨頭公司谷歌、臉書,亞馬遜等等在AI芯片領域從云端訓練到終端產品應用,在開源框架賦能產業行業上有一定的領先優勢。國內企業也在打造從AI芯
32、片注重云端訓練+AI芯片終端響應+AI算法框架開源的生態體系。表:英偉達國產替代產品產品型號工藝制程定位理論對標英偉達產品海思異騰9107nm高端 臺積電英偉達A100/A800異騰31012nm中低端阿里倚天7105nm高端一含光80012nm中低端英偉達P4百度昆侖芯2代7nm高端一騰訊紫霄12nm中低端英偉達A10海光信息深算二號一一一壁仞科技BR1007nm中高端摩爾線程MTT S30007nm燧原科技云燧T2012nm中低端寒武紀Gaudi7nm沐曦曦思N系列曦云C系列景嘉微JM9一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂,GPU主宰算力芯片目 錄四、HBM解決GP
33、U內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示GPU行業需跨越CUDA橫亙資料來源:集微網、The information、中航證券研究所英偉達CUDA已經實現了與算法工程師、芯片客戶的強綁定,眾多算法工程師已經習慣了一套工具庫、一套編程語言,向外遷移存在不習慣等問題。所以很多算力芯片硬件廠商選擇了兼容CUDA的路線使硬件能夠直接用CUDA調動起來,以降低用戶的硬件遷移痛點。兼容CUDA需要巨大時間和成本投入。據集微網,兼容CUDA涉及50個驅動、50個編譯器、50個數學庫、300
34、個應用層工程師,3-5年的時間。功能的驗證,用戶的培養需要額外3-5年,每年還要至少開支1000萬-3000萬元資助外部開發者。從頭部AI廠商布局來看,英偉達競爭者AMD選擇兼容CUDA+自研原生“兩條腿”并行,英偉達客戶谷歌、Meta、亞馬遜等均已推出自己的AI芯片。我們認為,國產GPU在起步階段兼容CUDA生態更容易發展,易于生存。在美國技術封鎖的大背景之下,“AI信創”為國產算力芯片提供了市場窗口,遠期國產GPU還是需要發展原生生態。圖:頭部廠商自研AI芯片公司芯片名發布時間代數制程(nm)對標英偉達GPU亞馬遜Trainium202215亞馬遜Inferentia201925Googl
35、eTensor(TPU)201547微軟Athena202415對標英特爾CPU亞馬遜Graviton201835GoogleMaple202515GoogleCypress202515微軟Cascade202415國產算力有待提升資料來源:各公司官網,中航證券研究所當下諸多國內本土芯片技術儲備和生態能力仍圍繞小模型時代的識別式人工智能展開,難以匹配大模型和生成式人工智能發展所需的軟件生態、模型框架、性能需求,因此本土人工智能芯片仍需在發展、繼承和競爭中成長。在中美脫鉤的時代背景下,國產算力芯片正經歷“可用”到“好用”的階段,國產算力芯片整體實力有待提升。從生態成熟度來看,我們認為,華為海思和
36、海光信息有望率先替代英偉達算力芯片。受益于華為ICT行業的領先地位,昇騰系列將獲得從芯片設計、芯片制造、算力部署、應用生態的全方位支持,有更大概率成為主流國產算力芯片。圖:國內GPU與英偉達性能對比英偉達英偉達華為海思海光信息寒武紀摩爾線程代表產品A100H100昇騰910深算二號MLU290-M5MTT S3000FP32算力(TFLOPS)19.560-15.2FP16算力(TFLOPS)6242000280-顯存大小(GB)808032-3232顯存帶寬(TB/S)23-10.4互聯帶寬(GB/S)60090056.5-600-功耗(W)400700300-350250生態CUDACUD
37、A昇思MindsporeROCm,兼容CUDA-華為:Mindspore開發生態崛起資料來源:Omdia中國人工智能框架市場調研報告、中航證券研究所圖:TensorFlow,PyTorch,MindSpore和PaddlePaddle在支持超大規模模型訓練方面處于領先據Omdia,在支持超大規模模型訓練開發方面,全球領先的人工智能框架TensorFlow和PyTorch仍然占據中國領導地位;中國人工智能開發者認為,昇思MindSpore原生支持預訓練大模型開發,已在中國市場上占據優勢地位,并已經孵化出了一系列創新大模型。在以ChatGPT為代表的AIGC火爆的的背后,也出現了“造假”等AI倫理
38、道德問題,人工智能開發者和機構越來越關注“負責任的人工智能”。Omdia在對人工智能開發者的調研中發現,在所有主流人工智能框架中,TensorFlow與MindSpore對“負責任的人工智能”提供的支持能力最好,分別位居第一與第二名。圖:TensorFlow和MindSpore對“負責任的人工智能”提供的支持能力最好華為:打造全棧 AI 軟硬件平臺,構筑國產智能基石資料來源:華為、中航證券研究所華為通過芯片、異構計算架構、AI框架、AI開發平臺等根技術的持續創新突破,打造自主的計算生態。硬件方面,昇騰GPU對標英偉達GPU,軟件方面;軟件方面,CANN計算架構對標英偉達CUDA架構;昇思計算框
39、架對標TensorFlow、Pytorch計算框架,并且PyTorch已同步支持昇騰NPU;應用方面,華為昇騰已經支持了業界50多個大模型,使能各行各業的智能化升級。圖:華為全棧 AI 軟硬件平臺對標英偉達CUDA架構同時兼容Pytorch框架對標英偉達GPU華為:引領國內AI芯片發展資料來源:至頂網、中航證券研究所2023年1月,國家工業信息安全發展研究中心提出,我國智能算力中心建設已進入2.0階段,在智能計算中心的建設過程中,投-建-運往往由不同的單位負責,導致資源浪費,體驗不佳。所以2.0階段,算力中心的建設、運營、應用應該聯動,滿足一體化服務需求。華為AI芯片在國內優勢顯著,因為華為在
40、ICT領域具備從建設到運營的全環節壁壘。至頂智庫統計,截至2023年2月,我國目前已投入運營和在建的人工智能計算中心達23個,有16家人工智能計算中心由華為參與建設,使用華為昇騰人工智能計算系統作為底層技術支持。國內約70%算力中心由華為參與,疊加國產AI芯片自主化的需求,所以華為AI芯片將長期引領國內算力芯片發展。圖:中國人工智能計算中心分布海光信息:CPU+GPU布局完整,產品迭代順利資料來源:海光信息招股書、中航證券研究所海光信息的產品包括海光通用處理器(CPU)和海光協處理器(DCU)。公司是少數幾家同時具備高端通用處理器和協處理器研發能力的集成電路設計企業?;趚86指令框架、“類C
41、UDA”計算環境和國際先進處理器設計技術,公司大力發展滿足中國信息化發展需要的高端處理器產品。強大研發實力推動公司產品持續迭代。公司骨干研發人員多擁有國內外知名芯片公司的就職背景,擁有成功研發x86處理器或ARM處理器的經驗。公司2021全年、2022全年、2023前三季度的研發投入分別為7.45億元、14.14億元、12.79億元,迅速增長的研發投入,支撐公司產品不斷迭代。海光CPU系列產品海光三號為主力銷售產品,海光四號、海光五號處于研發階段;海光DCU系列產品深算一號為公司GPGPU主要在售產品,深算二號于2023Q3發布,深算三號研發進展順利。圖:海光信息主要產品產品類型處理器種類指令
42、集主要產品產品特征典型應用場景海光CPU通用處理器兼容x86指令集海光3000系列內置多個處理器核心,集成通用的高性能外設接口,擁有完善的軟硬件生態環境和完備的系統安全機制,適用于數據計算和事務處理等通用型應用云計算、物聯網、信息服務等海光5000系列海光7000系列海光DCU協處理器兼容“類CUDA”環境海光8000系列內置大量運算核心,具有較強的并行計算能力和較高的能效比,適用于向量計算和矩陣計算等計算密集型應用大數據處理、人工智能、商業計算等海光信息:兼容“類CUDA“生態,打造全棧AI基礎設施資料來源:海光信息、中航證券研究所海光DCU屬于GPGPU的一種,全面兼容ROCm GPU計算
43、生態。ROCm是AMD的軟件平臺,用來加速 GPU 計算,對標英偉達的CUDA平臺。AMD的GPU上編程模型使用的是HIP或者OpenCL,運行環境是ROCm。英偉達顯卡上,編程模型是CUDA,運行環境也是CUDA。由于ROCm和CUDA在生態、編程環境等方面具有高度的相似性,CUDA用戶可以以較低代價快速遷移至ROCm平臺,ROCm也被稱為“類CUDA”。因此,海光DCU協處理器能夠較好地適配、適應國際主流商業計算軟件和人工智能軟件。在互聯網領域,公司的DCU產品已得到百度、阿里等互聯網企業的認證,并推出聯合方案,打造全國產軟硬件一體全棧AI基礎設施。圖:海光提供完善的AI軟件棧支持圖:公司
44、OEM客戶寒武紀:云邊端AI硬件協同發展資料來源:公司公告、中航證券研究所寒武紀提供云邊端一體、軟硬件協同、訓練推理融合、具備統一生態的系列化智能芯片產品和平臺化基礎系統軟件。公司云端產品線前五大客戶,包括中科可控、浪潮信息等服務器廠商及阿里、百度等互聯網公司,目前公司已完成了服務器廠商的產品適配并與主要服務器廠商建立了長期深入的合作關系。圖:寒武紀芯片產品面向云、邊、端三大場景產品線產品類型寒武紀主要產品推出時間云端產品線云端智能芯片及加速卡思元100(MLU100)芯片及云端智能加速卡2018年思元270(MLU270)芯片及云端智能加速卡2019年思元290(MLU290)芯片及云端智能
45、加速卡2020年思元370(MLU370)芯片及云端智能加速卡2021年、2022年訓練整機玄思1000智能加速器2020年玄思1001智能加速器2022年邊緣產品線邊緣智能芯片及加速卡思元220(MLU220)芯片及邊緣智能加速卡2019年IP授權及軟件終端智能處理器IP寒武紀1A處理器2016年寒武紀1H處理器2017年寒武紀1M處理器2018年基礎系統軟件平臺寒武紀基礎軟件開發平臺(適用于公司所有芯片與處理器產品)持續研發和升級,以適配新的芯片寒武紀:互聯網客戶存較大增長空間資料來源:ifind、中航證券研究所公司四季度收入較前三季度大幅增長,是由于智能計算集群系統業務主要服務于城市智能
46、計算中心客戶,該類客戶第四季度組織項目進度評審及項目驗收工作。從公司收入季節性明顯的特征分析,公司目前客戶可能主要為回款較慢的政府、學校、金融等G端客戶,公司在互聯網端存較大增長空間。圖:公司單季度收入(億元)一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂,GPU主宰算力芯片目 錄四、HBM解決GPU內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示AI算力刺激更多存儲器用量資料來源:TrendForce、中航證券研究所AI服務器存儲容量倍增,帶動存儲器需求成長。據Tren
47、dForce,AI服務器需要配置更多DRAM、SSD和HBM等大容量存儲以應對日益復雜的大模型所帶來的海量數據。當前普通服務器DRAM普遍配置約為500至600GB,而AI服務器DRAM 配置可達1.2至1.7TB,是普通服務器的二到三倍。此外,相較于一般服務器而言,AI服務器多增加GPGPU的使用,因此以NVIDIA A100 80GB配置4或8張計算,HBM用量約為320640GB。未來在AI模型逐漸復雜化的趨勢下,將刺激更多的存儲器用量,并同步帶動 Server DRAM、SSD 以及 HBM 的需求成長。圖:AI服務器 vs 普通服務器存儲用量普通服務器AI服務器未來AI服務器DRAM
48、容量500-600GB1.2-1.7TB2.2-2.7TBSSD容量4.1TB4.1TB8TBHBM容量320-640GB512-1024GBHBM解決GPU內存危機資料來源:中國移動研究院、AMD、中航證券研究所處理器的性能按照摩爾定律規劃的路線不斷飆升,內存所使用的DRAM卻從工藝演進中獲益很少,性能提升速度遠慢于處理器速度,造成了DRAM的性能成為制約計算機性能的一個重要瓶頸,即所謂的“內存墻”。HBM成為增加存儲器帶寬的路徑之一,以解決大數據時代下的“內存墻”問題。HBM(High Bandwidth Memory)即高帶寬存儲器,按照JEDEC的分類,HBM屬于GDDR內存的一種,其
49、通過使用先進的封裝方法(如TSV硅通孔技術)垂直堆疊多個DRAM,并與GPU封裝在一起。HBM主要優勢是在高帶寬和低功耗領域,應用場景以配合并行計算的GPU和ASIC芯片為主。圖:存儲計算性能存在“剪刀差”圖:HBM性能優勢明顯HBM是GPU主流內存方案資料來源:NVIDIA官網、AMD官網、奎芯科技、海力士、中航證券研究所主流用于大模型訓練的AI芯片,其顯存方案跟隨HBM技術的提升而演進,向更高帶寬的方向發展。英偉達的A100和AMD MI200均采用HBM2e方案,而英偉達最新一代的H100芯片則采用SK海力士的HBM3方案,AMD發布的MI300X采用192GB的HBM3內存方案,帶寬最
50、高可達H100的1.6倍。圖:部分AI訓練芯片內存方案GPU型號推出時間存儲技術GPU 顯存容量顯存帶寬NVIDIA V100 SXM22017年HBM216GB/32GB900 GB/sNVIDIA A100 80GB SXM2020年HBM2e80GB2039GB/sNVIDIA H100 SXM2022年HBM380GB3.35TB/sAMD Instinct MI1002020年HBM232GB1.2 TB/sAMD Instinct MI2002021年HBM2e128GB3.2TB/sAMD Instinct MI300X2023年HBM3192GB5.2TB/s圖:HBM約兩年迭
51、代一次帶寬(GB/s)HBM供不應求資料來源:Mordor Intelligence、中航證券研究所AI創造純增量市場,HBM需求量年增近六成。目前高端AI服務器GPU搭載HBM已成主流,TrendForce預估2023年全球HBM需求量將年增近六成,來到2.9億GB,2024年將再成長三成。根據Mordor Intelligence,2020年HBM市場價值為 10.68 億美元,預計到2026年將達到40.89億美元,在2021-2026年預測期間的復合年增長率為25.4%。HBM頭部企業SK海力士在2023年7月表示,目前其HBM的銷量占比還不足營收1%,但2023年銷售額占比有望成長到
52、10%,同時預計在2024年應用于AI服務器的HBM和DDR5的銷量將翻一番。2023年10月,SK海力士表示,已經在2023年出售了明年HBM3和HBM3E的所有產量。圖:HBM市場規模預測(億美元)10.6840.89051015202530354045202020262021-2026CAGR 25.4%50%40%10%53%38%9%0%10%20%30%40%50%60%SK海力士三星電子美光2022年2023年HBM價值量顯著敢于標準DRAM,成為新利潤增長點。芯片咨詢公司 SemiAnalysis 表示,HBM的價格大約是標準DRAM芯片的五倍,為制造商帶來了更大的總利潤。目前
53、,HBM占全球內存收入的比例不到5%,但SemiAnalysis預計到2026年將占到總收入的20%以上。SK海力士首席財務官Kim Woo-hyun 在4月份的財報電話會議上表示預計2023年HBM收入將同比增長50%以上。韓系存儲供應商積極擴產,主導HBM市場。根據TrendForce,2022年三大原廠HBM市占率分別為SK海力士約50%、三星約40%、美光約10%。高階深度學習AI GPU的規格也在刺激HBM產品更迭,2023下半年伴隨NVIDIA H100與AMD MI300的搭載,三大原廠也已規劃相對應規格HBM3的量產。SK海力士作為目前唯一量產新世代HBM3產品的供應商,其整體
54、市占率有望提升至53%,而三星、美光則預計陸續在2023年底至2024年初量產,市占率分別為38%及9%?;诟髟瓘S積極擴產的策略,HBM供需比有望獲改善,預估將從2023年的-2.4%,轉為0.6%。HBM成為存儲下一主戰場,頭部廠商相繼擴產資料來源:TrendForce、中航證券研究所圖:三大存儲廠的HBM開發進度圖:2022年及2023年HBM市場份額預測擁抱頭部原廠資源,投資半導體產業鏈協同賦能。香農芯創目前擁有兩大業務板塊:電子元器件分銷平臺,和半導體產業鏈協同賦能。公司第一大供應商為SK海力士,并獲得了SK海力士、MTK等原廠的授權代理權,形成了代理原廠線優勢。公司投資半導體設計、
55、封測、設備、應用等各個環節領軍企業,推動半導體產業鏈生態發展和升級。與海力士合作拓展SSD業務。5月26日,公司公告與深圳大普微電子、江蘇疌泉君海榮芯投資等合作方共同出資設立深圳市海普存儲科技有限公司。新公司擬開展SSD存儲產品的設計、生產和銷售業務,當前我國企業級SSD市場國產化率較低,而2022-2026年我國企業級SSD市場規模將以23.7%的年均復合增速成長,市場空間廣闊。新公司的成立,助力打破技術壟斷,推進企業級SSD國產替代進程。此外,投資方江蘇疌泉君海榮芯投資的第一大股東為SK海力士(無錫)投資公司,利益共享或有技術賦能。建議關注:香農芯創深度布局存儲產業資料來源:香農芯創、中航
56、證券研究所鎖定一線品牌代理資格投資賦能,與半導體產業鏈協同發展雅克科技是平臺型先進材料公司,形成了以電子材料為核心,LNG保溫板材為補充的戰略模式。公司收購海外優質資產彎道超車,并打入海外核心客戶供應鏈,技術實力國內領先。公司半導體材料包括前驅體、光刻膠及輔助化學品、電子特氣、硅微粉等,客戶包括臺積電、三星電子、Intel、中芯國際、海力士、京東方等業國際頭部企業。2023年9月,公司發布對外投資公告,子公司江蘇雅克半導體以約2.7億元的價格收購SKenpulse公司持有的SKC-ENF75.1%的股權,SKC-ENF持有愛思易(江蘇)公司及愛思開希(南通)公司100%的股權,主要產品為半導體
57、光刻膠輔助化學品,包括顯影液、稀釋劑、蝕刻液等,目前是國內唯一擁有相關技術的本土供應商,產品可以滿足對應全品類光刻膠匹配使用。公司橫向布局濕電子化學品,拓展業務疆界,并增強主業的規模效應。建議關注:雅克科技海力士重要供應商資料來源:雅克科技、中航證券研究所推出新High-K材料及超高/低溫硅類產品,是海力士主要供應商江蘇先科工廠量產在即前驅體球形氧化鋁等產品已開始向客戶穩定供貨亞微米球形二氧化硅完成研發,供貨給住友電木、日立化成等知名環氧塑封料的廠商硅微粉工業用六氟化硫受益于國內特高壓輸變電需求子公司科美特供應臺積電、三星電子、中芯國際、海力士等頭部客戶特氣OLED用低溫RGB光刻膠、CMOS
58、傳感器用RGB光刻膠、先進封裝RDL層用i-Line光刻膠等導入客戶測試光刻膠一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂,GPU主宰算力芯片目 錄四、HBM解決GPU內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示異構計算時代,先進封裝戰略地位凸顯資料來源:英特爾、英偉達、三星、中航證券研究所異構集成(Heterogeneous Integration),即橫向和縱向連接多個半導體,可將更多的晶體管裝在一個更小的半導體上,準確地說是在更小的半導體封裝內,從而提供比其各
59、部分之和更大的功用。CPU+GPU是人工智能異構計算的主要組合形式,英偉達的Grace Hopper超級芯片通過異構集成CPU、GPU以及存儲器,實現芯片更高帶寬的互連,能夠承擔更大的數據集、更復雜的模型和新的工作負載。先進封裝成為突破“摩爾定律”局限的技術。先進封裝技術充當著半導體器件與系統之間的橋梁,是實現異構集成的關鍵技術,因此,這種連接方法變得越來越重要。先進封裝技術本身已成為一種系統解決方案,半導體頭部設計、制造商均通過此方法,在摩爾定律放緩的時代,從系統層面繼續提升芯片性能。圖:英特爾異構 3D 系統級封裝集成圖:英偉達Grace Hopper 超級芯片集成GPUCPU存儲圖:三星
60、先進異構集成順應AI算力芯片發展,封裝技術持續創新資料來源:海力士、中航證券研究所自2020年開始,先進封裝進入技術融合期,成為關鍵的系統級解決方案。不僅需要借助多項技術將各類芯片集成到同一封裝內,還需要在整合系統時將多個部分連接至同一模塊。AI計算芯片融合了多項先進封裝技術,HBM應用TSV堆疊技術獲得超高帶寬,而為了將HBM和GPU集成,CoWoS封裝技術被深度開發。因此,封裝技術將成為提供整體系統解決方案的重要手段。海力士判斷,未來各公司將依賴封裝技術助力其成為半導體行業的領軍者。圖:封裝行業發展的三個階段2010年堆疊2020年性能2030年整合開發減少封裝高度的技術(封裝堆疊芯片堆疊
61、)開發提升封裝性能的技術(凸塊 TSV)開發增強封裝整合競爭力的新技術(SiP*)順應AI算力芯片發展,封裝技術持續創新資料來源:海力士、中航證券研究所隨著封裝技術的發展,近十年中,重新分配層(RDL)、倒片封裝(Flip Chip)和硅穿孔(TSV)等封裝技術得到了積極廣泛的應用,在硅晶圓或芯片堆疊結構晶圓中進行工藝處理,大幅提高了產品的性能和容量。SK海力士憑借業界領先的TSV堆疊技術引領了市場發展,這其中包括HBM封裝存儲器解決方案,以及用于服務器的高密度存儲器(HDM)三維堆疊技術。同時,海力士持續迭代封裝技術,研發了批量回流模制底部填充、混合鍵合、扇出型晶圓級封裝等技術,以進一步提升
62、了HBM的堆疊層數。圖:堆疊封裝層數增長,提高HBM帶寬圖:海力士持續迭代封裝技術四代HBM規格比較(以SK海力士產品為例)類別HBM1HBM2HBM2EHBM3帶寬128GB/s307GB/s460GB/s819GB/s堆疊高度4層4層/8層4層/8層4層/12層容量1GB4GB/8GB8GB/16GB 16GB/24GBI/O速率1Gbps2.4Gbps3.6Gbps6.4Gbps硅通孔封裝技術大幅提升HBM帶寬資料來源:海力士、中航證券研究所HBM采用一種全新的DRAM架構,這種架構借助硅通孔技術(TSV)來增加引腳數量。通常,在DRAM規范中,“X4”表示有四個引腳用于發送信息,或可以
63、同時從DRAM發送4位(bit)信息。相應地,X8表示8位,X16表示16位,以此類推。增加引腳數量有利于同時發送更多信息。由于堆疊芯片以及連接引腳(Pin)的數量增加,引線變得更加復雜,而且也需要更多空間來容納這些引線。相比之下,硅通孔芯片堆疊則不需要復雜的布線,因而封裝尺寸更小。因此,由于自身局限性,引線芯片堆疊最多只能達到X32,而硅通孔堆疊則沒有這方面的局限性,使HBM可達到X1024。圖:封裝剖面圖HBM臺積電CoWoS封裝集成HBM與GPU資料來源:海力士、中航證券研究所HBM并非一種全封裝產品,而是一種半封裝產品。當HBM產品被送到系統半導體制造商那里時,系統半導體制造商會使用中
64、介層構建一個2.5D封裝,將HBM與邏輯芯片并排排列。由于2.5D封裝中的基板無法提供用于支持HBM和邏輯芯片的所有輸入/輸出引腳的焊盤(Pads),因此需要使用中介層來形成焊盤和金屬布線,從而容納HBM和邏輯芯片。然后,再將這些中介層與基板連接。臺積電CoWoS技術主導2.5D封裝。CoWoS是英偉達選擇的主流封裝技術,能夠以合理的成本提供最高的互連密度和最大的封裝尺寸。由于目前大部分HBM系統都封裝在CoWoS上,因此,大部分先進的數據中心GPU由臺積電在CoWoS上封裝。圖:使用HBM的2.5D封裝CoWoS封裝流程資料來源:Amkor、TSV interposer fabricatio
65、n for 3D IC packaging,中航證券研究所TSV中介板TSV中介板1、深硅刻蝕/鉆孔2、沉積3、深孔填充4、表面平坦化5、正面UBM,重布線8、背面UBM,重布線6、支撐晶圓鍵合9、焊接凸塊10、拆鍵合,清洗7、減薄TSV中介板制作流程1、將頂端晶粒倒裝、對準,于中介板面對面鍵合2、晶圓級包覆成型、塑封晶圓研磨和模塊減薄3、切割CoW模塊,通過凸塊與封裝基板相連(CoW+oS)完工的封裝晶圓CoWoS由 CoW 和 oS 組合而來。先將芯片通過 Chip on Wafer(CoW)的封裝連接至中介板,再把 CoW 模塊與基板(Substrate)連接。先進封裝生態已形成,國產替
66、代空間廣闊資料來源:KLA、中航證券研究所先進封裝生態涵蓋從芯片設計、制造、材料的供應商。包括高性能算力芯片巨頭英特爾、英偉達、AMD;存儲芯片供應商三星、海力士、鎂光;先進封裝工藝服務商臺積電、英特爾、日月光;IC載板供應商欣興電子、英特爾、AT&S等。我國本土供應商在先進封裝產業鏈的參與度較低,在逆全球化的背景下,除了實現高階芯片制程的自主可控,先進封裝的國產化也同樣迫在眉睫。圖:先進封裝產業生態 應用于高性能計算的3D SoC技術,將存儲芯片堆疊在算力芯片上 適用于高連接密度和低功耗的混合鍵合技術 將DRAM堆疊在邏輯芯片的3D-IC技術 AI和數據中心增加了對HBM需求 基于TSV的2
67、.5D中介板 使用更少TSV的RDL和HD-FO技術 異質集成技術 IC載板線寬低至5微米以下 高密度布線的ABF載板建議關注:興森科技引領IC載板國產替代資料來源:yole、中航證券研究所興森科技專注于印制電路板產業,圍繞傳統PCB業務和半導體業務兩大主線開展。PCB業務聚焦于樣板快件及批量板的研發、設計、生產、銷售和表面貼裝;半導體業務聚焦于IC封裝基板(含CSP封裝基板和FCBGA封裝基板)及半導體測試板。興森科技對IC載板產能投資全球領先。據Yole,IC載板全球市場規模2022年達到151億美元,2028年將增長至289億美元,年均增速11%。但市場主要由海外公司主導,國內正在積極擴
68、充產能,大陸廠商對IC載板的投資額占比達全球的46%,興森科技(fastprint)的資本投入在2021-2022年間排名全球第四。圖:IC載板頭部公司收入(百萬美元)圖:中國IC載板產能投資領先全球(百萬美元)建議關注:興森科技引領IC載板國產替代資料來源:愛彼電路、ifind、中航證券研究所應用于智強手機的消費電子IC封裝主要思索問題便攜性、低成本等因素,普通認為合適而使用CSP封裝,封裝尺寸較小。應用于高性能計算機的IC封裝,主要思索問題性能,普通認為合適而使用較為大型的、I/O數太多的BGA封裝。公司IC封裝基板業務毛利率下降主要因行業需求大幅下滑導致整體產能利用率下降,隨著行業回暖以
69、及公司高端產能釋放,IC載板業務有望好轉。興森珠海FCBGA封裝基板項目擬建設產能200萬顆/月(約6,000平方米/月)的產線,預計2024年第一季度進入小批量生產階段。;廣州FCBGA封裝基板項目擬分期建設2,000萬顆/月(2萬平方米/月)的產線,一期廠房已于2022年9月完成廠房封頂;CSP封裝基板產能為3.5萬平方米/月,得益于行業需求逐步回暖,CSP封裝基板產能利用率逐季提升。圖:主流的IC載板類型圖:興森科技IC載板收入及毛利率建議關注:華海誠科環氧塑封領先企業資料來源:華海誠科招股書、中航證券研究所華海誠科主要產品包括環氧塑封料與電子膠黏劑,廣泛應用于半導體封裝、板級組裝等應用
70、場景。其中,環氧塑封料與芯片級電子膠黏劑與半導體封裝技術的發展息息相關,是保證芯片功能穩定實現的關鍵材料?,F建有先進的環氧模塑料中試線1條、大生產線5條。目前公司的研發能力和生產能力在國內環氧塑封料行業排名前列。芯片級底部填充膠主要應用于FC(Flip Chip)封裝領域,根據Yole,FC在先進封裝的市場占比約為80%左右,是目前最具代表性的先進封裝技術之一,具體類型包括FC-BGA、FC-SiP等先進封裝技術,目前該市場仍主要為日本納美仕、日立化成等外資廠商壟斷,國內芯片級底部填充膠目前主要尚處于實驗室階段。公司FC底填膠已通過星科金朋的考核驗證,在內資廠商中處于領先水平。圖:環氧塑封料應
71、用場景圖:FC底填膠的使用流程建議關注:艾森股份先進封裝材料平臺資料來源:艾森股份招股書、中航證券研究所艾森股份圍繞電子電鍍、光刻兩個半導體制造及封裝過程中的關鍵工藝環節,形成了電鍍液及配套試劑、光刻膠及配套試劑兩大產品板塊布局。公司主要產品以傳統封裝材料為主,先進封裝材料逐步放量。公司先進封裝用電鍍銅基液(高純硫酸銅)已在華天科技正式供應;先進封裝用電鍍錫銀添加劑已通過長電科技的認證,尚待終端客戶認證通過;先進封裝用電鍍銅添加劑正處于研發及認證階段。先進封裝光刻方面,公司以光刻膠配套試劑為切入點,成功實現附著力促進劑、顯影液、去除劑、蝕刻液等產品在下游封裝廠商的規?;?。同時,公司積極開展
72、光刻膠的研發,目前,公司自研先進封裝用g/i線負性光刻膠已通過長電科技、華天科技認證并實現批量供應。圖:公司先進封裝材料收入占比提升(億元)圖:公司先進封裝材料一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂,GPU主宰算力芯片目 錄四、HBM解決GPU內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示AI算力對高效電源提出新需求資料來源:MPS、中航證券研究所圖:圖24 云計算領域的電源市場規模(億美元)據高性能電源解決方案供應商MPS測算,云計算領域的電源市場規模增長迅速
73、,從2015年8億美元,至2021年增長四倍,達到40億美元。云計算模擬電源市場由CPU服務器電路、GPU服務器電路、機架電路構成,市場規模分別為10億美元、10億美元、20億美元。CPU服務器中,CPU供電、存儲器供電、PoL(負載點)供電、eFuse(電子保險絲)市場規模分別為6億、2.8億美元、0.6億美元、0.6億美元。圖:云計算電源市場構成服務器電源架構轉向48V資料來源:松下、中國信通院、中航證券研究所圖:中國數據中心功率密度趨勢(kW)數據中心功率密度增長,功耗隨之提升。隨著服務器計算能力增長快速,總體功耗也隨之提升。據華為,單IT機柜主流功率密度將從6-8kW/柜提高到12-1
74、5kW/柜2027,超算、智算中心功率密度將提升至30kW以上。高達 40%的數據中心運營成本來自為服務器機架供電與冷卻所需的能源,由于數據中心功率密度增加,提高供電效率成為數據中心廠商創造額外利潤的重要路徑。48V直流供電能夠降低服務器配電損耗。據松下測試結果,計算配電路徑的電阻為0.1m時的配電損耗,12V時為100W,48V時為6.25W,會出現16倍的計算差異。在各家公司都在積極致力于節省電力消耗中,谷歌公司于2016年率先引入了48V直流供電的手法。圖:供電電壓差異引起的損耗比較算力電路的供電設計擁有較高壁壘資料來源:MPS、中航證券研究所圖:服務器供電過程典型48V電源架構包含一個
75、 AC/DC 前端,負責生成 48V 直流電。該直流電會被輸送至DC/DC 變換器,在這里電壓被轉換成 12V 中間母線結構。然后將 12V 母線電壓分配至板上多個負載點(PoL)變換器中,為內核CPU、GPU等提供電源。大多數內核芯片或子電路所需的電壓范圍為 1V-3.3V,電流范圍卻為幾十毫安至數百安培。通常,處理從幾十毫安到數百安培應用程序的傳統方式會采用離散模擬解決方案。離散模擬解決方案的構建塊由一個控制器 IC 和一對外部 MOSFET 或一個驅動 MOSFET(DrMOS)IC 組成。由于內核芯片的電源軌對時序、電壓精度、裕量和檢測能力的設計要求非常嚴格,因此存在較大的設計壁壘。1
76、3.3V背面供電技術提升堆疊芯片能效資料來源:半導體行業觀察、維科網電子工程、中航證券研究所圖:前端供電 vs 背面供電隨著晶體管越來越小,密度越來越高,互連線和電源線共存的線路層變成了一個越來越混亂的網絡,堆棧層數也越來越多,可能需要穿過10至20層堆棧才能為下方的晶體管提供供電和數據信號。因此,業界在研究一種“將電源線遷移到芯片背面”的方法,這樣可以讓芯片正面只需要專注于與晶體管的信號互連。背面供電技術(BSPDN)可解釋成小芯片設計演變,原本將邏輯電路和存儲器模組整合的現有方案,改成正面具備邏輯運算功能,背面供電或信號傳遞。背面供電技術能減輕線路后端的布線擁塞并提供電源性能優勢,以及解決
77、晶體管縮放中日益嚴重的電力輸送問題。前端供電 高成本 高IR Droop 效應 高電容電阻延遲背面供電 減少EUV光刻次數,降低成本 IR Droop效應顯著下降。IR降從50mV下降到20mV 芯片性能提高了44%,能效提高了30埋入式電源軌、TSV技術驅動背面供電發展資料來源:泛林集團、中航證券研究所圖:使用埋入式電源軌進行背面供電背部供電需要兩項關鍵技術,分別是埋入式電源軌(BPR)與納米硅穿孔(nTSV)。晶圓制造過程將先制造正面的晶體管,然后添加互聯層,然后將晶圓反轉,并對背面進行打磨減薄,再通過納米硅穿孔(TSV)技術在晶圓背面進行制造供電網絡,并與埋入式的電源軌連接。埋入式電源軌
78、是一種微縮化技術,可以進一步降低標準單元的高度,并減緩IR壓降問題。這些電源軌是埋在電晶體下方的導線,一部份藏在硅基板內,另一部份則在淺溝槽隔離氧化層內。它們取代了傳統后段制程在標準單元布下的電源線與接地線。圖:硅中介層的工藝處理半導體巨頭加碼背面供電技術資料來源:臺積電、英特爾、三星、中航證券研究所臺積電、三星、英特爾等芯片大廠都在積極布局背面供電網絡技術,其中英特爾較為領先。英特爾將在Intel 20A工藝上首個采用PowerVia背面供電技術及RibbonFET全環繞柵極晶體管的節點,預計將于2024年上半年實現生產準備就緒,應用于未來量產的客戶端ARL平臺,目前正在晶圓廠啟動步進。計劃
79、在2027年1.4nm工藝使用背面供電技術Powervia背面供電技術預計將于2024年上半年實現生產準備就緒2納米背面電軌解決方案計劃于2025年下半年推出,并在2026年實現量產建議關注:希荻微研發服務器高壓供電方案資料來源:希荻微官網、中航證券研究所希荻微主要產品為服務于消費類電子和車載電子領域的電源管理芯片及信號鏈芯片等模擬集成電路,現有產品布局覆蓋DC/DC芯片、鋰電池充電管理芯片、端口保護和信號切換芯片、電源轉換芯片等,具備高效率、高精度、高可靠性的良好性能。此外,公司計劃拓展AF/OIS技術相關的音圈馬達驅動芯片作為新的產品線。希荻微與普林斯頓合作開發專利,解決服務器Chiple
80、t供電瓶頸。希荻微與普林斯頓兩方的研究人員共同發明了一種基于混合型電荷泵電路的兩級多輸出供電架構。其中,電荷泵輸入級以很高的效率將高壓(如48V)輸入轉換為多個錯相的脈沖,并通過多個電壓軌和電感元件同時耦接到多個電荷泵輸出級以為芯粒架構處理器的多個電壓域分別供電。這樣的架構顯著地簡化了供電電路,并為供電電路與處理器封裝的進一步集成提供了一條新的路徑。圖:希荻微與普林斯頓開發的專利架構圖圖:采用希荻微專利技術的三維封裝示意圖一、AI處史上最長繁榮期,算力國產化需求迫切二、AI技術收斂,GPU主宰算力芯片目 錄四、HBM解決GPU內存危機,成為存儲下一主戰場三、“AI信創”驅動,培育國產算力生態五
81、、異構計算時代,先進封裝戰略地位凸顯六、電源技術提升計算能效,背面供電蓄勢待發七、風險提示風險提示AI技術發展不及預期。AI算法、模型存較高不確定性,AI大模型迭代速度、升級效果存不確定性,AI技術整體進度發展可能延緩。AI應用不及預期。目前沒有成熟的應用場景,使AI大模型形成好的商業閉環。大模型成本過高的風險。目前AI大模型使用成本較高,如果下游接受不了長期高價的AI技術收費,相關AI投入增長或慢于預期,致使行業增長不及預期。國產芯片發展不及預期的風險。目前國產GPU生態不成熟,設計和生產能力落后于國外,國內客戶對國產芯片的接受程度有減弱的風險。針對AI的監管政策收緊。AI可能帶來越來越多的
82、用戶隱私、道德、倫理風險,由此將引致更嚴格的政策監管。分析師承諾負責本研究報告全部或部分內容的每一位證券分析師,再次申明,本報告清晰、準確地反映了分析師本人的研究觀點。本人薪酬的任何部分過去不曾與、現在不與,未來也將不會與本報告中的具體推薦或觀點直接或間接相關。風險提示:投資者自主作出投資決策并自行承擔投資風險,任何形式的分享證券投資收益或者分擔證券證券投資損失的書面或口頭承諾均為無效。免責聲明本報告由中航證券有限公司(已具備中國證券監督管理委員會批準的證券投資咨詢業務資格)制作。本報告并非針對意圖送發或為任何就送發、發布、可得到或使用本報告而使中航證券有限公司及其關聯公司違反當地的法律或法規
83、或可致使中航證券受制于法律或法規的任何地區、國家或其它管轄區域的公民或居民。除非另有顯示,否則此報告中的材料的版權屬于中航證券。未經中航證券事先書面授權,不得更改或以任何方式發送、復印本報告的材料、內容或其復印本給予任何其他人。未經授權的轉載,本公司不承擔任何轉載責任。本報告所載的資料、工具及材料只提供給閣下作參考之用,并非作為或被視為出售或購買或認購證券或其他金融票據的邀請或向他人作出邀請。中航證券未有采取行動以確保于本報告中所指的證券適合個別的投資者。本報告的內容并不構成對任何人的投資建議,而中航證券不會因接受本報告而視他們為客戶。本報告所載資料的來源及觀點的出處皆被中航證券認為可靠,但中
84、航證券并不能擔保其準確性或完整性。中航證券不對因使用本報告的材料而引致的損失負任何責任,除非該等損失因明確的法律或法規而引致。投資者不能僅依靠本報告以取代行使獨立判斷。在不同時期,中航證券可發出其它與本報告所載資料不一致及有不同結論的報告。本報告及該等報告僅反映報告撰寫日分析師個人的不同設想、見解及分析方法。為免生疑,本報告所載的觀點并不代表中航證券及關聯公司的立場。中航證券在法律許可的情況下可參與或投資本報告所提及的發行人的金融交易,向該等發行人提供服務或向他們要求給予生意,及或持有其證券或進行證券交易。中航證券于法律容許下可于發送材料前使用此報告中所載資料或意見或他們所依據的研究或分析。我
85、們設定的上市公司投資評級如下:買入:未來六個月的投資收益相對滬深300指數漲幅10%以上。持有:未來六個月的投資收益相對滬深300指數漲幅-10%-10%之間賣出:未來六個月的投資收益相對滬深300指數跌幅10%以上。我們設定的行業投資評級如下:增持:未來六個月行業增長水平高于同期滬深300指數。中性:未來六個月行業增長水平與同期滬深300指數相若。減持:未來六個月行業增長水平低于同期滬深300指數。中航科技電子團隊介紹:首席:趙曉琨SAC執業證書:S0640122030028十六年消費電子及通訊行業工作經驗,曾在華為、阿里巴巴、摩托羅拉、富士康等多家國際級頭部品牌終端企業,負責過研發、工程、供應鏈采購等多崗位工作。曾任職華為終端半導體芯片采購總監,阿里巴巴人工智能實驗室供應鏈采購總監。分析師:劉牧野SAC執業證書:S0640522040001約翰霍普金斯大學機械系碩士,2022年1月加入中航證券。擁有高端制造、硬科技領域的投研經驗,從事科技、電子行業研究。研究助理 劉一楠SAC執業證書:S0640122080006西南財經大學金融碩士,2022年7月加入中航證券,覆蓋半導體設備、半導體材料板塊。研究助理 蘇弘宇SAC執業證書:S0640122040021俄亥俄州立大學金融數學學士,約翰霍普金斯大學金融學碩士。2022年加入中航證券。