《電子行業:AI應用側深度滲透驅動國產先進封裝技術尋求突破-250227(36頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業:AI應用側深度滲透驅動國產先進封裝技術尋求突破-250227(36頁).pdf(36頁珍藏版)》請在三個皮匠報告上搜索。
1、請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -1-DeepSeek 在算法層面實現三大突破通過低秩鍵值壓縮(MLA)將注意力計算內存占用降低 80%,動態稀疏 MoE 架構使每個 Token 僅激活 5.5%參數,以及 GRPO 強化學習框架驅動模型自主進化多步推理能力。千億參數模型在通用任務上達到與密集模型相當的精度,同時降低 37%推理延遲。模型的高效運行模型的高效運行仍依賴硬件層面的三重能力支撐:仍依賴硬件層面的三重能力支撐:高并行計算高并行計算、高存儲帶寬、高存儲帶寬、超低延遲互連。、超低延遲互連。效率提升需求下降:
2、效率提升需求下降:本質上,算法優化并非削弱算力產業價值,而是通過重構需求結構打開更大市場空間從集中式訓練向分布式推理延展,從通用計算向場景專用架構升級,最終形成萬億級算力市場的多級增長引擎。降降本普及增量本普及增量 的螺旋上升的螺旋上升效應將推動效應將推動 PostPost-trainingtraining 微調算力激增微調算力激增、云端云端推理并發量指數增長推理并發量指數增長、邊緣側長尾需求爆發邊緣側長尾需求爆發帶來總算力需求。帶來總算力需求。模型參數量、訓練數據持續擴充,高性能算力芯需求仍高模型參數量、訓練數據持續擴充,高性能算力芯需求仍高:單純倚仗傳統芯片設計與制造通過縮小 FET 尺寸
3、去提高芯片性能的方式效率降低,且規?;呺H減弱。更重要的是,對于不同場景化需求不同,高帶寬,低延遲,高能效比有更高要求,系統級線寬系統級線寬/線距瓶頸限制了高速數據在芯片之間、芯片與外線距瓶頸限制了高速數據在芯片之間、芯片與外部存儲器之間高效傳輸,嚴重制約了部存儲器之間高效傳輸,嚴重制約了 AIAI 芯片性能的充分釋放。先進封裝是芯片性能的充分釋放。先進封裝是“More Than MooreMore Than Moore”(超越摩爾)時代的解決方案?!保ǔ侥枺r代的解決方案。封裝技術正逐步從封裝技術正逐步從 PCBPCB 的層面,向芯片內部(即的層面,向芯片內部(即 ICIC 層面)轉變:
4、層面)轉變:采用 2.5D和 3D 封裝技術,不再依賴傳統的 PCB 作為主連接平臺,而是直接將多個 IC芯片通過轉接板(interposer,如硅轉接板、玻璃轉接板等)進行集成。2.5D2.5D封裝技術的核心在于封裝技術的核心在于 TSVTSV、InterposerInterposer、RDLRDL、BumpsBumps,各大廠商基于這些組裝,各大廠商基于這些組裝以達到不同客戶需求。以達到不同客戶需求。據據 YOLEYOLE 預測,預測,20232023 年全球先進封裝營收約年全球先進封裝營收約 378378 億美億美元,占半導體封裝市場的元,占半導體封裝市場的 44%44%;2024202
5、4 年增長至年增長至 425425 億美元,至億美元,至 20292029 年,先進年,先進封裝營收有望增長至封裝營收有望增長至 695695 億美元,年復合增長率億美元,年復合增長率 11%11%,其中,其中 2.5D/3D2.5D/3D 封裝滲封裝滲透率最快。透率最快。投資建議:投資建議:關注關注 2.5D/3D2.5D/3D 封裝技術核心前道設備廠商、基板材料及封裝技術核心前道設備廠商、基板材料及 OSATOSAT 廠廠商。商。設備廠商:北方華創、拓荊科技、盛美上海、中微公司設備廠商:北方華創、拓荊科技、盛美上海、中微公司 基板材料廠商:興森科技基板材料廠商:興森科技 OSATOSAT
6、廠:長電科技、通富微電廠:長電科技、通富微電 風險提示:風險提示:1 1、2.5D2.5D 3D3D 封裝及其他先進封裝難度較大,良率有待改善,或影封裝及其他先進封裝難度較大,良率有待改善,或影響利潤響利潤;2 2、前期設備投入及研發成本較高前期設備投入及研發成本較高;3 3、AIAI 應用落地速度不及預期應用落地速度不及預期 行業指數相對滬深行業指數相對滬深 300300 表現表現 證券分析師:唐仁杰 執業證書編號:S0370524080002 公司郵箱: 聯系電話:0755-83025184 電子行業電子行業 評級:評級:增持(首次)增持(首次)2022025 5 年年 2 2 月月 27
7、27 日日 AIAI 應用側深度滲透,驅動國產先進封裝技術尋應用側深度滲透,驅動國產先進封裝技術尋求突破求突破 行業深度研究行業深度研究 證券研究報告證券研究報告 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -2-一、一、DeepSeek 架構上的突破架構上的突破-算法層面解決算力效率問題算法層面解決算力效率問題 DeepSeek 從模型的輸入處理階段到計算階段再到模型的輸出階段進行深層次優化,顯著提升算力效率,使得其在訓練階段以及推理階段在保持模型性能的同時,減少冗余計算,從而塑造出更高性價比模型。傳
8、統 Transformer 模型的自注意力機制存在顯著的計算瓶頸:處理 n 長度序列時需構建 n規模的注意力矩陣,導致內存和計算復雜度均呈(2)增長。以 1024 長度序列為例,單頭注意力矩陣即需 4MB 存儲,疊加多頭多層結構后硬件資源極易耗盡。在推理場景中,由于需實時逐 Token 生成文本,重復計算歷史 Token 的鍵值數據會引發指數級資源消耗。DeepSeek 通過引入 KV 緩存機制實現突破性優化:將歷史 Token的鍵值向量存儲復用,僅計算新 Token 的查詢向量進行匹配。該策略使推理階段復雜度從(2)降至(),大幅減少冗余計算。KVKV 緩存快速存取,以及更強的并行計算能力處
9、理動態增長的序緩存快速存取,以及更強的并行計算能力處理動態增長的序列數據,列數據,仍對高性能算力芯片吞吐仍對高性能算力芯片吞吐量量有一定要求。有一定要求。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -3-圖表圖表 1 1:With KV cache VS without KV cacheWith KV cache VS without KV cache 數據來源:數據來源:Transformers KV Caching ExplainedTransformers KV Caching Explained
10、,金元證券研究所,金元證券研究所 DeepSeek V2 通過 Multi-Head Latent Attention(MLA)技術突破現有注意力機制瓶頸:傳統多頭注意力(MHA)需存儲完整鍵值矩陣,導致 KV 緩存空間隨序列長度線性膨脹。主流改進方案如MQA(多查詢注意力)和 GQA(分組查詢注意力)雖能降低緩存需求,但存在顯著性能損失MQA 緩存需求最小但精度最弱,GQA則在緩存與性能間折中。MLAMLA 創新性地引入低秩鍵值聯合壓縮:創新性地引入低秩鍵值聯合壓縮:將原始高維鍵值矩陣映射至低秩潛在空間,僅需存儲壓縮后的潛在向量。該方法使 KV 緩存空間較 MHA 減少 90%以上(對標 G
11、QA 水平),同時保持與 MHA相當的性能表現。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -4-圖表圖表 2 2:MHA vs GQA vs MQA vs MLA 數據來源:數據來源:DeepSeek V2 tech reportDeepSeek V2 tech report ,金元證券研究所,金元證券研究所 DeepSeek-V3 的混合專家(MoE)架構實現超大規模高效計算 相較于傳統 Dense 模型(如 Llama3),DeepSeek-V3 作為 6710 億參數的 MoE 模型,通過動態稀
12、疏計算突破算力瓶頸:每個 Token僅激活約 5.5%參數(37B/671B),在保持模型規模優勢的同時顯著降低計算負載:動態路由機制:動態路由機制:通過門控網絡為每個 Token 選擇 1-2 個專家(小型前饋神經網絡),替代傳統 Transformer 中全參數參與的固定計算模式。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -5-稀疏計算流:稀疏計算流:僅被選中的專家執行正向傳播,其余 90%以上參數處于靜默狀態。通過細粒度專家通過細粒度專家+共享專家的組合替換粗粒共享專家的組合替換粗粒度的專家,形
13、成更高細粒度的專家池。度的專家,形成更高細粒度的專家池。訓練效率訓練效率方面:方面:正向傳播:單步計算量較 Dense 模型減少 40%-60%(與專家選擇數量強相關)反向傳播:梯度更新僅作用于被激活的專家及路由網絡,參數更新量減少至全量模型的 10%以下 推理推理效率效率方面:方面:算力需求解耦:推理延遲與激活參數量(而非總參數量)正相關,長文本處理效率提升 3-5 倍 硬件友好性:稀疏計算模式更適配支持動態路由的 AI 加速芯片 架構使模型在同等算力預算下,可擴展至架構使模型在同等算力預算下,可擴展至 1010 倍于倍于 DenseDense 模型的模型的參數量,為參數量,為 規模決定性能
14、規模決定性能 的大模型發展提供可持續路徑的大模型發展提供可持續路徑。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -6-圖表圖表 3 3:DeepSeekDeepSeek-V3V3 采用采用 DeepSeek DeepSeek MoEMoE 架構,算法層面提升計算效率架構,算法層面提升計算效率 DeepSeek V3 DeepSeek V2.5 0905 Qwen2.5 72B-Inst Llama3.1 405B-Inst Architecture MoE MoE DENSE DENSE#Activat
15、ed Params 37B 21B 72B 405B#Total Params 671B 236B 72B 405B 數據來源:數據來源:DeepSeekDeepSeek,金元證券研究所,金元證券研究所 圖表圖表 4 4:MoE 基礎架構 數據來源:數據來源:Hugging FaceHugging Face,Switch Transformer by Google,Switch Transformer by Google,DeepSeek V3 tech report,DeepSeek V3 tech report,金元證券研究所金元證券研究所 圖圖 1 1 左側:標準左側:標準 Transf
16、ormerTransformer 塊塊;右側:右側:Switch Switch TransformerTransformer 塊,單個塊,單個 FFNFFN 替換為多個替換為多個 FFNFFN(名為“專家”)(名為“專家”)傳統 MoE 模型通過引入輔助損失函數強制均衡專家負載,但策略因忽視數據分布特性,導致同類任務被分散路由至不同專家,引發領域知識割裂與參數冗余兩大問題。DeepSeek V3DeepSeek V3 創新性提出創新性提出無輔助損失負載均衡策略無輔助損失負載均衡策略,在門控網絡中嵌入可學習偏置項,動態感知專家負載狀態并自動調節路由偏好:過載專家通過偏置負向修正降低激活概率,使模
17、型在訓練過程中自主收斂至負載均衡2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -7-與知識聚合的平衡態。通過共享專家(每層強制全局激活)與 256個路由專家的協同設計,模型在模型在 TokenToken 級別動態篩選級別動態篩選 8 8 個候選專個候選專家并最終路由至家并最終路由至4 4 個高置信節點,實現通用能力集中化個高置信節點,實現通用能力集中化(共享(共享專家承載跨領域知識)與專業能力垂直化專家承載跨領域知識)與專業能力垂直化(路由專家專注細分任(路由專家專注細分任務)的解耦優化。務)的解耦優化。
18、訓練階段容忍10:1的專家激活頻率差異,通用任務精度損失0.5%的同時提升垂直任務性能 12-15%;推理階段通過共享專家固定激活與動態路由的混合計算流,單步計算量較傳統 MoE 減少 37%,顯存占用下降 28%。技術突破對算力芯片提出新需求,即需支持即需支持偏置項實時更新(微秒級動態路由決策)與專家權重異構存儲(共偏置項實時更新(微秒級動態路由決策)與專家權重異構存儲(共享專家高頻訪問數據獨立緩存)享專家高頻訪問數據獨立緩存)圖表圖表 5 5:共享專家+無額外損耗負載均衡策略 數據來源:數據來源:DeepSeek V3DeepSeek V3 ,金元證券研究所,金元證券研究所 2025 年
19、2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -8-二、二、DeepSeek-R1:打造更強大推理能力:打造更強大推理能力 DeepSeek-R1 系列包含基礎模型 R1-Zero 及其蒸餾變體,突破性地通過純強化學習(RL)路徑實現大語言模型高階推理能力,顛覆監督微調(SFT)為推理能力必要前提的傳統認知。其核心創新在于群體相對策略優化(GRPO)算法,相較主流近端策略優化(PPO)實現三大技術躍遷:1 1、算法架構重構、算法架構重構 去價值模型依賴去價值模型依賴:GRPO 摒棄 PPO 中獨立的價值模型(Value
20、 Model),通過組內相對優勢計算替代絕對基線預測,消除策略-價值模型協同訓練的開銷 動態組評分機制:動態組評分機制:對同批次生成結果進行組內排序,基于相對獎勵積分(如 Top 20%答案自動獲得優勢權重)驅動策略更新,避免 PPO 中廣義優勢估計(GAE)的復雜計算 2 2、計算效率突破、計算效率突破 訓練成本對比:訓練成本對比:在同等 7B 參數規模下,GRPO 較 PPO 減少 32%顯存占用,單步訓練耗時下降 41%收斂效率提升:收斂效率提升:在代碼生成任務(HumanEval 基準)中,GRPO達成 80%最終性能的迭代輪次僅為 PPO 的 1/3 2025 年 2 月 請務必仔細
21、閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -9-3 3、推理能力強化路徑推理能力強化路徑:推理(Reasoning)與推斷(Inference)解耦:推理能力:推理能力:通過 GRPO 的組內對抗機制,強制模型學習邏輯鏈拆解與多步決策優化(如數學證明題解決路徑規劃)推斷能力:推斷能力:保留基礎 Transformer 架構的并行計算特性,確保 Token 生成速度與標準模型對齊 圖表圖表 6 6:GRPO vs PPO 數據來源:數據來源:DeepSeek MathDeepSeek Math,金元證券研究所,金元證券研究所 在 GS
22、M8K 數學推理數據集上,R1-Zero 未經過 SFT 直接通過 GRPO訓練,準確率達 82.3%,超越同規模 SFT+PPO 方案(78.1%)DeepSeek-R1-Zero 通過群體相對策略優化(GRPO)算法,在純強化學習框架下實現了大語言模型推理能力的自主進化,其核心突2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -10-破在于無需監督微調(SFT)即可完成高階邏輯思維的涌現。訓練過程中,模型展現出顯著的非線性能力躍遷:初期階段(0-30%訓練周期)的思考鏈長度局限在 50-100 Toke
23、n,僅能處理簡單推理任務(如基礎算術),但在引入 GRPO 的組內相對優勢機制后,模型自發擴展多步推理能力,復雜數學證明任務的思考鏈長度提升至 2000+Token,且伴隨策略梯度突變現象(訓練損失曲率變化超 40%),驅動 AIME-2024 評測的 pass1 準確率從 15.6%躍升至71.0%,達到與 SFT+RLHF 混合訓練方案相當的水平。這一過程依賴于GRPO構建的自監督探索-評估閉環模型通過批量生成候選答案并動態對比組內獎勵積分,自主優化推理路徑規劃策略,例如在 33%訓練周期后出現關鍵轉折點:錯誤答案的路徑回溯率提升 62%,高難度任務的計算資源占比從 15%增至 58%,實
24、現類似人類頓悟(Aha Moment)的策略優化效果。GRPO 通過去價值模型依賴與動態組評分兩大革新,將傳統 PPO 算法的單步優勢計算轉化為批量相對評估,使訓練效率提升。同時激活硬件層面的新型需求:需支持動態計算圖(需支持動態計算圖(Dynamic Dynamic Computation Computation GraphGraph)以加速可變長度思考鏈()以加速可變長度思考鏈(128128-4096 Token4096 Token彈性伸縮)、稀疏激活內存管理(彈性伸縮)、稀疏激活內存管理(95%95%未激活路徑僅保留元數據)未激活路徑僅保留元數據)以及批內并行比較單元(如英偉達以及批內并
25、行比較單元(如英偉達 H100H100 的的 Transformer EngineTransformer Engine2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -11-指令集優化)。指令集優化)。圖表圖表 7 7:DeepSeek R1 Zero 推理能力顯著提升,達到了與 OpenAI-o1-0912 相當的性能水平 數據來源:數據來源:DeepSeekDeepSeek R1R1,金元證券金元證券 pass1pass1 為模型一次性通過測試,衡量模型準確度;為模型一次性通過測試,衡量模型準確度;co
26、ns64cons64 為模型多次測試,為模型多次測試,為模型為模型答案一致性考量答案一致性考量 三、效率提升需求下降三、效率提升需求下降 DeepSeek 在算法層面的突破顯著降低了訓練階段的算力門檻根據官方披露,R1 模型僅使用 2048 塊 NVIDIA H800 GPU(算力成本約 558 萬美元)即完成 14.8 萬億 Token 訓練,較同類千億參數模型的典型配置(通常需 5000+GPU)減少 60%硬件投入。這一效率提升主要源于動態稀疏計算架構(單 Token 激活 5.5%參數)與低2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲
27、明 曙光在前曙光在前 金元在先金元在先 -12-秩壓縮技術(KV 緩存減少 90%)的協同作用。然而,算法效率的提升正在加速然而,算法效率的提升正在加速 AIAI 應用的規?;涞?,進而催生應用的規?;涞?,進而催生總算力需求總算力需求,降本普及增量降本普及增量 的螺旋上升效應爆發的螺旋上升效應爆發:Post-training 微調算力激增:Post-training 階段的海量微調(如企業日均執行數萬次任務)會持續消耗可觀算力,高效微調技術(如 LoRA)雖將單任務能耗壓至預訓練的 1%-5%,但規?;渴鹣碌目偭咳詫λ懔A設施提出高并發、低延遲需求。云端推理并發量指數增長:AIGC 應用
28、推動云端推理 QPS(每秒查詢量)持續攀升,用戶要求響應延遲100ms,驅動高帶寬存儲與低延遲互連成為剛需。邊緣側長尾需求爆發:通過模型蒸餾技術,DeepSeek R1 能夠很容易部署至本地并進行微調,盡管單設備算力需求不敵云端,但總量需求仍大。本質上,算法優化并非削弱算力產業價值,而是通過重構需求結構打開更大市場空間從集中式訓練向分布式推理延展,從通用計算向場景專用架構升級,最終形成萬億級算力市場的多級增長引擎。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -13-圖表圖表 8 8:更多用戶和場景化采用
29、 AI,形成規?;?公司公司/機構機構 接入時間接入時間 合作內容合作內容 行業行業/領域領域 百度 2025 年 2 月 百度搜索、文心智能體平臺全面接入DeepSeek,優化拍照解題功能,千帆平臺上線 DeepSeek-R1/V3 模型 互聯網、AI 云服務 騰訊微信 2025 年 2 月15 日 灰度測試“AI 搜索”功能,接入 DeepSeek-R1 滿血版模型,支持聯網搜索和隱私保護 社交、搜索 中國電信、移動、聯通 2025 年 2 月 三大運營商全面接入 DeepSeek,推動通信產業智能化升級,優化算力成本與代碼生成功能 通信、云計算 奇安信 2025 年 2 月 QAX
30、安全大模型深度接入 DeepSeek,提升威脅研判性能 16%,降低運營成本 網絡安全 深圳市龍崗區政府 2025 年 2 月8 日 政務外網部署 DeepSeek-R1 全尺寸模型,賦能公職人員智能辦公 政務 宿遷市政務云 2025 年 2 月 完成 DeepSeek 私有化雙區部署,計劃構建多參數模型矩陣服務體系 智慧城市、政務 華南理工大學 2025 年 2 月22 日 本地部署 DeepSeek-R1 滿血版,支持復雜推理與私有知識庫融合,并向省內院校共享算力服務 教育、科研 鈦動科技 2025 年 2 月 全球首批 AI 產業布局企業,應用 DeepSeek優化算力兼容性 跨境營銷、
31、AI應用 東風汽車 2025 年 2 月 旗下自主品牌車型接入 DeepSeek 全系列大模型,應用于智能交互與車載系統 汽車制造 中國石化、國家能源集團 2025 年 2 月 完成 DeepSeek 私有化部署,推動石油化工、能源領域智能化轉型 能源 微博智搜 2025 年 2 月20 日 內部測試接入 DeepSeek-R1,結合微博討論內容生成分析結論 社交媒體 清華大學 2025 年 2 月 通過開源項目實現 DeepSeek-R1 滿血版本地部署,支持單張消費級顯卡運行 教育、技術研發 西城區數據局 2025 年 2 月 推動轄區企業接入 DeepSeek,加速“中國數據街”建設,聚
32、焦數據要素流通與產業生態構建 數字經濟、政策規劃 奇瑞汽車 2025 年 2 月 星途星紀元 ES 車型接入 DeepSeek-R1,實現語音交互與智能駕駛功能優化 智能汽車 致遠互聯 2025 年 2 月 協同管理平臺接入 DeepSeek,提升企業業務流程自動化與數據分析能力 企業服務 數據來源:數據來源:公司官網、公眾號等公司官網、公眾號等,金元證券,金元證券研究所研究所 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -14-四、模型參數量四、模型參數量、訓練數據、訓練數據持續擴充持續擴充,高性能算
33、力芯需求仍高,高性能算力芯需求仍高 雖然 DeepSeek 在算法層面優化運算效率,但 AI 模型的性能高度依賴訓練數據的規模和多樣性以及參數量。隨著 AI 應用的復雜性增加,訓練數據集規模持續擴大。根據 Zhewei Yao、Sehoon Kim 等人研究發現,大型 Transformer 模型中的參數數量呈指數級增長,每兩年增加 410 倍,這也使得這也使得采用并行計算、浮點計算采用并行計算、浮點計算能力更強的能力更強的 GPUGPU、FPGAFPGA、ASICASIC 的需求遠勝傳統的需求遠勝傳統 CPUCPU。圖表圖表 9 9:DeepSeek R1 Zero 推理能力顯著提升,達到了
34、與 OpenAI-o1-0912 相當的性能水平 數據來源:數據來源:AI and Memory WallAI and Memory Wall,金元證券,金元證券研究所研究所 傳統芯片設計與制造通過縮小 Mosfet 尺寸去提高芯片性能的方式已觸達物理極限,量子隧穿效應、短溝道效應以及光刻技術均2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -15-在一定程度上使得摩爾定律放緩,高性能芯片的可靠性及功耗成為難題。更重要的是,摩爾定律描述的是芯片的規?;?,但有不少研究表明隨著 FET 的柵長縮小,其成本并
35、未下降。28nm 技術節點后,FinFET 取代平面技術構建了 3D 結構后,成本居高不下。圖表圖表 1 10 0:Moore 定律放緩,且規?;J減 數據來源:數據來源:MarvellMarvell,金元證券,金元證券研究所研究所 單純倚仗傳統芯片設計與制造通過縮小 Mosfet 尺寸去提高芯片性能的方式效率降低,先進封裝技術是后摩爾時代的關鍵。隨著隨著晶圓技術的進步,晶圓技術的進步,片內互連(片內互連(ICIC 層級)與系統板級互連(層級)與系統板級互連(PCBPCB 層層級)之間的線寬級)之間的線寬/線距(線距(Line/Space,L/SLine/Space,L/S)差距日益擴大,
36、導致)差距日益擴大,導致信號完整性惡化、帶寬受限及能效下降信號完整性惡化、帶寬受限及能效下降。這一矛盾已成為制約算力芯片性能的關鍵瓶頸。面臨單芯片制程的物理極限及經濟效益遞減問題,先進封裝是“More Than Moore”(超越摩爾)時代的2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -16-解決方案。半導體封裝不僅提高了系統性能,也是人工智能發展的關鍵基礎。圖表圖表 1 11 1:先進封裝彌補單芯片制程極限先進封裝彌補單芯片制程極限 數據來源:數據來源:日月光日月光,金元證券,金元證券研究所研究所 系
37、統級線寬/線距瓶頸在 AI 時代更為凸顯。計算需求呈現爆發式增長,對 AI 芯片的算力、存儲帶寬、能效比提出了前所未有的高要求。然而,系統級線寬然而,系統級線寬/線距瓶頸限制了高速數據在芯片之間、線距瓶頸限制了高速數據在芯片之間、芯片與外部存儲器之間芯片與外部存儲器之間高效高效傳輸,嚴重制約了傳輸,嚴重制約了 AIAI 芯片性能的充芯片性能的充分釋放。分釋放。與傳統的通用處理器(CPU)相比,AI 加速器(如 GPU、ASIC、TPU)在模型需求并行計算以及高浮點運算上具有一定優勢。但是,AI 芯片對帶寬、延遲、能效等方面要求更為苛刻:2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲
38、明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -17-極高的極高的互連互連帶寬需求:帶寬需求:AI 計算中,特別是在深度學習、強化學習等算法,通常在 Pre-training(預訓練)需要大量訓練數據,例如 DeepSeek-V3 基于 14.8 萬億 Token 的數據進行訓練。這些數據需要在計算單元之間和存儲單元之間頻繁交換,對互連帶寬提出極高需求。極低的極低的互連互連延遲延遲需求需求:隨著 AI 應用落地至不同領域,對于實時性和響應速度在不同應用場景至關重要。例如在自動駕駛、實時語音識別、智能機器人等。AI 芯片系統中,數據需要在計算單元、存儲單元等組件之
39、間快速傳遞,任何任何互連互連環節的延環節的延遲都會累積,最終影響系統的整體響應。遲都會累積,最終影響系統的整體響應。極高的能效比需求:極高的能效比需求:AI 芯片的功耗問題日益突出。隨著 AI 模型規模的不斷擴大和計算復雜度的不斷提升,AI 芯片的功耗也急劇增加,甚至達到數百瓦甚至更高。高功耗不僅增加了散熱設計的難度和成本,也限制了 AI 芯片在移動設備、邊緣計算等功耗敏感場景的應用。系統級互連的功率效率是影響系統級互連的功率效率是影響 AIAI芯片整體能效比的重要因素。系統級互連的電阻損耗、信號芯片整體能效比的重要因素。系統級互連的電阻損耗、信號傳輸損耗等都會轉化為熱量,增加系統功耗,降低能
40、效比傳輸損耗等都會轉化為熱量,增加系統功耗,降低能效比 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -18-圖表圖表 1 12 2:高端 AI 加速器對先進封裝技術的需求 數據來源:數據來源:YoleYole,金元證券,金元證券研究所研究所 五五、先進封裝先進封裝實現實現高性能算力芯片高性能算力芯片的性能釋放的性能釋放 傳統封裝的工藝相對簡單,材料成本較低。且在封裝尺寸和互連密度上有限,例如引線鍵合(Wire Bonding)僅能將芯片的金屬導線連接到封裝基板中,引線長度較長,寄生電容較大,影響高速信號
41、傳輸。并且,引線鍵合的布線密布不足問題在納米級 IC 尤為凸顯。諸如塑料封裝、陶瓷封裝的熱效應較差,導熱性及散熱降低芯片的,例如 DIP、QFN、QFP 等。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -19-圖表圖表 1 13 3:傳統封裝技術(左為塑料封裝及常見封裝技術,右圖為引線鍵合)數據來源:數據來源:electronicsforuelectronicsforu、集成電路系統級封裝集成電路系統級封裝,金元證券,金元證券研究所研究所 先進封裝區別于傳統的引線鍵合、塑料封裝等封裝形式的新型封裝技術,
42、其目標是實現更高密度的互連、更小的封裝尺寸、更優其目標是實現更高密度的互連、更小的封裝尺寸、更優異的電氣性能和熱性能,以及更高的可靠性。異的電氣性能和熱性能,以及更高的可靠性。傳統半導體封裝技術依賴于印刷電路板(PCB)來進行芯片的連接與集成。PCB 通常作為芯片之間的連接平臺,負責將多個芯片互聯并提供外部電路連接。然而,隨著集成度的提高,PCB 技術面臨著尺寸、性能、功耗和成本等方面的限制。并且,PCB 板上走線寬度與凸點及微凸點差異較大,導致 IO 數量及密度限制芯片間或系統互連能力。隨著AI高性能計算等應用的需求不斷增長,傳統封裝方式無法滿足對高帶寬、低延遲和小型化的要求。2025 年
43、2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -20-圖表圖表 1 14 4:IO PitchIO Pitch 差異差異 數據來源:數據來源:YOLEYOLE,金元證券,金元證券研究所研究所 因此,封裝技術正逐步從 PCB 的層面,向芯片內部(即 IC 層面)轉變。采用采用 2.5D2.5D 和和 3D3D 封裝技術,不再依賴傳統的封裝技術,不再依賴傳統的 PCBPCB 作為主連作為主連接平臺,而是直接將多個接平臺,而是直接將多個 ICIC 芯片通過芯片通過轉接板轉接板(interposerinterposer,如如硅
44、硅轉接板轉接板、玻璃、玻璃轉接板轉接板等)進行集成。等)進行集成。這樣做不僅提高了芯片之間的帶寬,也縮短了信號傳輸的距離,減少了信號損耗。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -21-圖表圖表 1 15 5:封裝技術演進 數據來源:數據來源:CadenceCadence,金元證券,金元證券研究所研究所 引線框架封裝(leadframe Packaging):引線框架封裝的核心引線框架是一種金屬沖壓或蝕刻而成的框架,用于芯片與外部電路的電氣連接和機械支撐。芯片通過 WB 技術將芯片上的焊盤與引線框架
45、的內引腳相連,實現信號傳輸。最終通過塑料或陶瓷等材料進行塑封或氣密封裝。引線框架封裝的優勢在于成本低,技術成熟可靠。但是,但是,I/OI/O 密度瓶頸無法滿足高性能算力芯片對高帶密度瓶頸無法滿足高性能算力芯片對高帶寬互連的需求。其次,焊線帶來的寄生參數限制信號傳輸速度,寬互連的需求。其次,焊線帶來的寄生參數限制信號傳輸速度,延遲較高,且散熱性能較差。延遲較高,且散熱性能較差。球柵陣列封裝(Ball Grid Array,BGA)是對引線框架的改進。BGA 封裝取消了傳統的引線框架,轉而采用再封裝基板底部制作2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分
46、的免責聲明 曙光在前曙光在前 金元在先金元在先 -22-陣列狀焊球(Solder Balls)的方式來實現芯片與 PCB 板的互連。芯片與封裝基板之間仍然可以通過焊線或倒裝芯片(Flip Chip)等技術進行連接。但是但是 BGABGA 的焊球間距較大(通常為的焊球間距較大(通常為 0.8mm0.8mm,1.0mm1.0mm,1.27mm1.27mm),限制了互連密度。隨著,限制了互連密度。隨著 I/OI/O 數量增加,封裝尺寸也會數量增加,封裝尺寸也會隨之增大。隨之增大。FCBGA(Flip-Chip Ball Grid Array)是對 BGA 封裝的改進和升級。FCBGA 采用芯片倒裝技
47、術(Flip-Chip)將芯片正面朝下鍵合到基板上,通過微凸點(Micro-Bumps)或焊料凸點(Solder Bumps)實現芯片與基板之間的電氣連接。FCBGA 封裝的主要結構特點包括:基板(Substrate):通常采用多層陶瓷或高性能有機材料,比如 ABF(Ajinomoto Build-up Film)材料,提供更高的布線密度和更好的電氣性能。FC:芯片正面朝下通過微凸點或焊料凸點鍵合到基板上。焊球:與 BGA 相似,排列在基板底部,用于連接封裝體和 PCB。底部填充膠(Underfill):填充在芯片和基板之間,增強互連可靠性,緩解熱膨脹系數不匹配導致的應力問題。2025 年 2
48、 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -23-圖表圖表 1 16 6:FCBGA 結構 數據來源:數據來源:TITI,金元證券,金元證券研究所研究所 FCBGA 基板通常采用高性能、高可靠性材料,實現芯片與外部電路之間的信號傳輸。并且在熱管理方面,基板材料需要幫助芯片散熱,避免過熱導致性能下降。根據據 YOLEYOLE 數據,封裝基板成本數據,封裝基板成本約占總成本的約占總成本的 50%50%。圖表圖表 1 17 7:基板成本約占基板成本約占 FCBGAFCBGA 封裝成本的封裝成本的 50%50%數據來源:數據
49、來源:YOLEYOLE,金元證券,金元證券研究所研究所 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -24-倒裝芯片技術消除了 Wire-Bond BGA 中的連接線,采用了更小的微凸點,有效減小了芯片與基板之間的互連間距,提高了互連密度。且芯片與基板之間的信號傳輸路徑更短。但是,但是,FCBGAFCBGA 本質本質仍屬于仍屬于 BGABGA 一類,其基板布線密度和焊球間距仍然是限制一類,其基板布線密度和焊球間距仍然是限制 I/OI/O 數數量和帶寬的量和帶寬的核心原因。核心原因。為了克服 BGA 和
50、FCBGA 在互連帶寬方面的瓶頸,2.5D 封裝技術應運而生。2.5D2.5D 封裝技術的核心要素在于封裝技術的核心要素在于中介層中介層(interposer)(interposer)、RDLRDL(R Redistribution layeredistribution layer)、硅通孔(、硅通孔(TSVTSV,Through Through Silicon Silicon ViaVia)、凸塊()、凸塊(BumpBump)。圖表圖表 1818:2.5D2.5D 封裝全景封裝全景 數據來源:數據來源:IDTechEx ResearchIDTechEx Research,金元證券,金元證券研
51、究所研究所 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -25-中介層中介層設置在電子元器件和基板之間作為中介橋梁,實現芯片與設置在電子元器件和基板之間作為中介橋梁,實現芯片與元器件維細布線與封裝基板稀疏布線之間引腳間距的轉換。元器件維細布線與封裝基板稀疏布線之間引腳間距的轉換。轉接板根據材質劃分為無機轉接板和有機轉接板。無機中介層以 Si、或玻璃、陶瓷為材料,除核心通孔外,還包括底材上下表面的重布線層,利用 TSV 連接上下表面的重布線層。有機轉接板采用電鍍銅柱連接絕緣材料間的金屬線路層。有機材料的優
52、點在于其介有機材料的優點在于其介電常數低于硅,有助于降低封裝體中的電常數低于硅,有助于降低封裝體中的 RCRC 延遲。延遲。由于硅由于硅中介層中介層能夠提供三維布線,芯片之間的連接可以更加緊密,能夠提供三維布線,芯片之間的連接可以更加緊密,這有助于減少封裝的總尺寸。因此,在相同面積下,硅中介層可這有助于減少封裝的總尺寸。因此,在相同面積下,硅中介層可以實現更多的信號連接,從而提高布線密度以實現更多的信號連接,從而提高布線密度。這種緊湊的設計方式對于高性能計算、高帶寬應用尤為重要。圖表圖表 1919:InterposerInterposer 及及 2.5D2.5D 封裝結構封裝結構 數據來源:數
53、據來源:IDTechEX ResearchIDTechEX Research,金元證券研究所 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -26-TSV(Through Silicon Via,硅通孔)是 2D 晶圓平面封裝到 2.5D封裝,最終形成 3D 晶圓堆疊封裝的關鍵技術,包括臺積電的CoWoS-R 和新一代高帶寬存儲器(High-Bandwidth Memory,HBM)均通過 TSV 進行垂直方向上的互連通信。TSVTSV 工藝難點在于工藝難點在于 TSVTSV刻蝕,填充及背面露頭刻蝕,填充
54、及背面露頭,這也導致了,這也導致了 TSVTSV 的高成本和地良率,降的高成本和地良率,降低成本和提高良率成為了低成本和提高良率成為了 TSVTSV 大規模應用的市場驅動力之一。大規模應用的市場驅動力之一。TSVTSV 刻蝕主要方法分為兩種,一種是深反應離子刻蝕(刻蝕主要方法分為兩種,一種是深反應離子刻蝕(Deep Deep Reactive Ion EtchingReactive Ion Etching,DRIEDRIE),另一種是激光鉆孔。激光鉆孔),另一種是激光鉆孔。激光鉆孔除了具有成本優勢外,其他方面都難以與深反應離子刻蝕相比。除了具有成本優勢外,其他方面都難以與深反應離子刻蝕相比。圖
55、表圖表 2020:TSV DRIETSV DRIE 刻蝕與激光鉆孔的性能對比刻蝕與激光鉆孔的性能對比(左下(左下 1 1 為激光鉆孔、為激光鉆孔、2 2 為為 RIERIE、3 3為為 DRIEDRIE 工藝)工藝)制作工藝 孔徑 深寬比 租糙度 均勻性 通孔角度 生產效率 成本 深反應離子刻蝕 20m 20 差 差 85 低 低 數據來源:數據來源:三維集成電路制造技術王文武,金元證券三維集成電路制造技術王文武,金元證券研究所研究所 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -27-深反應離子刻蝕形
56、成硅通孔主要采用 Bosch 工藝,單個刻蝕周期分為刻蝕和鈍化兩個步驟,先通過6刻蝕氣體各向同性刻蝕至一定深度后,為了制造高深寬比的通孔需要在 TSV 內通過48鈍化氣體形成一層保護層,然后重復多個刻蝕周期,最終形成高深寬比 TSV 通孔。圖表圖表 2121:DRIEDRIE 刻蝕步驟刻蝕步驟 數據來源:數據來源:三維集成電路制造技術王文武,金元證券三維集成電路制造技術王文武,金元證券研究所研究所 刻蝕后需對 TSV 通孔沉積絕緣層對硅襯底進行電氣隔離,形成絕緣層材料一般采用2、和其他聚合物。2、等無機介質材料一般使用 PECVD(等離子增強化學氣相沉積)工藝沉積,沉積速率較高,且工藝溫度低、
57、臺階覆蓋性能好。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -28-為了實現信號導通,TSV 填充一般使用電阻率較低的銅。銅不僅有較好的導電性,而且熔點高,后續工藝溫度匹配性較好。但是銅的擴散率較高。為了抑制銅擴散需要一層擴散阻擋層阻擋銅原子與硅或氧化硅接觸,業界一般采用物理氣相沉積(PVD)的 Ti層。填充方面,TSV 鍍銅主要有均勻鍍銅及自下向上鍍銅方式。均勻鍍銅廣泛應用于低成本的晶圓級封裝,通過合理調配鍍液抑制劑和添加劑,在電鍍是通孔側壁和底部均勻生長,但均勻鍍銅并不適用于小孔徑、高深寬比的 TS
58、V 填充。自下向上的鍍銅工藝可以滿足無電鍍孔洞的鍍銅需求。通過使用特殊電鍍添加劑、電鍍設備及經過特殊設計的電場,在電鍍時可減慢通孔外表面銅的沉積速率,加速通孔內部銅的沉積。最后使用化學腐蝕或化學機械拋光 CMP(Chemical Mechanical Polish)工藝來去除芯片表面的銅覆蓋層和擴散阻擋層。RDL 重布線層通常采用銅作為導線材料,介質材料可以使用二氧化硅(2)、氮化硅()或其他聚合物,其主要用于在中介層上進行精細布線,RDL 可以將芯片上的 I/O 焊盤重新分布到中介層更大的區域,方便與封裝基板或 PCB 板的連接。并且,RDL 可2025 年 2 月 請務必仔細閱讀本報告最后
59、部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -29-以構建低阻抗的電源分配網絡,為芯片提供穩定的輸入/輸出電壓。RDL 一方面實現多芯片間的互連,另一方面實現芯片 I/O 與 TSV位置的再匹配。RDL 的工藝較為復雜,涉及較多關鍵制造設備。RDLDL 的制造工藝包括的制造工藝包括種子層沉積、種子層沉積、RDLRDL 光刻、光刻、RDLRDL 電鍍、去膠、種電鍍、去膠、種子層刻蝕、子層刻蝕、PIPI 鈍化鈍化等步驟等步驟,重復上述步驟可以形成多層,重復上述步驟可以形成多層 RDLRDL 互互連連。精度越高的光刻和刻蝕技術,線寬/線距越小.先進的 R
60、DL 工藝可以實現微米級,甚至亞微米級的線寬和線距。圖表圖表 2 22 2:多層多層 RDLRDL 工藝流程工藝流程 數據來源:數據來源:Redistribution layers(RDLs)for 2.5D/3D IC integration,金元證券,金元證券研究所研究所 凸塊(Bump)/微凸點(Micro-Bumps)主要用于芯片與中介層以2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -30-及中介層和封裝基板的連接。微凸點通常采用銅柱凸點(Copper pillar bump)結構,有時會在銅柱
61、頂部覆蓋一層薄的焊錫層。微凸塊尺寸更小,間距更密。凸塊的制造與 RDL 類似,同樣需要包括光刻、金屬沉積形成金屬種子層、電鍍和回流焊等步驟 圖表圖表 2 23 3:微凸點微凸點 數據來源:數據來源:三維集成電路制造技術王文武,金元證券三維集成電路制造技術王文武,金元證券研究所研究所 實際上,各大廠商在 2.5D 封裝技術上組合中介層、RDL、硅通孔、凸塊技術,以滿足不同客戶需求。以臺積電的 CoWoS-R、CoWoS-L、CoWoS-R 為例:CoWoS-S 是臺積電最為正統的封裝技術,它結合了 TSV、RDL、Interposer、微凸塊/C4 凸塊。TSV 集成在硅中介層中,用于垂直連接中
62、介層頂部的芯片與底部封裝基板。RDL 位于硅中介層頂部,負責水平布線,將芯片 I/O 重新分布到 TSV 位置。中介層采用被動硅中介層被動硅中介層(無晶體管),提供高密度互連和熱穩定性。微凸塊(Bumps):用于芯片與中介層之間的連接(間2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -31-距 40-50m)。C4 凸塊:用于中介層與基板之間的連接(間距 100-200m)。整體性能及成本均較高。CoWoS-R 主要利用 RDL interposer 層完成互連,無需硅中介層,多層高密度 RDL 替代硅中
63、介層,直接布線在有機基板上。CoWoS-L 更像是 CoWoS-R 與 CoWoS-S 的中間體。通過 LSI(Local Silicon Interconnect)實現高布線密度 Die-to-Die 互連。LSI 可以在多個產品中具有多種連接結構,比如SoC-SoC、SoC-Chiplet、SoC-HBM。中介層采用局部硅中介局部硅中介層(硅橋)層(硅橋)與有機基板有機基板的混合結構。其優勢在于其優勢在于僅在需要高僅在需要高密度互連的區域使用硅(如密度互連的區域使用硅(如 HBMHBM 與與 GPUGPU 的連接),其他區域的連接),其他區域用低成本有機材料。用低成本有機材料。且在且在邏輯
64、芯片的下方可以邁入額外被動邏輯芯片的下方可以邁入額外被動元器件的能力。元器件的能力。圖表圖表 2 24 4:CoWoS-SCoWoS-RCoWos-L 數據來源:數據來源:TSMCTSMC,金元證券研究所 國內 OSAT 廠商長電科技在 2021 年面向 Chiplet 異構集成應用推出以 2.5D TSV-less(無 TSV)的新一代封裝技術,XDFOI(多維扇2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -32-出封裝集成)。在設計上,長電科技主要通過多層 RDL 來實現高密度走線,其線寬/線距最小
65、可達 2m。并且根據根據 JCETJCET 公開信息公開信息,XDFOIXDFOI 使用先使用先 RDLRDL,后,后 ChipChip 的方式。的方式。RDL-first 工藝最大的優勢在于對良率的顯著提升。對于傳統的Chip-first 工藝來說,由于已知合格芯片(KGD)已經嵌入,后續加工過程中的各種缺陷都將導致芯片失效,特別是在金屬層較為復雜且層數較多的情況下,最終良率往往不能滿足要求。而 RDL-first 工藝可以首先完成線路排布,通過測試手段選擇合適的區域進行芯片倒裝,從而實現大幅度提高產品良率的目的 圖表圖表 2 25 5:CoWoS-SCoWoS-RCoWos-L 數據來源:
66、數據來源:JCETJCET,金元證券研究所 DeepSeek V3/R1DeepSeek V3/R1 的發布的發布及其開源及部署的便利性,及其開源及部署的便利性,很有可能推很有可能推動動 AIAI 在不同場景化的加速落地在不同場景化的加速落地。雖然。雖然 DeepSeekDeepSeek 通過優化算法減通過優化算法減2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -33-少冗余計算少冗余計算,提高模型的訓練及推理的計算效率,但隨著提高模型的訓練及推理的計算效率,但隨著 AIAI 滲滲透率及垂直領域發展很有可
67、能帶來高性能算力芯片的需求增長。透率及垂直領域發展很有可能帶來高性能算力芯片的需求增長。而當前而當前 ICIC 內部線寬內部線寬/線距與系統級線寬線距與系統級線寬/線距的巨大差異線距的巨大差異限制了限制了算力芯片算力芯片的帶寬及表現。先進封裝技術,尤其是的帶寬及表現。先進封裝技術,尤其是 2.5D2.5D 層面可滿層面可滿足不同場景下高帶寬、低延遲的需求。足不同場景下高帶寬、低延遲的需求。2.5D2.5D 的關鍵技術包括硅中的關鍵技術包括硅中介層、介層、TSVTSV、RDL layerRDL layer、BumpsBumps,各大廠商通過組合這些技術達,各大廠商通過組合這些技術達到客戶的不同場
68、景化需求。根據到客戶的不同場景化需求。根據 YOLEYOLE 預測,預測,2022023 3 年全球先進封年全球先進封裝營收約裝營收約 378378 億美元,占半導體封裝市場的億美元,占半導體封裝市場的 44%44%;20242024 年增長至年增長至425425 億美元,至億美元,至 20292029 年,先進封裝營收有望增長至年,先進封裝營收有望增長至 695695 億美元,億美元,年復合增長率年復合增長率 11%11%,其中,其中 2.5D/3D2.5D/3D 封裝滲透率封裝滲透率最快。最快。圖表圖表 2 26 6:先進封裝市場:先進封裝市場 2022023 3-2022029 9 年期
69、間,有望達到年期間,有望達到 1 11 1%的復合增長,且的復合增長,且 2.5D/3D2.5D/3D 滲透率提升滲透率提升 數據來源:數據來源:YOLEYOLE,金元證券,金元證券研究所研究所 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -34-六六、投資建議投資建議 我們認為,我們認為,2.5D2.5D 封裝涉及多項前道工藝設備,包括氣相沉積設備封裝涉及多項前道工藝設備,包括氣相沉積設備制作制作 RDLRDL 層及層及 TSVTSV 擴散阻擋層;刻蝕設備也應用于高深寬比的擴散阻擋層;刻蝕設備也應用于
70、高深寬比的TSVTSV 刻蝕應用。先進前道設備必不可少??涛g應用。先進前道設備必不可少。另外,封裝基板材料對封裝性能、熱管理、電氣特性和可靠性構另外,封裝基板材料對封裝性能、熱管理、電氣特性和可靠性構成較大影響,尤其是高性能芯片需要更強熱管理及機械支撐。成較大影響,尤其是高性能芯片需要更強熱管理及機械支撐。ABFABF材料具有較低的介電常數和低損耗特征,能夠在高速、高頻的應材料具有較低的介電常數和低損耗特征,能夠在高速、高頻的應用中有效傳輸信號,減少延遲和反射。此外,用中有效傳輸信號,減少延遲和反射。此外,ABFABF 材料適用于多材料適用于多層堆疊和復雜的信號線路設計。層堆疊和復雜的信號線路
71、設計。先進封裝先進封裝 OSATOSAT 直接受益,隨著直接受益,隨著 HPCHPC、AIAI 芯片及云端等垂直領域芯片及云端等垂直領域應用落地,對于高帶寬、低延遲的封裝技術要求更高。受益于應用落地,對于高帶寬、低延遲的封裝技術要求更高。受益于2.5D/3D2.5D/3D 的高速增長及滲透率,有望迎來強增長。的高速增長及滲透率,有望迎來強增長。2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -35-圖表圖表 2 27 7:相關公司相關公司 數據來源:數據來源:公司官網公司官網,金元證券研究所,金元證券研究所
72、 風險提示風險提示 1 1)2.5D2.5D 3D3D 封裝及其他先進封裝難度較大,良率有待改善,或影封裝及其他先進封裝難度較大,良率有待改善,或影響利潤響利潤 2 2)前期設備投入及研發成本較高)前期設備投入及研發成本較高 3 3)AIAI 應用落地速度不及預期應用落地速度不及預期 2025 年 2 月 請務必仔細閱讀本報告最后部分的免責聲明請務必仔細閱讀本報告最后部分的免責聲明 曙光在前曙光在前 金元在先金元在先 -36-金元證券行業投資評級標準:金元證券行業投資評級標準:增持:行業股票指數在未來增持:行業股票指數在未來 6 6 個月內超越大盤;個月內超越大盤;中性:行業股票指數在未來中性
73、:行業股票指數在未來 6 6 個月內基本與大盤持平;個月內基本與大盤持平;減持:行業股票指數在未來減持:行業股票指數在未來 6 6 個月內明顯弱于大盤。個月內明顯弱于大盤。金元證券股票投資評級標準:金元證券股票投資評級標準:買入:買入:股票價格在未來股票價格在未來 6 6 個月內超越大盤個月內超越大盤 15%15%以上;以上;增持:股票價格在未來增持:股票價格在未來 6 6 個月內相對大盤變動幅度為個月內相對大盤變動幅度為 5%5%15%15%;中性:股票價格在未來中性:股票價格在未來 6 6 個月內相對大盤變動幅度為個月內相對大盤變動幅度為-5%5%+5%+5%;減持:股票價格在未來減持:股
74、票價格在未來 6 6 個月內相對大盤變動幅度為個月內相對大盤變動幅度為-5%5%-15%15%免責聲明免責聲明 本報告由金元證券股份有限公司(已具備中國證監會批復的證券投資咨詢業務資格)制作。本報告所載資料的來源及觀點的出處皆被金元證券認為可靠,但金元證券不保證其準確性或完整性。該等信息、意見并未考慮到獲取本報告人員的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對任何人的個人推薦。投資者應當對本報告中的信息和意見進行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業、財務、稅收等方面咨詢專業財務顧問的意見。對依據或者使用本報告所造成的一切后果,金元證券及/或
75、其關聯人員均不承擔任何法律責任。投資者需自主作出投資決策并自行承擔投資風險,任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。本報告所載的信息、材料或分析工具僅提供給閣下作參考用,不是也不應被視為出售、購買或認購證券或其他金融工具的要約或要約邀請。該等信息、材料及預測無需通知即可隨時更改。過往的表現亦不應作為日后表現的預示和擔保。在不同時期,金元證券可能會發出與本報告所載意見、評估及預測不一致的研究報告。金元證券的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。金元證券沒有將此意見及建議向報告所有接收者進行更新的義務。金元證券的自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。在法律許可的情況下,金元證券可能會持有本報告中提及公司所發行的證券頭寸并進行交易,也可能為這些公司提供或爭取提供投資銀行業務服務。因此,投資者應當考慮到金元證券及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。本報告的版權僅為金元證券所有,未經書面許可任何機構和個人不得以任何形式轉發、翻版、復制、刊登、發表或引用。