《通信行業英偉達GTC專題:新一代GPU、具身智能與AI應用-240318(20頁).pdf》由會員分享,可在線閱讀,更多相關《通信行業英偉達GTC專題:新一代GPU、具身智能與AI應用-240318(20頁).pdf(20頁珍藏版)》請在三個皮匠報告上搜索。
1、證券研究報告證券研究報告 20242024年年3 3月月1818日日 英偉達英偉達GTC專題:新一代專題:新一代GPU、具身智能與、具身智能與AI應用應用1中泰通信中泰通信首席分析師:陳寧玉(S0740517020004)Email:研究助理:佘雨晴 Email:研究助理:楊雷Email:核心觀點核心觀點GTC2024召開在即,關注新一代召開在即,關注新一代GPU、具身智能、具身智能、AI應用三大方向。應用三大方向。GTC 2024將于當地時間3月18-21日在美國加州圣何塞會議中心及線上舉行,預計發布加速計算、生成式AI以及機器人領域突破性成果。建議關注三大方向:1)B100及后續芯片路線。
2、B100預計采用BlackWell全新架構,與H200系列相比性能有望翻倍提升,GB200或于2024-2025年推出,芯片迭代周期縮短至1年,帶動配套工藝及組件加速升級。2)具身智能:AgilityRobotics、波士頓動力公司、迪士尼和Google DeepMind等公司將參加GTC機器人相關會議,現場將展出25款機器人。黃仁勛曾表示具身智能是AI下一個浪潮,2024年初英偉達投資人形機器人公司FigureAI并成立通用具身智能體研究實驗室GEAR,大會或將更新相關成果。3)AI應用。本次GTC共有亞馬遜、Anthropic、Runway等1000多家參會企業,300多家參展商將展示英偉
3、達平臺在農業、汽車、云服務等行業的應用。多模態大模型助力AI賦能下游行業,提升推理側算力與帶寬要求,數據中心、CDN等或將受益AI應用帶來的新一輪流量增長。B100性能預計大幅提升,性能預計大幅提升,GB200有望超預期。有望超預期。英偉達將推出全新芯片架構BlackWell,或為英偉達首次采用多chiplet設計的架構。B100成為首款基于BlackWell架構的芯片,預計為MCM多芯片封裝,臺積電N3或N4P制程工藝,可能使用CoWoS-L,性能預計至少為H200的2倍,H100的4倍;首發內存或為200G HBM3e,約為H200的140%;或采用224Serdes。為了更快推向市場,B
4、100前期版本或使用PCIe5.0和C2C式鏈接,功耗700W,方便直接沿用H100的現有HGX服務器,后續將推出1000W版本,轉向液冷,并將通過ConnectX8實現每GPU網絡的完整800G。根據英偉達芯片路線圖,GB200將于2024-2025年推出,由CPU和GPU通過NVLinkC2C連接構成,或采用NVLink5.0及192GB HBM3e內存,性能有望超預期提升。聚焦光通信與液冷產業鏈,關注新技術變革方向。聚焦光通信與液冷產業鏈,關注新技術變革方向。AI芯片加速升級帶動光模塊、交換機等底層網絡硬件迭代提速,2024年1.6T需求將現,速率升級同時伴隨功耗成本增加等問題,硅光、L
5、PO、CPO、薄膜鈮酸鋰等新技術方案導入有望加快。國內光模塊廠商全球份額過半,市場競爭力較強,帶動光通信產業鏈逐步向國內轉移,上游光芯片國產替代預計加速。B100后續迭代版本功耗或達1000W,GB200或進一步增長至1200W,英偉達已聯合行業伙伴布局混合液冷等創新散熱方案。算力器件功耗持續增長對傳統風冷帶來挑戰,AI算力將導致數據中心能耗不斷抬升與PUE指標趨嚴將共同倒逼產業對液冷需求升級,冷板式液冷或率先放量,浸沒式液冷為長期方向。溫控、IDC、服務器、運營商等多方積極部署液冷路線。隨著AI發展,液冷產業鏈參與者不斷增加,上下游協同增強。投資建議投資建議:重點關注光模塊器件:中際旭創、天
6、孚通信、新易盛、源杰科技、仕佳光子、騰景科技、光庫科技、光迅科技、聯特科技、太辰光等;液冷:英維克、申菱環境、高瀾股份、佳力圖、依米康、網宿科技等;ICT設備:菲菱科思、盛科通信、銳捷網絡、紫光股份、中興通訊等;數據中心:寶信軟件、潤澤科技、光環新網、奧飛數據等。風險提示:風險提示:AI發展不及預期、技術迭代不及預期、市場競爭加劇、海外貿易爭端、市場系統性風險、研究報告使用的公開資料可能存在信息滯后或更新不及時等風險HVjWNA9UlXfUIUkYcZmV8OaO9PmOpPpNrNlOoOmPeRpNqR9PrQqRNZnPrONZoNyQGTC 2024前瞻:見證前瞻:見證AI的變革時刻的
7、變革時刻3來源:英偉達官網,中泰證券研究所GTC 2022:硬件為主,發布全新Hopper架構H100 GPU及Grace CPU 超級芯片,第四代NVLink和第三代NVSwitch技術、DGX H100 SuperPOD等。GTC 2023:側重軟件及服務更新,發布及更新H100 NVL GPU,PCIe H100等硬件,以及AI超級計算服務DGX Cloud、光刻計算庫CuLitho、GPU加速量子計算系統等。GTC 2024:當地時間3月18-21日舉行,黃仁勛將發表主題演講“見證AI的變革時刻”,發布加速計算、生成式AI以及機器人領域突破性成果。會議期間將舉辦超過1000場演講、圓桌
8、討論、培訓等各種活動,來自英偉達、Meta、微軟、斯坦福等業界及學術界眾多權威AI研究者將參加200多場會議。共有1000多家企業將參加本屆GTC,包括但不限于亞馬遜、OpenAI、微軟、Meta、谷歌等AI巨頭以及Anthropic、Cohere、Runway等AI初創企業。300多家參展商將展示企業如何在航空航天、農業、汽車和運輸、云服務、金融服務、醫療和生命科學、制造、零售和電信等各行業部署英偉達平臺。圖表:圖表:GTC 2024會議主題數量分布會議主題數量分布關注一:關注一:Blackwell GPU架構及架構及B1004來源:英偉達官網,中泰證券研究所英偉達有望在英偉達有望在GTC
9、2024上發布上發布B100及及B200系列。系列。B100將首次采用Blackwell架構,基于更復雜的多芯片模塊(MCM)設計,與現有采用Hopper架構的H200系列相比性能有望翻倍提升,預計使用臺積電3nm或N4P工藝制程,功耗或達1000W,采用液冷方案,2024Q2/Q3開始規模生產。此外,根據英偉達最新官方路線圖及IT之家報道,預計2024-2025年之間推出GB200,或采取差異化策略推動客戶采購,加大其與B100/B200之間的配置差距,特別在NVLink和網絡性能方面。B100預計配套全新組件。此外根據路線圖,英偉達將于2024年底前推出速度更快、功能更強大的 Infini
10、Band 和以太網 NIC 以及交換機,每個端口的帶寬可達 800Gb/s,本次大會上或將有所透露。據Barrons報道,英偉達將于2025年推出B200 GPU,單張功耗達1000W,升級后的B200變體可能采用更快版本的HBM內存,以及更高的內存容量,升級規格和增強功能。圖表:英偉達芯片路線圖圖表:英偉達芯片路線圖關注二:具身智能關注二:具身智能/人形機器人人形機器人/自動駕駛自動駕駛5來源:英偉達官網,中泰證券研究所人形機器人:人形機器人:AgilityRobotics、波士頓動力公司、迪士尼和Google DeepMind等公司將參會,現場將展出25款機器人,包括人形機器人、工業機械手
11、等。英偉達于2018年推出包含全新硬件、軟件和虛擬世界機器人模擬器的NVIDIA Isaac,同時還推出專為機器人設計的計算機平臺Jetson Xavier和相關的機器人軟件工具包,2023年發布多模態具身智能系統VIMA和自主移動機器人平臺Isaac AMR。同時,英偉達通過仿真模擬平臺Omniverse與AI結合,幫助建立訓練數據集,23年3月Omniverse Cloud托管至微軟Azure,以擴大英偉達AI機器人開發和管理平臺Isaac Sim的接入范圍。2024年2月英偉達向人形機器人公司Figure AI投資5000萬美元并成立通用具身智能體研究實驗室GEAR,人形機器人作為具身智
12、能優良載體,有望迎來加速發展。自動駕駛:自動駕駛:2022年英偉達發布全新一代自動駕駛SoC芯片Thor,內部擁有770億個晶體管,算力高達2000TFLOPS,較此前Orin提升8倍,計劃2024年量產,極氪將于2025年搭載首發。圖表:英偉達自動駕駛芯片路線圖圖表:英偉達自動駕駛芯片路線圖圖表:英偉達圖表:英偉達Isaac AMR硬件配置圖硬件配置圖關注三:關注三:AI推理推理/邊緣計算邊緣計算6來源:英偉達官網,Bloomberg,中泰證券研究所GTC2024有望更新以太網架構及產品、有望更新以太網架構及產品、ASIC芯片計劃等相關信息。芯片計劃等相關信息。英偉達FY2024數據中心業務
13、收入40%來自AI推理,AI在汽車、醫療和金融服務等垂直領域廣泛應用,其正在推出全新Spectrum-X端到端產品進入以太網領域,引入新技術為AI處理提供較傳統以太網高1.6倍的網絡性能。根據路透社報道,英偉達正在建立新業務部門,專注為云廠商及其他企業設計定制芯片(ASIC),包括先進的AI處理器。本次GTC共有亞馬遜、Anthropic、Runway等1000多家參會企業,會上將展示英偉達平臺在農業、汽車、云服務等行業的應用,英偉達、HuggingFace、Zalando、AWS、微軟、Cloudflare、谷歌等將參加AI推理相關會議。生成式生成式AI在影視上的應用將被重點展示。在影視上的
14、應用將被重點展示。中國游戲廠商騰訊、網易,以及傳媒巨頭奈飛、皮克斯、迪士尼動畫工作室等均將參與游戲/傳媒娛樂討論,可能探討如何利用生成式AI和路徑追蹤技術創造更加逼真的虛擬人物和世界,輔助游戲開發和影視制作;Runway、騰訊及Digitrax等有望介紹其文生圖、文生視頻模型及其他AI應用。其他可能被討論的應用包括3D內容生成、云端創作游戲等。2萬億美元可尋址市場(萬億美元可尋址市場(TAM):):英偉達預計隨著通用AI技術發展,目前1萬億美元數據中心基礎設施安裝量(可尋址市場,TAM)將在未來五年翻一番。AI設備有望替換掉所有的傳統計算。圖表:英偉達在圖表:英偉達在GTC2023上推出上推出
15、4款款AI推理平臺推理平臺圖表:圖表:ASIC芯片在邊緣芯片在邊緣AI應用占比提升應用占比提升圖表:英偉達圖表:英偉達1萬億美元萬億美元TAM結構結構BlackWell架構演進架構演進7來源:英偉達官網,51CTO,中泰證券研究所英偉達每隔英偉達每隔1-2年提出新的芯片架構以適應計算需求升級。年提出新的芯片架構以適應計算需求升級。2017年提出Volta架構,專注深度學習和AI應用,并引入Tensor Core,2020年Ampere架構在計算能力、能效和深度學習性能方面大幅提升,采用多個SM和更大的總線寬度,提供更多CUDA Core及更高頻率,引入第三代Tensor Core,具有更高的內
16、存容量和帶寬,適用于大規模數據處理和機器學習任務。2022年發布Hopper架構,支持第四代TensorCore,采用新型流式處理器,每個SM能力更強。Blackwell:或為英偉達首次采用多chiplet設計的架構,一方面可能簡化基于Blackwell架構的GPU硅片層面生產,最大限度提高小型芯片產量,另一方面,多芯片封裝將更加復雜。預計SM和CUDA將采用新結構,光線追蹤性能等將進一步優化和加強,RT單元有可能被PT單元所取代,以實現對Ada Lovelace架構的性能翻倍。Blackwell架構GPU很可能會支持GDDR7內存,相比GDDR6X效率更高,鑒于第一代 GDDR7 SGRAM
17、 IC將具有32GT/s 的傳輸數據速率,采用這些芯片的384位內存子系統將提供約1536 GB/s 的帶寬。與Hopper/Ada架構不同,Blackwell或將擴展到數據中心和消費級GPU,但消費級場景或將延續單芯片設計,以實現時間可控及低風險。圖表:英偉達芯片架構演進圖表:英偉達芯片架構演進架構架構VoltaTuringAmpereHopper發布時間發布時間2017201820202022核心參數核心參數80個SM,每個SM包括32個FP64+64個Int32+64個FP32+8個TensorCore102核心92個SM,SM重新設計,每個SM包含64個Int32+64個FP32+8個
18、TensorCore108個SM,每個SM包含64個FP32+64個INT32+32個FP64+4個TensorCore132個SM,每個SM包含128個FP32+64個INT32+64個FP64+4個TensorCore特點特點NVLink2.0,TensorCore第一代,支持AI運算TensorCore2.0,RTCore第一代TensorCore3.0,RTCore2.0,NVLink3.0,結構稀疏性矩陣MIG1.0TensorCore4.0,NVLink4.0,結構稀疏性矩陣MIG2.0制程制程12nm,211億晶體管12nm,186億晶體管7nm,283億晶體管4nm,800億晶
19、體管代表產品代表產品V100/TiTan VT4/2080Ti/RTX5000A100/A800/A30系列H100/H800B100:性能翻倍,帶寬、顯存等大幅提升:性能翻倍,帶寬、顯存等大幅提升8來源:51CTO,半導體行業觀察,中泰證券研究所B100:預計為MCM多芯片封裝,臺積電N3或N4P制程工藝,可能使用CoWoS-L,性能預計至少為H200的2倍,相當于H100的4倍;首發內存或為200G HBM3e,約為H200的140%;參考歷代NVLink迭代,預計雙向帶寬有望較H100接近翻倍,或采用224Serdes。為了更快推向市場,為了更快推向市場,B100前期版本或使用前期版本或
20、使用PCIe5.0和和C2C式鏈接,功耗式鏈接,功耗700W,方便直接沿用,方便直接沿用H100的現有的現有HGX服務器,以大幅提高供應服務器,以大幅提高供應鏈更早提高產量和出貨量的能力。后續將推出鏈更早提高產量和出貨量的能力。后續將推出1000W版本,轉向液冷,并將通過版本,轉向液冷,并將通過ConnectX8實現每實現每GPU網絡的完整網絡的完整800G。這些。這些 SerDes 對于以太網對于以太網/InfiniBand 仍然是仍然是 8x100G。雖然每個。雖然每個 GPU 的網絡速度翻倍,但基數減半,因為它們仍然必須經過相同的的網絡速度翻倍,但基數減半,因為它們仍然必須經過相同的 5
21、1.2T 交換機。交換機。B100預計預計2024H2規模出貨。規模出貨。MorganStanley預計2024年英偉達CoWoS需求量15萬片,對應AI GPU出貨量400萬張,其中H100/B100分別為377萬張/28萬張。圖表:英偉達芯片性能參數圖表:英偉達芯片性能參數性能參數性能參數V100 PCIeA100 80GB PCIeA800 80GB PCIeH100 80GB PCIe微架構微架構VoltaAmpereHopperFP647TFLOPS9.7TFLOPS26TFLOPSFP3214TFLOPS19.5TFLOPS51TFLOPSFP16 TensorCore312TFL
22、OPS756.5TFLOPSINT8 TensorCore62TOPS624TOPS1513TOPSGPU顯存顯存32/16GB HBM280GB HBM2e80GB HBM3GPU顯存帶寬顯存帶寬900GB/s1935GB/s2TB/sTDP250W300W300-350W多實例多實例GPU最多7個MIG,每個10GB外形規格外形規格PCIe雙插槽風冷式或單插槽液冷式PCIe雙插槽風冷式互連技術互連技術NVLink:300GB/sPCIe:32GB/sNVLink:600GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/sNVLink:600GB/sP
23、CIe5.0:128GB/s服務器選項服務器選項搭載18個GPU的合作伙伴認證系統和NVIDIA認證系統英偉達采用英偉達采用CoWoS-L,驅動先進封裝升級,驅動先進封裝升級9來源:Bloomberg,中泰證券研究所CoWoS封裝成為英偉達封裝成為英偉達GPU供應產能瓶頸之一。供應產能瓶頸之一。CoWoS(Chip On Wafer On Substrate)是臺積電開發的一種2.5D先進封裝技術,由CoW和oS組合,先將芯片通過Chip on Wafer(CoW)的封裝制程連接至硅晶圓,再把CoW芯片與基板(Substrate)連接,整合成CoWoS。根據不同中介層(interposer),
24、CoWoS封裝又分為CoWoS-S/R/L三種類型。CoWoS-S:應用最為廣泛,采用硅作為中介層;CoWoS-R:基于InFO技術,利用RDL中介層互連各chiplets;CoWoS-L:使用小芯片(chiplet)和RDL作為中介層(硅橋),結合了CoWoS-S和InFO技術的優點,使用內插器與LSI(本地硅互連)芯片進行芯片間互連,同時用于電源和信號傳輸的RDL層提供靈活集成。MorganStanley預計預計2024年全球年全球CoWoS產能翻倍擴張至產能翻倍擴張至32kwpm(千片(千片/月),臺積電產能將達到月),臺積電產能將達到27kwpm,英偉達仍為需求主力。,英偉達仍為需求主
25、力。圖表:圖表:CoWoS-L圖表:圖表:CoWoS-S英偉達加快液冷方案布局英偉達加快液冷方案布局10來源:大模型之家,中加創新中心,中泰證券研究所英偉達積極與行業伙伴合作創新液冷方案。英偉達積極與行業伙伴合作創新液冷方案。2022年推出基于直接芯片冷卻技術(Direct-to-chip)的A100 800G PCIe液冷GPU,較風冷版本性能相當,電力節省約30%,單插槽設計節省最多66%的機架空間。2023年,與Vertiv、BOYD、Durbin、霍尼韋爾等6家行業伙伴合作打造混合液冷創新方案,將芯片直接冷卻、泵送兩相(P2P)和單相浸沒式冷卻集成在帶有內置泵和液體-蒸汽分離器的機架歧
26、管中,使用兩相冷板冷卻芯片,其余具有較低功率密度的服務器組件將浸沒在密封的浸沒式箱體內,服務器使用綠色制冷劑分別進行兩相冷卻和浸沒冷卻。相較當前無法處理高于400W/cm 功率密度的液冷,混合冷卻支持服務器機架功率高達200kW,是目前的25倍,與風冷相比成本至少降低5%,冷卻效率提高20%。同時與臺積電、高力等合作開發AI GPU浸沒式液冷系統。2024年3月,Vertiv與英偉達專家團隊共同針對GPU型高密數據中心制冷方案進行研發測試并發布實測數據,結果顯示冷板液冷和風冷的創新風液混合制冷方案中大約75%的IT負載可通過冷板液冷技術實現有效冷卻,IT負載從100%風冷轉型為75%液冷的方案
27、時,服務器風扇用電量降低最多達到80%,使總體使用效率(TUE)提高15%以上。圖表:英偉達圖表:英偉達A100&H100液冷方案液冷方案圖表:英偉達混合液冷方案圖表:英偉達混合液冷方案AI算力芯片功耗提升,催化液冷需求算力芯片功耗提升,催化液冷需求11來源:通信世界,英維克,中泰證券研究所冷板式液冷或率先放量,浸沒式液冷技術不斷優化。冷板式液冷或率先放量,浸沒式液冷技術不斷優化。液冷技術目前主要包括冷板式液冷、浸沒式液冷和噴淋式液冷三種,其中冷板式液冷將服務器芯片等高發熱元件的熱量通過冷板間接傳遞給液體進行散熱,低發熱元件仍通過風冷散熱,兼具性能與價格優勢,技術相對成熟;浸沒式液冷將服務器完
28、全浸入冷卻液中,全部發熱元件熱量直接傳遞給冷卻液,通過冷卻液循環流動或蒸發冷凝相變進行散熱,散熱效率更高,數據中心基礎設施中應用比例有望逐步提升,但對冷卻液要求嚴格,在建設改造以及后續管理維護方面成本更高。溫控、溫控、IDC、服務器、運營商等多方積極部署液冷路線。、服務器、運營商等多方積極部署液冷路線。隨著AI發展,液冷產業鏈參與者不斷增加,上下游協同增強。英維克、申菱環境等領先溫控廠商普遍推出數據中心液冷解決方案,潤澤科技、科華數據等IDC廠商積極改造或新建液冷智算中心,新華三、中興通訊等ICT設備廠商均推出液冷服務器,以提升自身競爭力,滿足客戶需求。圖表:液冷技術方案對比圖表:液冷技術方案
29、對比圖表:英維克圖表:英維克Coolinside全鏈條液冷解決方案全鏈條液冷解決方案分類分類冷板式液冷冷板式液冷浸沒式液冷浸沒式液冷噴淋式液冷噴淋式液冷作用原理作用原理冷卻液與服務器發熱部件不直接接觸,將液冷冷板固定在服務器的主要發熱器件上,依靠流經冷板的液體將熱量帶走服務器發熱部件完全浸泡在冷卻液中,發熱部件與冷卻液接觸充分,發出的熱量隨時被循環的冷卻液帶走面向服務器發熱部件,冷卻液借助重力或系統壓力直接噴淋至發熱器件或與之連接的固體導熱材料上,與之進行熱交換冷卻液使用情況冷卻液使用情況 冷卻液用量小,要求低冷卻液用量大,對冷卻液安全要求高冷卻液用量適中,要求高建設成本建設成本主要成本在換熱
30、系統和冷卻系統,成本適中架構調整大且冷卻液用量大,成本較高僅增加必需裝置,成本較低服務器改造成本服務器改造成本 冷板需要定制,改造成本高無需改造,新、老設備均可使用服務器改動小,成本較低運營成本運營成本與傳統風冷基本相同,運維成本低遇故障需將服務器從冷卻液中取出,運維成本高服務器部件表面帶有冷卻液,運維成本適中服務器兼容性服務器兼容性根據服務器定制冷板,兼容所有機器因冷卻液不同,需要進行兼容性測試因冷卻液不同,需要進行兼容性測試空間利用率空間利用率較高中等最高主流廠家主流廠家華為、浪潮、中科曙光、新華三等阿里、綠色云圖、諾基亞、云酷等廣東合一等GB200有望超預期有望超預期12來源:英偉達官網
31、,信息平權,中泰證券研究所GB200是將是將CPU和和GPU組合的超級芯片,組合的超級芯片,GB200NVL是超級計算使用的互連平臺。是超級計算使用的互連平臺。根據產業鏈信息,預計芯片包括1個Grace CPU和2個B100 GPU,內存為192GB HBM3e,CPU和GPU之間使用NVLink C2C連接,采用NVLink5.0,NVSwitch或將突破尋址限制,支持NVLink連接2500張GPU集群。芯片功耗或達1200w,采用混合冷卻,預計其中GPU/CPU/網卡/NVLink Switch ASICs使用液冷,其他組件使用風冷。預計預計2024-2025年之間發布,年之間發布,JP
32、Morgan預期預期2025年出貨量年出貨量50萬張。萬張。GH200:上一代超級芯片,2023年5月發布,包含1個Grace CPU和1個Hopper GPU,之間通過900GB/s的NVLink-C2C芯片互連,從而使GPU可以共享CPU內存,不再需要傳統的CPU至GPU PCIe連接。與最新的PCIe Gen5技術相比,GPU和CPU之間帶寬提高7倍,互連功耗減少5倍以上?;贕H200芯片的DGX GH200集群,所有256個GPUs連接可以訪問到累計144TB內存,較DGX H100的640GB提升約230倍。GH200對推薦系統提升效果尤其明顯。對推薦系統提升效果尤其明顯。GH20
33、0在LLM 65B上的推理速度較H100提升2倍多,在VectorDB和DLRM上較H100提升5-6倍。谷歌云、Meta和微軟預計成為首批DGX GH200用戶。圖表:英偉達圖表:英偉達Grace Hopper超級芯片架構超級芯片架構圖表:大內存圖表:大內存 AI 工作負載的性能比較工作負載的性能比較英偉達下一代英偉達下一代GPU展望展望13來源:Wccftech,世界先進制造技術論壇,TSMC,中泰證券研究所產品性能進一步加快提升。產品性能進一步加快提升。根據Bloomberg,英偉達可能在2026年推出下一代數據中心GPU N100,N100的GPU芯片數量可能由B100的2個增加到4個
34、,每個芯片的尺寸相似,盡管GPU芯片總面積可能翻倍,性能躍進將更加顯著。N100預計采用臺積電N3E工藝,晶體管密度或增加50%,芯片內存可能升級到全新一代HBM4。封裝設計將同步升級以擴大芯片尺寸,可能加速熱壓縮鍵合(TCB)和混合鍵合技術應用。芯片算力、工藝及互連等組網方案升級將持續帶動交換機、光模塊等相關硬件創新迭代,芯片算力、工藝及互連等組網方案升級將持續帶動交換機、光模塊等相關硬件創新迭代,LPO、硅光、硅光、CPO等新技術有望加快推進。等新技術有望加快推進。圖表:英偉達數據中心圖表:英偉達數據中心/AI GPU基礎信息基礎信息圖表:臺積電工藝制程路線圖圖表:臺積電工藝制程路線圖AI
35、服務器對光模塊彈性測算服務器對光模塊彈性測算14來源:A Scalable,Commodity Data Center Network Architecture,英偉達官網,中泰證券研究所測算BOM測算:以500臺DGX H800主機測算,每臺搭載8張GPU&400G IB,“銅線+光模塊“方案下,銅線=GPU/2=2000,光模塊數量按400G計算為4000*4=16000個,考慮800G二合一,即為8000個,交換機數量=GPU*5/端口數=320臺;全光模塊方案,類似上一代計算,2000*800G+4000*400G光模塊替換銅線,總光模塊數包括1萬個800G(2.5倍GPU)和4000
36、個400G(GPU1:1對應)BOM(500 DGX H800,8 GPU&IB/SERVER)物料(銅線物料(銅線+光模塊方案)光模塊方案)數量數量物料(全光模塊方案)物料(全光模塊方案)數量數量GPU(H800)4000GPU(H800)4000IB網卡(400G NDR IB)4000IB網卡(400G NDR IB)4000銅線(400G Server-to-ToR)2000光模塊(400G Server)4000光模塊(800G Spine/Core switch)8000光模塊(800G ToR)2000IB交換機(400G 64port)320光模塊(800G Spine/Cor
37、e switch)8000IB交換機(400G 64port)320圖表:圖表:Fat-Tree網絡架構網絡架構BOM(250 DGX A800,8 GPU&IB/SERVER)物料(銅線物料(銅線+光模塊方案)光模塊方案)數量數量物料(全光模塊方案)物料(全光模塊方案)數量數量GPU(A800)2000GPU(A800)2000IB網卡(200G NDR IB)2000IB網卡(200G NDR IB)2000銅線(200G Server-to-ToR)2000光模塊(200G Server-to-ToR)4000光模塊(200G Spine/Core switch)8000光模塊(200G
38、 Spine/Core switch)8000IB交換機(200G 40port)250IB交換機(200G 40port)250GPU迭代加速迭代加速1.6T光模塊升級光模塊升級15來源:ITPUB,光通信女人,中泰證券研究所光模塊趨勢向高速率發展。光模塊趨勢向高速率發展。AIGC等技術的快速發展帶來數據量呈指數級增長,設備與設備之間的亦需要更大帶寬連接,因此光模塊需要向更高帶寬發展?,F有光模塊帶寬主要以100G/200G/400G,目前正朝著800G、1.6T甚至更高的帶寬發展。交換機芯片密度的提升有望帶來交換機芯片密度的提升有望帶來1.6T加速放量加速放量。數據中心交換芯片的演變趨勢基本
39、上處于每兩年翻一番的快速增長,25.6T交換芯片用7nm工藝,51.2T則需要選擇5nm工藝節點,預計2025年3nm工藝節點可實現,并支持交換芯片能實現102.4T的容量。對于102.T的交換容量,則需要1.6T光模塊,光口每波長速率需要達到200G。我們預計2024年1.6T有望小批量出貨,2025年1.6T即可進入產業化節點。圖表:光模塊向高速率發展趨勢圖表:光模塊向高速率發展趨勢圖表:交換機密度提升帶動光模塊速率提升圖表:交換機密度提升帶動光模塊速率提升光通信:硅光光通信:硅光/LPO/CPO前沿技術方向前沿技術方向16來源:光電匯OESHOW,MACOM,鮮棗課堂,光學小豆芽,中泰證
40、券研究所硅光:技術集成化更具優勢。硅光:技術集成化更具優勢。硅光方案可繼承CMOS工藝,芯片層面最大程度實現混合集成,在短距、場景、相干光場景應用有望成為主流。硅光方案可大幅節約器件、組裝成本,控制占地空間,實現低成本、大規模的光連接,從根本上改變光器件和模塊行業。1.6T時代,多模VCSEL200G芯片或面臨瓶頸,硅光有望替代成為主流方案。LPO:線性驅動可插撥光模塊。:線性驅動可插撥光模塊。通過LPO技術把DSP替換,使用高線性度、具備EQ功能的TIA和DRIVER芯片(成本上升少許,比傳統DSP解決方案降低功耗、延遲和成本,滿足AI計算短距離、大寬帶、低延時要求。400G光模塊中使用7n
41、m DSP,功耗約為4W占整個模塊功耗的50%,DSP的BOM成本約占20-40%。高線性度的TIA、Driver芯片作為LPO技術的核心零部件,目前有Macom、Semtech、美信(已被ADI收購)等主要供應商,博通也在推進相關產品研發。微軟、Meta、AWS都有可能逐步接受LPO方案。CPO:光電共封裝。:光電共封裝。交換ASIC芯片和硅光引擎(光學器件)在同一高速主板上協同封裝,集中解決散熱問題,同時也可以省去很多SerDes功能,節省功耗,是有望最有潛力實現高集成度、低功耗和低成本的封裝方案。但是由于目前的技術與產業鏈尚不成熟等原因,短期內難以大規模應用。預計從1.6T開始,傳統可插
42、拔速率升級或達到極限,后續光互聯升級可能轉向CPO和相干方案。圖表:硅光模塊結構圖表:硅光模塊結構圖表:圖表:CPO結構圖示結構圖示圖表:圖表:LPO結構圖示結構圖示算力網絡圖譜:算力網絡圖譜:GTC聚焦光通信與液冷產業鏈聚焦光通信與液冷產業鏈17來源:各公司官網,中泰證券研究所整理通 信 大 變 革算 網 新 基 建 算網設備算網運營算網建設運營商:移動、電信、聯通有線/無線參股/合作中國通信服務潤建股份、元道通信算 力 網 絡運營商云互聯網云設備商云中立云/IDC移動云、天翼云、聯通云、電子云算力散熱算力供給算力連接算力接入衛星互聯網工業互聯網芯片:高通、聯發科、紫光展銳、翱捷科技模組:移
43、遠通信、廣和通、美格智能、有方科技車聯網:移為通信、鴻泉物聯、銳明技術T/R芯片&組件:鋮昌科技、臻鐳科技、國博電子通信載荷:上海瀚訊、信科移動、創意信息核心網:震有科技、信科移動衛星運營:中國衛通衛星終端:海格通信、華力創通、盟升電子傳感層:威勝信息、四方光電、力合微網絡層:東土科技、三旺通信、映翰通、震有科技平臺層:寶信軟件光模塊液冷風冷英維克、曙光數創、申菱環境、高瀾股份、佳力圖、依米康、網宿科技冷板式散熱浸沒式散熱噴淋式散熱散熱模組系統風扇算 力 交 換全球:Cisco、HPE、Juniper、Arista、NVIDIA國內:華為、紫光股份、銳捷網絡、中興通訊、邁普科技交換機代工廠商臺
44、資:工業富聯、臺達電子、智邦科技、明泰科技大陸:菲菱科思、共進股份、劍橋科技、卓翼科技交換芯片全球:BroadCom、Cisco、Intel、Marvell國內:華為、中興通訊、盛科通信、裕太微阿里云、騰訊云、京東云、字節云華為云、紫光云、浪潮云、金山云青云、優刻得、首都在線、寶信軟件、潤澤科技、光環新網、奧飛數據、數據港、科華數據光器件光芯片全球:Finisar、Lumentum、MOLEX、Intel國內:中際旭創、新易盛、光迅科技、華工科技、博創科技、劍橋科技、聯特科技、德科立、銘普光磁全球:Finisar、Oclaro、Broadcom等國內:天孚通信、三環集團、太辰光、騰景科技、兆龍
45、互連全球:Finisar、Lumetum、BroadCom、三菱、住友國內:源杰科技、長光華芯、仕佳光子、光庫科技、永鼎股份、華西股份連接器全球:安費諾、莫仕、泰科國內:鼎通科技、意華股份、瑞可達傳輸設備:華為、中興通訊、烽火通信服務器:浪潮信息、紫光股份、超聚變、中科曙光、中興通訊基站:華為、中興通訊、信科移動光纖光纜:長飛光纖、亨通光電、中天科技邊緣算力AIOT重點關注標的重點關注標的18來源:Wind,中泰證券研究所GTC大會召開在即,預計將在本次大會上推出大會召開在即,預計將在本次大會上推出Blackwell架構的架構的B100 GPU,與,與H200系列相比性能有望翻倍提升,后續版本
46、功率或達系列相比性能有望翻倍提升,后續版本功率或達1000W,采用液冷散熱。隨著采用液冷散熱。隨著B100等芯片算力持續提升,光通信產品有望朝高速率進一步演進,成本與功耗瓶頸有望加速硅光等芯片算力持續提升,光通信產品有望朝高速率進一步演進,成本與功耗瓶頸有望加速硅光/LPO/CPO等新技術方等新技術方案落地。建議關注光通信與液冷產業鏈。案落地。建議關注光通信與液冷產業鏈。同時,本次同時,本次GTC大會將圍繞機器人、數據中心云計算等多領域開展主題演講、討論交流等活動,現場將展出大會將圍繞機器人、數據中心云計算等多領域開展主題演講、討論交流等活動,現場將展出25款機器人,有望發布具身智能款機器人,
47、有望發布具身智能相關進展。大模型向多模態演進,加速相關進展。大模型向多模態演進,加速AI應用落地,數據中心、應用落地,數據中心、CDN等或將受益推理場景拓寬帶來的新一輪流量增長。等或將受益推理場景拓寬帶來的新一輪流量增長。圖表:重點標的估值圖表:重點標的估值細分板塊細分板塊 代碼代碼公司公司股價(元)股價(元)市值(億元)市值(億元)歸母凈利潤(億元)歸母凈利潤(億元)PE2023E增速增速2024E增速增速2023E2024E光模塊器件光模塊器件300308.SZ中際旭創177.36 1423.89 21.81 78.19%40.26 84.60%65.29 35.37 300394.SZ天
48、孚通信156.01 616.06 7.30 81.14%12.11 65.91%84.40 50.87 688498.SH源杰科技162.00 138.45 0.19-80.58%1.06 442.61%710.73 130.98 300502.SZ新易盛76.98 546.50 6.91-23.57%12.58 82.14%79.13 43.45 688313.SH仕佳光子11.65 53.45-0.48-174.21%0.81 269.76%-112.03 65.99 688195.SH騰景科技27.08 35.03 0.42-28.34%0.75 80.21%83.72 46.46 30
49、0620.SZ光庫科技51.03 125.18 0.73-37.92%1.56 113.75%171.18 80.09 002281.SZ光迅科技39.91 316.97 5.82-4.41%7.37 26.75%54.50 43.00 301205.SZ聯特科技109.22 141.71 0.62-45.26%1.82 193.55%228.56 77.86 300570.SZ太辰光42.19 97.04 1.68-6.80%2.60 55.13%57.83 37.28 液冷液冷002837.SZ英維克33.85 192.43 3.89 38.78%5.23 34.55%49.47 36.7
50、7 872808.BJ曙光數創53.37 106.74 1.05-10.61%1.84 76.16%102.14 57.98 301018.SZ申菱環境27.82 74.02 2.27 36.51%3.04 34.00%32.61 24.34 300499.SZ高瀾股份13.82 42.19 0.38-86.93%1.76 369.33%112.49 23.97 603912.SH佳力圖8.16 44.21-300249.SZ依米康7.92 34.89-300017.SZ網宿科技10.10 246.16 5.13 169.00%5.61 9.33%48.01 43.92 ICT設備設備3011
51、91.SZ菲菱科思95.62 66.30 1.72-11.79%3.21 86.63%38.55 20.66 688702.SH盛科通信-U42.34 173.59-0.20 0.00000.13 161.67%-854.31 1385.30 301165.SZ銳捷網絡39.95 226.99 5.12-6.92%7.34 43.47%44.34 30.91 000938.SZ紫光股份23.17 662.68 22.64 4.90%28.08 24.05%29.28 23.60 000063.SZ中興通訊29.00 1285.41 93.26 15.41%106.45 14.15%13.78
52、12.08 數據中心數據中心300442.SZ潤澤科技25.10 431.86 17.93 49.67%23.25 29.67%24.09 18.57 600845.SH寶信軟件42.86 869.59 26.36 20.59%33.04 25.34%32.99 26.32 300383.SZ光環新網9.87 177.42 7.16 181.36%9.24 29.05%24.78 19.20 300738.SZ奧飛數據9.88 94.21 1.78 7.74%2.56 43.67%52.78 36.74*注:以2024年3月15日收盤價計算,橙底加粗標的為已覆蓋公司,盈利預測來自中泰預測,中際
53、旭創/天孚通信/源杰科技/中興通訊2023年歸母凈利潤來自業績快報及年報,其余標的盈利預測及估值均取自Wind一致預期風險提示風險提示19AI發展不及預期風險。發展不及預期風險。AI是底層算力增長核心驅動力之一,若AI技術及應用發展不及預期,算力規模增速可能放緩,進而影響產業鏈擴張升級;技術迭代不及預期風險。技術迭代不及預期風險。技術升級帶動硬件價值量提升,打開增量市場,若行業技術迭代速度不及預期,可能導致新品導入量產放緩,公司若不能及時根據市場需求變化進行技術、產品及業務創新,市場競爭力將可能被削弱,影響經濟效益;市場競爭加劇風險。市場競爭加劇風險。競爭從業務布局、核心技術、人才、資金和政策
54、等方面展開,存在新的進入者導致市場競爭加劇的風險;海外貿易爭端風險。海外貿易爭端風險。中美之間經貿磋商不斷反復,需要保持高度關注;市場系統性風險。市場系統性風險。全球和國內宏觀層面相關因素仍可能對市場產生系統性影響;研究報告使用的公開資料可能存在信息滯后或更新不及時的風險。研究報告使用的公開資料可能存在信息滯后或更新不及時的風險。重要聲明重要聲明中泰證券股份有限公司(以下簡稱“本公司”)具有中國證券監督管理委員會許可的證券投資咨詢業務資格。本報告僅供本公司的客戶使用。本公司不會因接收人收到本報告而視其為客戶。本報告基于本公司及其研究人員認為可信的公開資料或實地調研資料,反映了作者的研究觀點,力
55、求獨立、客觀和公正,結論不受任何第三方的授意或影響。本公司力求但不保證這些信息的準確性和完整性,且本報告中的資料、意見、預測均反映報告初次公開發布時的判斷,可能會隨時調整。本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告所載的資料、工具、意見、信息及推測只提供給客戶作參考之用,不構成任何投資、法律、會計或稅務的最終操作建議,本公司不就報告中的內容對最終操作建議做出任何擔保。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。市場有風險,投資需謹慎。在任何情況下,本公司不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者應注意,在法律允許的情況下,本公司及其本公司的關聯機構可能會持有報告中涉及的公司所發行的證券并進行交易,并可能為這些公司正在提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。本公司及其本公司的關聯機構或個人可能在本報告公開發布之前已經使用或了解其中的信息。本報告版權歸“中泰證券股份有限公司”所有。事先未經本公司書面授權,任何機構和個人,不得對本報告進行任何形式的翻版、發布、復制、轉載、刊登、篡改,且不得對本報告進行有悖原意的刪節或修改。20