《計算機行業【AIGC算力時代系列報告】:ChatGPT研究框架-230214(64頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業【AIGC算力時代系列報告】:ChatGPT研究框架-230214(64頁).pdf(64頁珍藏版)》請在三個皮匠報告上搜索。
1、浙商證券股份有限公司2證券研究報告ChatGPT研究框架【AIGC算力時代系列報告】行業評級:看好2023年2月14日分析師陳杭姚天航安子超李佩京張建民研究助理郵箱chenhangstocklipeiingstocke.coyaotianhangstockezhangjianminstock郵箱證書編號S1230518060001S1230522110004S1230522060001S1230522010001#page#浙商證券股份有限公司摘要【芯片算力】芯片需求=量t價1,AIGC拉動芯片產業量價齊升。1)量:AIGC帶來的全新場景+原場景流量大幅提高;2)價:對高端芯片的需求將拉動芯片
2、均價。ChatGPT的“背后英雄”:芯片,看好國內GPU、CPU、FPGA、AI芯片及光模塊產業鏈。相關標的:海光信息、景嘉微、龍芯中科、中國長城、安路科技、復旦微電、紫光國微、寒武紀、瀾起科技、德科立、天孚通信、中際旭創【深度學習框架】深度學習框架是人工智能算法的底層開發工具,是人工智能時代的操作系統,當前深度學習框架發展趨勢是超于大模型訓練,對深度學習框架的分布式訓練能力提出了要求,國產深度學習框架迎來發展機遇。相關標的:百度、海天瑞聲、商湯科技、微軟、谷歌、Meta。Y馬香rawojsueuc書0面靜d迎蟲ldionsuicEvIvuedo青音ldieuo【Y區素到】模型數量激增,參數量
3、進入干億時代,國內百度也發布了ERNIE系列模型并有望運用于即將發布的文心一言(ERNIEBot)對話系統,未來國內廠商有望在模型算法領域持續發力。相關標的:百度、科大訊飛、商湯科技、谷歌、微軟?!緫谩緾hatGPT火爆全球的背后,可以癡見伴隨人工智能技術的發展,數字內容的生產方式向著更加高效邁進。ChatGPT及AIGC未來有望在包括游戲、廣告營銷、影視、媒體、互聯網、娛樂等各領域應用,優化內容生產的效率與創意,加速數實融合與產業升級相關標的:百度、騰訊、阿里巴巴、網易、昆侖萬維、閱文集團、捷成股份、視覺中國、風語筑、中文在線、三互娛、吉比特、天娛數科?!就ㄐ拧緼IGC類產品未來有望成為5
4、G時代新的流量入口,率先受益的有望是AIGC帶來的底層基礎算力爆發式增長相關標的:包括算力調度(運營商)、算力供給(運營商、奧飛數據、數據港)、算力設備(浪潮信息、聯想集團、紫光股份、中興通訊、銳捷網絡、天孚通信、光庫科技、中際旭創、新易盛)、算力散熱(英維克、高瀾股份)。新2#page#芯片算力1、#page#浙商證券股份有限公司算力需求爆發拉動芯片量價齊升光模塊和光芯片通過AI服務器實現Transformer技術模型送代芯片需求快速增加GPU門門芯片均價大幅提升算力需求增加CPU號芯片量價十需求AI訓練計算需求FPGA模型訓練成本預計每3.5個月翻一番1200萬美元算力A模型算法訓練數據浙
5、商英偉達GPUA100號ChatGPT完美運行1萬顆光模塊AI芯片(加速器)資料來源:浙商證券研究所#page#浙商證券股份有限公司2人工智能四層架構,芯片為底層支撐AI繪畫:盜夢師AI寫作:奔寫AIGCAI音樂:DeepMusic上層應用ChatGPT百度:文心大模型谷歌:PaLM大模型華為:盤古大模型GPT3.5OpenAl:百度:PaddlePaddleMeta:PyTorch深度學習框架華為:MindSpore谷歌:TensorFlowCPUGPU底層芯片FPGAASIC資料來源:瀾舟科技,IDC,量子位,電子發燒友等,浙商證券研究所#page#浙商證券股份有限公司人工智能不同計算任務
6、需要各類芯片實現強大的調度、管理、并行架構低延時成本低計算單元多開發周期短能耗低協調能力;應用范圍廣適合大量邏輯確定硬件可根據需求調整性能強開發方便靈活的重復計算成本和壁壘高針對AI設定特定架構通用性強CPUNPUGPUD4atrix uniAUSystem Memory應用方便FPGAAI用ASICDRAM研發階段浙商邏輯判斷數據中心模型訓練任務調度與控制成熟量產階段AI推理性能更優,能效更高資料來源:Huaweiforum,浙商證券研究所#page#浙商證券股份有限公司ChatGPT流量激增,為AI服務器帶來重要發展機遇原場景流量提升+新應用場景服務器算力要求提升AI服務器需求增加達成1億
7、月活躍用戶耗時傳統CPU服務器史上用戶增速最終端用戶使用頻率提高通用性較強,專用性較弱iTunes快消費級應用數據流量暴漲,對服務器Ewitter0的數據處理能力、可靠性Meta算力無法滿足及安全性等要求相應提升nstagam78個月S60個月54個月OpenAI30個月數據的質和量發生變化,9個月AI服務器需求非結構化數據占比激增2個月應用288億美元CAGR=18.8%ChatGPT在問答模式的基礎上進行推理、編寫代碼、原場景流量提升文本創作等,用戶人數及使用次數均提升!122億美元全球AI服務器市場內容生產智能客服智能音箱規模創造新應用場景游戲NPC陪伴型機器人20202025資料來源:
8、Sensor Tower,World of Engineering,頭豹研究院,華經產業研究院,浙商證券研究所#page#浙商證券股份有限公司AI服務器快速增長,大力拉動芯片需求2022年中國人工智能芯片中國人工智能服務器工作負載預測AI服務器=?市場規模占比FPGA.0.ASIC.1.0%100%NPU9.6%異構形式B0%70%50409CPU30910%十20202022202320242022026GPU89.0%2021年全球服務器市場格局2021年中國服務器市場格局GPU新華三/HPE其他,17.1%其他,21.8%15.6%館浪潮,30.7%AI團FPGA戴爾,15.4%浙商OD
9、M.8.59怡聯想,6.6%ODM浪潮,8.9%ASIC35.5%新華三/HPE華為,7.4%聯想,6.4%17.5%華為,1.1%戴爾,7.5%資料來源:IDC,2022-2023中國人工智能計算力發展評估報告旅了檔浙商證券研究所整理#page#浙商證券股份有限公司3SAI服務器芯片構成CPU+加速芯片應用場景AI服務器應用領域CPU+加速芯片:通常搭載GPU、計算機視覺機器學習FPGA、ASIC等加速芯片,利用訓練CPU與加速芯片的組合可以滿足(算力30TOPS)自然語言處理高吞吐量互聯的需求芯片種類優點缺點提供了多核并行計算的基礎結構,核心高度推理管理控制能力弱,功GPU數多,可支撐大量
10、數據的并行計算,擁適配耗高(算力30TOPS)有更高浮點運算能力開發難度大,只適合可以無限次編程,延時性較低,擁有流FPGA定點運算,價格比較水線并行(GPU只有數據并行),實時禮昂貴性最強,靈活性最高計算與通用集成電路相比體積更小,重量更(530TOPS)靈活性不夠,價格高ASIC輕,功耗更低,可靠性提高,性能提高于FPGA保密性增強,成本降低資料來源:華經產業研究院,億歐智庫,浙商證券研究所#page#浙商證券股份有限公司01CPU擅長邏輯控制,可用于推理/預測整個CPU的指揮控制中心,由指CPU運行原理令寄存器IR、指令譯碼器ID和操修改指令作控制器OC等組成。取指令指令譯碼執行指令計數
11、器控制單元作為計算機系統的運算和控制核心,暫時存放數據是信息處理、程序運行的最終執行單元的區域,控制指令CPU控制指令保存等待處理有大量的緩存和復雜的邏輯控制單元,優勢或已經數據擅長邏輯控制、串行的運算處理過運算單元存儲單元的數據。計算量較小,且不擅長復雜算法運算和勞勢處理并行重復的操作。尚長執行部件,運算器的核心??梢詧绦兴阈g運算和邏輯運算。運算單元所進行的全部操作在深度學習中可用于推理/預測都是由控制單元發出的控制信號來指揮10資料來源CSDN,浙商證券研究所整理#page#浙商證券股份有限公司服務器CPU向多核心發展,滿足處理能力和速度提升需要多核心CPU單核心CPU系統性能優劣不能只考
12、I慮CPU核心數量,還要考慮操作系統、調度算串行單任務處理分時多任務處理分時多任務處理處理的任務更多、法、應用和驅動程序等。處理速度更快一心一用”一心多用”多心多用20172023200520102020英特爾Sapphire酷睿i9Lakefield奔騰D系列酷容i7-980X從單核到多核Rapids史上第一個雙核首款6核處理器18核處理器首款采用混合架構擁有56個核心處理器的x865核處理器20072018200520202023AMD第二代銳龍銳龍ThreadripperPhenom9500香龍9004Athlon 64X2從雙核到96核3990XThreadripper同一塊芯片內整首
13、款原生4核處最大核心數量已擁有64核核心數量最多可理器合兩個K8核心達到32核達96個11資料來源:芯論語,半導體產業縱橫,AMD官網,浙商證券研究所#page#浙商證券股份有限公司GPU高度適配AI模型構建ChatGPT引I發GPU熱潮AI模型構建(以以英偉達A100為例)百度:即將推出文心一言推理過程訓練過程(ERNIEBot)GPU的并行計算高度適配神經網絡多實例GPU(MIG)技術允許多個網絡同時蘋果:引入AI加口速器設計的M2系基于單個A100運行,從而優化計算資源的列芯片(M2pro和M2max)將被利用率搭載于新款電腦在A100其他推理性能增益的基礎之上,僅結構稀疏支持一項就能帶
14、來高達兩倍的性能OpenAl:隨著ChatGPT的使用量提升。激增,OpenAl需要更強的計算能在BERT等先進的對話式AI模型上,A100GPU幫助高速解決問題:2048個A100力來響應百萬級別的用戶需求,因可將推理吞吐量提升到高達CPU的249倍;GPU可在一分鐘內成規模地處理BERT此增加了對英偉達GPU的需求249X之類的訓練工作負載;245X3XAMD:計劃推出與蘋果M2系列芯片競爭的臺積電4nm工藝“Phoenix*系列芯片,以及使用Chiplet工藝設計的“AlveoV70AI0.7X老芯片。這兩款芯片均計劃在今年推1X向市場,分別面向消費電子市場以A10080GBV100A1
15、0040GB及AI推理領域CPU OnlyA10080GBA10040GBFP16FP16FP1612資料來源:英偉達官網,鎂客網,騰訊網,浙商證券研究所#page#浙商證券股份有限公司FPGA:可通過深度學習+分布集群數據傳輸賦能大模型通信可編程靈活性高:半定制電路,理論上可以實現任意ASIC和DSP的邏輯功能開發周期短:可通過設計軟件處理布線、布局及時序等問題。圖人工智能數據中心現場可重編功能:可以遠程通過軟件FPGA實現自定義硬件功能。低延時:邏輯門通過硬件線連接,不需要時鐘信號自動駕駛工業互聯網方便并行計算:集成了大量基本門電路,一次可執行多個指令算法推理Intel,AMD(Xilin
16、x),亞馬遜深度學習異構計算、并行計算AMD (Xilinx)微軟,百度,阿里,騰訊訓練YIntel, AMD (Xilinx)通信接口數據高速收發、交換13邊緣端數據中心資料來源摩爾星球C114億歐智庫,湖商證券研究所#page#浙商證券股份有限公司ASIC可進一步優化性能與功耗,全球巨頭紛紛布局國內外ASIC芯片龍頭布局隨著機器學習、邊緣計算、自動駕駛的發展,大量數據處理任務的產生,對于芯片計算效率、計算能力和計能耗比的要求也越來越高,ASIC通過與CPU結合的方式被廣泛關注,國內外龍頭廠商紛紛布局迎戰AI時代的到來。谷歌:張量處理器TPU阿里巴巴:含光800AI芯片最新的TPUV4集群被
17、稱為Pod,包含4096個硬件:自研芯片架構v4芯片,可提供超過1exaflops的浮點性能軟件:集成達摩院先進算法,可實現大網絡模型在一顆NPU上完成計算。英偉達:GPU+CUDA百度:昆侖2代AI芯片國外國內主要面向大型數據密集型HPC和AI應用采用全球領先的7nm制程,搭載自研的第二基于Grace的系統與NVIDIAGPU緊密結代XPU架構,相比一代性能提升2-3倍;合,性能比NVIDIADGX系統高出10倍;昆侖芯3代將于2024年初量產。Habana(Intel收購)華為:昇騰910已推出云端AI訓練芯片Gaudi和云端AI業界算力最強的AI處理器,基于自研華為推理芯片Goya;達芬
18、奇架構3DCube技術14資料來源:機器之心,華為官網,半導體產業縱橫,公開資料整理,浙商證券研究所#page#浙商證券股份有限公司數據傳輸速率:容易被忽略的算力瓶頸算力需求:超摩爾發展算力供給:芯片提升+并行計算并行瓶頸:數據傳輸速率通信延時導致加速放緩AI時代模型算力需求以超過摩爾定律增長數據中心通過交換機網絡實現設備互聯算力(FLPOs)加理論加速比速比5-6個月翻倍(遠超摩爾定律)實際加速比深深度學習之前度學習時大模型時王家惠活20個月翻倍(近似摩爾定律)浙送模型發布時間并行計算節點數5資料來源:GoogleScholar并行處理中節點間通信對加速比的影響,浙商證券研究所#page#浙
19、商證券股份有限公司數據傳輸核心器件:光模塊光模塊包含發射器件和接收器件,光纖通信時的光電轉換數據中心占光模塊一半以上市場(2021Q4)32.6%骨干發射器件接收器件電信城域驅動電路放大器電信電信號探測器(內含激光器(內含接入光芯片)光模塊光芯片)號67.4%光纖傳輸數據中心內部數通光信號電信號電信號數據中心互聯光模塊向高速傳輸發展,以順應數據傳輸量增長趨勢10GQSFP-DDNOSFP-XD40G400G800、1.6T.SFP、XFPQSFP、CFP、COBO1x9、GBIC硅光技術浙2G4G5G3G相干技術光電共封裝技術2000-20102010-20202020之后1995-2000(
20、CPO)16中際旭創年報,光纖在線,電子發燒友,華經情報網,浙商證券研究所資料來源:#page#浙商證券股份有限公司服務器CPU需求增長,國化產三條發展路線中國服務器市場規模國產服務器CPU發展之路中國加速計算服務器市場預測自主化程度:低,未我12000上海兆芯來擴充指令集難度較(百萬美元)10000大,但生態遷移成本CisCX86架構IP內核授權80小、性能高中H6000海光信息缺點:安全基礎不牢40002000自主化程度:較高,華為鯤鵬20222023202520242026安全基礎相對牢靠指令集架擁有自主發展權HUAWEIARM架構服務器CPU市場格局構授權缺點:生態構建較為Phytiu
21、m天津飛騰困難服務器CPUX86架構廠商份額飛騰AMDRISC9.80%自主化程度:極高,龍芯中科MIPS架構龍芯中科申威科技已基本實現授權+自主完全自主可控我1研制指令集缺點:生態構建極其!英特爾MIPS架構申威科技90.205困難1資料來源DCwind所整#page#浙商證券股份有限公司未來算力升級路徑:CHIPLET、存算一體近期CHATGPT的興起推動著人工智能在應用端的蓬勃發展,這也對計算設備的運算能力提出了前所未有的需求。雖然AI芯片GPU、CPU+FPGA等芯片已經對現有模型構成底層算力支撐,但面對未來潛在的算力指數增長,短期使用CHIPLET異構技術加速各類應用算法落地,長期來
22、看打造存算一體芯片(減少芯片內外的數據搬運),或將成為未來算力升級的潛在方式。2021201920162023Google DeepMndOpenATGoogleDepMind蛋白質結構游戲AlphaGoChatGPTAlphaFold2AlphaStarAlphaGo(DeepMind)(DeepMind)(DeepMind)201820202022OpenAIGoodleAIGoogle DeeplChatGPT (OpenAI)CPT-3GOGato大模型通用AI浙BERT(Google AGPT-3 (OpenAI)Gato (DeepMind)大算力CPUGPU未來:未來:存算一體?
23、Chipletz18資料來源:知乎先進存算一體芯片設計(陳魏等),浙商證券研究所#page#浙商證券股份有限公司CHIPLET是布局先進制程、加速算力升級的關鍵技術Chiplet異構技術不僅可以突破先進制程的封鎖,并且可以大幅提升大型芯片的良率、降低設計的復雜程度和設計成本、降低芯片制造成本。chiplet技術加速了算力升級,但需要柄性一定的體積和功耗,因此將率先在基站、服務器、智能電車等領域廣泛使用65135功模數28m能用十中字率擬90nm45nm十美國芯片法案禁子Chiplet芯粒芯粒Chiplet4GCPU5G2GPU基站AI7mm夠用14omFPGA服務器十智能座艙AI演算L4+智駕
24、L2+基帶ChatGPTAIGC、33/2nm智能電車、無人駕駛5nm好用十VRARMR智能座艙、人工智能、5/6G手機9浙商證券研究所數據來源:芯智訊,#page#浙商證券股份有限公司CHIPLET已廣泛應用于服務器芯片AMD:EPYC第1代至第4代華為海思:鯤鵬920采用7nm制造工藝,基于ARM架構授權Chiplet服務器芯片的引領者,4代產品采用5nm,由華為公司自主設計完成。典型主頻下,基于chiplet的第一代AMDEPYC處理器中,裝載SPECintBenchmark評分超過930。8個“zen“CPU核,2個DDR4內存通道和32個PCle通道,以滿足性能目標。Chiplet寒
25、武紀:云端AI芯片思元3702022年AMD正式發布第四代EPYC處理器,擁有服務器基于7nm制程工藝,是寒武紀首款采高達96顆5nm的zen4核心,并使用新一代的芯片用chiplet(芯粒)技術的AI芯片Chiplet工藝,結合5nm和6nm工藝來降低成本。集成了390億個晶體管,最大算力高英特爾:第14代酷容MeteorLake達256TOPS(INT8),是寒武紀第二代產品思元270算力的2倍。內存帶寬是上一代產品的3倍,訪存首次采用intel4工藝,首次引入chiplet小芯片設龍芯中科:龍芯3D5000(試驗)能效達GDDR6的1.5倍。計,預計將于23年下半年推出至少性能功耗比的目
26、標要達到13代RaptorLake面向服務器市場的32核CPU產品,通過Chiplet技術把兩個3C5000硅片封裝在的1.5倍水平。一起,集成了32個LA464處理器核和64MB片上共享緩存,22年未初樣試驗成功20資料來源:各公司官網,浙商證券研究所#page#浙商證券股份有限公司存算一體:打破“存儲墻”限制,技術選代演進存算技術演進路線“存儲墻”成為了數據計算應用的一大障礙面對計算中心的數據洪流,數據搬運慢、搬運能耗大等問題成為查存計算(ProcessingWithMemory)了計算的關鍵瓶頸。從處理單元外的存儲器提取數據,搬運時間往往是運算時間的成百上千倍,整個過程的無用能耗大概在6
27、0%-最早期技術GPU對復雜函數的運算90%之間,能效非常低。近存計算(ComputingNearMemory)HW FLOPS:算力發展速度10000AMD的Zen系列CPU三星HBM-PIM存儲墻限制存內計算(Computing In Memory)閃存知存Mythic千芯科技存儲發展速度存內邏輯(Logic In Memory)201120142017滿足大模型計TSMC千芯科技算精度要求21資料來源:知乎先進存算一體芯片設計(陳等),浙商證券研究所#page#浙商證券股份有限公司存算一體:更大算力、更高能效、降本增效存算一體就是存儲器中疊加計算能力,以新的高效運算架構進行二維和三維矩陣
28、計算。存算一體的優勢包括:(1)具有更大算力(1000TOPS以上)(2)具有更高能效(超過10-100TOPS/W),超越傳統ASIC算力芯片(3)降本增效(可超過一個數量級)CPUGPU存算一體存算一體一般10-100計算核心一般萬量級計算核心一般百萬量級等效計算核心存儲器中疊加計算能力以新的高效運算架構進行控制單元計算計算二維和三維矩陣運算。筒地色號單元單元緩存控制存算一體的應用領域單元控制單元計算計算計計計性算算算德單元單元緩存自動駕駛自然語言處理控制單元計計算計智慧城市計算緩存商品推薦緩存工業視覺醫藥計算套個性化推薦片外內存片外內存多語言精準識別片外內存22資料來源:知乎先進存算一體
29、芯片設計(陳額等),浙商證券研究所#page#深度學習框架2、23#page#浙商證券股份有限公司02深度學習框架:人工智能時代的操作系統模型驗證模型訓練精度調試算法實現數據準備環境安裝訓練人工智能開發1鏈條長且復雜效果驗證模見部香數據收集鎖型轉換環境安裝推理數據人工智能基礎設施通用模型架構使用深度學習框使用深度學習框架工具進行開發支持計算機視覺應用深度學習框架架工具進行開發物理資源調度使用流行的編程語言VO設備管理模型GPU加速拓展包分布式硬件資源新開發者使用簡單支持AI領域的快速變化資料來源:北京日報、認知計算與云安全公眾號、華為云4#page#浙商證券股份有限公司02深度學習框架:大模型
30、訓練和前端垂直化成為趨勢科技巨頭入場,并噴式發展2017201220152019華為M紐約大學FacebookGoogleAI創業公商湯科技司Skymind微軟torchTensorflowCafez驢視科技第DLASeCNTKPYTORCHAmazonFacebook0蒙特利爾大學mxnetConvNet百度theanodarketO PyTorch清華大學微軟多倫多大學1飛漿Preferred圖403154JosephNetworksRedmon提出福Chainer200820132018202x2016系統設計簡單前端垂直化多GPU的訓練加速模型配置文件非常不靈活用戶友好、更加靈活大型模
31、型訓練5伯禹人工智能學院、機器之心,中國計算機學會、知乎簡書MAREKREI、馨創AI、浙商證券研究所CSDN.資料來源#page#page#浙商證券股份有限公司3502OpenAI:從多種框架的使用到專注于Pytroch大多數情況使用特殊情況使用2015年TheanoTensorFlow深度模型框支持GPU加速架轉變的張量計算核心Pytroch成為統一的深度學習框架功能2020年方便優化模型的自動微分機制簡單易懂:PyTorch具有用戶友好的API便于調試:對Python生態的良好支持;原因極大縮短研究周期強大高效:Pytorch提供了非常豐富的模型組件27資料來源:OpenAI官網#pag
32、e#浙商證券股份有限公司02Tensorflow:谷歌開源的向更加易用發展的主流學習框架Tensorflow從0.1到2.0的發展歷程缺點:調試困難、API混缺點缺乏調度能力,需手動配置亂、入門困難優點:更快、!更靈活、優點:簡化的模型開發流程、強大使得神經網絡能夠優點隨時就緒的跨平臺能力、強大的研究發現有效計算添加兩種新機制,解決輸入管采用CPU+GPU計引入更高級的API,可在運用更簡單的模型進行構建、簡化改進之道瓶頸并節約資源PI處算模型移動設備上運行開源TensorflowTensorflow1.0.0發布發布版Tensorflow2.3發布Tensorflow2.0發布本0.1版本穩
33、定版誕生2017年2015年2019年202x年28CSDN、helloword、城市經濟網資料來源:騰訊云、#page#浙商證券股份有限公司02ChatGPT實現路徑:算力與框架支持,應用百花齊放對話虛擬人人工智能客服機器翻譯語音工作助手無代碼小說生成語音陪伴對話類搜索引擎編程對話AI模型人類反饋強化學習RLHF人工監督微調連續多輪對話承認自身錯誤ChatGPT質疑不正確的問題承認自身的無知模型人類反饋強化學習RLHFInstructGPT/GPT-3.5大模型Transfomer的Decoder分支GPT-3模型小樣本學習能力1750億個參數Attention機制Transformer參數
34、少速度快效果好深度學習框架店PyTorch易于使用API送代更穩定算力資源微軟云AzureOpenAI的獨家云提供商29CSDN.電子工程世界機器之心資料來源專知浙商證券研究所#page#浙商證券股份有限公司02分布式訓練需求對深度學習框架提出更高要求模型深度學習框架支持日益增長的數據量分布式訓練模型的復雜度訓練模型的參數巨大數據并行訓練數據巨大參數平均法更新式方法模型并行intra-layerinter-layer落后的計算資源大模型拆分拆分30CSDN資料來源:騰訊云開發者社區知平浙商證券研究所#page#3、深度學習大模型31#page#浙商證券股份有限公司203Transformer延
35、伸的四條線OpenAl(微軟對話程序GPT-1InstructGPT-2GPT-3Chat只有decoder,GPT模型更大,數據超大規模GPT僅使用上文進行量更多RLHF編碼2020202201920222018谷歌谷歌FaceBookFaceBookBARTM2mT5BigBird采用更加多樣的-100noiseTransfo2020201920202019-rmer谷歌FaceBookFaceBook谷歌谷歌ELECTRAROBERTaALBERTXLM訓練參數調整性能明顯升級輕量化模型BERT2020201920192019只有encoder同時使用上下文對話程序ERNIE進行編碼ER
36、NIEERNIE1.02.0文心一言3.03.OTITAN知識增強的持續學習知識增強大模型參數量大幅提升語義理解模型語義表示模型2018201720212023E2021201932真格基金、知乎、各模型官網、arxiv.org、浙商證券研究所,注:先后順序按照發布時間進行了重新排序資料來源#page#浙商證券股份有限公司03大模型參數邁向干億時代Google PaLM (5400)微軟和英偉達Megatron-Google LaMDA (2800)Turing NLG (5300)2018-2022年大模型參數量1億-5400億Google Gopher (2800)百度ERNIE3.0Ti
37、tan(2600)Naver CorpBigScience BLOOMOpenAi GPT-3(1758)HyperCLOVA (2040)(1760)Google T5(110)MetaAl OPT (1750)Google BigBird (1750)Google FLAN (1370)NIVIDIA Megatron-LM(83)Micrasoft Truning-NLGGLM (1300)EleutherAl GPT-NeoX(172)OpenAi GPT-2(15.8)(200)Facebook M2m-100百度ERINE3.0(100)Facebook RobertTa(150)
38、(3.35)Eleuther AI GPT-j (60)GoogleBERT-LargeGoogle ALBERT (0.31)(3.4)OpenAi InstructGPT(13)Facebook BARTAI團OpenAi GPT-1(1.2)Facebook XLMGoogle ELECTRA(1.02)新百度ERINE2.02020年:千億參數轉折點百度ERINE1.020222021201820192020知乎、各模型官網、arxiv.org、浙商證券研究所,單位:億資料來源真格基金電子工程世界、HuggingFace、#page#浙商證券股份有限公司303GPT模型僅保留Trans
39、former的解碼器,逐步升級層數和參數量GPT系列架構TransformerDecoder解碼器架構nainoTrmTrm僅保留Decode解碼器Encoder編碼器TrmTrmBEInstructGPT-1GPT-2GPT-3GPT論文年份2018201920202022Transformer層數124896PositionPositionEncodnOutaut參數量1.2億13億15.8億1750億預訓練數據量5GB45TBOutputs40GBInpulsshifte ngh)34資料來源:CSDN、電子工程世界、新商證券研究所,注:GPT(GereratePre-TrainingM
40、odel)#page#浙商證券股份有限公司03基于InstructGPT形成ChatGPT對話系統Chat略微降低參數量增加chat屬性網頁公眾測試入口GPTInstruct代碼訓練參數數量降低了100倍指令微調(instruction tuning)(1750億-13億)GPT基于人類反饋的強化學習(RLHF)GPT-3福時35資料來源:CSDN、電子工程世界、新智元、浙商證券研究所#page#浙商證券股份有限公司303基于BERT衍生百度文心大模型,料將推出對話系統文心一言Transformer架構BERT架構IDecoder解碼器DutpuEncoder編碼器TmTrmTrm1僅保留En
41、coderTrmTmTrm編碼器PositionaCupoouInputEEInputsPositionaPostional向新Outputs(shiftedrgh)6二sentation from Transformers)#page#浙商證券股份有限公司03基于BERT衍生百度文心大模型,料將推出對話系統文心一言ERNIERNIE1.0架構:改進了MLM任務ERNIE2.0:+持續學習框架ERNIE3.0、3.0TITAN:+參數量2.03.0ERNIE版本1.03.0 TITAN論文年份2019201920212021參考bertbase(1.1億),參數量100億2600億參考bert
42、base(1.1億)bert large (3.4億)Wiki,baike,wiki,news,dialogue,IR,4TB預訓練數據量news,tiebadiscourse relation37資料來源:黑馬程序員、知乎、BaiduResearch、浙商證券研究所,注:ERNIE#page#4、應用38#page#浙商證券股份有限公司04ChatGPT的背后:技術驅動的數字內容新生產方式AIGCAI生成內容內容生產總量人工智能技術驅動下,數字內容生產方式向更高效邁進AIGC: AI-GeneratedAI輔助生成內容ContentAIUGC:Al-assisted口內容生產總量巨大用戶生成
43、內容Generated Content口元宇宙式體驗DUGC:User-Generated口內容生產總量大專家生成內容口舉例:ChatGPT、AI繪Content口大規模沉浸交互畫、AI生成視頻等PGC:Professionally-口內容生產總量變多舉例:語音轉文字協助Generated Content口小規模多人交互紀要生成、百家號TTV內容生產總量較低口舉例:小紅書、微博協助新聞圖文生成視頻單人/多人專業體驗舉例:長視頻內容消費體驗數據來源:浙商證券研究所39#page#浙商證券股份有限公司04按技術場景,AIGC內容可分為文本、音頻、圖像、視頻等0501文本生成跨模態生成區0206音頻
44、生成叫m策略生成茶0307按技術場景劃分圖像生成Game AlAIGC內容分為AIZ活新0403視頻生成虛擬人生成數據、浙商證券研究所40#page#浙商證券股份有限公司04產業鏈逐步形成,玩家百花齊放,商業模式持續探索以ChatGPT為代表的AIGC行業,上游主要包括數據供給方、算法/模型機構、創作者生態以及底層配合工具等,中游主要包括文字、圖像、音頻、視頻等數字內容的處理加工方,下游主要是各類數字內容分發平臺、消費方及相關服務機構等。數據供給方數據分析及底層配合工具創作者生態(業務數據聯通、素材數據收集等,如第三方營銷標注瀘染引擎、混音設備等生物資產及內容素材公司、版權圖庫方等)放相關算法
45、模型研究機構相關開源算法嵌入/結合能力的業務平臺/業務生態運營增效內容設計內容制作工具周邊售賣視覺設計、文案設計、結構設計等音頻/視頻編輯工具、新聞采編、游戲制作等NFT、個性化產品等智能客服、簡單決策等中游自動實時個性化市場營銷數據梳理交互廣告植入、品牌虛擬形象打造、營銷內容生成等內外部數據分析及更新、數據分析及算法訓練第三方消費品各內容創作及分發平臺內容終端生產廠商分發渠道廠商基于AICG激發PGC及UGC活力新聞媒體機構、金融機構等下游第三方內容服務機構AIGC內容檢測MCN公司、公關公司等數據來源:量子位、浙商證券研究所41#page#浙商證券股份有限公司04應用領域廣泛,核心價值在于
46、優化內容生產的效率與創意中提升內容生產效率降低內容生產成本01游戲讓創作者擁有一個更加高效AIGC能夠代替人工完成聲音錄制、圖像渣染、視頻創作的智能創作工具,優化內容02廣告營銷等工作,從而降低內容生產創作,大幅提升效率并降低成本;提升創作效率的同時的成本與門檻,使更多用戶03影視能夠參與到高價值的內容創同樣提升了反饋生成效率,ChatGPT作流程中。有助于實現實時交互內容。04媒體C捕捉激發創作靈感聯動實現數據優化05互聯網幫助有經驗的創作者捕捉靈在與其他特定的數據庫(例感,在設計初期生成大量草如實時更新數據、特定主體圖,更好的理解創作需求并數據等)或AI系統進行聯動06娛樂尋找創作靈感。海
47、量數據提后,AIGC能夠實現更精準的AIGC高創造性和開放性,激發創未來預測或更個性化預測基07其他礎上調整生成內容。意認知、提升生產多樣性。數據來源:量子位、浙商證券研究所42#page#浙商證券股份有限公司04ChatGPT/AIGC+游戲:推動游戲生產范式升級,行業新篇章店增加玩家游戲體驗1)對局陪伴??膳惆橥婕疫M行游戲,包括平衡匹配、冷啟動、玩家掉線接管等。2)特定風格模擬。AI通過模仿職業選手,玩家則感覺像在與真實的職業選手對抗3)玩法教學。與玩家在真實對戰環境中交流協作,并在過程中向玩家傳授職業級的策略與操作技術,幫助玩家迅速熟悉英雄操作與游戲玩法,提高游戲的可玩性。安游戲性能測試
48、1)前期平衡性測試。Allbot可充分地模擬玩家在某一套數值體系下的游戲體驗,提出優化策略,為玩家帶來更加平衡的多樣性游戲交互2)游戲功能測試。通過AIbot針對性的找出游戲中所有交互的可能性,通過發現潛在漏洞輔助游游戲戲策劃。體驗03NPC角色AI生成功能AI可以創造不同的面孔、服飾、聲音甚至性格特征,甚至可同步驅動嘴型、表情等面部變化,達到角色高度逼真;并通過大量數據模擬人類運動,完成行走、跑步等一系列動作反應。劇情NPC邏輯及劇情AI生成策略AI智能NPC能夠分析玩家的實時輸入,與玩家動態交互,構建幾乎無限且不重復的劇情,增強用戶體驗并延長游戲生命周期。新XAO游戲策略生成6x讓AI感知
49、環境、自身狀態并基于特定目標決定當下需要執行的動作,基于特定問題和場景,自主提出解決方案。數據來源:量子位、浙商證券研究月43#page#page#浙商證券股份有限公司04ChatGPT/AIGC+廣告營銷:內容智能生成,精準個性化營銷A多模態廣告智能制作多套廣告營銷解決方案生成營銷內容個性化Al可按廣告主要求自動生成廣告AI可根據目標人群,進行素材分AI生成系統與底層的客戶數據文案;亦可根據廣告文案自動生析、招圖、配色等項目,制作多系統進行數據聯通,實時根據成為廣告海報、廣告視頻,大大種類型的廣告文案/海報/視頻,生數據的反饋,對需求進行針對降低了廣告的制作成本。成多套設計解決方案。性調整,
50、由AI快速選代對營銷內容進行更新,提升個性化營銷的效率和精準性。APIIYHA數據來源:量子位、浙商證券研究所45#page#浙商證券股份有限公司04ChatGPT/AIGC+影視:賦能影視制作,提升作品質量提升影視剪輯、后期制作水平影視劇本文稿創作1)實現對影視圖像進行修復、還原,提升影像資料的清晰度,保障影視作品通過對海量劇本數據進行分析歸納,并按照預設風格快速生產劇本,創作者再進行篩選和二次加工,的畫面質量。2)實現影視預告片自動生成。3)實現將影視內容維度轉制,從激發創作者的靈感,縮短創作周期。2D向3D自動轉制影視發行智能審核、用戶端個性化推薦擴展角色和場景創作空間浙1)通過AI人臉
51、合成、聲音合成實現數字復活已故演員、替換“勞跡藝人”、演員性電鮮70區專到dN重平目再票(角色年齡的跨越、高難度動作合成等,減少演員自身局限對影視作品的影響;頻傳播技術;2)通過人工智能合成虛擬物理場景,將無法實拍或成本過高的場景生成出來,拓2)用戶端實現視頻自主互動、彈幕防擋寬影視作品想象邊界,帶來更優質的視覺效果和聽覺體驗。46#page#浙商證券股份有限公司04ChatGPT/AIGC+媒體:推進人機協作共生,媒體效率提升8V新聞采編環節新聞傳播環節新聞主體影響提高內容制作效率播報高效智能化智媒影響產業及生活實現采訪錄音語音轉寫應用范圍不斷拓展對傳媒機構產生深刻營銷借助語音識別技術將錄音
52、語音轉寫成文目前新華社、中央廣播電視總臺、人民AIGC大幅提高生產效率,帶來新的視字,有效壓縮重復工作,保障新聞時效目報社、湖南衛視等積極布局,推出覺化、互動化體驗,推動傳媒向智媒轉性。變?!靶滦∥ⅰ?、“小C“等虛擬新聞主持人實現智能新聞寫作應用場景不斷升級對傳媒從業者產生深刻影響提升新聞資訊的時效?;谒惴ㄗ詣泳幊顺R幍男侣劜?,AI合成主播開始AIGC助力生產更具人文關懷、社會意寫新聞,將工作自動化,更快、更準、陸續支持多語種播報和手語播報,不斷義和經濟價值的新聞作品,并將部分勞更智能化地生產內容。升級應用場景。動性的采編播工作自動化。實現智能視頻剪輯應用形態日趨完善對傳媒受眾產生深刻影
53、響提升視頻內容的價值。通過使用視頻字在形象方面,逐步向3D拓展;在驅動范AIGC使其在更短時間內獲得以更豐富幕生成、視頻錦集、視頻拆條、視頻超圍上,向面部表情、肢體、手指、背景多元的形態呈現的新聞內容,也降低了分等視頻智能化剪輯工具,節省成本內容素材延伸;在內容構建上,向智能傳媒行業的技術門檻,極大增強其參與化生產探索。感。最大化版權內容價值。數據來源:中國信息通信研究院、浙商證券研究所47#page#浙商證券股份有限公司04ChatGPT/AIGC+互聯網:重構搜索引擎,更便捷高效多元更好的搜索體驗更完整的答案圖:微軟旗下搜索引擎集成ChatGPTBingbing改進用戶搜索體驗,在一些簡審
54、查從網絡上搜索到的結果找BREAKING:NewBingjust dropped.單的事情如體育比分、股票價到并總結答案。例如問題如譯推攻格和天氣等,新必應會提供更何用雞蛋代替蛋糕中的另一種相關結果,同時顯示更全面的成分,新版必應能夠給出詳答案。細說明。全新的交互式聊天體驗使用戶可幫助用戶獲得靈感,例如可能夠通過詢問更多細節、清晰以幫助用戶編寫電子郵件、規度和想法來優化搜索,直到獲劃旅游行程、準備工作面試等AI得正在尋找的完整答案,并提還引用了信息所有來源,用戶供可用鏈接??稍敿毑榭存溄蛹ぐl創造性火花全新的聊天體驗數據來源:機器之心、Bing、浙商證券研究所#page#浙商證券股份有限公司04
55、ChatGPT/AIGC+互聯網:電商購物虛實結合,沉浸式體驗生成商品3D模型打造虛擬主播線上線下商城加速演變010203用于商品展示和虛擬試用提升直播帶貨效率打造全新購物場景基于不同角度的商品圖像,借助視覺生1)為觀眾提供24小時不間斷的貨品推通過二維圖像的三維重建,實現虛擬貨成算法自動化生成商品的3D幾何模型和薦介紹,增加商品商鋪爆光度;場快速、低成本、大批量的構建,有效紋理,輔以線上虛擬“看、試、穿、2)推進店鋪品牌年輕化科技化進程;降低商家搭建3D購物空間的門檻及成本,戴”,提供接近實物的差異化網購體驗,3)虛擬主播穩定性強,行為言談可根為消費者提供新消費體驗。助力高效提升用戶轉化。據
56、品牌方要求個性化定制,失誤率低。圖:優衣庫4D試衣間圖:潮牌Vans在游戲Roblox的店鋪展覽圖:快手虛擬主播與真人主播場景互動黑嘉任公房中國性查房VANSWORLD優衣庫APP電商報新究49#page#浙商證券股份有限公司04ChatGPT/AIGC+娛樂:人機交互新臺階,有趣有料高熱度ChatGPT有趣有料,人機交互娛樂邁入新臺階ChatGPT火爆全網高熱度,2個月活躍用戶破億圖:ChatGPT百度搜索指數趨勢圖(2022/02/02-2023/02/09圖:ChatGPT百度資訊指數趨勢圖(2022/02/02-2023/02/09數經來源:微博、小紅書、百度指數、浙商證券研究所50#
57、page#浙商證券股份有限公司04ChatGPT/AIGC+娛樂:降低內容生產門檻,助力元宇宙加速實現趣味性圖像或音視頻生成,激發用戶參與熱情口1)圖像視頻生成,極大滿足用戶獵奇需求;口2)語音合成,變聲增加互動娛樂性。8。打造虛擬偶像,釋放IP價值自8開發C端用戶數字化身1)與用戶共創合成歌曲,加深粉絲黏性;各大科技巨頭積極探索與加速布局口2)合成音視頻動畫,支撐虛擬偶像“虛擬數字世界”與現實世界大融在更多元的場景進行內容變現合的“未來”。數據來源:中國信息通信研究院、浙商證券研究所5#page#浙商證券股份有限公司04ChatGPT/AIGC+其他:加快數實融合,產業升級提速教育+金融+A
58、IGC助力實現降本增效。1)AIGC賦予教育材料新活力為教育工作者提供了新的工實現金融資訊、產品介紹視頻內容的自動化生產,提升效率具,使原本抽象、平面的課本具體化、立體化。2)塑造視聽雙通道的虛擬數字人客服。ChatGPTAIGC醫療+工業+AIGC賦能診療全過程AIGC提升產業效率和價值。1)融入計算機輔助設計CAD,1)輔助診斷,可用于改善醫學圖像質量、錄入電子病歷等;極大縮短工程設計周期;支持2)康復治療,為失聲者合成生成行生設計,實現動態模擬語言音頻,為殘疾者合成肢體2)加速數字李生系統的構建,投影等。高效創建數字李生系統。數據來源:中國信息通信研究院、浙商證券研究2#page#5、通
59、信53#page#浙商證券股份有限公司算力調度:提高算力使用效率,電信運營商打造算力統一調度05平臺智能調度,提高算力使用效率算力調度平臺內蒙古算力資源/應用樞紐京津翼框紐寧夏樞紐長三角A團隊框紐甘肅感知算力應用意圖極紐算網管理算力網絡成渝框粵港澳注冊服務/路由/位置時延等紐框紐浙商證券研究所數據來源:#page#浙商證券股份有限公司算力供給:為應對不同應用場景需求,AIGC將推動智能算05力中心大發展奧飛數據奧飛數據基礎算力:當前主流通用計算X86、ARM模式數據中心服務器應用場景:電商、短視頻等數據港數據港運營商智能算力:80%以上非結構化2AI、GPU型數據處理需要多樣化算力智算中心服務
60、器應用場景:AIGC、無人駕駛等華為HUAWEI中科曙光Sugon超算算力:超級計算機供給算3浙力,算力規模極高超算中心超級計算機!應用場景:科學計算、AI聯想lenovo5資料來酒:浙商證券研究所#page#浙商證券股份有限公司算力設備:向高速率多樣化演進,AIGC有望催動國產05化替代進程服務器交換機方向:400G/800G高速率交換方向:AI、GPU型服務器代表廠商:銳捷網絡、紫光股份、代表廠商:浪潮信息、紫光股份、中興通訊等中興通訊、.中科曙光等.光模塊以太網芯片算力方向:硅光、CPO新型技術方向:25G/200G等國產芯片設備代表廠商:天孚通信、中際旭創等代表廠商:裕太微等光芯片光器
61、件方向:新型調制解調器方向:25G/50G/100G等國產光芯片代表廠商:天孚通信、光庫科技等代表廠商:源杰科技、光迅科技等56數據來源:浙商證券研究所#page#浙商證券股份有限公司算力設備:光模塊作為算力核心器件,有望明顯05受益當前階段交換機密度每兩年翻番X22X2交換機5Tbps12.8Tbps25.6Tbps51.2Tbps速率帶動光模塊代際演進222光模塊100G200G400G800G速率AI團隊浙商、7資料來源:Yole,浙商證券研究所#page#page#浙商證券股份有限公司算力設備:光模塊作為算力核心器件,有望明顯05受益光模塊封裝工藝演進:CPO有望成為主流可插拔NPOC
62、PO光電模組和ASIC芯片的距離不斷下降,應對交換機功耗提升主板SerDe光纖交換芯片光模塊主板PCB基板光纖SerDes光引擎光適配器交換芯片豐板酒ECB基板ASIC Substrate光纖SerDes光通配器交換芯片光引擎資料來源:弱電智能網、浙商證券研究所59#page#浙商證券股份有限公司3S05算力配套:散熱向芯片級液冷演進設備越來越貼近核心發熱源7房間級機柜級芯片級更加高效的冷卻介質團隊風冷液冷60資料來源證券研究#page#浙商證券股份有限公司風險提示1、AI技術發展不及預期:當前以ChatGPT為代表的NLP模型以及其他類型人工智能模型發展仍不成熟,存在一定缺陷;2、版權、倫理
63、和監管風險:AIGC生成的內容依賴現有版權素材,另外不當使用或模型自身問題可能導致不良后果3、半導體下游需求不及預期:全球芯片行業存在周期性,可能因宏觀經濟波動導致需求低迷。板塊建議關注的公司海光信息、景嘉微、龍芯中科、中國長城、安路科技、復旦微電、紫光國微、寒武紀、瀾起科技芯片算力德科立、天孚通信、中際旭創百度、海天瑞聲、商湯科技、微軟、谷歌、Meta深度學習框架深度學習大模型百度、科大訊飛、商湯科技、谷歌、微軟百度、騰訊、阿里巴巴、網易、昆侖萬維、閱文集團、捷成股份、視覺中國、風語筑、中文在線、應用三七互娛、吉比特、天娛數科底層基礎算力設施:算力調度(運營商)、算力供給(運營商、奧飛數據、
64、數據港)、算力設備通信(浪潮信息、聯想集團、紫光股份、中興通訊、銳捷網絡、天孚通信、光庫科技、中際旭創、新易盛)、算力配套(英維克、高瀾股份)#page#浙商證券股份有限公司行業評級與免責聲明行業的投資評級以報告日后的6個月內,行業指數相對于滬深300指數的漲跌幅為標準,定義如下:1、看好:行業指數相對于滬深300指數表現+10%以上;2、中性:行業指數相對于滬深300指數表現-10%+10%以上;3、看淡:行業指數相對于滬深300指數表現-10%以下。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比重。建議:投資者買入或者賣出證券的決定
65、取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者不應僅僅依靠投資評級來推斷結論Ai團P浙商62#page#浙商證券股份有限公司行業評級與免責聲明法律聲明及風險提示本報告由浙商證券股份有限公司(已具備中國證監會批復的證券投資咨詢業務資格,經營許可證編號為:Z39833000)制作。本報告中的信息均來源于我們認為可靠的已公開資料,但浙商證券股份有限公司及其關聯機構(以下統稱“本公司”)對這些信息的真實性、準確性及完整性不作任何保證,也不保證所包含的信息和建議不發生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進行更新的義務本報告僅供本公司的客戶作參考之用。本公司不會因
66、接收人收到本報告而視其為本公司的當然客戶。本報告僅反映報告作者的出具日的觀點和判斷,在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議投資者應當對本報告中的信息和意見進行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求。對依據或者使用本報告所造成的一切后果,本公司及/或其關聯人員均不承擔任何法律責任。本公司的交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。本公司沒有將此意見及建議向報告所有接收者進行更新的義務。本公司的資產管理公司、自營部門以及其他投資業務部門可能獨立做出與本報告中的
67、意見或建議不一致的投資決策。本報告版權均歸本公司所有,未經本公司事先書面授權,任何機構或個人不得以任何形式復制、發布、傳播本報告的全部或部分內容。經授權刊載,轉發本報告或者摘要的,應當注明本報告發布人和發布阜期,并提示使用本報告的風險。未經授權或未按要求刊載、轉發本報告的,應當承擔相應的法律責任。本公司將保留向其追究法律責任的權利。浙商63#page#浙商證券股份有限公司聯系方式浙商證券研究所上??偛康刂罚簵罡吣下?29號陸家嘴世紀金融廣場1號樓25層北京地址:北京市東城區朝陽門北大街8號富華大廈E座4層深圳地址:廣東省深圳市福田區廣電金融中心33層郵政編碼:200127電話:(8621)80108518傳真:(8621)80106010浙商證券研究所:http:/AI團隊浙商8#page#