《AI行業產業研究:算力系列之二算力租賃產業框架-240123(23頁).pdf》由會員分享,可在線閱讀,更多相關《AI行業產業研究:算力系列之二算力租賃產業框架-240123(23頁).pdf(23頁珍藏版)》請在三個皮匠報告上搜索。
1、中 泰 證 券 研 究 所專 業 領 先 深 度 誠 信證券研究報告2 0 24.0 1.2 3分析師:蘇儀執業證書編號:S0740520060001Email:聯系人:劉一哲Email:AI產業研究算力系列之二:算力租賃產業框架 算力租賃因何而起。算力租賃因何而起。1)全球范圍內,GPT等一系列生成式大模型推動產業界對算力需求顯著增加,但短期內高端GPU產能與交付效率有限,造成GPU供需失衡。2)在國內,國產GPU距離海外先進GPU仍有一定性能差距,且制造工藝短板使得其短期無法大量生產,因此當前國內AI產業發展仍需主要依賴海外英偉達、AMD為代表的先進GPU。但受制于美國科技禁運與封鎖,當前
2、國內產業界只能更多利用現有GPU資源,算力租賃產業因此應運而生。如何理解算力租賃產業。如何理解算力租賃產業。算力租賃是將計算能力或云計算資源以租賃的方式提供給用戶使用,這一過程中用戶可按需選擇使用資源類型和時間,且無需承擔運維、升級等工作及相應成本。算力租賃一方面使得下游客戶靈活使用算力的門檻降低,更利于眾多AI初創公司快速實現產品服務的開發與應用,另一方面也充分利用閑置的算力資源,提升算力資源的利用效率。目前,我國算力租賃的商業模式主要有三種:1)按整臺服務器進行租賃;2)按使用算力規模租賃;3)按租用GPU付費租賃。算力租賃市場的潛在發展方向:運營服務與解決方案。算力租賃市場的潛在發展方向
3、:運營服務與解決方案。目前國內已有多家公司在算力租賃領域上實現布局,且有相當部分公司已做好未來更大規模擴張的規劃。我們認為,算力租賃在短期內可較好應對當前國內算力資源稀缺的問題,但長遠來看,若要避免資源過剩與同質化服務帶來的激烈市場競爭,算力租賃產業相關從業者或需更多將精力聚焦于算力調度為代表的運營服務、以及AI運營工具與整體解決方案上。海外英偉達、Oracle等公司均已推出在算力租賃基礎之上的整體AI服務工具與解決方案,或可以為國內相關產業的發展提供較好指引。風險提示:風險提示:國際政治經濟變動的風險;AI進展不及預期帶來下游算力需求不及預期的風險;算力供給稀缺迅速緩解的風險;市場競爭加劇的
4、風險;研究報告中使用的公開資料可能存在信息滯后或更新不及時的風險。摘要摘要gZaXuZgXzWaXmWdUyWmOoMpN7NaOaQoMpPsQqMfQoOqRfQnPmQ9PmNmQvPqQoPMYpOvMCONTENTS目錄CCONTENTS專 業 領 先 深 度 誠 信專 業 領 先 深 度 誠 信中 泰 證 券 研 究 所中 泰 證 券 研 究 所1算力租賃因何而起算力租賃行業的興起邏輯算力租賃行業的興起邏輯GPT等生成式大模型等生成式大模型興起,推動算力需求興起,推動算力需求高增高增高端高端GPU需求高增,需求高增,GPU交付周期拉長、交付周期拉長、價格飛漲價格飛漲國產芯片整體性能
5、仍國產芯片整體性能仍落后,當前國內仍需落后,當前國內仍需NV為代表的高端為代表的高端GPU來搭建算力來搭建算力制裁之下國內高端制裁之下國內高端GPU嚴重短缺,現有嚴重短缺,現有算力資源租賃成為短算力資源租賃成為短期需求爆發方向期需求爆發方向全球全球中國中國AIGC產業趨勢產業趨勢GPU供需失衡供需失衡國內仍需依賴國內仍需依賴NV國內國內NV資源有限資源有限資料來源:中泰證券研究所51.1 大模型興起助推算力需求激增大模型興起助推算力需求激增 算力是人工智能大模型訓練的核心生產力,算力是人工智能大模型訓練的核心生產力,隨著隨著AI大模型的快速發展,智能算力需求正呈現爆發性增長態勢。大模型的快速發
6、展,智能算力需求正呈現爆發性增長態勢。據IDC發布的2023-2024年中國人工智能計算力發展評估報告測算,2022年我國智能算力規模達260EFLOPS(每秒百億億次浮點運算次數),預計到2027年我國智能算力規模有望突破1117EFLOPS,中國智能算力規模年復合增長率將高達33.9%。預計到2030年,人工智能驅動的全球算力將增長500倍,一個千億級智能算力藍海市場已悄然開啟。大模型爆發帶來算力需求激增,其成功背后有著萬張訓練卡的計算資源支撐。當前,熱門熱門生成式生成式大模型現階段訓練主大模型現階段訓練主要依賴以要依賴以A100/H100為代表的高性能為代表的高性能GPU算力算力,其不僅
7、能提供高效的數據的傳輸能力,還可以盡可能減少算力閑置。圖表:熱門大模型消耗卡的數量及訓練時長模型模型消耗卡的數量消耗卡的數量訓練時長訓練時長LLaMA-65B模型2048張A100 80GB計算需求21天GPT3-175B模型1024張A100 40GB34天GLM-130B模型768張A100 40GB兩個月Falcon-40B模型384張A100 40GB GPU兩個月Inflection模型3500張H100-Inflection-2模型5000張H100 GPU-Megatron-Turing(MT-NLP)模型4480張A100 GPU-GPT4-1800B模型2.5萬張A10090
8、-100天資料來源:論文LLaMA(Large Language Model Meta AI)、GLM-130B:開源的雙語預訓練模型,澎湃新聞,InfoQ,亞馬遜云科技,量子位,中國算力發展指數白皮書,中泰證券研究所6 GPT等等AI大模型的爆火帶動超算集群背后的高性能大模型的爆火帶動超算集群背后的高性能GPU需求急劇增加,供需失衡導致卡價格大幅上漲,交付周期明顯需求急劇增加,供需失衡導致卡價格大幅上漲,交付周期明顯拉長。拉長。市場需求高漲、產能有限雙重驅動導致供需失衡,高性能GPU市場供應持續緊缺,價格不斷上漲。據IDC數據顯示,英偉達A100價格2022年12月份至2023年4月上半月期
9、間,5個月價格累計漲幅即37.5%,2023年5月A100 GPU市場單價達15萬元。而A800同期累計漲幅達20%,5月A800 GPU市場單價達9.5萬元。圖表:全球AI芯片市場規模及預測(單位:億美元)資料來源:Gartner,中泰證券研究所1.1 算力需求暴增算力需求暴增加劇高性能加劇高性能GPU價格上漲,交付周期變長價格上漲,交付周期變長 龐大的需求量下龐大的需求量下,英偉達英偉達高性能高性能GPU交付交付周期被迫拉長周期被迫拉長,未來未來交付交付存在存在不確定性不確定性目前目前是整個行業普遍面臨的狀況是整個行業普遍面臨的狀況。根據Omdia的統計數據,NVIDIA在2023年Q3售
10、出了約50萬塊A100和H100計算卡,基于H100構建的服務器交付周期大概需要36周到52周不等。此外,Omdia預計2023年Q4時,A100和H100計算卡出貨量將超過50萬塊,旺盛的需求導致相關服務旺盛的需求導致相關服務器的交付周期長器的交付周期長進一步延長進一步延長。對AMD MI210型號的GPU需求驟增,目前該GPU產品的交付周期已延長至16周之久。根 據 英偉達官方說法,2024年Q1之前的GPU芯片早已全部售罄。442534671119420.81%25.66%0%5%10%15%20%25%30%020040060080010001200140020222023E2024E
11、2027E全球AI芯片市場規模及預測增速7 由于技術代際差距和使用生態習慣,由于技術代際差距和使用生態習慣,近年來我國人工智能算力芯片市場近年來我國人工智能算力芯片市場仍仍主要由主要由英偉達英偉達主導主導。據IDC數據,2022年中國AI加速卡出貨量約109萬張,英偉達以85%市占率保持著較高的競爭優勢。然而,在貿易對抗和科技禁運的背景下,包括英偉達A800/H800在內的多款高端芯片被禁止對中國供應,中國中國AI大模型算力面臨缺卡的困難,大模型算力面臨缺卡的困難,短期內短期內挑戰嚴峻。挑戰嚴峻。2023年10月,美國商務部工業和安全局(BIS)發布了一系列出口管制規則,更新了對先進計算集成電
12、路、半導體制造設備以及支持超級計算應用和最終用途的物項向包括中國在內的武器禁運國家的出口管制措施,并將中國的13家實體列入了實體清單。受美國對華高科技行業逐漸嚴苛的限制威脅,國內市場算力缺口進一步增大,存量依賴與租賃需求激增受美國對華高科技行業逐漸嚴苛的限制威脅,國內市場算力缺口進一步增大,存量依賴與租賃需求激增。英偉達英偉達卡進口受限:卡進口受限:受科技禁運影響,英偉達高性能GPU進口受到嚴格限制,國內市場供應趨緊。存量資源利用:存量資源利用:為應對供應短缺,國內企業紛紛轉向利用現有存量資源,包括優化現有設備配置、提升設備利用率等。租賃需求爆發:在成本壓力和市場需求的雙重驅動下,企業租賃需求
13、爆發:在成本壓力和市場需求的雙重驅動下,企業“由買轉租由買轉租”的趨勢愈發明顯,的趨勢愈發明顯,GPU算力算力租賃租賃需求需求迎來爆發迎來爆發式增長式增長。圖表:2023年10月美國出口管制政策及中國 GPU 芯片企業實體名單資料來源:AI前線,騰訊新聞,中泰證券研究所1.2 科技封鎖科技封鎖政策政策下中國下中國GPU市場租賃需求激增市場租賃需求激增8CONTENTS目錄CCONTENTS專 業 領 先 深 度 誠 信專 業 領 先 深 度 誠 信中 泰 證 券 研 究 所中 泰 證 券 研 究 所2何為算力租賃9 算力租賃:將計算能力或云計算資源以租賃的方式提供給用戶使用。算力租賃:將計算能
14、力或云計算資源以租賃的方式提供給用戶使用。允許用戶通過租用他人的計算設備或云服務器來滿足其計算需求,而無需自己購買和維護硬件設備。用戶只要按需付費,不用承擔硬件設備的采購、維護、升級等費用,也不用擔心設備閑置或者過時造成浪費;用戶可隨時隨地通過云端訪問所需的算力資源,快速開始訓練和應用;用戶可根據需求選擇不同算力平臺和機型,不受地域或者時間的限制模型、工具等資源,進行更多的嘗試和探索。算力租賃使得下游客戶靈活使用算力的門檻降低。算力租賃使得下游客戶靈活使用算力的門檻降低。對算力提供方:優化資源、將自身閑置的計算資源出租;對算力需求方:可以最大限度地降低使用門檻。2.1 算力租賃算力租賃及與云服
15、務器及與云服務器的區別的區別圖表:算力租賃和云服務的區別算力租賃算力租賃云服務器云服務器實質實質用戶通過租賃計算資源來滿足特定的計算需求在云平臺上提供的虛擬服務器實例服務范圍服務范圍側重于計算能力的租賃,提供的是計算資源服務云服務器提供的是一種全面的云計算服務,包括計算、存儲、網絡等資源靈活性靈活性靈活性強,可根據實際需求調整租賃時間和配置通常需要購買一定的套餐,對使用時間、配置等有固定的限制成本成本可以根據實際使用情況進行計費,有效降低成本。成本相對較高,需要支付固定的套餐費用特點特點租用計算資源的靈活性和定制化注重彈性擴展、易于管理,可根據實際需求快速地增加或減少服務器實例的數量。資料來源
16、:世外云,中泰證券研究所10 AI算力租賃的商業本質為具有大模型訓練需求的軟件研發廠商向具有算力租賃的商業本質為具有大模型訓練需求的軟件研發廠商向具有GPU資源的廠商租賃資源的廠商租賃GPU算力。算力。出租方利潤來源主要是租金收入減運營成本,其運營成本主要包括固定資產折舊,數據中心日常運營、IDC機房租金以及人員成本等。AI算力租賃市場中,租金的計量方式因租賃雙方的需求和資源狀況而異。目前市場上常見的三類租金計量方式如下目前市場上常見的三類租金計量方式如下(三類計量方式間可相互換算)按整臺服務器租賃按整臺服務器租賃:以每臺服務器(含8張GPU)為單位進行計量,租金按照每臺每月的標準收取,適用于
17、需要長期穩定使用大量GPU資源的客戶;提供最新Nvidia GPU卡的同時具備低服務器運維成本。按算力規模租賃:按算力規模租賃:租金按每P每年計量,可以根據算力需求選擇合適的算力規模,實現更加靈活的資源配置;按單張按單張GPU租賃:租賃:租金按照每GPU每小時計量,適用于短期或臨時性的算力需求,可以根據實際需求隨時調整卡的租賃數量。圖表:百度智能云高性能H5系列 GPU-H5-8NA100-IB01租賃價格資料來源:百度智能云,中泰證券研究所2.2 算力租賃的三種商業模式算力租賃的三種商業模式11 在AIGC時代的大潮中,中國企業亦須緊跟AIGC時代潮流,積極尋求提升自身AI能力的途徑,而這對
18、應較大的算力水平需求。在當前市場環境下,適用于AI計算的高性能GPU供不應求,許多AI公司無法購買到足夠的計算卡來搭建自己的算力集群,而算力租賃可以高性價比緩解當下算力短缺的困局。算力租賃是當前中小企業解決算力需求的最優解之一。算力租賃是當前中小企業解決算力需求的最優解之一。目前,除了少數大型互聯網企業自身資金實力充沛,可購買較多的GPU,算力儲備較充足之外,剩下中小企業普遍面臨算力緊缺,算力租賃需求突出。對于規模較小的公司,購買GPU搭建算力集群的投入成本過高,租賃外部算力相對自建算力更合算、靈活。自建集群規模固定、可擴展性較弱、可靠性較差,中小企業的算力需求往往難以通過自建算力設施解決,而
19、算力租賃可有效降低除硬件成本外的維護、升級等長期投入,使其直接享受高性能算力的便利,以快速響應市場變化,把握發展機遇。2.3 算力租賃的重要性算力租賃的重要性有望挖掘存量資源潛力,以高性價比緩解當下算力短缺困局有望挖掘存量資源潛力,以高性價比緩解當下算力短缺困局圖表:算力自建與租賃成本對比成本成本自建算力以175B參數,300B tokens訓練集大小作為參照;以DGX A100(5petaFLOPS),45%的訓練有效性;訓練30天作為中型企業的訓練標準,需要55臺A100,每臺15萬美元,共825萬美元(近6000萬人民幣),此外還有機房建設、運維、減值等費用。算力租賃4.52430855
20、=142.56萬美元(近1000萬人民幣),沒有其他費用,且中小型企業一次訓練+更新后一般不用再訓練,只有推理需求,且明后年降本50%以上(有降價趨勢)。對于租賃運營商而言,有測算單臺A100服務器生命周期內IRR為35%(需驗證)。資料來源:觀研天下,中泰證券研究所12CONTENTS目錄CCONTENTS專 業 領 先 深 度 誠 信專 業 領 先 深 度 誠 信中 泰 證 券 研 究 所中 泰 證 券 研 究 所3算力租賃未來發展探討13 算力租賃市場現有商業模式:基于硬件資源的按需租賃和按量付費模式。算力租賃市場現有商業模式:基于硬件資源的按需租賃和按量付費模式。面對激烈算力租賃競爭,
21、多元算力融合成為關鍵,算力市場將更加重視輔助運營服務,從提供硬件資源逐步轉變為提供算力服務。我們認為,未來,國內算力租賃市場或有望我們認為,未來,國內算力租賃市場或有望向向提供更高附加值的提供更高附加值的運營服務方向轉型運營服務方向轉型。算力調度:算力調度:通過智能分配策略實現算力的靈活流動,進一步解決算力需求與資源分布不均的矛盾,快速滿足上層應用多樣化的算力需求,助推數字經濟進入普惠共享的新階段。提供整體提供整體AI解決方案:以解決方案:以GPU云為例,其除了提供算力外,還包括了如AI軟件開發相關的增值服務,是未來算力租賃的進階方向,增值潛力高。算力租賃市場的未來算力租賃市場的未來或或向提供
22、更高附加值的運營服務方向轉型向提供更高附加值的運營服務方向轉型圖表:算力市場向多元化服務發展資料來源:華為官網,中泰證券研究所14 算力調度是算力調度是根據算力資源提供方的供給能力和應用需求方的動態資源需求,整合區域內算力基礎設施底層的計算、存儲、網絡等多維資源,基于算力調度平臺對算力資源進行一致性管理、一體化編排和統一調度,可以整合多張算力卡來應對外圍禁售、優化算力資源配置,是解決算力供需矛盾、算力網絡傳輸問題、算力資源普惠問題的新型能力體系?!耙跃W強算”是發展算力網絡的根本路徑?!耙跃W強算”是發展算力網絡的根本路徑。算力網絡可以實現云、邊、端算力的高效調度,吸納全社會算力資源,組成泛在、立
23、體的算力網絡,實現智能調度和全局優化。全國一體化算力算網調度平臺綜合集成網絡情況全國一體化算力算網調度平臺綜合集成網絡情況+綜合算力綜合算力+算力調度“三位一體”推動我國算力算網調度發展。算力調度“三位一體”推動我國算力算網調度發展。平臺匯聚通用算力、智能算力、高性能算力、邊緣算力等多元算力資源,針對通用、智算、超算等不同客戶需求,設計異構資源池調度引擎,實現不同廠商的異構資源池的算力動態感知與作業智能分發調度。在AI訓練作業調度流程中,作業可在智算資源池上進行訓練推理,在通用算力資源池部署,從而實現跨資源池/跨架構/跨廠商的異構算力資源調度。圖表:算網調度的兩種路徑資料來源:中興官網,中泰證
24、券研究所圖表:算力調度涉及到的關鍵環節資料來源:論文算力調度關鍵問題和實施路徑研究,中泰證券研究所3.1 全國一體化算力網,算力調度運營進程加速全國一體化算力網,算力調度運營進程加速15 整體整體AI解決方案重視解決方案重視全??蛻趔w驗:全??蛻趔w驗:從設備到算力,基于客戶全場景需求,圍繞算力咨詢、建設和運營等全周期,提供端到端全棧專業服務,全程護航算力集群建設、人工智能創新、產業聚合發展。AI解決方案的四個關鍵功能:解決方案的四個關鍵功能:自動化流程:通過收集和解釋輸入其中的大量數據,可以利用人工智能解決方案來確定流程中的下一步并無縫執行。數據分析與解釋:創建結構化和非結構化數據的知識庫、分
25、析和解釋數據,根據其發現做出預測和建議。用戶個性化和參與度:使企業能夠為客戶提供個性化的服務,并實時預測和解決擔憂。業務效能:支持新服務和功能。圖表:NVIDIAAI 解決方案資料來源:NVIDIA官網,中泰證券研究所3.2 整體整體AI解決方案激發極致算力解決方案激發極致算力圖表:NVIDIAAI 平臺在計算、軟件和AI 模型方面進行全棧創新資料來源:NVIDIA官網,中泰證券研究所16圖表:NVIDIA DGX Cloud-AI 軟件堆棧資料來源:NVIDIA官網,中泰證券研究所3.2.1 英偉達英偉達DGX Cloud通過瀏覽器就能即時接入通過瀏覽器就能即時接入AI超級計算機超級計算機
26、DGX Cloud:集成一流軟件的:集成一流軟件的AI超級計算服務。超級計算服務??芍苯釉L問 NVIDIAAI 專家,近乎無限地訪問高性能計算,為開發人員提供行業領先的利用效率、規模和高效工作能力,使企業能夠立即訪問為生成AI和其他突破性應用程序訓練高級模型所需的基礎設施和軟件。DGX Cloud實例價格為每實例每月36999美元起。DGX Cloud租賃服務提供訪問租賃服務提供訪問NVIDIA云計算機的機會,云計算機的機會,硬件出類拔萃,性能卓越,硬件出類拔萃,性能卓越,其每臺計算機都配備了強大的H100或A100 GPU以及高達640GB的GPU內存,為企業進行深度學習、機器學習等計算密集
27、型任務、運行復雜的人工智能應用程序提供了強大的支持;提供企業按月租用的專用基礎設施,確??梢钥焖匍_發大型多節點訓練工作負載。商業模式:將商業模式:將DGX Cloud 托管在各家云服務商的云平臺上提供服務,托管在各家云服務商的云平臺上提供服務,即NVIDIA 將基礎硬件設施出售給云廠商,再向其購買云計算資源,最后把云服務出售給企業客戶并自留全部收入。圖表:DGX Cloud 與 IaaS成本對比資料來源:NVIDIA官網,中泰證券研究所17 Azure AI:使用 Azure AI 組合構建企業規模的智能應用,為計算密集型 AI 工作負載(包括深度學習)提供高性能性能,加速AI創新。Azure
28、 的領先云 AI 超級計算基礎結構和端到端機器學習功能提供了構建、訓練和部署苛刻的 AI 工作負載所需的最佳性能、可伸縮性和內置安全性。從訓練復雜的 AI 模型到深度學習和推理,Azure提供以Microsoft負責任的AI原則為支撐的解決方案,確保工具鏈的一致性。Azure 虛擬機:虛擬機:用于靈活地虛擬化各種計算解決方案,支持 Linux、Windows Server、SQL Server、IBM 和 SAP 等。收費方式:即用即付,以秒為單位為計算容量付款,無需長期承諾或提前付款??砂葱柙黾踊驕p少使用量。Azure ND H100 v5 虛擬機(虛擬機(VM)系列:)系列:Azure功能
29、和規模最大的 AI 虛擬機系列,用于應對先進的 AI工作負載帶來的日益增加的復雜性,為最復雜的生成式 AI 模型獲取超計算性能。優勢如下:AI 超級計算 GPU:配備8個 NVIDIA H100 Tensor Core GPU,使 AI 模型顯著提速,提供無與倫比的計算能力;新一代計算機處理單元(CPU):第四代 Intel Xeon Scalable 處理器確保虛擬機達到最佳的處理速度;低延遲網絡:采用 NVIDIA Quantum-2 ConnectX-7 InfiniBand,每個 GPU 擁有 400Gb/s跨節點帶寬;優化主機到 GPU 的性能:通過 PCIe Gen5 提供每個 G
30、PU 64GB/s 的帶寬;大規模的內存和內存帶寬:DDR5 內存是該系列虛擬機的核心,提供更高的數據的傳輸速度和效率。3.2.2 微軟微軟AzureAI弄潮兒弄潮兒全面布局整體全面布局整體AI解決方案解決方案圖表:Azure GPU 優化虛擬機大小虛擬機型號虛擬機型號用途用途配置配置NC T4_v3 系列針對計算密集型 GPU 加速的應用程序進行優化NVIDIA Tesla T4 GPUNCv3 系列NCv3 系列:NVIDIA Tesla V100 GPUNC 100 v4 系列側重于中型 AI 訓練和批量推理工作負載使用 NC A100 v4 系列ND A100 v4 系列側重于縱向擴展
31、和橫向擴展深度學習訓練以及加速的 HPC 應用程序8 個 NVIDIA A100 TensorCore GPUNDm A100 v4 系列為高端深度學習訓練以及緊密耦合的縱向擴展和橫向擴展 HPC 工作負載而設計一個虛擬機(VM)、八個 NVIDIA Ampere A100 80GB Tensor Core GPU資料來源:微軟官網,中泰證券研究所18 Oracle Cloud Infrastructure(OCI)提供了經濟高效的高性能計算能力,基于OCI上的高性能計算(HPC)的性能堪比本地部署解決方案,并且具備云技術的彈性和基于用量的經濟性。OCI Supercluster高性能解決方案
32、:訓練生成式高性能解決方案:訓練生成式 AI 的理想選擇的理想選擇能夠部署數萬個能夠部署數萬個 NVIDIA H100 和和 A100 GPU。每個 OCI Compute 裸金屬實例都使用 OCI 的超低延遲集群網絡進行連接,在單個集群中可以擴展到數千個 NVIDIA H100 或 A100 GPU。面向生成式面向生成式 AI 具備出色的可擴展性。具備出色的可擴展性。每個集群可部署多達數千個 GPU,實現更高的可擴展性。超低延遲和超高帶寬。超低延遲和超高帶寬。通過簡單的以太網網絡架構提供大規模的超高性能,可有效縮短 AI 模型訓練用時。3.2.3 Oracle Cloud跨云提供全面云技術服
33、務跨云提供全面云技術服務圖表:Oracle Cloud基于NVIDIA GPU實例使用場景資料來源:Oracle官網,中泰證券研究所圖表:OCI大規模橫向擴展AI 訓練、數據分析和 HPC價目表ShapeGPUsNetworkGPU Price Per Hour*BM.GPU.H100.88x NVIDIA H100 80GB Tensor Core8x2x200 Gb/sec¥68.22BM.GPU.A100-v2.88x NVIDIA A100 80GB Tensor Core8x2x100 Gb/sec RDMA*¥27.288BM.GPU4.88x NVIDIA A100 40GB T
34、ensor Core8x2x100 Gb/sec RDMA*¥20.8071資料來源:Oracle官網,中泰證券研究所19 GPU加速的加速的Google Cloud服務:服務:加速計算和可視化的快速、功能強大的云。與NVIDIA 強強聯手,使用 NVIDIA GPU 加速深度學習、分析、科學仿真及其他高性能計算(HPC)工作負載,結合使用 NVIDIA RTX 虛擬工作站和 Google Cloud,隨時隨地加速渲染、仿真和圖形密集型工作負載。GPU算力供應充足,具有全球覆蓋的高端GPU現貨以及價格競爭力。能提供多款高端GPU,如A100、L4等,可為用戶節省高達50%以上的成本。Googl
35、e Cloud TPU助力高效助力高效AI訓練與推理。訓練與推理。Cloud TPU v5e:谷歌最新一代TPU產品,可實現經濟高效的 AI 模型訓練與推理。Google Cloud TPU Multislice Training全棧訓練產品:支持TPU v4和v5e,使客戶能夠充分利用谷歌高性價比、多功能且可擴展的Cloud TPU資源,實現大規模、高效的機器學習模型訓練。3.2.4 Google CloudGPU加速云平臺的領先提供商加速云平臺的領先提供商圖表:Google Cloud TPU訓練棧資料來源:Google Cloud官網,中泰證券研究所圖表:谷歌云所支持的英偉達GPU類型G
36、PU模型模型內存內存用途用途A100 80GB80 GB HBM2e 1.9TB/s機器學習訓練、推理、HPC、BERT、DLRM的大量數據表的大型模型A100 40GB40 GB HBM2 1.6TB/s機器學習訓練、推理、HPCL4預覽版24 GB GDDR6 300 GB/s機器學習推斷、訓練、遠程可視化工作站、視頻轉碼、HPCT416 GB GDDR6 320 GB/s機器學習推理、訓練、遠程可視化工作站、視頻轉碼V10024 GB GDDR6 300 GB/s機器學習訓練、推理、HPCP10016 GB HBM2 732 GB/s機器學習推理、HPC、遠程可視化工作站資料來源:數據猿
37、公眾號,中泰證券研究所20CONTENTS目錄CCONTENTS專 業 領 先 深 度 誠 信專 業 領 先 深 度 誠 信中 泰 證 券 研 究 所中 泰 證 券 研 究 所4投資建議與風險提示21 算力租賃作為當前新興的產業領域,其誕生與發展體現出一定的時代特征。目前,我國算力市場體現出需求較高、但算力租賃作為當前新興的產業領域,其誕生與發展體現出一定的時代特征。目前,我國算力市場體現出需求較高、但供給方資源利用率較低的特點,在當前國際政治經濟與科技發展形勢下,通過算力租賃的方式充分利用現有算力資源,供給方資源利用率較低的特點,在當前國際政治經濟與科技發展形勢下,通過算力租賃的方式充分利用
38、現有算力資源,最大限度促進最大限度促進AI、大數據產業發展,是當前較優的發展選擇。、大數據產業發展,是當前較優的發展選擇。長期來看,考慮到遠期算力資源緊缺或將得到緩解,我們建議投資人更多關注算力租賃產業從單純的資源租賃向運營服務方向的發展。投資建議投資建議22 國際政治經濟變動的風險。國際政治經濟變動的風險。AI進展不及預期帶來下游算力需求不及預期的風險。進展不及預期帶來下游算力需求不及預期的風險。算力供給稀缺迅速緩解的風險。算力供給稀缺迅速緩解的風險。市場競爭加劇的風險。市場競爭加劇的風險。研究報告中使用的公開資料可能存在信息滯后或更新不及時的風險。研究報告中使用的公開資料可能存在信息滯后或
39、更新不及時的風險。風險提示風險提示23重要聲明重要聲明 中泰證券股份有限公司(以下簡稱“本公司”)具有中國證券監督管理委員會許可的證券投資咨詢業務資格。中泰證券股份有限公司(以下簡稱“本公司”)具有中國證券監督管理委員會許可的證券投資咨詢業務資格。本公司不會因接收人收到本報告而視其為客戶。本公司不會因接收人收到本報告而視其為客戶。本報告基于本公司及其研究人員認為可信的公開資料或實地調研資料,反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響。本公司力求但不保證這些信息的準確性和完整性,且本報告中的資料、意見、預測均反映報告初次公開發布時的判斷,可能會隨時調整。本公司對本
40、報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告所載的資料、工具、意見、信息及推測只提供給客戶作參考之用,不構成任何投資、法律、會計或稅務的最終操作建議,本公司不就報告中的內容對最終操作建議做出任何擔保。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。市場有風險,投資需謹慎。在任何情況下,本公司不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者應注意,在法律允許的情況下,本公司及其本公司的關聯機構可能會持有報告中涉及的公司所發行的證券并進行交易,并可能為這些公司正在提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。本公司及其本公司的關聯機構或個人可能在本報告公開發布之前已經使用或了解其中的信息。本報告版權歸“中泰證券股份有限公司”所有。事先未經本公司書面授權,任何機構和個人,不得對本報告進行任何形式的翻版、發布、復制、轉載、刊登、篡改,且不得對本報告進行有悖原意的刪節或修改。