《量子位:2023 AIGC算力全景與趨勢報告(41頁).pdf》由會員分享,可在線閱讀,更多相關《量子位:2023 AIGC算力全景與趨勢報告(41頁).pdf(41頁珍藏版)》請在三個皮匠報告上搜索。
1、Q童子位InsightsAIGC算力全景與趨勢報告分析師:丁喬量子位智庫QbitAlInsights#page#nsights2023年無疑是AIGC元年,ChatGPT引發的各類大模型競賽中,行業內繞不開的一個話題便是算序言力從何而來。算力目前已經在AIGC產業內形成新共識一算力成為AIGC發展的關鍵基石。隨著英偉達今年一系列不斷推陳出新的產品動作,可以看到國際上最先進的算力廠商如今已邁向由超級芯片組成的算力集群階段。此外,算力廠商也無疑成為AIGC產業下的率先受益方。然而,隨著大模型參數的不斷增長,OpenAl近期表明算力成為其發展的挑戰之一。在AIGC產業繁榮的當下,可以預見的是未來對算
2、力的需求會越來越大。那么,在這場AIGC盛宴中,應該如何應對當下面臨的算力危機呢?在AIGC算力全景與超勢報告中,量子位智庫將從我國算力產業現狀、算力產業變革、超勢預判等角度出發,通過廣泛調研與深度分析,全面立體描繪我國當前AIGC算力產業全景與趨勢。我們期待,能夠與眾多投入、關注、期待中國AIGC算力產業的伙伴一起,共同見證并打造中國AIGC算力產業的蓬勃未來。#page#page#oghtsAIGC驅動,算力產業機遇空前01insights#page#AIGC潮起,算力產業挑戰巨大,機遇空前insightsOpenAI發布ChatGPT屬于GPT系列中的聊天機器人模型。GPT系列中,GPT
3、3是由1750億參數組成的語言模型,而GPT4的參數更是達萬億級別。國內目前公布的大模型參數規模也普遍在百億至千億級別。如此龐大的參數規模,對于芯片提供商、云服務廠商以及服務器廠商都產生了新需求。全球范圍內,GPT具備從底層改變各行業規則的能力,作為AIGC產業的基建,算力產業在未來有望成為一項公共服務滲透入各行各業?;诖?,智算中心作為公共算力基礎設施,成為AIGC基建中的關鍵環節。大模型參數量變化游戲規則被改寫,MaaS能力成為競爭的關鍵變量云計算廠商在算力需求暴漲、數據和模型資源稀缺、AI技術廣泛智算中心落地背景下,智算中心成為地區AI新基建大模型訓練驅動AI服務器需求暴漲,并且正在催生
4、新服務器廠商物種:AI模型一體機GPU為核心的AI訓練芯片供不應求,是AIGC算力產業芯片最大挑戰和最大機遇ionisBeautiful來源:Inforn#page#芯片:大模型訓練需求暴漲,GPU供不應求nsights需求當前大模型參數量在百億至千億參數規模,在訓練階段,對芯片的需求從CPU+加速器轉變為以GPU主導的大規模并行計算。未來,當多數大模型參數規模到達萬億級別,將產生更大的算力需求。在單芯片性能之上,智算中心能夠通過算力的生產-調度-聚合-釋放,支持AI產業化發展。缺口目前市場對于英偉達芯片的需求遠大于供給。經測算,一萬枚英偉達A100芯片是做好AI大模型的算力門檻。國內具備此量
5、級的公司最多只有1家,而GPU芯片持有量超過一萬枚的企業不超過5家。算力需求微調階段推理階段(日常運營)訓練階段(單次成本)單次GPT-3Small(1.25億)計算量2.6PFlops/天預計算力ChatGPT2023年2月官網總訪問量11億次;1350.4PFlops/天單次GPT-3XL計算量為27.5PFlops/天用戶每次與ChatGPT互動的云計算成本成為約0.01美元;單次GPT-3(175B)計算量3640PFLops/天保守預估,假設用戶每次訪問網站只進行一次互動芯片需求芯片需求芯片需求GPT3(175B)3640PFLops:35000塊A100/113000塊A100/1
6、天或433塊A100跑1個月采用A100或V100設備天或1024塊A100跑1個月成本成本成本成本:920萬月單次訓練成本:1200萬美元運營的算力成本:1100萬美元/月來源:阿里公開資料,量子位智庫整理#page#nsights服務器:業務增長顯著,高端芯片AI服務器火爆?,F狀AIGC產業的發展將加劇AI服務器行業的增長速度,國產服務器廠商普遍業務增量在30%以上;國內市場中,服務器重新進入洗牌期。需求超勢由于AIGC對于高性能計算的需求,云廠商在服務器的選擇上以AI服務器為主。據IDC數據,2025年全球AI服務器市場規模將達317.9億美元,年復合增長率為19%。英偉達GPU短期內面
7、臨產能不足問題,或將一定程度上限制AI服務器生產,從而影響出貨量。2022年中國服務器市場份額占比2021-2025中國AI服務器市場規模預測800017.009680928.10%50965006.10%400AS4.90%405.109620017.2095.30%1006.20%10.100202120258市場規模(億元)中興通訊戴爾聯想動海變數據來源:IDC,量子位智庫整理#page#page#智算中心:基建級AI算力供應,打造地區經濟增長新引擎nsights智能計算中心創新發展指南指出,在智算中心實現80%應用水平的情況下,城市/地區對智算中心的投資可帶動人工智能核心產業增長約2.
8、9-3.4倍,帶動相關產業增長約36-42倍;未來80%的場景都將基于人工智能,所占據的算力資源主要由智算中心提供,智算中心將成為經濟增長的新動力引擎。企業方公共基建中國智能算力發展情況及預測全國超30座城市落地智算中心:阿里云張北超級智算中心、烏蘭察布智算中心百億億次浮點運算/秒(EFLOPS)北京、天津、河北、南京、無錫、寧波、商湯科技人工智能計算中心杭州、武漢、沈陽、成都、哈爾濱、許昌、1500百度智能云-昆侖芯(鹽城)智算中心1271.4廣州、宿州、烏鎮、昆山、甘肅、長沙百度智能云(濟南)智算中心922.8騰訊長三角(上海)人工智能先進計算中心1000640.7騰訊智慧產業長三角(合肥
9、)智算中心曙光5A級智算中心427500268克拉瑪依浪潮智算中心155.25317中國電信京津冀大數據智能算力中心0中國聯通廣東AI智算中心9Z0Z SZOZ tzOz EZOZ ZZOZ TZOZ OZOZ6TOZinsights來源:國家信息中心智能計算中心創新發展指南IDC,量子位智庫整#page#ssghtsAIGC算力產業全景02insightsinsights#page#sigsAIGC算力現狀鏈路:芯片一服務器一云平臺一模型應用以微軟為例芯片資源外部:Azure云服務為ChatGPT構建了超過1萬枚英偉達A100GPU芯片的AI計算集群內部:微軟正在自研AI芯片一一雅典娜(At
10、hena),將由臺積電代工,采用5nm制程首個目標:為OpenAI提供算力引擎,以替代英偉達A100/H100云基礎設施平臺Azure微軟是OpenAI唯一云服務提供商,為GPT訓練提供計算資源、存儲資源、自動化部署和管理等支持Microsoft模型即應用(MaaS)1)AzureOpenAI服務:企業級解決方案:借助AzureOpenAl,用戶可以匯總文本、獲取代碼建議、為網站生成圖像等2)Microsoft 365Copilot使用了GPT-4作為其核心的LLM,將用戶的自然語言輸入轉化為高效的生產力工具,集成在Word、Excel、PowerPoint、Outlook、Teams等多個應
11、用中insiights#page#芯片層現狀:AIGC算力2大路線,GPU通用路線和AISC專用路線insightsAI芯片目前有兩大路線,一種是英偉達代表的GPU路線,更適合當前AIGC產業對大算力的需求,與AIGC大模型的訓練及推理適配度極高。另一種路線則是以國內華為(主力產品)、寒武紀廠商為代表的專用AI芯片路線,此路線下的芯片更適用于垂類小模型,為其提供能效比更高的芯片。此外互聯網云廠商的自研芯片也是專用路線,芯片主要服務于自家產品,為自身產品打造性能更優的算力底座。專用芯片路線(Application-specificintegrated通用芯片路線(Graphicsprocessi
12、ngunit)circuit)用來執行專門/定制化任務能夠完成多樣化算力任務優勢局限優勢局限擅長大規模并行在廠商被迫重復造專用場景中能夠做,研發周期長、計算輪子的前提下,追到更優的能效比商業風險較大,趕上英偉達的難度極兼容英偉達生態,跳出當前的已有生產品易受市場高是最快也是最適態,長期來看有可變化影響用于當下的解決,芯片總體功耗高能實現真正超越不易擴展,難方案以滿足后續增加功能的需求#page#服務器層現狀:AI服務器成主要增長點,采購占比互聯網客戶為主insights服務器作為算力的載體,是AIGC基礎設施的核心硬件。由于AIGC對于高性能計算的需求,云廠商在服務器的選擇上以A服務器為主。據
13、IDC數據,2025年全球AI服務器市場規模將達317.9億美元,年復合增長率為19%。AIGC產業的發展將加劇AI服務器行業的增長速度,國產服務器廠商普遍業務增量在30%以上;TrendForce日前發布預測,指出隨著AI服務器與AI芯片需求同步看漲,預計2023年A服務器(包含搭載GPU、FPGA、ASIC等主芯片)出貨量將接近120萬臺,年塔38.4%,并將2022-2026年AI服務器出貨量年復合增長率上調至22%。2022年,國內互聯網大廠成為AI服務器的最大買家;2023年,隨著AIGC的爆發,根據業內消息,互聯網廠商依舊是AI服務器的最大買方。2023AI服務器出貨量預測2022
14、年AI服務器采購量占比15.51519%14.522.70915091413961.508617%613.52913145168612.512字節跳動口騰訊ZZ0Z2023TFS#page#云計算現狀:MaaS重塑服務模式,新老玩家重構競爭力nsights大模型成為MaaS的基座,MaaS所打造的商業模式也是大模型廠商的主要變現模式一一基于大模型產生有實際應用價值的產品。MaaS模式最早由阿里提出,隨后互聯網大廠、人工智能企業(如商湯)均已引入MaaS模式。此外,互聯網大廠、華為等企業已經將自研芯片用于MaaS底座構建中。云廠商是MaaS的提出者,也是主要參與方。MaaS模式基于大模型,能夠最
15、大限度消除大型企業數字化過程中規?;?、標準化壁壘,降低企業部署難度;對于C端用戶來講,MaaS可在不同層級里產生價值,有望為云計算廠商帶來新增長曲線。云計算廠商承擔訓練和微調成本,提供MaaS服務大模型訓練和通過MaaS賦能MaaS服務提供商分時微調成本高,垂直領域模型52AI滲透率較低分次計費,按照用戶的下游用戶開發的行業需求量核算投入產出難度高API或模型壓縮行業模型L1行業數據基礎大模型LOinsightsAtsnsig#page#智算中心現狀:地域發展差異明顯,東數西算成算力調度關鍵nsights智算中心是對原有數據中心的升級,其提供的首要是AI算力。具體來講,智算中心提供包括算力、框
16、架、模型,以及支持應用場景具體的基礎設施,將不同層級進行打包,通過本地化部署完成智算中心建設。相比于數據中心,智算中心更貼近應用和產業方東數西算整體規劃從計算設備分布來看從供給角度來看北京、廣東、浙江、上海、江蘇在服目前智算中心多分布在東部和中部內蒙古框紐京津翼框紐務器和A服務器市場中居前五,市場省份,而AIGC業務需要處理海量數和林格爾集群張家口集群份額總計分別達到75%和90%據導致東部算力資源成本過高。將寧夏框紐(2021年數據)。大模型訓練等對計算要求高的任務中衛集群蕪湖集群移至西部地區,形成“東數西訓”,長三角框紐從需求角度看能夠有效降低成本,實現算網資源長三角綜合成本最優。生態綠甘
17、肅框紐色一體AIGC算力需求主要來源為京津翼具體來講,針對算力需求供需不平慶陽集群化發展地區、長三角及大灣區。衡等問題,需要通過算力調度將東示范區粵港澳框紐集群天府集群部的算力和數據處理需求轉移至成成渝松紐韶關集群本較低的西部地區。其中,優化東重慶集群西部之間互聯網絡和框紐節點間直貴州樞紐連網絡是提升算力調度水平的關鍵。貴安集群#page#AIGC算力產業全景圖insightsMaaS層騰訊云上火山引華阿里云華為云超20京東云O百度智能云從容8M通義千問混元盤古日日新火山方舟言屎云計算平臺阿里云百度智能云S騰訊云山火山引家華為云線C天翼云收菜興購C5首云UCLOUD優刻得紫光云?金山云HUAy
18、UN華云出服務器廠商E.8inspur浪洲號H3CZTE中興SugonNettrix寧暢SHUAWEILenovo聯想計算類芯片存儲類芯片通用芯片專用芯片DRAMEEPROMNANDNor FlashCPUASICQ54cxmtNetoc朗科RHYGONSe HUAWEIphytium飛Se HUAWEI阿里巴巴Puya龍芯中科美兆芯修阿里巴巴華容5FPGAQGPU剪級服黃尚菜菜吧羽絨口光用路BHYGON3MOOGOIN意云ALOCIC3D NANDposilicon店ANnARDSAAZURDosiliconM長江存銷5種X活天下8城#page#ssghtsAIGC算力產業五新超勢03ins
19、ightsinsights#page#背景:算力供給超于復雜,大規模運算需要系統級工程支撐nsights芯片在AIGC算力產業中是最底層也是最關鍵的硬件產品。AIGC爆發,既是芯片廠商的一個重要分水嶺,也將芯片廠商的目標重新聚焦于大算力方向。芯片作為算力直接來源,其發展邏輯是從應用端的需求出發,根據應用端所需要的算力特點提供相應的算力服務。在ChatGPT相關大模型爆發之前,國內芯片廠商一方面在做GPU布局,另一方面更多在滿足垂直行業中的特定需求,且后者在國內市場更常見。此外,國產GPU廠商的設計初表也多是按照推理芯片設計。在AIGC爆發后,對芯片的需求集中在訓練側,并且對于訓練芯片的算力要求
20、極高,目前只有英偉達能夠滿足。然而,OpenAl表示目前英偉達的產能已無法滿足其更高的算力需求。未來,隨著大模型參數量不斷攀升,以及芯片制程走到盡頭等問題,對于算力的定義將從單芯片性能逐漸轉向超算/智算集群的計算能力。國產處理器廠商的挑戰與機遇挑戰機遇硬件市場將給予國產GPU廠商更多機會。目前在高端AI芯片中,英偉達占據絕對優勢,而英偉達的高端國產GPU廠商可選擇成熟制程+先進封裝的方案來達到與英偉系列在中國只有存量沒有增量。達近似的性能指標。在服務器集群層面,通過高速互聯技術實,在芯片代工層面,目前優于7nm制程工藝沒有對應的國產代現高性能計算。工廠可以承接。目前國產芯片廠商采用兩種路徑:軟
21、件1)兼容CUDA生態;2)構建自身生態業內普遍認為國產芯片在10年內很難突破英偉達的CUDA生態。短期來看,兼容CUDA生態的廠商更適合為通用大模型提供算力對于構建自身生態的廠商來說,其產品更適用于垂類小模型。#page#超勢01新機遇:芯片競逐高性能大算力,引入新計算架構fnsights大模型不同階段對應不同的芯片需求需求方變化大模型訓練階段大模型推理階段芯片類型:GPU為主芯片類型:ASIC/FPGA/NPU與GPU均可對芯片模型需,芯片需求:執行大量矩陣運算和計算芯片需求:低延退、低功耗(專用芯片回歸到要大算密集任務更符合)最原始力支持GPU優勢:高并發和浮點計算能力,專用芯片優勢:更
22、高的能源效率和計算的需求密度可大幅提升訓練速度GPU劣勢:功耗高、成本高專用芯片劣勢:缺乏通用性供給方變化技術超勢億鑄科技、后摩智能、存算一體架構通過減少/消除數據路運,降低功耗AI芯片廠知存科技等硬件層面海光信息、燒原科技GPU+片間互聯實現大規膜并行計算中突破芯片算力性能AI芯片廠商稀疏計算通過減少計算量,降低成本星芯人工智能軟件/算法層面高性能網RDMA互聯騰訊云星脈網絡高帶寬接入,提升通信性,縮短訓練時長#page#page#超勢03新游戲規則:MaaS重塑云服務范式,AIGC商業模式閉環insightsMaas(模型即服務):在算力、算法和應用層中嵌入大模型,以智能底座集成應用并統一
23、對外輸出。MaaS的本質是將行業內通用的基礎技術提煉整合成服務,滿足各類應用場景需求;云計算服務能力的判別式從算力水平轉向云智一體能力,在算力基礎設施之外,核心競爭力變為把算力、模型和場景應用打造成標準化產品的能力。insic商業化路徑AI開發者AI研究者AI使用者AI愛好者多樣化應用開發,更多面向C端市場C端市場商業模式:軟件訂閱付費使用接口,直接調用基模型定制模型體驗模型使用云端模型部署礎模型,基于不通過行業的B端市場數據進行fine-tune,形成垂直大模型,更多面向B端市場盈利模式:按需計費,根據實際計算量收費算力平臺數據倉庫模型倉庫大模型基礎能力#page#超勢04一新物種:AI模型
24、一體機呼之欲出,傳統產業開箱即用hsighs傳統行業構建AIGC產品的痛點云服務廠商在硬件和軟件層面完成系內外部數據流通中難數據以確權確保算法模型部統級工程、調試測試環節,最后在用署到服務器上并戶側可以直接使用的AI模型一體機。能高效運行對于數據安全性敏感的行業,通過A模型構建自身模型難度大AI模型一體機用戶開箱即用模型一體機,完成模型+服務器的一體化部署,能夠保證數據的安全。算力算力資源緊缺百度智能云飛獎一體機-產品架構主要參與方安全能力飛獎深度學習平臺硬件類(服務器)云廠商互聯網云廠商模型加密統信售華開解中科方德CentosLoongni優勢優勢國內外主流操作系統硬件部署能力,如何讓模型在
25、具備通用大模型能力代碼加固昆侖寒武紀英特爾申威英偉達飛膜國內外主流國內外主流服務器上運行效率達到最高分勢AI加速芯片CPU芯片比特大陸海光海光龍芯場兆芯劣勢硬件能力可售授權飛騰通用版飛腳版通用版軟件算法能力以及大模型研發能力主機防護2U機型40機型#page#超勢05-新基建:智算中心護航AIGC運營,算力租賃模式成新解nsights算力租賃模式可以有效降低大模型研發門檻,對于研發垂類行業的小模型企業來說,沒有購買足夠AI服務器的實力,公共算力基礎平臺將幫助中小型企業搭建其自身所需模型。企業無需購買服務器,通過瀏覽器便可訪問算力中心,并使用算力服務。對于中小企業來講,無需依賴云廠商所構建的大模
26、型底座進行二次開發,而是通過租用公有算力平臺的算力資源,研發垂類行業小模型。國外:以英偉達為代表的超級計算機,目前已建成5座A工廠大模型訓練推理過程消耗算力平臺向B端用戶中小企業有模型研發需求,國內:大量算力資源,成本高昂但無法承擔高昂的算力成本直接銷售算力1)在建及投入使用的智算中心2)云廠商單獨租賃國內:智算中心完成系統級工程國外:英偉達DGXCloud模式NVLink-C2CAI算力一體化交付流程900GB/sGraceHopper生產算力聚合算力調度算力釋放算力superchipCPUGPU8個AmpereA100或算力租賃平臺HopperH100旗艦算力供需失衡的前提下,算力租賃有望
27、成為行業內供每月3.7萬美元HPC加速器,每個節DGXCloud給側的最優解點共有640GB顯存#page#ssghtsAIGC算力產業周期預測OAinsightsinsights#page#個周期三個階段:基建期、開發期,商業期nsightsAIGC基建期AIGC開發期AIGC商業期率先受益方:算力基礎服務提供方大模型廠商制勝點技術創新型公司迎來紅利大模型持續國內國外存算一體光子芯片送代的能力5類腦芯片算法、算力、數據、知識仁服務器廠商GPU廠商更具競爭力的企業具備兩項能力優勢功耗好餐計算效率自研芯片集成創新競,高性能芯片數量算力大小能力能力,計算集群建設能力帶寬大小素0-2年3-5年5年以
28、上#page#AIGC基建期:2023年2025年nsights全球范圍內,OpenAI的GPT初步實現智能涌現,其背后的算力支撐是英偉達高性能GPU。在追趕GPT的過程中,需要大模型企業在短時間內完成模型的訓練過程。因此,在AIGC初期階段,大模型研發企業不會考慮除英偉達之外的芯片作為訓練階段的芯片。需求端氣泡大小代表規模訓練速度英偉達掌握行業絕對話語權英偉達拉動下游代工廠業務,二者為王成為AIGC基建期的關鍵莫基者英偉達芯片核心點高性能計算集群A服務器需求保持持續、穩定增長,國智算中心內服務器廠商率先受益加快建設,算力網絡建設是智算中心運營的關鍵,算力網絡算網運營商在算力網絡建設中為主導方
29、在初期階段,高性能GPU廠商將成為最大收益方;同時,AI服務器廠商是此階段的強勢供給方。目前,AI服務器領域已經出現供不應求的局面供給端短缺充足insightsinsights#page#AIGC開發期:2026年2028年insights在中期階段(5年內),推理芯片將成為主要需求方。相比于GPU的高算力高功耗以及對應的算力浪費,推理芯片更注重芯片的算效比,對于功耗和成本有更優的把控。此外,這個階段也會是創新型芯片的機會。分析師預計存算一體芯片、類腦芯片、硅光芯片將有更多市場機會。中期階段AIGC市場將呈現收斂超勢,從百花齊放到逐步淘達,此階段主要是模型層公司之間的淘汰戰。在此階段,AI服務
30、器廠商的紅利期逐漸見頂,智算中心與超算中心走向融合;芯片也從GPU轉向NPU/ASIC/FPGA/CPU等多種形式并存。創新型芯片路線中,看好存算一體架構的發展。大模型由訓練階段過渡到需求成熟度氣態大小代表規模HST0推理階段,企業更加注重推理類芯片占比上升,降低算力成本,對于功耗芯片需求超于多元化高的GPU集群,企業趨向稀疏計算尋求替代方案核心點能效比更高的芯片將迎來存算一體機會點芯片智算中心在滿足人工智能硅光芯片智算超算中心融合,業務的基礎上,為了覆蓋類腦滿足多樣需求更多業務需求,將逐步與芯片超算中心走向融合中期階段,具備底層創新能力的芯片廠商有望成為最大獲益方技術成熟度#page#AIG
31、C商業期:2028年后insights后期階段(10年內)將在應用端呈現出百花齊放的趨勢;屆時,AIGC應用將呈現出類app模式,出現各類細分領域的應用程序,通過模型層提供的API接口來發展各自的應用程序。此階段,大眾層面幾乎不會感知到算力問題。需求成熟度氣泡大小代表規膜AIGC算力層的新商業AIGC應用爆發,模式超于成熟,業務算力感知弱化,量與下游應用需求成核心點正比算力租賃AIGC算力成為公垂類模型使得算力租MaaS共資源賃和MaaS具備更優模型一體的商業前景機后期階段,算力租賃有望成為算力平臺最具規模的盈利模式商業模式成熟度insights#page#ssghtsAIGC算力行業案例集0
32、5insightsinsights#page#阿里云阿里巴巴sights2022年,阿里云在國內首侶MaaS(ModelasaService,模型即服務)理念,提出以AI模型為核心的開發范式,并搭建了一套以AI模型為核心的云計算技術和服務架構,積累了豐富的大模型研發經驗、工具和平臺,這套能力將全部向大模型初創企業和開發者開放,提供包括模型訓練、推理、部署、精調、測評、產品化落地等的全方位服務。以模型為中心,打造MaaS平臺服務模型社區模型開發平臺模型服務PAI機器學習平臺Modelscope國內最活躍的模型社區,提供,交互式建模與可視化建模提供靈活、易用的模型API接口與提供模型不依托于云,豐
33、富的預訓練SOTA模型、多元SDK支持萬億參數級模型訓練提供高效可同階段需要數據集和模型知識庫。單任務集群規??蛇_萬卡GPU自適應推理優化與高效微調訓練的平臺服務靠的服務開源Pythonpackage,統一?;谠频鬃亩鄥^域彈性伸縮能力型接入接口阿里云底座insights10#page#百度智能云百度insights國內首個全棧自研的A基礎設施:百度智能云跨越芯片層、框架層、模型層、應用層四層,實現端到端的云智一體全棧AI設施,其中包含自研AI芯片昆侖,自研的深度學習框架和平臺,自研的AI大底座,自研的大模型和深入千行百業的垂直行業應用。端到端優化帶來實際效果的顯著提升:云智一體四層結構互相
34、反饋和相互適配,全棧且深度融合帶來的端到端優化,在大模型的訓練和推理上均帶來了更多的效果提升,具有顯著優勢。行業與應用智慧能源智能制造智慧金融智慧城市智慧交通+906千卡加速比網盤AI數字人AI質檢智能客服文心大模型能源媒體沉淀增強金融航天支100%+資源利用率撐飛漿提AI大底座數據標注知識管理部署運行模型開發模型管理知識生產效709+開發效率提升昆侖芯高速互聯加速套件AI服務器AI作業調度彈性訓練GPU虛擬化基礎云#page#signt騰訊云騰訊騰訊云新一代HCC(High-PerformanceComputingCluster)高性能計算集群,采用騰訊云星海自研服務器,搭載英偉達最新代次H
35、800GPU,服務器之間采用業界最高的3.2T超高互聯帶寬,為大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延退的集群算力。騰訊高性能計算集群為MaaS提供充沛算力。騰訊云MaaS全景圖MaaS高性能計算集群應用平臺智能應用客戶專屬大模型細分領域模型訓練平臺高性能計算集群(TencentHigh-媒體A中臺TI-OCR訓練平臺數智人Performance Computing Cluster行業大模型精調解決方案THCC)以高性能云服務器為節點,通過AI語音助手TI-AOI訓練平臺智能視頻分析平臺RDMA(Remote Direct Memory Access)(車載/家居)互聯,提供了
36、高帶寬和極低延遲的網絡TI平臺服務,大幅提升網絡性能,能滿足大規平臺&工具模高性能計算、人工智能、大數據推薦等應用的并行計算需求。TI-DataTruth數據標平臺TI-ONE訓練平臺TI-Matrix應用平臺太極Angel加速組件應用場景技術底座科研生命行業大模型科學教育金融大模型政務大模型文旅大模型傳媒大模型教育大模型工業大規?;A設施仿真AI訓練高性能計算集群HCC向量數據庫高性能網絡:自研星脈計算網絡架構#page#華為云華為insights算力是訓練大模型的基礎。華為在最底層構建了以鵬和異騰為基礎的AI算力云平臺,以及異構計算架構CANN、全場景AI框架異思MindSpore,AI開
37、發生產線ModelArts等,為大模型開發和運行提供分布式并行加速、算子和編譯優化、集群級通信優化等關鍵能力?;谌A為的AI根技術,大模型訓練效能可以調優到業界主流GPU的1.1倍。異騰AI云服務除了支持華為全場景AI框架異思Mindspore外,還支持Pytorch、TensorFlow等主流AI框架。異騰聚焦AI基礎軟硬件,分層開放,促進行業智能升級行業解決方案插件化Adapter框架適配能力演進版本快速適配昇騰訓練解決方案異騰推理解決方案3個月1個月支持PyTorch、TensorFlow飛漿等業界框架訊飛火石平臺招行A平臺深度學習平臺星河AI平臺聯通AI平臺動態Shape算子滿足度動態
38、Shape能力二進制算子庫Mindx異騰應用使能深度學習使能|智能邊緣使能優選模型庫|行業SDK70%695%消除算子編譯時間提升整網性能,并在CV、NLP等1書飛漿M思O PyTorch性能滿足場景需求典型場景性能領先A框架算子開發周期算子開發能力AscendC編程語言CANN異構計算架構AscendC編程語言|1400+高性能算子|6大算子庫|基礎加速庫一2人月2人周C/C+編程規范已支持運營商、互聯網等客戶多個結構化核函數編程方式AI基礎硬件昇騰AI系列硬件自定義大Keme開發#page#中科曙光nsightsSugon中科曙光基于在智能計算領域的深耕,構建了完備的異構智能算力技術體系,
39、實現了包含核心部件、整機、計算系統在內的諸多突破,打造了開放通用的算力底座。此外,還積極協同產學研用,孵化場景化解決方案,推動Al技術的實際應用和落地。0Q魚O3帶錄利華行業大模型目前已完成醫療源通信交通創淮互30+計算機視覺Alfor Science國內外主流大模型自然語言處理跨模態多模態大模型適配及解化國古我京我正家包含GPT系列LLaMA系列GLM系列全精度算力供絡生態開放包容全國算力服務深度優化服務ERNIE系列牛預區城調區硬件組優化政省模擬兼容主消軟件生素A博兼客國內外各類芯片多任務區運行提優化5A級智算中心算力服務平臺AI算力集群A維理8編澤級優化計養源存儲歷代碼量優化網絡資同等條
40、件下用資算法螺優化大模型訓練效率及訓練穩定性人工智能算力基礎設施顯著提升#page#MOFFETTA墨芯人工智能nsighs全面賦能大模型行業落地與AIGC等應用墨芯人工智能稀疏計算引領者隨著A大模型參數的日益攀升,稀疏計算已成為公認的AI發展必然趨勢,從根本上解決大0加速水aR網模型發展與算力的矛盾。音頻生成AIGC應用文本生成圖生成跨模態生成代碼生成墨芯人工智能通過核心的稀疏計算技術建立起深厚優勢,成為AIGC時代具有代表性的算力企業:率先基于原創的雙稀疏算法,推出新一代A計算平臺,在算力、功耗、能效比等方印在好小e支撐大模型面實現大幅優化,緩解大模型的高算力需求、高功耗、高費用等痛點,帶
41、來“多贏”的效行業落地百聯網物聯網智慧城市運營商生命科我牌制造果;并且在大模型算力的相關技術、產品、商業落地等方面,均已取得積極進展。京.5OO支持模型200年多模態視覺自然語言處理語音技術:獨創雙稀疏算法,井率先將稀疏化算法與硬件結合落地適用于各類型CUP推出全球首顆高倍率稀疏芯片Antoum,支持高達32倍稀疏:將此前的業界紀錄提AI任務與模型支持算子100+算子涵蓋大部分常見模型,并支持客戶定制算子升16倍。產品:展獲MLPerf冠軍,性能位居行業領先飛漿主流框架ONNXoPyiord基于Antoum芯片的墨芯AI計算卡產品,在國際權威基準測評MLPerf中連續兩屆支持UbuntuCen
42、tOS等主流版本歐拉、龍斷、麒麟等國產操作系統全方位生態兼容操作系統獲得冠軍,并在MLPerf3.0中獲得雙料冠軍。適配浪湖、新華三等主流服務器廠商X86服務器平臺,飛病為代表的Arm應用:支持千億參數大模型,實現高吞吐、低延時,表現優異服務器平臺在1300億參數的GLM-130B大模型上,僅用8張墨芯S30計算卡,吞吐達432token/s,為AIGC大幅加速。NeworkSparseSparseOPT應用范圍廣:支持BLOOM、OPT、GPT-X、LLaMA、StableDiffusion等主流大模型。MOFFETTA高算力,低功耗,助力降本增效:有效緩解A企業的算力基礎設施與運營成本高昂
43、CodecSOLA RuntirmeSparseRTSDK芯人工智能SOLAContaineVirtualizatio等難題,為企業拓展AIGC應用和業務提供強大算力支持。DriverSEALKMD&UMDToolkitToolbox商業落地:實現量產,多領域落地軟硬協同產品已在互聯網、交通、生命科學領域成單落地:同時適用于運營商、金融、制造、AI計算平臺AI計算卡系列Antoum芯片醫療、能源、自動駕駛等眾多行業與場景,獲得市場認可。#page#am天數智芯insights天數智芯是中國領先的通用GPU高端芯片及超級算力系統提供商。作為國內擁有云邊協同、訓推組合的完整通用算力系統全方案提供商
44、,其系統架構、指令集、核心算子、軟件棧均為自主研發,可獨立發展演進。天數智芯已與國內重要行業合作伙伴攜手,從源頭對設計進行定義,率先實現大規模商業化量產,產品開發和商業應用進度領先國內同行。天數智芯軟件棧通用GPU訓練產品天坡應用層AI深度學習FFT高性能數字李生港化層適配主流K9SOpenStack應用廣開發易支持200余種CPU/服務器泛注移如退展iXStream人工智能模型廠商框架層IGIE推理高PTigch國產架構性能分析加速庫BASDNNFFT設備管理本地團隊根據全樓可性能可基于通用編譯器指令集優化加速支持多種開發語言預期定制客戶需求提供GPU架構驅動層UserMade Driver
45、Kernel Mode Driver定制化服務處理器X86ARM通用GPU推理產品一一智鎧生態兼容與市場主流產品相云平臺靈雀云、DAOClooud、聯想云計算、iStation、天翼云、時速云、觀測云計算性應用程使用成算法框架PyTorch、Tensorflow、計圖、ONNX比,實現2-3倍能高超產本低50Centos、ubuntu、銀河麟、統信、OpenEuler、OpenAnolis實際使用性能提升招5理市場主流服務器CPU芯片5aU餛州婚托#page#星爾摩爾線程insights摩爾線程是一家以全功能GPU芯片設計為主的國家高新技術企業,能夠為科技生態合作伙伴提供強大的計算加速能力,致
46、力于打造為下一代互聯網提供多元算力的元計算平臺。摩爾線程基于圖形計算、人工智能計算,打造了第一款AIGC內容生成平臺摩筆馬良支持中英雙語,以及支持在簡筆畫、照片、真實畫作、AI畫作等多種模式輸入下的圖文生成、圖文編輯,為用戶提供零門檻的創作平臺,促進用戶自由創新表達?;贏I+Graphics的智能內容創作(AIGC)平臺簡單易用豐富功能軟硬一體中英文圖文生成、圖文編輯、圖像零創作門檻和MUSA架構深度集成優化超分、簡筆畫創作、視頻生成等畫作賞析#page#insights視拓云SAutoDL視拓云團隊的前身是中科院計算所山世光老師創建的中科視拓SeeTaaS部門,從2017年開始專注C端云計
47、算市場和算法社區的研發和運營,面向“大AI圈”內的科研工作者和科技企業,運營AI算力服務平臺AutoDL.com和算法社區CodeWithGPU.como產品介紹AutoDL.com是一個算力互聯網平臺,面向“大AI圈”內的科研工作者和科技企業,提供彈性、省錢、好用的普惠A云算力服務。AutoDL整合了來自全國各地的不同IDC、運營商和云計算廠商的高性價比算力,共有超10個型號的7000多片GPU和國產A加速芯片。自2021年10月公測至今,伴隨著生成式AI和東數西算的紅利溫回“果長Y+HOTKX“不00“是型OO是一TTS86OT7aony“+解能生票以“上降7aony力節點)。特點案例1.
48、彈性彈性充分發揮容器相比虛擬機高效、性能損失小的優勢,結合靈活彈性的按量計費方式等成本升降配置等產品設定,使得AutoDL在架構本身、計費方式功能上都極具彈性。2.省錢省錢基于GPU算力應用場景的特點,以高配置主機、獨占算力提升核心體驗,精筒非必曾服務某AI生成LOGO用戶,在短短三天內提供了800+卡3090+A5000的混合GPU資要件、共享高成本資源降低服務成本使AutoDL成為好用不貴的GPU云算力平臺。源池,幫助用戶成功應對了社區裂變帶來的流量高峰,保證了終端客戶的用戶體驗3.好用站在科研工作者和科技企業的角度提供好用的功能,比如:打通CodewithGP使得便利的分享或使用鏡像和模
49、型;團隊子賬號管理;接口調用AIGC彈性部署等。在彈性、省錢的同時,還有很好的用戶體驗。#page#億錫科技億鑄科技insights億鑄科技致力于基于新型存儲器ReRAM研發存算一體AI大算力芯片,是全球首家基于存算一體超異構創新架構,面向數據中心、云計算、自動駕駛、中心側服務器等場景的AI大算力芯片公司。初代產品基于傳統工藝制程,可實現500-1000T單卡算力。億鑄科技存算全數字化技術路徑應用創新消除存儲墻高精度C存算一體架構創新有效算力更大非易失性一讀寫速度快一穩定性強一體超異構系統級創新放置參數更多功耗低一CMOS工藝兼容一密度極大型憶阻父減少能耗墻大算力能效比更高高低阻值差異大一成本
50、優勢一微縮化發展器應軟件兼容性好工藝成熟,可量產出貨超高能效比降低編譯墻發展天花板更高用創新將存算一體在大算力真正落地應用場景(部分)金融無人機智能獨政#page#德盛熊清微智能Tinsights清微智能是可重構計算(CGRA)領導企業,全球首家也是出貨量最大的可重構計算芯片商用企業。核心團隊來自于清華大學以及海思、英偉達、蘋果、AMD等知名企業,專注于可重構計算芯片的創新研發和產業應用,面向云端訓推一體,邊端自動駕駛,安防監控等智能計算場景,提供高性能算力支持,致力于打造自主可控的可重構通用計算生態。TX5系列TX8系列TX2系列產品產品產品中算力CGRA大算力CGRA小算力CGRA簡介簡介
51、簡介高性能端側/邊緣AI芯片高性能AIOT芯片高性能云端訓推一體芯片CGRA可重構網絡引擎,CGRA通用計算引擎以國內相對成熟工藝實現國外CGRA可重構計算引擎,超低功耗產品產品產品高能效比,圖像處理性能超海思可穿戴,能效比為傳統音頻先進工藝下頂級性能亮點亮點亮點等同類芯片2-6倍,面積效率較同算力下功耗價格有數倍優勢DSP2-5倍以上國際頂級IP產品1.4-4倍可重構ISP、CV、GPU、DSP多核拓展技術,可重構編譯技術時空域數據流拓展技術可重構技可重構技可重構技術驗證術驗證高能效通用處理跨芯片邊界互聯高能效AI處理術驗證#page#Q量子位insights關于量子位智庫:量子位旗下科技創新產業鏈接平臺。致力于提供前和技術創新領域產學研體系化研究。面向前沿AI&計算機,生物計算,量子技術及健康醫療等領域最新技術創新進展,提供系統化報告和認知。通過媒體、社群和線下活動,基于專題技術報道及報告、專項交流會等形式,幫助決策者更早掌握創新風向。關于量子位:能領域及前沿科技領域的產業服務平臺。微信號:Qbitbot020今日頭條、知乎、百家號及各大科技信息平臺量子位排名均為科技領域TOP10,內容每天可覆蓋數百萬人工智能量子位智庫小助手全網訂閱科技領域從業者#page#