《半導體行業專題報告:存算一體繼CPU、GPU架構之后的算力架構“第三極”-230414(20頁).pdf》由會員分享,可在線閱讀,更多相關《半導體行業專題報告:存算一體繼CPU、GPU架構之后的算力架構“第三極”-230414(20頁).pdf(20頁珍藏版)》請在三個皮匠報告上搜索。
1、1 敬請關注文后特別聲明與免責條款 存算一體:繼存算一體:繼 CPUCPU、GPUGPU 架構之后的算力架架構之后的算力架構“第三極”構“第三極”方正證券研究所證券研究報告方正證券研究所證券研究報告 行業專題報告 行業研究 半導體行業半導體行業 2023.04.14/推薦 TABLE_ANALYSISINFO 分析師:分析師:吳文吉 登記編號:S1220521120003 Table_Author 聯 系聯 系 人人人:人:萬瑋 重要數據:重要數據:Table_IndustryInfo 上市公司總家數上市公司總家數 114 總股本總股本(億億股股)790.23 銷售收入銷售收入(億元億元)36
2、37.16 利潤總額利潤總額(億億元元)581.86 行業平均行業平均 PEPE -80.13 平均股價平均股價(元元)72.28 行業相對指數表現行業相對指數表現:TABLE_QUOTEINFO-19%-12%-5%2%9%16%2022/42022/72022/102023/1半導體滬深300 數據來源:wind 方正證券研究所 相關研究相關研究 TABLE_REPORTINFO 北京君正:營收逆勢實現增長,車規存儲巨頭有望下半年業績回升2023.04.11 瑞芯微:旗艦芯片放量拓寬應用領域,靜待 SoC 龍頭復蘇2023.04.11 斯達半導:高歌猛進新能源,研發突破業績輝2023.04
3、.10 國芯科技:RAID 晉新程,助力 AI 銳意進取2023.04.09 存算一體:解決馮存算一體:解決馮諾依曼計算架構瓶頸。諾依曼計算架構瓶頸。算力需求的指數級增長驅動大算力與大模型計算的瓶頸(帶寬低、時延長、功耗高)亟待解決。在深度學習中,數據移動大量且頻繁地存在于計算單元與存儲單元之間,由于數據在 CPU 或 GPU 中頻繁高速傳遞,整個過程的無用能耗大概在 60%-90%;同時由于外部 DRAM 的運行速度遠遠小于 CPU 或 GPU 的運算速度,馮諾依曼架構也受到傳輸帶寬瓶頸的限制(常稱:存儲墻瓶頸),因此系統的運算效率大打折扣。計算架構演進道阻且長,存算一體呼之欲出。存算一體:
4、繼存算一體:繼 CPU、GPU 架構之后的算力架構“第三極”。架構之后的算力架構“第三極”。提升算力的傳統思路(ASIC/CPU/GPU/NPU)有待完善,存算一體的優勢包括:1)具有更大算力(1000TOPS 以上);2)具有更高能效(超過 10-100TOPS/W),超越傳統 ASIC 算力芯片;3)降本增效(可超過一個數量級)。存算一體:在云存算一體:在云、邊邊、端大有可為。端大有可為。端側單設備算力需求約為 0.164 TOPS;端側設備對運行時間、功耗、便攜性等有較高要求。邊側單設備算力需求約為64256 TOPS;邊側設備對時延、功耗、成本以及通用性等有較高要求。云側大算力、高帶寬
5、、低功耗需求催漲 AI 芯片,存內計算或將成為智算中心下一代關鍵 AI芯片技術。存算一體技術三大驅動因素:存算一體技術三大驅動因素:新型存儲器的發展+來自應用側的需求+產業側的配合 存算一體技術三大應用方向:存算一體技術三大應用方向:AI和大數據計算、感存算一體、類腦計算 存算一體公司競爭格局:存算一體公司競爭格局:國外存算一體產業比國內起步早 3-5年左右。存算一體芯片存算一體芯片市場規模:市場規模:基于存算一體技術的小算力芯片 2025 年約 125 億人民幣遠期市場空間。2030 年,基于存算一體技術的中小算力芯片市場規模約為 1069 億人民幣,基于存算一體技術的大算力芯片市場規模約為
6、 67億人民幣,總市場規模約為 1136 億人民幣。建議關注建議關注:恒爍股份,知存科技(非上市)風險提示風險提示:1)半導體下游需求不及預期;2)技術發展不及預期;3)行業競爭加劇。2 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 目錄目錄 1 存算一體:解決馮諾依曼計算架構瓶頸.4 1.1 算力需求的指數級增長驅動大算力與大模型計算的瓶頸(帶寬低、時延長、功耗高)亟待解決 4 1.2 優良的能效比為提升算力的關鍵.4 1.3 提升算力的傳統思路(ASIC/CPU/GPU/NPU)有待完善.5 1.4 計算架構演進道阻且長,存算一體呼之欲出.5 2 存算一體:繼 CPU、GPU 架構
7、之后的算力架構“第三極”.6 2.1 存算一體三大優勢.6 2.2 存算一體技術三大底層特征.7 2.3 存算一體行業趨勢.7 2.4 存算一體技術分類.8 2.4.1 近存計算(PNM).8 2.4.2 存內處理(PIM).8 2.4.3 存內計算(CIM).9 2.5 存內計算存儲器件.9 3 存算一體:在云、邊、端大有可為.11 3.1 端側應用場景.12 3.1.1 端側單設備算力需求約為 0.164 TOPS.12 3.1.2 端側設備對運行時間、功耗、便攜性等有較高要求.12 3.1.3 存內計算在功耗與計算效率等方面具備明顯優勢.12 3.2 邊側應用場景.12 3.2.1 邊側
8、單設備算力需求約為 64256 TOPS.12 3.2.2 邊側設備對時延、功耗、成本以及通用性等有較高要求.12 3.2.3 存算一體在深度學習等領域具備獨特優勢.12 3.3 云側應用場景.13 3.3.1 云側大算力、高帶寬、低功耗需求催漲 AI 芯片.13 3.3.2 存內計算智算中心下一代關鍵 AI 芯片技術.13 4 存算一體技術三大驅動因素.13 4.1 新型存儲器的發展.13 4.2 應用側需求.14 4.3 產業側配合.14 5 存算一體技術三大應用方向.14 5.1 AI 和大數據計算.15 5.2 感存算一體.15 5.3 類腦計算.15 6 存算一體公司競爭格局:國外存
9、算一體產業比國內起步早 3-5年左右.15 7 基于存算一體技術的小算力芯片 2025年約 125 億人民幣遠期市場空間.18 8 相關廠商.18 8.1 恒爍股份:CINOR 存算一體 AI 推理芯片方興未艾.18 8.2 知存科技(非上市):深耕存內計算芯片領域,引領存內計算產業化.19 PWkYlYRUjXhUpMpMtR6McM9PoMoOpNnOjMrRsOfQrQtP6MmNyQMYmNwONZoOnO 3 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 圖表目圖表目錄錄 圖表 1:馮 諾伊曼計算架構.4 圖表 2:數據搬運占 AI 計算的主要功耗.4 圖表 3:存儲計算性能
10、“剪刀差”:算力發展速度遠超存儲器.4 圖表 4:提升算力的傳統思路(ASIC/CPU/GPU/NPU).5 圖表 5:SOTA TRANSFORMER 模型參數量(紅點)和 AI 硬件內存大?。ňG點)增長趨勢對比.5 圖表 6:GPU 中數據傳輸引發功耗損失超過 60%.6 圖表 7:CPU、GPU 等處理數據的能效表現.6 圖表 8:計算架構演進圖示.6 圖表 9:CPU、GPU 與存算一體結構比較.7 圖表 10:存算一體行業趨勢.7 圖表 11:高帶寬內存方案.8 圖表 12:可計算存儲方案.8 圖表 13:基于 DRAM 的 PIM 方案實例.9 圖表 14:五種主流存內計算器件性能
11、對比分析.10 圖表 15:五種主流存內計算器件的研究與應用進展.10 圖表 16:存算一體技術應用.11 圖表 17:端側、邊側、云側設備各指標需求強度分析.11 圖表 18:端側小算力企業概覽.12 圖表 19:云和邊緣大算力企業概覽.13 圖表 20:先進計算技術產業體系框架.14 圖表 21:中國存算一體芯片公司.16 圖表 22:海外存算一體芯片公司.17 圖表 23:中國存算一體芯片市場規模估計.18 4 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 1 存算一體:存算一體:解決解決馮馮諾依曼計算架構瓶頸諾依曼計算架構瓶頸 1.1 算力需求的指數級增長算力需求的指數級增長驅
12、動驅動大算力與大模型計算的瓶頸(帶寬大算力與大模型計算的瓶頸(帶寬低、低、時延時延長、功耗高)長、功耗高)亟待解亟待解決決 傳統的人工推理芯片解決方案將訓練好的權重值存儲在外部的存儲器 DRAM 中,CPU 或 GPU 做推理運算時不停地調用 DRAM 中的數據,并將中間數據實時存回。這種架構被稱為傳統馮諾伊曼架馮諾伊曼架構構,馮氏架構以計算為中心,計算和存儲分離,二者配合完成數據的存取與運算。圖表1:馮諾伊曼計算架構 圖表2:數據搬運占 AI 計算的主要功耗 資料來源:存算一體白皮書(2022 年)-中國移動研究院,方正證券研究所 資料來源:知乎,陳巍談芯,先進存算一體芯片設計(陳巍、耿云川
13、等),方正證券研究所 1.2 優良優良的的能效能效比比為為提升算力的關提升算力的關鍵鍵 正如正如 CMOS 工藝憑借優良的能效比成為主流工藝的關鍵,工藝憑借優良的能效比成為主流工藝的關鍵,優良優良的的能能效效比比亦是提升算力的關鍵。亦是提升算力的關鍵。在深度學習中,數據移動大量且頻繁地存在于計算單元與存儲單元之間,由于數據在 CPU 或 GPU 中頻繁高速傳遞,整個過程的無用能耗大概在無用能耗大概在 60%-90%;同時由于外部 DRAM 的運行速度遠遠小于 CPU 或 GPU 的運算速度,馮諾依曼架構也受到傳輸帶寬瓶頸的限制(常稱:存儲墻瓶頸存儲墻瓶頸),因此系統的運算效率大打折扣。圖表3:
14、存儲計算性能“剪刀差”:算力發展速度遠超存儲器 資料來源:知乎,陳巍談芯,先進存算一體芯片設計(陳巍、耿云川等),github,方正證券研究所 5 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 1.3 提升提升算力算力的的傳統思路(傳統思路(ASIC/CPU/GPU/NPU)有待完善有待完善 目前集成電路的發展進入后摩爾時代,業界除了從“More Moore(深度摩爾)”、“More than Moore(超越摩爾)”與“Beyond CMOS(新器件)”這三大方向探索提升算力的技術路徑,也在通過通過變革變革當當前前的的計算架構計算架構來實現來實現算力算力的的突破突破。目前,目前,主流
15、芯片主流芯片如如 CPU、GPU 以以及及 DPU 均均按照按照馮馮諾依曼諾依曼架構架構設計設計。圖表4:提升算力的傳統思路(ASIC/CPU/GPU/NPU)資料來源:知乎,陳巍談芯,方正證券研究所 1.4 計算架構計算架構演進演進道阻且長,道阻且長,存算一體存算一體呼之欲出呼之欲出 雖然多核(如 CPU)/眾核(如 GPU)并行加速技術可以提升算力,但在后摩爾時代,存儲帶寬制約了計算系統的有效帶寬,系統算力增長步履維艱。GPU 的的架構架構演進演進并未并未解決解決大算力大算力和和大模大模型型的的挑挑戰戰。圖表5:SOTA Transformer 模型參數量(紅點)和 AI 硬件內存大?。ňG
16、點)增長趨勢對比 資料來源:英特爾官網,github,方正證券研究所 6 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 圖表6:GPU中數據傳輸引發功耗損失超過 60%圖表7:CPU、GPU 等處理數據的能效表現 資料來源:知乎,陳巍談芯,方正證券研究所 資料來源:知乎,陳巍談芯,方正證券研究所 2 存算一體存算一體:繼繼 CPU、GPU 架構之后架構之后的算力架構的算力架構“第三極第三極”作為一種新的計算架構,存算一體被認為是最具有潛力的革命性技術,其核心是將存儲與計算完全融合,存儲器中疊加計算能力,以新的高效運算架構進行二維和三維矩陣計算,結合后摩爾時代先進封裝、新型存儲器件等技術
17、,能有效克服馮諾依曼架構瓶頸,實現計算能效的數量級提升。圖表8:計算架構演進圖示 資料來源:知乎,陳巍談芯,方正證券研究所 2.1 存算一體存算一體三大優勢三大優勢 存算一體的優勢包括 1)具有更大算力(1000TOPS 以上);2)具有 7 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 更高能效(超過 10-100TOPS/W),超越傳統 ASIC 算力芯片;3)降本增效(可超過一個數量級)。2.2 存算一體存算一體技術技術三大三大底層特征底層特征 存算一體技術的技術底層特征包括:1)減少數據搬運(降低能耗至1/101/100);2)存儲單元具備計算能力(等效于在面積不變的情況下規模
18、化增加計算核心數,或者等效于提升工藝代);3)單個存算單元替代“計算邏輯+寄存器”更小更快。圖表9:CPU、GPU 與存算一體結構比較 資料來源:知乎,陳巍談芯,先進存算一體芯片設計(陳巍、耿云川等),方正證券研究所 2.3 存算一體存算一體行業行業趨勢趨勢 圖表10:存算一體行業趨勢 資料來源:存算一體芯片深度產業報告量子位智庫,方正證券研究所 8 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 2.4 存算一體存算一體技術分類技術分類 2.4.1 近存計算(近存計算(PNM)近存計算通過芯片封裝和板卡組裝等方式,將存儲單元和計算單元集成,增加訪存帶寬、減少數據搬移,提升整體計算效率。
19、近存計算仍是存算分離架構,本質上計算操作由位于存儲外部、獨立的計算單元完成其技術成熟度較高,主要包括存儲上移、計算下移兩種方式。近存計算已應用于人工智能、大數據、邊緣計算等場景因其基本保持原有計算架構,產品化方案可較快投入使用。1)存儲存儲上上移移:采用先進封裝技術將存儲器向處理器(如 CPU、GPU)靠近,增加計算和存儲間的鏈路數量,提供更高訪存帶寬。典型的產品形態為高帶寬內存(High Bandwidth Memory,HBM),將內存顆粒通過硅通孔(Through Silicon Via,TSV)多層堆疊實現存儲容量提升,同時基于硅中介板的高速接口與計算單元互聯提供高帶寬存儲服務。圖表1
20、1:高帶寬內存方案 資料來源:存算一體白皮書(2022 年)-中國移動研究院,方正證券研究所 2)計算計算下移:下移:采用板卡集成技術將數據處理能力卸載到存儲器,由近端處理器進行數據處理,有效減少存儲器與遠端處理器的數據搬移開銷。典型的方案為可計算存儲(Computational Storage Drives,CSD),通過在存儲設備引入計算引擎承擔如數據壓縮、搜索、視頻文件轉碼等本地處理,減少遠端處理器(如 CPU)的負載。圖表12:可計算存儲方案 資料來源:存算一體白皮書(2022 年)-中國移動研究院,方正證券研究所 2.4.2 存存內內處理(處理(PIM)存內處理是在芯片制造的過程中,
21、將存和算集成在同一個晶粒 9 半導體-行業專題報告 敬請關注文后特別聲明與免責條款(Die)中,使存儲器本身具備了一定算的能力。存內處理本質上仍是存算分離相比于近存計算,“存”與“算”距離更近。當前存內處理方案大多在內存(DRAM)芯片中實現部分數據處理,較為典型的產品形態為 HBM-PIM 和 PIM-DIMM,在 DRAM Die 中內置處理單元,提供大吞吐低延遲片上處理能力,可應用于語音識別、數據庫索引搜索、基因匹配等場景。圖表13:基于 DRAM的 PIM方案實例 資料來源:存算一體白皮書(2022 年)-中國移動研究院,方正證券研究所 2.4.3 存內存內計算(計算(CIM)存內計存
22、內計算算即狹義的即狹義的存算一體存算一體。在芯片設計過程中,不再區分存儲單元和計算單元,真正實現存算融合。存內計算是計算新范式的研究熱點,其本質是利用不同存儲介質的物理特性,對存儲電路進行重新設計使其同時具備計算和存儲能力,直接消除“存”“算”界限,使計算能效達到數量級提升的目標。存內計算最典型的場景是為存內計算最典型的場景是為 AI算法提供向量矩陣乘的算子加速算法提供向量矩陣乘的算子加速,目前已經在神經網絡領域開展大量研究,如卷積神經網絡(Convolutional Neural Network,CNN)、循環神經網絡(Recurrent Neural Network,RNN)等。存內計算主
23、要包含數字和模擬兩種實現方式,二者適用于不用的應用場景。1)模擬模擬存內計存內計算算:適用于適用于低精低精度、度、低功耗計算低功耗計算 模擬存算一體通常使用 FLASH/RRAM、PRAM 等非易失性存儲截至作為存儲器件,存儲密度大,并行度高,但是對環境噪聲和溫度非常敏感,適用于低精度、低功耗計算場景,如端側可穿戴設備等。2)數字數字存內存內計算計算:適用于適用于高精度、高精度、功耗不敏感功耗不敏感計算計算 數字存算一體主要以 SRAM/RRAM/DRAM 作為存儲器件,采用先進邏輯工藝,具有高性能高精度的優勢,且具備良好的抗噪聲能力和可靠性,適用于高精度、功耗不敏感計算場景,未來可應用于云邊
24、AI 場景。一直以來,主流的存內計算大多采用模擬計算實現,近兩年數字存內計算的研究熱度飛速提升。2.5 存內計算存內計算存儲器件存儲器件 存內計算電路可基于易失性存儲器和非易失存儲器件實現。易失性存儲器在設備掉電之后數據丟失,如 SRAM 等;非易失性存儲器在 10 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 設備掉電后數據可保持不變,如 NOR Flash、阻變隨機存儲器(Resistive Random Access Memory,RRAM))、磁性隨機存儲器(Magnetoresistive Random Access Memory,MRAM))、相變存儲器(Phase Cha
25、nge Memory,PCM)等。圖表14:五種主流存內計算器件性能對比分析 資料來源:存算一體白皮書(2022 年)-中國移動研究院,方正證券研究所 圖表15:五種主流存內計算器件的研究與應用進展 資料來源:存算一體芯片深度產業報告量子位智庫,方正證券研究所 11 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 3 存算一體:存算一體:在在云云、邊邊、端端大有可為大有可為 圖表16:存算一體技術應用 資料來源:存算一體芯片深度產業報告量子位智庫,方正證券研究所 根據陳巍談芯,按算力大小劃分:1)針對端側的可穿戴等小設備,對算力的要求遠低于智能駕駛和云計算設備,但對成本、功耗、時延、開發
26、難度很敏感。端側競品眾多,應用場景碎片化,面臨成本與功效的難題。存算一體技術在端側的競爭力影響約占 30%。(例如 arm占 30%,降噪或 ISP占 40%,AI加速能力只占 30%);2)針對云計算和邊緣計算的大算力設備是存算一體芯片的優勢領域。存算一體在云和邊緣的大算力領域的競爭力影響約占 90%。邊緣端存算一體芯片具有高算力、低功耗、高性價比的優勢。圖表17:端側、邊側、云側設備各指標需求強度分析 資料來源:存算一體白皮書(2022 年)-中國移動研究院,方正證券研究所 12 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 3.1 端側應用場景端側應用場景 3.1.1 端側端側單
27、設備算力需求單設備算力需求約為約為 0.164 TOPS 據 IDC 預測,2025 年全球物聯網設備數將超過 400 億臺,產生的數據量接近 80ZB,智慧城市、智能家居、自動駕駛等諸多場景中超過一半的數據需依賴終端本地處理,單設備算力需求約在 0.164 TOPS之間。3.1.2 端端側側設備設備對運行時間、功耗、便攜性等有較高要求對運行時間、功耗、便攜性等有較高要求 如智能眼鏡/耳機需保證滿負荷待機時間超 16 小時,手機的最高運行功耗則不超 8W。端側設備的未來發展將更加注重時延、功耗、成本和隱私性等需求特征。3.1.3 存內計算存內計算在在功耗功耗與與計算效率計算效率等方面等方面具備
28、具備明顯優勢明顯優勢 在相同制程工藝下,存內計算芯片可在單位面積下提供更高算力與更低功耗,進而延長設備工作時間。目前存內計算產品已成功在端側初步商用,提供語音、視頻等 AI 處理能力,并獲得十倍以上的能效提升,有效降低端側成本。圖表18:端側小算力企業概覽 資料來源:陳巍談芯,創業芯睿,方正證券研究所 3.2 邊邊側應用側應用場景場景 3.2.1 邊側邊側單單設備算力需求設備算力需求約為約為 64256 TOPS 隨著車聯網等邊緣計算應用的快速興起,海量數據將在邊緣側進行處理,流量模型逐漸從云側擴展到邊側。3.2.2 邊邊側側設備設備對對時延、時延、功耗、功耗、成本成本以及以及通用性通用性等有
29、較高要求等有較高要求 比如智慧港口要求端到端時延 1020ms,車聯網場景要求端到端時延 3100ms。此外,由于邊側設備通常部署在等靠近數據生產或使用的場所,對散熱要求也比較高。3.2.3 存算一體存算一體在深度學習在深度學習等領域等領域具備具備獨特優勢獨特優勢 13 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 與傳統方案相比,存算一體在深度學習等領域可以提供比傳統設備高幾十倍的算效比,此外存內計算芯片通過架構創新能提供綜合性能全面兼顧的芯片及板卡,預計將為廣泛的邊緣 AI業務提供服務。3.3 云云側應用場景側應用場景 3.3.1 云側云側大大算力、算力、高帶寬、高帶寬、低功耗低功
30、耗需求需求催漲催漲 AI 芯片芯片 以圖像、語音、視頻為主的非結構化數據呈現高速增長趨勢,根據IDC 預測,到 2030 年將帶動智能算力需求增長 500倍,以 AI算力為核心的智算中心將成為算力基礎設施主流,大規模的 AI 芯片集約化建設帶來高功耗挑戰,每機架平均功耗將由 35kw 逐漸升至710kw。未來智算中心呼喚新型 AI 芯片,以滿足云側大算力、高帶寬、低功耗等特性。3.3.2 存內存內計算計算智算中心下一代關鍵智算中心下一代關鍵 AI 芯片技術芯片技術 存內計算可通過多核協同集成大算力芯片,結合可重構設計打造通用計算架構,正面向大算力、通用性、高計算精度等方面持續演進,有望為智算中
31、心提供綠色節能的大規模 AI算力。針對智能駕駛、數據中心等大算力應用場景,在可靠性、算力方面有較高要求,云計算市場廠商相對集中,存算一體芯片以其高能效大算力優勢有望另辟蹊徑搶占云計算市場。圖表19:云和邊緣大算力企業概覽 資料來源:陳巍談芯,創業芯睿,方正證券研究所 4 存算一體存算一體技術技術三大三大驅動因素驅動因素 4.1 新型存儲器新型存儲器的的發展發展 新型存儲器件的物理性新型存儲器件的物理性能更能更適合開發存內計算,在適合開發存內計算,在實現更高計算實現更高計算密密度度的同時的同時具備成本優勢。具備成本優勢。在新型存儲器件上發展存算一體技術,能夠帶來更大的算力優勢,從而開拓更多的人工
32、智能應用場景。此外,新型存儲器件的發展上限更高,現有存儲器件再過 3-4 年將走向技術極限,而新型存儲器件還可以往前發展新型存儲器件還可以往前發展 10-20 年年。根據量子位智庫,基于 RRAM 的新型存儲器件有望在 5 年內在產品化上取得突破。新型存儲器件的特點是在其開發過程中需要在傳統 CMOS 工藝里增加特殊材料或工藝,這些特殊材料或工藝的開發需要經過大量實驗及測試驗證,而傳統的 CMOS 代工廠在開發進度上相對緩慢。14 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 因此,新型器件工藝的突破點主要是工藝的迭代速度,如果沒有標準的 12 寸量產產線,新型存儲器件很難走向量產。如
33、果新型存儲器發展受限,在傳統存儲器件走到成熟盡頭后,開拓新應用場景的難度會極大。4.2 應用側應用側需求需求 后摩智能認為存算一體的發展邏輯是由外向內后摩智能認為存算一體的發展邏輯是由外向內的的,當大量需求出現,當大量需求出現后,一項能夠滿足客戶需求的新技術將迅速發后,一項能夠滿足客戶需求的新技術將迅速發展。展。在存算一體領域,AI、大數據分析這類數據密集型應用的出現,對能效比的需要迅速上升,推動了存算一體的發展。存算一體的底層邏輯是讓很大一部分數據不需要搬出存儲器便可參與計算,以此大幅提升計算效率。同時,隨著深度學習被廣泛應用,對算力的需求不僅僅是大算力,有效算力也成為企業關注的焦點。在傳統
34、的馮諾依曼架構下,存儲單元和計算單元分離,存儲器讀寫速度慢產生的時延,在一定程度上造成算力浪費。盡管處理器的性能再優,依然需要平衡存儲器的特性,存儲器運行速度慢導致實際運算效率不及理論上所呈現的指標。而存算一體架構通過使存儲器具備計算能力,實現在相同芯片面積下規?;黾佑嬎愫诵臄?。4.3 產業產業側側配合配合 存算一體技術在存算一體技術在 0 到到 1 的階段已初步形成的階段已初步形成 IP 授權,定制開發授權,定制開發,自定,自定義產品多種商業模式,能夠在特定應用場景中義產品多種商業模式,能夠在特定應用場景中實現小規模量產。實現小規模量產。一旦產品出現可大規模量產的趨勢或能夠產生足夠的收益,
35、整個產業鏈便會積極加入,在生產制造的各個環節都將有相應公司專門基于存算一體做研發,共同推動整個產業發展。根據根據量子位量子位智庫智庫,從,從目前小規模量產到實現大規模量產大概有目前小規模量產到實現大規模量產大概有 10 年年的時間,其中前的時間,其中前 5 年存內計算將以年存內計算將以 AI 計算為主,后計算為主,后 5 年將覆蓋更多年將覆蓋更多應用場景。應用場景。在底層技術上,選擇正確的方向和適配的場景決定了技術在未來是否有足夠的潛力走向產業化。5 存算一體存算一體技術技術三大應用方向三大應用方向 圖表20:先進計算技術產業體系框架 資料來源:中國算力發展指數白皮書(2022 年),方正證券
36、研究所 15 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 5.1 AI 和和大數據大數據計算計算 存內計算存內計算適用于適用于 AI 的深度神經網絡應的深度神經網絡應用和基于用和基于 AI 的的大數據技術大數據技術。通過存算一體技術,可將帶 AI 計算的大量乘加計算的權重部分存在存儲單元中。對此,在電路設計方面,通過在存儲單元的核心電路上做修改,從而在讀取的同時進行數據輸入和計算處理,在存儲陣列中完成卷積運算,再加上大量乘加的卷積運算是深度學習算法中的核心組成部分,存內計算助力基于 AI 的大數據技術。5.2 感存算一體感存算一體 存算一體存算一體助力助力含含 AI 存算一體存算一體
37、芯片芯片的的傳感器傳感器實現實現零延時零延時和和超低功耗超低功耗的的智能智能視覺視覺處理處理能力能力。集傳感、儲存和運算為一體構建感存算一體架構,在解決馮諾依曼架構的存儲墻瓶頸的同時,與傳感結合提高整體效率。1)在傳感器自身包含的 AI 存算一體芯片上運算,可實現零延時和超低功耗的智能視覺處理能力;2)基于 SRAM 模數混合的視覺應用存內計算神經擬態芯片僅在檢測到有意義的時間才會進行處理,大幅降低能耗。5.3 類類腦計算腦計算 存算一體存算一體為為類腦計算類腦計算的的關鍵技術基石關鍵技術基石。類腦計算又被稱為神經形態計算,是借鑒生物神經系統信息處理模式和結構的計算理論、體系結構、芯片設計以及
38、應用模型與算法的總稱。本質與存算一體類似,類腦計算旨在使計算機像人腦一樣將存儲和計算合二為一,從而高速處理信息。由于類腦計算屬于大算力高能效領域,因此針對云計算和邊緣計算的存算一體技術,是未來類腦計算的首選和產品快速落地的關鍵。6 存存算一體算一體公司公司競爭格局:競爭格局:國外存算一體產業比國外存算一體產業比國內起步國內起步早早 3-5 年年左右左右 從發展進程上講,國外存算一體產業比國內起步早 3-5 年左右,并且基于存算一體的技術已普遍實現產品化。目前來看,SST,Syntiant和和 Mythic 走在商業化前列走在商業化前列;SST的 IP 授權數量最多,且許多芯片大廠愿意為其買單。
39、從芯片營收上講,經量子位智庫統計,美國超過 100 億美元營收的芯片公司有 10 家左右,歐洲有 5 家左右,而中國只有 1-2 家(中國公司數量遠超國外)。從技術得到驗證到產品化過程的前期,存算一體配套工具(如 EDA軟件)的研發公司尚處在探索階段。缺乏成熟的配套工具導致基于存算一體技術的產品在短期內(5年左右)以小規模量產為主。16 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 圖表21:中國存算一體芯片公司 資料來源:存算一體芯片深度產業報告量子位智庫,方正證券研究所 17 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 圖表22:海外存算一體芯片公司 資料來源:存算一體芯
40、片深度產業報告量子位智庫,方正證券研究所 18 半導體-行業專題報告 敬請關注文后特別聲明與免責條款 7 基于存算一體技術的小算力芯片基于存算一體技術的小算力芯片 2025 年年約約 125 億億人民幣人民幣遠期市場空遠期市場空間間 根據量子位智庫測算,2025 年,基于存算一體技術的小算力芯片市年,基于存算一體技術的小算力芯片市場規模約為場規模約為 125 億人民幣億人民幣。存算一體技術從實驗室的研究成果到實現初步量產需要 5 年左右的時間,從初步量產到大規模量產則需要10 年左右時間。國內存算一體公司從成立時間上看,集中在 2017-2020 年,其中實現量產的公司有 4 家左右,其余公司
41、中進入測試階段的有 2-3 家。量子位量子位智庫智庫預計,預計,2025 年存算一體將迎來商業化轉年存算一體將迎來商業化轉折點,應用場景折點,應用場景從麥克風、智能手表和從麥克風、智能手表和 TWS 耳機拓展到智能安防、耳機拓展到智能安防、移動終端和移動終端和 AR/VR 等(從語音識別、喚醒到等(從語音識別、喚醒到視覺處理)。視覺處理)。2030 年,基于存算一體技術的中小算力中小算力芯片市場規模約為 1069 億人億人民幣民幣,基于存算一體技術的大算力大算力芯片市場規模約為 67 億人民幣億人民幣,總市場規模約為 1136 億人民幣。大算力芯片和小算力芯片在底層的存算一體單元基本可以復用,
42、但 NPU 架構和編譯器需要做一定修改以支持更通用的場景。除了提升芯片設計能力,使用新型存儲器也能夠增加單個芯片的算力。RRAM 新型存儲器技術具有高速、結構簡單 的優點,有望成為未來發展最快的新型存儲器,目前距離工藝成熟還有 2-5 年的時間??紤]到從技術突破到產品化還需要 2-3 年的時間,量子位量子位智庫智庫預計在預計在 2030 年,基于存算年,基于存算一體的大算一體的大算力芯片將實力芯片將實現規?,F規模量產量產,應用場景覆蓋大數據檢索、蛋白質/基因分析、數據加密、圖像處理等。圖表23:中國存算一體芯片市場規模估計 資料來源:存算一體芯片深度產業報告量子位智庫,方正證券研究所 8 相關
43、廠商相關廠商 8.1 恒爍股份:恒爍股份:CiNOR 存算存算一體一體 AI 推理芯片推理芯片方興未艾方興未艾 高并行度和高能效計算催漲存算一體需求,高并行度和高能效計算催漲存算一體需求,CiNOR 存算存算一體一體 AI 推推理芯片理芯片方興未艾。方興未艾。2019 年公司研發的存算一體 AI 推理芯片(恒芯 1號)流片和系統演示成功,目前在研 CiNOR V2 芯片(恒芯 2 號)。隨著存算一體技術的深化應用,公司的 CiNOR 存算一體 AI 推理芯片前景可期。估估值:值:Wind 一致預期 23、24 年攤薄 EPS分別為 1.00、1.77,對應76X、43X PE。19 半導體-行
44、業專題報告 敬請關注文后特別聲明與免責條款 8.2 知存科技(知存科技(非上市非上市):深耕深耕存內計算芯片領域,引領存內計算產存內計算芯片領域,引領存內計算產業化業化 知存科技創立于知存科技創立于 2017 年,專注存內計算芯片領域,創新使用年,專注存內計算芯片領域,創新使用 Flash存儲器完成神經網絡的儲存和運算,解決存儲器完成神經網絡的儲存和運算,解決 AI 的存儲墻問題,提高運的存儲墻問題,提高運算效率,降低成本。算效率,降低成本。研發團隊由王紹迪博士與郭昕婕博士聯合多位學者、產業從業者組建,平均擁有 10 年以上產業工作經驗。公司旗下 WTM2101 芯片適配低功耗 AIoT 應用
45、,可使用微瓦到毫瓦級功耗完成大規模深度學習運算,可應用于智能語音、智能健康等市場領域,目前已完成批量生產和市場應用。WTM8 系列芯片面向 6-48Tops算力產品,應用于 4K-8K視頻的實時處理。2023 年 1 月,知存科技完成 2 億元 B2輪融資,累計融資近 8億元。未來,公司將繼續專注存內計算芯片領域,引領存內計算產業化。20 半導體-行業專題報告 分析師聲明分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格,保證報告所采用的數據和信息均來自公開合規渠道,分析邏輯基于作者的職業理解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響
46、。研究報告對所涉及的證券或發行人的評價是分析師本人通過財務分析預測、數量化方法、或行業比較分析所得出的結論,但使用以上信息和分析方法存在局限性。特此聲明。免責聲明免責聲明 本研究報告由方正證券制作及在中國(香港和澳門特別行政區、臺灣省除外)發布。根據證券期貨投資者適當性管理辦法,本報告內容僅供我公司適當性評級為C3及以上等級的投資者使用,本公司不會因接收人收到本報告而視其為本公司的當然客戶。若您并非前述等級的投資者,為保證服務質量、控制風險,請勿訂閱本報告中的信息,本資料難以設置訪問權限,若給您造成不便,敬請諒解。在任何情況下,本報告的內容不構成對任何人的投資建議,也沒有考慮到個別客戶特殊的投
47、資目標、財務狀況或需求,方正證券不對任何人因使用本報告所載任何內容所引致的任何損失負任何責任,投資者需自行承擔風險。本報告版權僅為方正證券所有,本公司對本報告保留一切法律權利。未經本公司事先書面授權,任何機構或個人不得以任何形式復制、轉發或公開傳播本報告的全部或部分內容,不得將報告內容作為訴訟、仲裁、傳媒所引用之證明或依據,不得用于營利或用于未經允許的其它用途。如需引用、刊發或轉載本報告,需注明出處且不得進行任何有悖原意的引用、刪節和修改。公司公司投資評級的說明:投資評級的說明:強烈推薦:分析師預測未來半年公司股價有20%以上的漲幅;推薦:分析師預測未來半年公司股價有10%以上的漲幅;中性:分
48、析師預測未來半年公司股價在-10%和10%之間波動;減持:分析師預測未來半年公司股價有10%以上的跌幅。行業投資評級的說明:行業投資評級的說明:推薦:分析師預測未來半年行業表現強于滬深300指數;中性:分析師預測未來半年行業表現與滬深300指數持平;減持:分析師預測未來半年行業表現弱于滬深300指數。地址地址 E-mail:北京北京 西城區展覽館路 48 號新聯寫字樓 6 層 上海上海 靜安區延平路 71 號延平大廈 2 樓 深圳深圳 福田區竹子林紫竹七道光大銀行大廈 31 層 廣廣州州 天河區興盛路 12 號樓 雋峰苑 2 期 3 層方正證券 長沙長沙 天心區湘江中路二段 36 號華遠國際中心 37 層