新思科技:市場對 SoC 中專用人工智能IP的需求日益增加(10頁).pdf

編號:117985 PDF  DOCX 10頁 1,012.65KB 下載積分:VIP專享
下載報告請您先登錄!

新思科技:市場對 SoC 中專用人工智能IP的需求日益增加(10頁).pdf

1、白皮書市場對 SoC 中專用人工智能 IP 的需求日益增加作者Ron Lowman新思科技 DesignWare IP戰略營銷經理序言在過去十年間,設計人員開發了能夠以足夠快的速度運行高級深度學習數學運算的硅技術,以探索并實施對象識別、語音和面部識別等人工智能(AI)應用。如今,機器視覺應用通常比人類更精確,是推動新的片上系統(SoC)投資的關鍵功能之一,旨在滿足 AI 的發展,以滿足日常應用需求。通過在視覺應用中使用卷積神經網絡(CNN)和其他深度學習算法,這產生了巨大的影響,使 SoC 中的 AI 功能變得越來越普遍。Semico 在 2018 年 AI 報告中對此總結到:“.幾乎每種類型

2、的芯片都擁有一定程度的 AI 功能,而且這一勢頭將持續保持?!背艘曈X之外,深度學習還被用于解決復雜問題,例如蜂窩通信基礎架構中的 5G 網絡實施,以及通過配置、優化和修復自身的能力而簡化 5G 操作任務,也就是大眾所知的自組織網絡(SON)。5G 網絡將帶來更大的復雜度,包括波束賦形、毫米波中的更多頻譜、載波聚合和更高的帶寬,所有這些都需要機器學習算法在分布式系統中妥善優化和處理數據。AI 加速無處不在,它增加各種應用的價值。每個人都在添加某種形式的人工智能,在不依賴人類交互的情況下做更多的事情,但這些算法的類型各不相同,因此,這些算法使用的加速器也不同。其中包括傳統上用于成像和物體檢測的加

3、速器。在時間比較重要的文本和演講中,循環神經網絡能夠加入時間。除此之外,深度神經網絡還有其他形式,例如脈沖神經網絡和膠囊神經網絡。目前為 AI 開發的半導體有兩種。獨立加速器以某種方式連接到應用處理器,并且有一些應用處理器在設備上添加了神經網絡硬件加速。獨立加速器可以通過芯片與芯片的互連而實現了將硬件擴展到多個芯片的巨大創新,從而實現最高性能,或者利用獨特的 in-memory 和 near-memory 計算技術而減少能耗需求。設備上的 AI 加速正在通過利用處理器和架構對他們的神經網絡處理器進行升級,這些處理器和架構是獨立半導體的先驅。半導體領導者、行業巨頭和數百家初創公司都在全力將 AI

4、 能力推廣到各個行業的大量新型 SoC 和芯片組中,涵蓋從云服務器組到每個廚房中的家庭助理等所有環節。圖 1:AI 的主要市場細分AI 市場細分深度學習神經網絡用在許多不同的應用中,為使用它們的人提供了強大的新工具。例如,它們可以用于高級安全威脅分析、預測和預防安全漏洞,以及通過預測潛在買家的購物流程而幫助廣告商識別和簡化銷售流程。這是在融合最新 GPU 和 AI 加速器半導體技術的服務器群中運行的數據中心應用的兩個實例。但 AI 設計并未包含在數據中心內(見圖 1)。許多新功能可基于傳感器輸入的組合而了解發生的情況,例如用于對象和面部檢測的視覺系統,用于改進人機接口的自然語言理解以及上下文感

5、知)。這些深度學習能力已添加到所有行業的 SoC 中,包括汽車、移動、數字家庭、數據中心和物聯網(IoT)。Datacenters5nm7nm12nmCloud AIAcceleratorEdgeservers5nm7nm12nmAcceleratorcards12nm22nmEdge Computing AIAcceleratorAutomotive7nm12nmDigitalTV7nm12nmVoiceassistants7nm12nm22nm40nmCameras7nm12nm22nm5nm7nm12nmMobile&AR/VRIoT/AIoT22nm40nmEdge DeviceAcc

6、eleratorOn-Device AIPerformance in TOPSPerformance in TOPS/W Model Compression為實現最高性能,針對云 AI 加速的 SoC 設計人員致力于最大限度地提升性能以解決重大問題。執行 AI 訓練以及為了得到最高準確度而需要的最復雜的 AI 算法,需要很高的處理器運算能力(TOPS),這最終可通過縮短訓練時間而降低成本,并減少推理過程所需的能耗。云計算市場的這些半導體硬件創新使人們認為可能需要花費數年開發才能完成的工作成為可能,并縮短了取得突破的時間,例如,以識別和疫苗開發的形式找到當前最令人擔憂的健康問題的治療方法。然而,

7、并非所有問題都可以在云端解決,因此,許多 AI 加速器架構經過修改,可支持邊緣計算和設備端 AI。在邊緣服務器和插入式加速卡中,成本和功耗更加重要。隨著我們越來越靠近并進入數據收集點的應用“邊緣設備加速器”,單位能耗性能的優化成為最高設計要求。邊緣設備加速器的資源、處理和內存有限,因此,經過訓練的算法需要壓縮和裁剪,以滿足功耗和性能的要求,同時保證所需的準確性。最大的 AI 細分市場是設備端 AI,它會影響多種應用,例如汽車 ADAS、數字電視的超高圖像分辨率、音頻和語音識別以及智能音箱中的語言理解。這類應用包括執行面部檢測、面部識別和物體識別的攝像頭。例如,在某些行業中,攝像頭中的設備端 A

8、I 可對工業應用執行缺陷分析。設備端 AI 類別還包括消費類應用,例如手機和 AR/VR 耳機,這些應用可實現前面提到的許多AI 功能,例如導航、超高圖像分辨率、語音理解、對象/面部檢測等,而且所有這些都在小巧的體積中實現。移動設備通過最新的工藝節點而持續在工藝中保持領先地位,這與用于云計算的工藝節點類似。邊緣和設備端計算不斷優化性能。根據市場的不同,可以采用傳統工藝節點,如圖 1 所示。AI 市場正高速發展2020 年,AI 市場仍處于初期階段,并有望在未來幾年內快速增長(見圖 2)。大于 100W 的云 AI SoC 廠商包括市場領導者NVIDIA 和 Intel。通過先發優勢,這些廠商占

9、據了主導地位。大量初創企業希望在效率方面比這些解決方案高出多倍。此外,Google、TPU、阿里巴巴、亞馬遜和百度等系統公司也設計自己的芯片,并通過優化而支持其業務模式。所有這些公司都為客戶提供云出租服務,使客戶能夠在云端進行培訓和推理。圖 2:AI 芯片組市場的增長(按功耗計算)($Millions)Deep Learning Chipset Revenue by Power Consumption,World Markets:2018-2025201820192020$80,000$70,000$60,000$50,000$40,000$30,000$20,000$10,000$-2021

10、2022Source:Tractica202320242025High(100 W)Medium(5-100 W)Low(5W)SoC 通常利用現有的云解決方案,或者經過修改的云架構,但是許多初創企業通過更低功耗和更優化的解決方案而找到了自己的市場位置,同時在性能上遠遠超越當今的解決方案。在圖 2 中,5W 以下市場包括設備端和獨立加速器,通常稱為 AIoT 加速器,這一市場正在迅速發展。對于設備端解決方案,移動市場在出貨量方面占主導地位,而汽車市場也在快速增長,例如Tesla ASIC。在低于5W的市場中,AIoT加速器仍然只占很小的比例,但 Perceive、Kneron、Gyrfalco

11、n、Brainchip 和 GrAI Matter Labs 等公司都在試圖突圍。AI 市場挑戰每個 AI 市場細分都有不同的目標和挑戰。云 AI SoC 設計人員注重縮短昂貴的訓練時間,同時適應可包含 80 億個甚至更多參數的最復雜的新算法。邊緣計算AI設計更注重降低功耗和延遲。5G和設備端AI旨在實現低延遲,但對于5G,這些AI并不用于壓縮模型,因為這可能是非常昂貴且耗時的設計過程。對于設備端 AI,您需要通過壓縮模型,最大程度優化功能和性能的推理。最后,AIoT獨立加速器設計人員使用更多創新技術,并且往往是 TOPS/W 的領導者。在提高密度,縮短延遲,以及應對存儲系數的波動方面,他們承

12、擔著更多的風險,而且他們還是裁剪和壓縮算法以及為客戶實施算法的專家,提供了獨特的差異化能力。除這些獨特的挑戰外,AI 市場也面臨著一系列核心挑戰,包括:添加專門的處理能力,可以更高效地執行必要的數學運算,例如矩陣乘法和點積 高效的內存訪問,可處理深度學習所需的唯一系數,例如權重和激活 可靠且經過驗證的實時接口,用于芯片到芯片、芯片到云端、傳感器數據以及加速器到主機的連接 保護數據并防止黑客攻擊和數據損壞專業處理添加神經網絡能力的 SoC 必須適應異構矩陣和大規模并行矩陣乘法。異構組件需要標量、矢量 DSP 和神經網絡算法能力。例如,機器視覺的每個階段都需要不同類型的處理。預處理需要更簡單的數據

13、級并行性。選定區域的精確處理需要更復雜的數據級并行性,可以通過具有良好矩陣乘法運算能力的專用 CNN 加速器有效地處理。決策階段通??梢酝ㄟ^標量處理的方式來處理。每個應用都是獨一無二的,但很明顯的是,包括神經網絡算法加速的異構處理解決方案需要有效地處理 AI 模型。內存性能AI 模型使用大量內存,這增加了芯片的成本。訓練神經網絡可能需要幾 GB 到 10 GB 的數據,這需要使用最新的 DDR 技術,以滿足容量要求。例如,作為圖像神經網絡的 VGG-16 在訓練時需要大約 9GB 的內存。更精確的模型 VGG-512 需要 89GB 的數據才能進行訓練。為了提高 AI 模型的準確性,數據科學家

14、使用了更大的數據集。同樣,這會增加訓練模型所需的時間或增加解決方案的內存需求。由于需要大規模并行矩陣乘法運算以及模型的大小和所需系數的數量,這需要具有高帶寬存取能力的外部存儲器。新的半導體接口 IP,如高帶寬存儲器(HBM2)和未來的衍生產品(HBM2e),正被迅速采用,以滿足這些需求。先進的 FinFET 技術支持更大的片上 SRAM 陣列和獨特的配置,具有定制的存儲器到處理器和存儲器到存儲器接口,這些技術正在開發中,目的是更好地復制人腦并消除存儲器的約束。AI 模型可以壓縮。這種技術是確保模型在位于手機、汽車和物聯網應用邊緣的 SoC 中受限的存儲器架構上運行所必需的。壓縮采用剪枝(pru

15、ning)和量化(pruning)技術進行,而不降低結果的準確性。這使得傳統 SoC 架構(具有 LPDDR 或在某些情況下沒有外部存儲器)支持神經網絡,然而,在功耗和其他方面需要權衡。隨著這些模型的壓縮,不規則的存儲器存取和不規則的計算強度增加,延長了系統的執行時間和延遲。因此,系統設計人員正在開發創新的異構存儲器架構。實時數據連接一旦AI模型經過訓練并可能被壓縮,就可以通過許多不同的接口IP執行實時數據的運算。例如,視覺應用由CMOS圖像傳感器支持,并通過 MIPI 攝像頭串行接口(CSI-2)和 MIPI D-PHY IP 連接。LiDAR 和雷達可通過多種技術支持,包括 PCI Exp

16、ress 和 MIPI。麥克風通過 USB、脈沖密度調制(PDM)和 I2S 等連接傳輸語音數據。數字電視支持 HDMI 和 DisplayPort 連接,以傳輸視頻內容,而這些內容可通過神經網絡傳輸后得到改善,實現超高圖像分辨率,從而以更少的數據生成更高質量的圖像。許多(甚至是大多數)電視制造商正在考慮部署這項技術?;旌?AI 系統是另一個預計會大量采用的概念。例如,心率算法通過健身帶上的 AI 識別異常,甚至假陽性,該健身帶可將信息發送到云端,用于對異常進行更準確的深入 AI 神經網絡分析,并提示適當的動作。這類技術已經成功地用于電網負載的平衡,特別是在電線中斷或出現意外重負荷的情況下。為

17、了支持快速、可靠的網絡與云端連接,上述示例中的聚合器需要以太網連接。安全AI 在安全漏洞方面提出了新的挑戰。AI 的數據往往是私有的,所開發的算法非常昂貴,并且就最終結果的準確性而言,僅破壞一個比特的數據就有可能帶來災難性的后果。SoC和系統設計需要保護訓練數據、訓練后的算法、敏感的私人信息以及操作的完整性。實施完整的信任根子系統或安全領域可能帶來很大的價值,但也可能需要進行額外的咨詢,以確?;谠缙陂_發的 SoC 流程定義的威脅配置來防止特定的違規行為。AI SoC 設計解決方案在 SoC 中添加 AI 功能突顯了當今 SoC 架構在 AI 方面的薄弱。在為非 AI 應用構建的 SoC 上實

18、施視覺、語音識別和其他深度學習和機器學習算法時,資源非常匱乏。IP 的選擇和集成明確界定了 AI SoC 的基準效率,這構成了 AI SoC 的“DNA”,或者叫先天性。例如,引入定制處理器或處理器陣列可以加速 AI 應用中所需的大規模矩陣乘法。云 AI 加速器為了應對帶寬和可靠性挑戰,云 AI 加速器 SoC 設計人員正在集成 HBM2e 和 HBM3,以及用于芯片到芯片通信的高速 SerDes die-to-die 或 PCIe。安全(包括支持 AI 模型加密和身份驗證的高速安全協議加速器)的作用越來越明顯。嵌入式內存解決方案的多端口存儲器(TCAMs)與 SRAM 編譯器一起有助于減少泄

19、漏。HBM2HBM2PCIe 5.0Die-to-Die 56G/112G SerDesMemorycontroller AI Accelerator SoCHBM2HBM2ProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryProcessingMemoryCustom SRAMbitcells S

20、TARMemory SystemMulti-portSRAMHigh densityanalysis tools Foundationcores 圖 3:具有高速、高帶寬、內存、主機到加速器以及高速 die-to-die 接口(HBI PHY 或 SerDes PHY)的云 AI 加速器 SoC,用于擴展多個 AI 加速器。邊緣計算 AI 加速器許多邊緣計算應用的主要目標是圍繞與較低延遲相關的新服務。為了支持較低的延遲,許多新系統都采用了一些最新的行業接口標準,包括 PCIe 5.0、LPDDR5、DDR5、HBM2e、USB 3.2、CXL、基于 PCIe 的 NVMe 以及其他基于新一代標

21、準的技術。與上一代產品相比,每一種技術都通過增加帶寬而降低延遲。比減少延遲的驅動因素更為突出的是為所有這些邊緣計算系統增加 AI 加速。AI 加速由某些服務器芯片通過 x86 擴展 AVX-512 向量神經網絡指令(AVX512 VNNI)等新指令提供,或者提供給移動應用處理器,例如高通 DSP 內核。很多時候,這種額外的指令集不足以提供預期任務所需的低延遲和低功耗,因此,大多數新系統中還添加了定制 AI 加速器。這些芯片所需的連接能力通常采用帶寬最高的主機而實現加速器連接。例如,由于這些帶寬要求直接影響延遲,PCIe 5.0 正迅速得到廣泛的應用,最常見的是用在具有多個 AI 加速器的某種交

22、換配置中。CXL 是另一種為降低延遲并提供緩存一致性而專門開發的接口,正迅速興起。由于 AI 算法具有異構計算需求和大量內存需求,因此,確保緩存一致性至關重要。除了本地網關和聚合服務器系統之外,單個 AI 加速器通常無法提供足夠的性能,因此需要借助帶寬極高的芯片到芯片的 SerDes PHY 而擴展這些加速器。最新發布的 PHY 支持 56G 和 112G 連接。支持 AI 擴展的芯片到芯片要求已經在多個項目中實施。在基于標準的實施項目中,以太網可能是一種可擴展的選項,現在已經推出了一些基于這種理念的解決方案。然而,當今許多實施項目都是通過專有控制器而利用最高帶寬的 SerDes。不同的架構可

23、能會改變服務器系統的未來 SoC 架構,從而將網絡、服務器、AI 和存儲組件整合到集成度更高的 SoC 中,而不是目前實施的 4 種不同 SoC 中。LPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRD2D PHYPIPE 5.1PCIe/CXLAIAcceleratorLightControllerHS SerDes XSR/USR PHY with LPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRLPDDRD2D PHYPIPE 5.1PCIe/CX

24、LLightControllerAIAccelerator圖 4:邊緣計算 AI 加速器 SoC 具有 SerDes PHY Die to Die 連接、LPDDR 和 PCIe/CXL 到交換機或用于背板連接的 LR 以太網 SerDes,可實現低成本、高帶寬內存訪問以及擴展處理器數量。設備端 AI關于設備端 AI 處理的一個最大關注點就是軟件能力。算法變化很快。設計人員需要采用 Tensorflow 和 Caffe 等傳統工具訓練初始模型,然后將其映射到設備上的處理器。借助可針對特定處理器進行優化并保持高精度的圖形映射工具,以及進行壓縮和修剪的工具,許多工程可以節省數月的時間和精力。如果沒

25、有這些工具,軟件和系統的設計速度趕不上硬件的設計。優化的內存配置可以優化設備端 AI 系統。在開始設備本身的架構設計之前,設計人員需要擁有可模擬多個 IP 權限和配置的工具。在運行實際算法的同時,通過利用處理器模擬片上和片外存儲器,可以在開始設計之前為設計人員提供最有效的架構。由于有些設計人員尚不清楚如何優化系統,因此,他們經常需要為同一過程節點開發多代產品,這會浪費數月的時間。最后,傳感器連接對于設備端 AI 系統的視覺至關重要。MIPI CSI-2 是 CMOS 圖像傳感器的最常見實施。新的 V3 規范旨在提高機器感知能力,并支持更高的精度,從而提供更高質量的圖像。特別需要指出的是,智能化

26、能力應有助于提高效率,因為新數據僅在需要時才提供,而不是提供整個圖像。I3C 整合了多個傳感器,為支持多個系統輸入源提供了一種低成本的方法。邊緣設備 AI 加速器許多企業都在設計獨立 AI 加速器,因為設計這些加速器的企業知道,這是針對特定應用優化神經網絡處理引擎的非常有效的方法。它們采用模擬處理器和創新內存(MRAM、近內存、內存計算)等技術,但仍需要標量和矢量處理單元移動數據并執行浮點運算和其他矢量 DSP 數學運算(圖 x)。(請參見用于內存/近內存計算的 IP 視頻)。邊緣設備 AI 加速器在多芯片 PCIe 卡上最多可擴展至 16 個,可滿足邊緣計算需求并擴展其市場能力。另一個關鍵趨

27、勢是在語音應用中使用 BLE Audio。預計到 2030 年,超過70%的網絡搜索將通過語音激活,因此,支持 BLE 音頻并具有低功耗 AI 語音識別能力的智能芯片可能是非常受消費者重視的設備。MIPIUSBStorageLPDDREthernetHDMIPCIe 4/5MemoryControllerAppsProcessorDSPProcessorApplicationSpecificSubsystemAIProcessor圖 5:設備端 AI 框圖用于 AI SoC 的 DesignWare IP新思科技 DesignWare IP 可支持移動、IoT、數據中心、汽車、數字家庭和其他市

28、場所用 AI 芯片中的專用處理能力、高帶寬內存吞吐量和可靠的高性能連接需求。專用處理新思科技提供了一系列嵌入式處理器,可有效執行 AI 應用的大量工作負載。這包括用于標量、矢量和神經網絡處理的 IP 和工具。ARC EV 處理器集成了針對嵌入式視覺應用而優化的異構計算元件,其中包括卷積神經網絡(CNN)。ARC HS 和 EM 處理器結合了RISC 和DSP處理能力,可以在性能、功率和面積之間實現最佳平衡。ARC的可擴展指令集架構能夠讓用戶添加自己的指令或硬件,以加速 AI 算法,并且能夠將內存與處理器外設緊密耦合在一起,從而減少系統瓶頸。對于受益于高度并行性及專用數據路徑元素的定制 AI 工

29、作負載,新思科技的 ASIP Designer 工具可以實現定制處理器和硬件加速器開發的自動化。Dual-issue,10-stage pipelineInstructionCCMInstructionCacheDataCacheDataCCMARCv2 ISA/DSPUser Defined Instruction ExtensionsMAC andSIMD MultiplierALUDividerLateALUReal-TimeTraceJTAGCache Coherency Unit(HS47D)Memory Protection Unit L2 Cache(HS47D)Memory M

30、anagement Unit(HS47D)ClusterDMAARC Processor EXtensions(APEX)ARCv2DSP Instruction Set Architecture(ISA)Interrupt Controller NVM I/FMemoryProtection Unit3-stage pipelineIFQReal-TimeTraceDMADebugcJTAGJTAGInstructionCCMDivider32x32MULMUL/MACDMPMemoryDataCache(EM7/11D)InstructionCache(EM7/11D)DataCCMCom

31、mitExecuteEnhanced Security/Safety PackagesARC HS4xD ProcessorEM DSP ProcessorDSPXYMemory(EM9/11D)LicensableIEEE 754 Compliant Floating Point UnitFloating Point Unit(FPU)CryptoPackInnovative Embedded MemoryProcessingNear-Memory/In-MemoryProcessingNear-Memory/In-MemoryProcessingNear-Memory/In-MemoryP

32、rocessingNear-Memory/In-MemoryPCIe 3/4USB 3.2/4圖 6:DesignWare ARC EM 和 ARC HS DSP 處理器圖 7:帶有近內存和內存計算能力的邊緣設備 AI 加速器內存性能新思科技提供了多種內存 IP 解決方案,以支持針對不同 AI 內存約束(帶寬、容量、緩存一致性)的高效架構。最新的 DDR IP 可滿足數據中心 AI SoC 的容量需求。HBM2 IP 解決了帶寬瓶頸問題,同時提供了優化的片外存儲器訪問功耗。CCIX IP 支持高速緩存一致性,具有面向 AI 異構計算的虛擬化內存功能,并且能夠減少 AI 應用中的延遲。大量嵌入式

33、內存編譯器能夠支持高密度、低漏電流、高性能的片上 SRAM 選擇(包括 TCAM)和多端口內存。實時數據連接新思科技提供了與 CMOS 圖像傳感器、麥克風和運動傳感器之間可靠的連接,可用于包括視覺、自然語言理解和情景感知在內的各種 AI 應用。采用先進 FinFET 工藝技術的接口 IP 產品組合能夠降低功耗,并支持一系列廣泛使用的標準規范,例如 MIPI、USB/DisplayPort、HDMI、PCI Express、面向加速器的高速緩存一致性互連(CCIX)、以太網等。安全性隨著 AI 廣泛運用于計算應用中,系統各個層面也都需要高級別的安全性。安全性是 AI 流程中一個不可或缺的部分。對

34、 AI 系統、其數據以及通信的保護對于用戶的安全和隱私至關重要,對于保護企業投資也不可或缺。DesignWare 安全 IP 產品組合包含具有信任根(Root of Trust)的 tRoot 硬件安全模塊,可以作為一個或多個主機處理器的輔助能力而在可信執行環境(TEE)中提供多種安全性功能,包括安全標識和身份驗證、安全啟動、安全更新、安全調試和密鑰管理。DesignWare 安全協議加速器是高度集成的嵌入式安全解決方案,具有高效的加密和身份驗證功能,可提供更高的性能、易用性和高級安全功能,例如服務質量、虛擬化和安全命令處理。它們用于保護 AI 模型并支持與云端或其他設備之間的安全通信。高性能

35、 AES-XTS 內核能夠保護運行時內存的靜態數據。培育 AI SoC 已超越芯片設計的范疇在 SoC 中添加 AI 能力突顯了當今 SoC 架構在 AI 方面的薄弱。在為非 AI 應用構建的 SoC 上實現視覺、語音識別和其他深度學習和機器學習算法時,資源非常匱乏。IP 的選擇和集成明確地界定了AI SoC的基準效率,這構成了AI SoC的“DNA”,或者叫先天性。例如,引入定制處理器或處理器陣列可以加速 AI 應用中所需的大規模矩陣乘法。然而,后天培養設計這一要素會影響各部分在硬件中如何協同工作,或者影響如何優化 IP 以實現更有效、更優化的 AI SoC。優化、測試和基準界定 SoC 性

36、能的設計過程需要工具、服務和專業知識來優化 AI 系統。在設計過程中通過定制和優化而培育設計最終可以決定 SoC 在市場中能否取得成功。使用工具、設計專業知識和基準測試專業知識增強功耗、性能和成本對于構建成功的 SoC 架構必不可少。設計人員需要各種后天培養方法而加快實現設計過程和芯片的成功。軟件開發、驗證和基準測試工具為了培育設計實現,設計人員需要各種先進的仿真和原型設計解決方案,例如新思科技公司提供的此類解決方案,以支持早期軟件開發、性能驗證以及最重要的架構優化。這些工具正在 AI 中得到日益頻繁的采用,其原因也是由于設計的不成熟性和復雜性。要想輕松、快速地對不同 AI 圖進行基準測試,需

37、要具備相關的專業技能和成熟的工具鏈。手工編寫這些圖形用于基準測試活動可能是一項艱巨的任務,但要想了解芯片設計是否能夠提供所需價值,這也是一項必不可少的任務。依靠 DeisgnWare ARC EV 等處理器(擁有多種工具,可對這些圖形進行有效、快速的基準測試),可以加快系統設計,確保滿足您的要求。專業知識和定制借助于新思科技公司提供的定制解決方案,有針對性的嵌入式內存可以幫助設計人員解決高密度、低泄漏方面的挑戰。對近閾值邏輯庫的支持可以實現能量收益功能,從而顯著降低 AI 加速器的功耗。新思科技公司的基礎 IP 產品組合包含一個 HPC 設計套件,這是一組邏輯庫單元和內存,已經在先進節點上與

38、EDA 工具進行了共同優化,可以推進任何設計的 PPA 包絡(envelope),它也針對支持 AI 的設計進行了優化。除了提供經過流片驗證的、能夠實現卓越 PPA 的豐富產品組合之外,新思科技還支持對所有IP 權限進行定制,以滿足個性化設計需求,從而使得這套產品比任何其他產品更具靈活性。前端設計專業知識可以利用經驗豐富的設計人員所提供的預先構建的 AI SoC 驗證環境。因此,設計服務工作以及設計第二代及后代芯片組的企業可以優先將產品投入市場。設計人員可以依賴新思科技公司經驗豐富的設計師專家的知識,將此作為加快產品上市速度的有效途徑,從而解放內部設計團隊,讓他們專注于差異化芯片的功能。接口

39、IP 固化為低功耗和低面積實現提供了額外的優化路徑。固化的 IP 能夠在 SoC 上為寶貴的片上 SRAM 和處理器組件騰出空間,以期獲得更好的 AI 性能,并改進 PCIe、USB 和 DDR 等 IP 權限的 PPA??蛻舫晒适滦滤伎萍寂c我們的客戶合作,幫助確??蛻粼谡麄€ AI 市場上取得成功。AI SoC 的近期公開成功客戶案例包括:Tenstorrent 采用 DesignWare IP,使其高性能 Grayskull AI 處理器 SoC 實現了首次流片成功 Black Sesame 將 DesignWare IP 用于智能自動駕駛 SoC 中,實現了 L3 及以上級別的自動駕駛

40、NVIDIA 選擇將 DesignWare IP 用于其下一代高性能云計算網絡芯片 Himax 將 DesignWare IP 集成到 WiseEye ASIC 中,用于設計具有 AI 智能感應能力的電池供電智能設備 Infineon 采用 DesignWare IP 加速汽車 AURIX SoC 中使用的 AI,設計更智能的自動駕駛汽車 Orbecc 采用 DesignWare IP 實現其 3D 智能計算攝像頭的首次流片成功結束語隨著 AI 能力進入新市場,選擇用于集成的 IP 為 AI SoC 提供了關鍵組件。但除了 IP 之外,設計人員還發現,利用 AI 專業知識、服務和工具具有明顯的優勢,能夠確保設計的按時交付,為最終客戶提供高質量的服務和高價值,以滿足新的創新應用需求。2020 Synopsys,Inc.版權所有,保留所有權利。Synopsys 是 Synopsys,Inc.在美國和其他國家的商標。Synopsys 商標列表可在 找到。本文提及的所有其他名稱均為其各自所有者的商標或注冊商標。10/08/20.CS568740477-SG|AI WP.2020 年 9 月發布

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(新思科技:市場對 SoC 中專用人工智能IP的需求日益增加(10頁).pdf)為本站 (探險者) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站