《12.AM李春強-玄鐵RISC-V AI全棧軟硬件平臺-V0.8.pdf》由會員分享,可在線閱讀,更多相關《12.AM李春強-玄鐵RISC-V AI全棧軟硬件平臺-V0.8.pdf(12頁珍藏版)》請在三個皮匠報告上搜索。
1、李春強平頭哥 軟件研發總監玄鐵RISC-V AI全棧軟硬件平臺RISC-V AI技術的挑戰和機遇RISC-V作為開源、開放指令架構,進一步推動AI算力和芯片架構發展算法應用多樣性芯片架構多樣性算法應用部署難量化需多樣性算子分割/融合難算力分析優化難軟硬協同優化AI基礎軟件,創新玄鐵RISC-V AI算力,打造算法和應用開發便捷性算力抽象庫OpenCV、CSI-NN功能性能診斷工具視頻視覺應用框架cxVision pipeline引擎TMedia媒體庫編解碼、變換、傳輸AI算法&應用玄鐵RISC-V 彈性算力HHBAI編譯部署工具不斷豐富的算法應用生態(170+)不斷豐富的硬件算力生態FCENP
2、UGPUVPUISPCV181xTH1520TX510K320D1MobilenetResnetYOLOBERTViTASRNLPTransformer玄鐵RISC-V AI全棧軟硬件平臺RISC-V彈性算力助力不同場景的AI應用RISC-V Vector覆蓋500GOPS應用場景INT4/8/16、FP16等數據類型8RLEN=256RLEN=128Matrix registers20+條擴展指令,8個二維矩陣寄存器單核可達 2 TOPS,支持INT4/8/16,FP16RISC-V MatrixRISC-V 異構芯片GPU,NPU,FCE、DSP,VPU等異構算力高速IO:MIPI、PCI
3、e、USB等和DDR存儲帶寬高性能算力低成本算力多層次全覆蓋的AI硬件算力抽象算法從RISC-V Scalar、Vector到Matrix再到異構算力引擎的無縫遷移RISC-V軟硬協同優化全鏈路算子覆蓋RISC-VVector指令RISC-VMatrix指令芯片異構算力RISC-VScalar指令CSI-NNAI算子庫TMedia媒體庫18645124096mobilenetresnetvggyoloscalarvector(vlen128)matrix(mlen256+vlen256)npu(4T)不同算力性能并行編譯、內建函數原生vlen、匯編優化200+卷積、激活等算子視頻編解碼、前/后
4、處理ONNXCaffe、PytouchTensorFlow算子融合,算子拆分常量折疊,量化信息傳播零點合并等計算圖優化對稱/非對稱/通道INT8/INT16/FP16類型自動混合、量化損失評估離線子圖劃分CPU/NPU異構計算ONNX Runtime模型轉換圖優化量化代碼生成異構執行前端算法模型異構執行文件算法開放接口ONNX生態插件00.20.40.60.81resnet50mobilnetv2inceptionv1ssd量化精度(越越好)HHB第三具01000200030004000resnet50mobilnetv2inceptionv1ssdAI推理性能(時間,越越好)HHB第三具圍繞
5、著RISC-V Vector、Matrix及其自主擴展指令的AI編譯讓RISC-V可以第一時間適應AI算法和算子的快速發展HHB RISC-V AI編譯工具HHB RISC-V AI推理引擎雙推理引擎覆蓋算力場景和應用生態場景實現RTOS、Linux、Android跨平臺算子靜態鏈接模式適應低成本場景0.915.64.834.611.163.514.5010203040506070動態庫(單位MB)HHB推理引擎ONNX runtimetflite引擎1引擎2引擎3引擎4ONNX推理引擎兼容主流算法生態Original modelCompilationexecutionCPU instruct
6、ionbinary graphData-interchangeformat graphInterpretationexecutionHHB AI編譯10類,5000+網絡模型支持ONNX17000+開源項目依賴ONNXcxVision視頻視覺pipeline引擎RenderCaptureDetectorTrackerClassifierDecodeImagePre-process算法插件庫Pipeline引擎Pipeline描述應用流水線u插件式算法開發u腳本描述定義流水線應用u40+通用插件,200+RISC-V Vector優化算子u16路 1080P 25fps(TH1520+yolov
7、5檢測算法)u 40ms 時延(TH1520+yolov5檢測算法)算力模塊拐點分析4T133ops/byteops/smobilenetVGG16MemoryboundComputebound量化損失分析inputlayer0layer1output0.9990.989layer20.947熱點算子分析瓶頸拐點分析profiler精度損失定位熱點算子跟蹤調用關系算力負載分析HHB編譯自動插樁模型轉換圖優化量化代碼生成前端算法模型異構執行針對RISC-V指令特性的自動插樁和PMU性能數據呈現讓RISC-V AI算法性能優化快速收斂RISC-V AI算法功能和性能Profiling從開發板到應用方案的觸手可及小到門鎖門禁,大到邊緣計算、安全支付覆蓋電力,商業,教育,支付,辦公,家居等多領域LicheePi 4ACPU:4*C910Android/LinuxK230勘智CPU:C908Vector+KPUCV81x華山派CPU:C906Vector+NPU跨RTOS、Linux、Android的RISC-AI生態開發板門鎖邊緣計算門禁視覺支付未來展望多芯、多卡、多機RISC-V AI分布式部署RISC-V安全保障AI可信計算AI Model Zoo算法和應用驅動RISC-V演進T H A N K S