《3-12697-embedded world keynote唐丹-推動開源芯片生態發展V1.1.pdf》由會員分享,可在線閱讀,更多相關《3-12697-embedded world keynote唐丹-推動開源芯片生態發展V1.1.pdf(58頁珍藏版)》請在三個皮匠報告上搜索。
1、構建開源芯片技術體系推動開源芯片生態發展唐丹匯報大綱一、RISC-V與開源芯片二、“一生一芯”人才培養計劃三、開源EDA工具四、高性能開源RISC-V處理器核IP五、總結(一)RISC-V與開源芯片處理器芯片的戰略意義 2022年進口5384億個集成電路,進口額高達4155.79億美元,成為我國第一大進口商品,遠超第二位石油(3655.12億美元)其中處理器芯片占比達到49.2%,進口超過2051億美元 處理器芯片是電子設備的“大腦”,支撐了占我國GDP約1/6的信息產業 處理器技術體系是有技術標準和知識產權將器件、IP核、SoC芯片、EDA軟件、系統軟件和應用軟件等聯系在一起的技術整體數據來
2、源:2023年3月國家統計局發布2022年國民經濟和社會發展統計公報指令集是處理器芯片生態的基石l指令集架構(Instruction Set Architecture),簡稱指令集l計算機系統中硬件與軟件之間交互的標準規范指令集可類比于螺母和螺釘的尺寸規范指令集芯片版圖l芯片設計:將指令集手冊定義的功能,變成源代碼l芯片制造:將版圖提交給臺積電/中芯國際等企業流片,然后封裝、測試,獲得芯片工程開發RTL代碼EDA工具芯片版圖指令集手冊設計文檔微架構設計RISC-V:指令集應該免費l幾十年來,處理器指令集均屬于公司私有或無法獲取,或需授權費l2010年,UC Berkeley開始開發一套開放免費
3、的指令集RISC-VV.S.RISC-V v.s.X86/ARM:指令更精巧lX86從1978年的80條指令,增長到2015年的3600條lRISC-V基礎部分(RV32I)只有47條指令,并已凍結RISC-V v.s.X86/ARM:指令更精巧X86手冊:約5000頁ARM手冊:約2700頁RISC-V手冊:約200頁RISC-V v.s.X86/ARM:模塊化l實現一個X86/ARM處理器,需實現所有上千條指令,復雜度極高lRISC-V指令集采用模塊化設計l必要的RV32I只有47條指令l其余指令可選擴展l可根據需求自由組合,靈活適配l嵌入式(處理器成本)RV32Il嵌入式(存儲器成本)R
4、V32ICl桌面 RV64GCl高性能 RV64GCVl支持自定義指令基礎64位基礎64位基礎壓縮特權乘除原子浮點向量RISC-V常用的可選擴展,可適配從嵌入式到高性能的各種場景開源、開放、共建、共享的處理器芯片生態l核心理念與5G通信技術發展模式相同 全世界共同制定標準,各國企業根據標準自主實現產品l投入多,貢獻大,則主導權大RISC-V國際基金會快速發展(總部位于瑞士)05001000150020002500Q1 2016Q2 2016Q3 2016Q4 2016Q1 2017Q2 2017Q3 2017Q4 2017Q1 2018Q2 2018Q3 2018Q4 2018Q1 2019Q
5、2 2019Q3 2019Q4 2019Q1 2020Q2 2020Q3 2020Q4 2020Q1 2021Q2 2021Q3 2021Q4 2021Q1 2022芯片廠商(SoC,IP,FPGA)I/O設備相關(內存,網絡,存儲)大學及科研機構芯片設計服務公司(芯片制造及設計服務)軟件提供商(開發工具、框架及操作系統)應用廠商(云端,移動端,高性能計算,機器學習,自動控制)RISC-V個人開發者及推廣者 已有全球80多個國家3200多個會員 2020年會員數增長133%2021年會員數量再度翻倍 數據參考:https:/riscv.org/wp-content/uploads/2021/0
6、8/RISC-V-Introduction-_-Aug-2021.pptxRISC-V國際基金會的中國力量(2022.12)l22個理事會成員l10個中國l4個發展伙伴l3個來自中國l高級會員:14/25l戰略會員:46/179l學術組織:12/127新態勢:高性能RISC-V處理器核進入競賽階段 RISC-V處理器核與X86/ARM在性能上存在差距,但正在快速縮小 當前SiFive和Ventana具備一定優勢 香山處理器核進展迅速 RISC-V國際基金會已成立數據中心工作組,主要由google、阿里、Ventana和開源芯片研究院組成新態勢:RISC-V軟件生態正在加速發展 國際開源社區積極
7、投入RISC-V軟件生態 例:Debian操作系統軟件包對RISC-V的支持已超過95%RISC-V已成為Debian支持的Tier-1架構開源軟件的成功經驗l降低互聯網創新的門檻l3-5位開發人員用幾個月即可快速開發創新業務,滴滴、摩拜等l提高互聯網企業自主能力l“去IOE”(IBM/Oracle/EMC)l數據庫:華為高斯/阿里OceanBase,國際先進用戶定制代碼 90%代碼321開源芯片工程開發RTL代碼EDA工具芯片版圖指令集手冊設計文檔微架構設計lL1開源指令集lL2開源設計實現lL3開源工具和開放流程開源芯片實踐(人才+工具+IP)芯片敏捷設計云平臺開源RISC-V核“一生一芯
8、”計劃開源EDA工具鏈OpenSSD芯片開源供應鏈與系統軟件與鵬城實驗室、北京大學聯合開發與字節跳動、微核芯等企業聯合開發(二)“一生一芯”人才培養計劃我國優秀處理器芯片人才儲備嚴重不足一作國籍畢業去向ISCA十年論文第一作者統計情況(2008-2017)l85%v.s.4%:2008-2017十年體系結構國際頂級會議ISCA論文的第一作者85%在美國,僅有4%在中國,不足美國的1/20,差距巨大l中國加快處理器芯片人才培養規模與速度,迫在眉睫科教融合l把芯片設計人才培養與開源芯片生態構建結合起來l受Matlab啟發的四個觀點l把東西做出來l把東西用起來l把教學場景用起來l把持久戰意識樹立起來
9、教學:啟動“一生一芯”計劃l硅上做教學:“一生一芯”通過讓本科生設計處理器芯片并完成流片、運行操作系統,貫通本科階段計算機系統課程知識點,包括計算機組成原理、體系結構、操作系統、編譯原理等操作系統編譯原理應用軟件處理器設計“一生一芯”計劃執行情況第四期(統計至今)l1700+人報名開展預學習l覆蓋328所高校 (含國外56所)l第一批230人進入正式學習l自2019年至今已歷三期,循序漸進,逐步放大規模,保持教學質量l第四期:2022年2月20日啟動l第五期:2022年8月28日啟動首期“一生一芯”計劃讓學生帶著自己設計的處理器芯片畢業l2019年8月底,在國內首次以流片為目標,由5位2016
10、級計算機學院本科生主導完成一款64位RISC-V處理器SoC芯片設計,于12月19日完成流片l芯片成功運行Linux操作系統與國科大教學操作系統UCAS-Core金越王華強王凱帆張林雋張紫飛4個月高強度開發歷程RV64IM壓縮指令(RVC)FreeRTOS/RT-ThreadL1 cache預取Sv32-PTW發現cache設計bugTLB支持RVC的分支預測Sv39-PTW分析預取性能倒退原因M/S/U特權級原子操作(RVA)Sfence.vma分時多任務Nanos-lite添加burst讀寫支持作為L2TLB流水化xv6缺頁異常L2預取分析解決性能倒退TLB資源/時序優化補充CSR/Lin
11、ux聯調LinuxDebian11/18 22:5711/18 10:3911/21 17:3112/10 16:26Debian聯調12/13 14:2610/19 13:2110/21 18:289月10月11月12月應用OSCPUSoCRV64IM時鐘中斷BusyboxhelloGCC,QEMUloginRVC時鐘FreeRTOS/RT-ThreadSv39-PTWM/S/U缺頁異常xv6RVA補充CSRLinuxBusyboxhello11/10 13:0711/13 21:29Dummy-SD卡LinuxDebianGCC,QEMU12/08 16:2710/19 19:0809/1
12、8 01:07王華強張紫飛張林雋金越王凱帆項目分工接入SPI Flash控制器開源IP核并進行訪問和取指驗證驗證UART開源IP核驗證SDRAM控制器開源IP核驗證ETHMAC開源IP核發現SDRAM控制器64位數據讀寫bugxv6聯調xv6聯調Redis確定技術路線選擇基礎平臺搭建開發環境前期準備模擬器成果:果殼(NutShell)l110nm工藝l10mm2l200mw350MHz TypicallTQFP100封裝l單發射9級流水順序核lRV64IMAC指令集,支持M/S/U特權級l兩位飽和計數器分支預測,512項BTB,16項RASl支持Sv39分頁機制,支持硬件TLB填充l32K指令
13、/數據L1 cachel支持L1 指令/數據cache讀一致性l128K L2 cache,支持next line預取l使用Chisel語言開發l支持SDRAM、SPI flash、UART等外設l支持啟動Linux 4.18.0內核l支持運行Busybox套件l在仿真/FPGA環境下支持啟動Debian 11一款功能完整的RISC-V處理器基于國產110nm工藝完成流片首期“一生一芯”計劃取得成功l五位同學實現“帶著自己設計的處理器芯片畢業”這一目標第二期“一生一芯”計劃l11位同學l5位國科大、3位浙大、1位南大、1位西北工大、1位哈工大l2020年8月12日正式啟動l楊宇恒同學被麻省理工
14、學院(MIT)博士全獎錄取l胡博涵同學被多倫多大學錄取n報名總數:760人n 在校生是“一生一芯”的主力,共 625人,占比82%;較多已畢業學生報名n 覆蓋168所高校(含國外30所)n 國科大(72人)n 浙江大學(29人)n 電子科技大學(24人)n 華中科技大學(23人)n 東南大學(23人)n 西安電子科技大學(20人)n 南京大學(16人)n 北京大學(15人)n 第三期報名情況第三期“一生一芯”成果n 第一批流片4個SoC,包含39個處理器核n 第二批流片2個SoC,包含9個三期同學用開源EDA工具設計并投片的110nm(一生一芯)處理器核n報名總數(2.20-今):1700+人
15、n 覆蓋 328 所高校(含國外56所)n 國科大(70人)n 電子科技大學(65人)n 北京大學(34人)n 西安電子科技大學(32人)n 太原理工大學(31人)n 東南大學(29人)n 武漢大學(24人)n 華中科技大學(23人)n 中國科學技術大學(22人)n 第四期報名情況簡析大一大一3%9%14%13%研一研一25%19%4%博一博一2%1%10%保存與開放每一位學員的學習記錄一位學員在“一生一芯”學習過程的成長記錄(三)開源EDA工具2030”三步走”規劃l第一步:開源SoC用3-5年為社區提供經過流片驗證的高質量RISC-V開源核、開源SoC設計lRISC-V處理器核IP、外圍I
16、P等l第二步:用開源工具鏈構建開源SoC用5-7年逐步構建一套基于開源EDA工具鏈、開源IP、開源工藝庫的開源SoC芯片設計流程l將商業版工具、IP逐漸替換為開源版l實現本科生用全開源工具開發開源芯片,帶著自己芯片畢業l第三步:用開源工具鏈自動化構建開源硬件用10-15年開發更智能、更自動化的開源工具,提高設計驗證效率l形成開源芯片設計生態,降低芯片開發門檻n 成功經驗表明,開源開放是構建繁榮的技術生態和產業生態的必要基礎n 開源EDA工具可極大推動開源開放的芯片產業生態,降低芯片設計門檻n 開源EDA工具為開展EDA領域的基礎科學研究和人才培養,提供了很好的思路開源EDA是支撐開放芯片生態的
17、重要保障領域代表系統影響力體現操作系統Linux重要的基礎軟件,支撐了整個開源生態體系編譯器LLVM、GCC移動操作系統Android雖然現在已閉源,但當年以開源為起點,統一了除iOS外的整個移動互聯網生態人工智能Caffe、TensorFlowPytorch、PaddlePaddle整個 AI 技術生態體系的基石大數據系統Hadoop、Spark開啟了信息領域的大數據系統時代EDA 工具-基礎薄弱(Verilator,OpenRoad/OpenLane)共同特點:皆為重要的基礎性平臺,支撐各領域技術創新外,服務了巨大的產業經濟企業高校學術科研機構芯片和EDA方向的個人愛好者開源EDA系統平臺
18、科學研究人才培養EDA是芯片設計編譯器l功能設計和驗證:生成模塊級和系統級的芯片代碼并驗證功能正確性l電路設計:將RTL代碼經過邏輯設計和工藝映射成網表l版圖設計:用EDA工具將設計好功能等網表物理化成GDS版圖l芯片制造:將設計好的版圖通過光刻制造封裝形成芯片RTL代碼邏輯綜合網表物理設計制造晶圓封裝測試芯片產品module conv;reg 31:0 m0:8192;reg 12:0 pc;reg 31:0 acc;reg15:0 ir;always begin ir=mpc;if(ir15:13=3b000)pc=mir12:0;else if(ir15:13=3b010)acc=-mi
19、r12:0;.芯片版圖EDA工具全程支持芯片自動化設計和驗證工程開發體系結構設計EDA是硬件編譯器n 研究智能化和全自動化的芯片設計流程及其輔助工具,提升芯片設計效率和質量n開源智能EDA工具和流程,實現24小時無人值守的全流程芯片設計n2017年,美國DARPA啟動ERI電子復興計劃,部署IDEA和POSH(合計100M$)n由機器來學習專家知識,提供自動化和低成本的(軟件/芯片)系統構建工具“開源”“智能”的“芯片設計”預處理編 譯匯編鏈接優化開源編譯器(LLVM、GCC等)軟件設計流程gcc O3開源智能EDA平臺芯片設計流程ieda O3完備的自動化設計部分自動化尚需耗費大量人力,極度
20、依賴專家經驗開源EDA目標n 構建28nm工藝上RTL到GDS芯片設計的開源EDA平臺,支持百萬門級Block設計n 以 10%的成本(技術、時間、費用),達成 90%的芯片指標n 支持靈活定制和實現 EDA 算法,支撐 EDA 方向的算法研究和應用從低工藝(110nm),至更高工藝(55nm/28nm,甚至14nm)從小規模SoC芯片(數十萬門),到更大規模(上千萬到上億)從部分單點EDA設計工具,到完整EDA設計+驗證工具鏈從EDA工具可用,工具功能完善可靠,到工具質量和性能良好EDA平臺設計規則需求芯片設計流程工具邏輯綜合物理設計簽核分析物理驗證數據庫解析器輔助庫評估器優化器管理器基礎庫
21、開始規劃總體計劃2018.10鵬城實驗室開展開源EDA2020.4跑通Flow2020.102020.05開始跑Flow鵬城實驗室立項開源EDA課題2021.07流片110nm數十萬門CPU無其他IP2022.02完成iFlow2021.04BOSC開源IP2022.03流片110nm百萬門CPU含自研多個IP2022.082022.08首次公開報告時間線中科院先導專項資助開源EDA2019.10開源鴿到2023年流片28nm百萬門CPU含多個數字IP2022.12EDA總體設計n 目標:構建28nm工藝上RTL到GDSII芯片設計的開源EDA平臺,支持百萬門級設計描述問題,形成白皮書探索解決
22、方案,形成文檔問題拆解步驟和方法軟件架構平臺結構設計芯片設計開源EDA進展l進展:l問題分解:拆解45個工具,600余個步驟,2000多個問題;l系統平臺:已支持110nm百萬門芯片后端設計的原型系統;l工具研發:已經完成9個工具的研發,涵蓋邏輯綜合,物理設計,簽核分析,物理驗證;l流片驗證:經過2次ysyx芯片流片驗證拆解出45個工具,600個步驟,2000多個問題研發9款工具構建1個重基礎庫的系統平臺開源EDA進展流片驗證110nm工藝,70萬門芯片(5級流水線,Chiplink、UART、和SPI,外接板卡時鐘,已經回片)110nm工藝,150萬門芯片(11級流水線帶cache、UART
23、、VGA、PS/2、SPI、SDRAM等,片上兩個PLL模塊輸出時鐘,支持啟動Linux,等待回片)2022年2月2日,第1次流片2022年8月12日,第2次流片l目標:驗證工具業務拆解,系統平臺設計,和工具功能研發的功能和性能l進展:完成3次流片,2次110nm,1次28nm2022年12月21日,第3次流片28nm工藝,150萬門芯片(11級流水線帶cache、UART、VGA、PS/2、SPI、SDRAM等,片上兩個PLL模塊輸出時鐘,支持啟動Linux)n 全鏈條支撐n 開源EDA設計流程+開源IP+開源工藝庫和pdkn 流程支撐n SoC模板+SoC集成方法+流片渠道+網站和在線設計
24、“一生一芯”支撐SoC松散集成芯片(四)高性能開源RISC-V處理器核IP香山:開源高性能RISC-V處理器l建立一個像Linux那樣的開源RISC-V核主線,既能被工業界廣泛應用,又能支持學術界試驗創新想法敏捷開發流程與工具新特性提出設計/實現文檔RTL實現功能驗證性能驗證物理設計驗證測試生成參考實現結果對比基礎架構設計語言出錯現場復現出錯現場分析測試生成仿真平臺仿真加速器平臺(WIP)FPGA平臺性能數據分析XiangShan開源硬件平臺Chisel敏捷設計語言Transforms代碼轉換工具TL-C總線請求生成器NEMU指令集模擬器nexus-am簡易運行時環境Difftest差分驗證框
25、架SMP-Diff多核驗證框架LightSSS仿真進程快照Waveform Terminator波形解析工具Golden Mem多核內存模型LogViewer日志可視化工具TL-C Agent總線/緩存標準行為模型TL-C Scoreboard總線行為/數據檢查框架GCPT全系統狀態檢查點KFDB性能建模與分析工具NEMU-Functional快速結構預熱方法(WIP)BetaPoint程序特征采樣方法(WIP)自動化持續集成測試完成后進入主線具有國際先進性的芯片敏捷設計方法l提出面向對象體系結構、基于規則的敏捷驗證框架、輕量級仿真快照、敏捷性能評估等多項創新技術,在國際上形成獨特優勢(國際頂
26、會MICRO-2022接收)兩代香山架構設計l第一代:雁棲湖架構l2020年6月:代碼倉庫建立l2021年7月:流片l頻率:1.26GHz28nml性能:SPEC CPU2006 7分/GHzl第二代:南湖架構l2021年5月:開始RTL實現工作l2021年12月:功能確定,時序優化階段l2023年Q1:計劃流片l預期頻率:2GHz14nml預期性能:SPEC CPU2006 20 分l2022年已交付2家企業用于產品開發中第三代香山“昆明湖架構”聯合研發l 在北京市與中科院支持下,由18家企業聯合發起北京開源芯片研究院,進行“香山”處理器核的產品化改造和后續架構研發18家發起單位2021年1
27、2月6日成立攻堅昆明湖架構聯合研發啟動 已設立包括性能模擬器、向量擴展、驗證、全定制開發等多個工作組 與企業技術合作進展順利,項目例會約有100位工程師積極參與 目前在指令預取、向量功能部件、Cache重構、前后端協同優化上取得進展第三代香山“昆明湖架構”聯合研發第三代香山(昆明湖)規劃功能目標指令:V8/V9/SVE/SIMD/加密微結構:前端/后端/Memory/Cache(50分)架構(SoC):多核DSU(DynamicIQ/SCU/L3 Cache)總線接口(AXI/ACE/CHI)多核片上網絡(CMN-700)功耗管理(時鐘域、電源域、休眠模式)調試診斷:調試/診斷/性能計數器虛擬
28、化:Hypervisor特權級/TrustZone/GIC/通用定時器高可靠:RAS(Reliability/Availability/Serviceability)對標ARM最新數據中心處理器核Neoverse N2 為企業提供處理器核敏捷開發基礎設施技術目標對標ARM Neoverse N2處理器核(5nm)3GHz以上,15分/GHz,總分45分目前Intel60分;ARM50分;香山20分7nm/5nm/3nm等先進工藝處理器生態構建的新趨勢(五)總 結開源PC設計,催生新產業l1981年8月12日,IBM推出PC,公開了設計文檔,包括源代碼、電路圖,成就繁榮的PC市場開源軟件推動中國新興產業發展l云計算、移動互聯網、大數據、人工智能、區塊鏈等新興產業的核心技術均得益于開源軟件價值數百億美元的開源軟件生態降低了開發門檻,有利于人才培養,促進中國新興產業進入世界領先行列大數據云計算人工智能移動互聯網區塊鏈價值數百億美元的開源軟件生態開源芯片,賦能新產業開源芯片,普惠世界 開源芯片是構建全球芯片共同體,解決全球科技供應鏈安全和實現科技普惠世界的有效途徑敬請批評指正!