《GPU 加速工程設計與仿真.pdf》由會員分享,可在線閱讀,更多相關《GPU 加速工程設計與仿真.pdf(41頁珍藏版)》請在三個皮匠報告上搜索。
1、GPUGTCTECHNOLOGYCONFERENCEGTC中國線上大會GPU助力工程設計與仿真丁海強首席技術官Ansys中國2020年12月Ansys#page#當今技術變革的速度是前所未有的,并且還在不斷加速19762019數碼相機10000分辯率0.01兆像素1000減重2kg1000x價格降低$10.0001960年代2019ICBM慣導系統陀螺儀手機陀螺儀:25kg33$50 millionAnsys2020ANSY,Inc./Confdential#page#產品設計部門面臨著越來越大的壓力30%SPL產品研發面臨的最大挑戰上市時間產品復雜度更高40%運行環境復雜多變36%2年36%
2、設計周期開發資源受限更難產生競爭差異31%66%21%對設計失敗的容忍度更低新品數量Source:E,TheAberdeAnsys2020ANSYS,Inc./Confidentia#page#仿真為您提供解開問題的鑰匙Ansys#page#基于CAE仿真的產品設計流程仿真是一種科學計算,通過數值算法,利用計算機強大的計算能力,在電腦中進行物理量(結構、流體、電磁、熱)計算,從而預測產品的性能。以汽車碰撞安全性設計為例,利用仿真進行產品設計時的流程為:優化設計概念設計(輪廊設計)詳細設計(圖紙設計)CAE仿真分析Aan試驗驗證批量生產樣件試制沒有仿真,就需要建立原型,進行試驗,依據試驗結果和經
3、驗不斷修改產品。所以仿真分析的價值是:降低研發成本縮短研發時間提高可靠性增強市場競爭力洞察設計核心提高設計水平Ansys2020ANSYS,Inc./Confiidential#page#工程仿真的基本過程與效率提升計算:物理量數值計算后處理:展示計算結果前處理:網格生成將網格上的物理解合成為整體結果通過網格部分,將模型劃分成在每一個網格上求解物理方程需要快速處理可能多達數十億網格很多小塊(網格)得到數值結果的數據實際工程問題的網格數可能多提供豐富的三維動畫/圖片幫助工達數十億程師分析設計的問題CAD模型Z.WznM2M+成Z.5成z.w-M2采用包括GPU在內的并行計算技術,可以顯著提高仿真
4、速度和問題計算的規模Ansys2020ANSYS,Inc./Confdentia#page#過去50年仿真技術的發展仿真早已確立自己作為理論和實驗并行的第三大科學支柱并且成為工程設計的主要手段基于先進的仿真技術很有局限的技術進行產品開發用于驗證用于生產和運營(數字李生)Ansys2020ANSYS,Inc./Confidentia#page#/Ansys仿真工具與平臺為工程設計提供有力支撐結構流體電磁半導體光學3D設計軟件系統材料平臺Ansys2020ANSYS,Inc./Confidentia#page#仿真無處不在,覆蓋所有產品并貫穿全生命周期概念和創意階段80%的成本在設計早期階段即已確
5、定更早進行仿真能夠有效降低成本,驗證創意的可行性設計與分析階段對設計參數進行更廣泛的探索和優化,提高產品性能米將研發時間縮短9倍,質保成本降低89%NOL海生產與制造階段通過魯棒性仿真研究加工和材料偏差對良率的影響通過拓撲優化和增材制造將部件重量減輕25%OPERATONS運營與維護階段考慮產品實際運行環境和極端條件,確保產品質量和可靠性在提高性能的同時將維護成本降低10-20%Ansys2020ANSYS,Inc./Confidentia#page#仿真應用不斷深入,創造更大的工程價值系統工程集成化仿真與系統優化多物理域分析設計探索支持定義設計準則對設計全局的敏感性分析單目標/多目標優化設計
6、工程價值產品部件的設計驗證滿足設計要求虛擬驗證單個部件分析理解工作原理/為什么失效應用程度和應用領域Ansys2020ANSYS,Inc./Confidentia#page#基于GPU加速的實時仿真在設計早期進行方案篩選Ansys#page#/DiscoveryLive用于設計師的快速實時仿真工具幫助設計師進行快速方案驗證與CAD軟件緊密集成全模板化操作,非常容易學習-在進行仿真驗證之前發現問題,在設計早期進行方案篩選,瞬間完成仿真與后處理-基于GPU進行大規模并行計算,實時獲得仿真結果,無需等待-無需幾何清理、無需網格劃分推動設計探索和產品創新-快速驗證設計概念和創意,修改設計參數h.3.5
7、3-降低專業CAE的工作負擔,提高整個設計團隊的效率仿真時間比思考的時間還短!NVIDIA.Ansys2020ANSY,Inc./Confdential#page#ANSYSDiscovery建模、求解與后處理的無縫集成在統一的界面下完成仿真全SpaceClaim直接建模工具過程-建模/模型導入-求解設置直觀的指頭顯示,-后處理沉愛式建模多種物理場求解,-與經典工具Fluent,Mechanical及同一操作界面Maxwell相連接多種結果,同個后處理界面-腳本編程與仿真模板擴展實時自動更新仿真結果-支持云計算多個物理場求解精度與速度設置Tnsys2020ANSy,Inc./Confdenta
8、l#page#/Discovery:一個界面,多個物理場33仿真模板選擇結構、,內流場、外流場、熱、電磁場仿真自動后處理與Ansys經典工具鏈接云圖、流線圖、場圖結果曲線與數表SCDM直接概念建模求解設置導入模型簡化處理材料特性,載荷、邊界條件,精度Ansys2020ANSYS,Inc./Confidential#page#從DiscoveryLive開啟工程設計之旅設計探索結果分析模型建立模型簡化處理快速探索設計空間添加更多后處理結果求解區域建立實時交互設計從多種角度深入分析設計清理細小孔縫與接觸測試/調試仿真設置提高求解精度,確認設計結果建立參數化模型,研究更好地洞察設計核心what if
9、模型傳遞到經典工具中仿真Ansys2020ANSYS,Inc./Confiidentia#page#/DiscoveryLive和經典CAE仿真應用于不同的設計階段詳細設計驗證最終驗證設計探索Designer:Designer:Analyst:關注問題如何實現,是否可行能否正常工作參數選擇,技術指標主要特點初始設計和概念設計設計選代/優化,通過與否實際工作狀態下的特性廣泛而開放的設計空間復雜的部件和系統整體求解空間若干設計方案方向與趨勢正確高保真度高精度/復雜環境精度要求DiscoveryDiscovery LiveAIMDiscovery SpaceClaimAnsys2020ANSYS,I
10、nc./Confidentia#page#DiscoveryLive:提高團隊效率沒有DiscoveryLive等待結果等待結果設計設計修改定型結構處理CAE仿真仿真等待吉果結構處都分雙料等待求解結果 Discovery LiveDiscovery Live后處理設計設計設計定型仿真CAE驗證 Ansys2020ANSYS,Inc./Confiidential#page#求解速度的進一步提升通過優化矩陣求解算法,實現和GPU的更好匹配,提高求解速度,特別是瞬態物理場的求解速度2020R22020R1提速65%的公園Ansys2020ANSYS,Inc./Confidentia#page#GPU
11、加速高精度、多物理場仿真快速實現參數優化Ansys#page#GPU和并行計算技術助力仿真應用更大的規模將仿真分布到多臺計算機上并行計算,擴大求解規模,解決復雜問題,降低設計風險更快的速度采用并行計算技術加快求解進程,快速獲得仿真結果,提高設計效率更高的保真度采用真實模型,進行更廣泛的優化和設計空間探索,實現高性能、高可靠、穩健性設計Ansys2020ANSYS,Inc./Confidentia#page#2019-2020并行計算技術的演進和GPU加速FDTD并行計算和GPU光學軟件SpeosGPU并行計算2017-2018結構、流體、熱實時仿真技術2014-20162020云部署和GPU并
12、行計算更多算法支持并行計算電磁場多算法混合計算2016-2017流體3萬核以上并行計算技術瞬態電磁場GPU加速2012-2013DMP并行,多GPU支持任意陣列蒙版,合成激勵求解2010-2011混合算法并行計算,有限大陣列求解3072核并行計算2009從2010年開始,引入2048核支持,萬億次浮點運算性能20102007-2008GPU加速計算技術域分解技術,GPU求解支持首個億級單元流體仿真電磁場和結構井行網格劑分2005-2006流體并行網格劑分,支持WindowsHPC2005-2007分布式稀疏求解器,分布式PCG求解2001-2003分布式求解(DSO)HFSS10并行動態移動/
13、變形網格,分布式內存1998-199920002004第一個求解100M結構自由度問題集成化負載均衡管理Linux集群10M單元流體模擬,128個處理器1999-20001994-199564位求解器技術,共享內存多處理器并行動態網格細化,動態負載平衡19941993大型結構分析中引入送代PCG求解首個通用并行計算流體力學軟件1001990多結構模擬的共享內存Ansys1980s大型機上的向量處理2020ANsYSnc./Confidental#page#/Ansys全線產品均支持并行計算和GPU加速并行計算財HPC Job多參數仿真分析與優化SchedulerMPI- NUMAFluentM
14、echanical區域分解&Distrib.Mem.ClusterMulticore/多任務并行仿真MultithreadIntra-Core/GPU并行加速GPULumerical FDTDLS-DynaHFSS/SI-WaveAnsys232020ANsYSnc./Confidental#page#GPU計算的不同方式GPU具有較大的帶寬和計算吞吐量不同的求解器,采用不同的工作方式“offload”模式進行并行計算-Ansys旗艦產品,包括Mechanical,Fluent,HFSS,MaxwellDRAM適合于計算規模較大的問題線性矩陣求解等問題采用GPU具有較高的計算效率GPU輻射散熱
15、問題GPU并行效率較高Control本地GPU求解模式ALUALUAnsys光學仿真工具SPEOS,DiscoveryLive求解器ALUALU-HFSS的彈跳射線法求解器完全運行在GPU上,進行實時電磁仿真Cache光電子仿真工具Lumerical的FDTD也非常適合于GPU并行計算DRAMCPUAnsys2020ANSYSnc./Confidental#page#/AnsysMechanical結構有限元分析(FEA)仿真工具Ansys旗艦產品,廣泛用于結構、熱、聲學等仿真適合各種應用,從線性靜態到涉及非線性材料的復雜瞬態仿真,友好的圖形界面,樹形構架內置拓撲優化功能,找到最佳幾何形狀,有
16、效滿足設計目標Workbench工作環境,建模和模型處理、網格部分、求解、后處理的集成化和一體化強大的雙向數據連接功能,與Ansys工具電磁、流體和系統工具進行雙向數據傳遞Ansys25#page#/AnsysLS-Dyna顯式動力學分析軟件功能最強大的顯式動力學工具能夠針對在極短時間內承受較大載荷的部件/裝配體進行仿真用途包括:汽車碰撞測試、運動碰撞、金屬卷邊等集成到AnsysMechanical中,基于Workbench進行定制,提供易于使用的界面進行前處理和后處理LS-Dyna已經被Ansys收購Ansys262020ANSYS#page#結構仿真工具的GPU加速運行環境NVIDIAGP
17、U(Tesla系列和高端的Quadro系列)。Windows和Linux操作系統支持單個或多個GPU并行Performance w/ 16 CPU cores3.3結構仿真求解器Relative Speedup稀疏矩陣(真接法)和PCG(送代法)矩陣求解器均支持GPU并行包括模態求解器2.0對GPU支持的廣度是業內獨一無二的同時支持分布式和共享內存方式的并行計算1.0采用offload模式(CPU仍然參與計算)在線性問題求解中,若干關鍵計算通過Offload方式分配到GPU上實現加速計算OGPU1GPU2GPUTotal Simulation Time SpeedupAnsys#page#NV
18、IDIA-GPU與Ansys結構仿真軟件的匹配GPU主要提高矩陣求解的速度較大規模的問題,矩陣求解時間長,能夠利用GPU獲取更好的加速效果模型自由度大于50萬以上時,加速性能更好結構仿真采用DMP方式運行比SMP方式具有更好的性能GPU和系統性能對結構軟件的加速性能有重要影響較大規模的高階有限元模型加速效果更好如果模型的自由度(DOF)超過500萬,推薦使用單個GPU加12G內存(QuadroRTX6000/8000GV100,P100)Ansys28#page#/AnsysMaxwell低頻電磁場有限元仿真工具電機、變壓器、傳感器、永磁體等機電設備與部件的電磁場仿真Maxwell求解器:支持
19、剛體運動的瞬態電磁仿真交流電磁仿真靜磁場仿真靜電場仿真直流傳導仿真瞬態電場仿真Simplorer(電路和系統仿真)AnsysMechanical和AnsysCFD的多物理場耦合內嵌設計工具:RMxprt-電機設計工具PExprt-電感器與變壓器設計工具Ansys292020ANSYSConfidecntial#page#/AnsysHFSS業界領先的高頻電磁場仿真工具高速和高頻應用領域的黃金工具能夠求解射頻和微波設計的各種應用問題(例如天線),對高速PCB和IC封裝的信號完整性和電源完整性進行分析HFSS求解器:頻域。時域積分方程電路與系統基于區域分解法的并行計算技術,在陣列天線設計仿真方面有
20、絕對領先的技術優勢多算法混合:有限元/積分/彈跳射線/物理光學,場路協同仿真。AnsysMechanical和AnsysIcepak的多物理場耦合nsys30ANSYS1ia#page#GPU加速HFSS和Maxwell電磁場仿真電磁場有限元算法高性能64位線性稀疏矩陣求解器高效率的區域分解法并行計算技術實現超HFSSMaxwell線性的加速比有限大陣列天線求解可獲得較好的并行提速效果有限元可同時利用多種并行技術,包括SMPDMP求解器和GPU進行加速求解SpeedupQ3D其他電磁場算法Siwave-HFSS時域有限元DGTD求解器-SBR+彈跳射線法求解器Ansys31#page#/Ans
21、ysHFSS和Maxwell電磁場仿真:GPU提速效果Maxwell采用GPU求解和8核CPU求解時的速度對比HFSS瞬態電磁場總求解時間對比9.008 CPU Cores8.00口XeonE5-2687W+1P1007.00Tesla K406.00Quadro GP1008 CPU Cores500+1K804.003.001.2.008 CPU Cores1.000.0000.20.40.60.81.21.4口8 CPU Cores8 CPU Cores8 CPU Cores+1K80+1P100Ansys322020ANSYS.Inc./Confidentiial#page#NVIDI
22、A GPU與Ansys HFSS & Maxwell的匹配GPU可以加速HFSS和Maxwell的直接法矩陣求解一般地,200萬以上自由度的問題會獲的較好的加速效果如果檢測到加速效果不好,則自動切換到CPU求解GPU加速HFSS時域瞬態混合算法求解器GPU對瞬態混合算法求解器的加速效果明顯優于隱式算法網格比較均勻,頻率比較高的問題加速效果最好一般地,14萬自由度以上的問題會獲得比較好的加速效果如果軟件檢測到HFSS瞬態求解混合算法的加速效果不好(加速比小于1),則自動切換到CPU求解7Ansys2020ANSYSnc./Confidental#page#/AnsysCFD通用計算流體動力學工具
23、流體動力學仿真的行業標桿工具由Fluent和CFX構成Fluent:通用計算流體動力學仿真經過廣泛充分驗證功能強大,應用廣泛,為最廣泛的CFD和多物理場應用提供了快速、準確的結果CP6高題份置,捷高速度的同時降低仍真“的簡箱許算機?成本行計算效率高,Fluent能夠使用創紀錄的超過17.2萬個內核進計算用了新的網格部分技術,新的漏流模型大大提開了Fluent求解的速度寫便捷性CFX:適合于渦輪機械和通用流體仿真及流固耦合仿真穩定地提供可靠而準確的求解結果,滿足各種CFD和多物場應用的要求憑借出色的準確性,魯棒性和高速度,AnSR援輪機械領或備受認奇,例如泵、風機、燃氣和水力渦輪Ansys3A5
24、202011a#page#Ansys流體動力學計算軟件FluentGPU加速仿真AMG代數多重網格求解器DO輻射散熱求解器線性求解,GPUOffload模式CPU/GPU混合計算28核CPU+4GPUs求解與32核CPU相比輻射散熱仿真具有較高的并行效率可實現4X提速1400萬網格問題,28CPU核+4GPUS求解與32核CPU求解,可實現3X提速ys Fluent (Bocing Landing Gearl PerforAMG求解器ys Fluent (Headlamp DO Radiation Pernancon CPUand GPUSystemson CPU and GPU System
25、DO求解器CPCAnsys352020ANSYS,Inc./Confidentia#page#NVIDIA-GPU與AnsysFluent的匹配GPU加速CFD分析中AMG矩陣的速度AMG求解時間占比較高的問題加速效果更好基于壓力的耦合求解器AMG的占比較高,大約在60%到70%,因此,一般提速效果較為明顯精細的網格和低耗散問題具AMG求解占比較高求解問題必須和GPU相匹配才能獲得較好的加速效果壓力基耦合求解器,每100萬網格大約需要4GB的GPU內存高超音速瑞流問題經常是高耗散的,因此,并行效果不易提升采用內存較大的GPU,如TeslaV100,QuadroRTX6000/8000GV100
26、可以獲得理想效果與GPU協同并行求解時使用較少的CPU核可以獲得更高的并行提速推薦每個GPU配合3到4個CPU核Ansys2020ANSYSnc./Confidental#page#GPU加速魯棒性設計與設計空間探索汽車雷達魯棒性設計案例InfineonPCB多學科優化設計空間探索針對三種不同的設計方案進行可靠性分析,得到方案3的可靠包含結構形變和散熱性能仿真性最高;目標:結構應力和變形最小,流體壓損和散熱器熱阻最小利用MOP快速完成幾千個設計點計算,大大提升計算速度獲得最優解區域,各目標之間的相關性Siuat12個設計參數:散熱片數量、厚度、風扇位置、流速等Method:Adaptive S
27、ampling(AS)Safe domainUnsafedomaiAnsys2020ANSYS,Inc./Confiidentia#page#人工智能-機器學習-深度學習MOP技術采用機器學習的框架35ALHSWinner lsSamplingTest Dat.MOPIFeatureMachine Learningextractionlculateforecast一還!TestingRun differentClassificationDeep LearningmetamodelsAnsys382020ANSYS,Inc./Confiidentia#page#深度學習應用案例一渦輪葉盤結構基于幾何變量、質量、剛度、壓損和壽命進行分析。在機器學習框架下進行深度學習6parameters(optimal subspace)3 layer/ 7 neuronsinsys2020ANSYS.inc./Confidentia#page#GPUGTCTECHNOLOGYCONFERENCEGTC中國線上大會謝謝驗聽/nsySANSYS-ChinaANSYS中國