《2018年阿里云高性能計算在制造業的應用.pdf》由會員分享,可在線閱讀,更多相關《2018年阿里云高性能計算在制造業的應用.pdf(26頁珍藏版)》請在三個皮匠報告上搜索。
1、阿里云高性能計算在制造業的應用智能制造專場背景HPC方案相關產品解析EDA場景10 PFlops10 PFlops1 PFlops1 PFlops100 TFlops100 TFlops10 TFlops10 TFlops1 TFlops1 TFlops100 GFlops100 GFlops10 GFlops10 GFlops1 GFlops1 GFlops100 MFlops100 MFlops100 PFlops100 PFlops10 EFlops10 EFlops1 EFlops1 EFlops100 EFlops100 EFlops1993199320172017199919992
2、005200520112011202320231 ZFlops1 ZFlops20292029天氣預報天氣預報醫療圖像醫療圖像基因研究基因研究預測預測HPC 20年:云計算推動HPC進入普惠時代2015:2015:云計算落地云計算落地2010:2010:國家超算中心國家超算中心2005:2005:集群普及集群普及2000:2000:集群出現集群出現1995:MPP1995:MPP大型機大型機客戶聲音:HPCaaS的挑戰云超算 vs.超算云?1.1.流場問題基于有限單元求解器流場問題基于有限單元求解器2.2.把物理模型按區域劃分為把物理模型按區域劃分為MPIMPI計算模塊計算模塊3.3.計算與低
3、延遲計算與低延遲MPIMPI同步通信保證并行效率和加速比同步通信保證并行效率和加速比典型典型HPCHPC應用的建模和并行實現應用的建模和并行實現主節點主節點+登陸節點登陸節點 任務調度任務調度 集群監控集群監控 集群報告集群報告 用戶賬戶管理用戶賬戶管理 預處理預處理+后處理應用后處理應用 NFSNFS導出到計算節點的外掛存儲導出到計算節點的外掛存儲計算節點計算節點 2 2路,路,4 4路,刀片路,刀片 GPUGPUXeon Phi Xeon Phi 加速卡加速卡 單路單路KNLKNL高密度節點高密度節點集群網絡集群網絡 TCPTCPRDMARDMAIBIB 管理,計算,存儲三套網絡管理,計算
4、,存儲三套網絡集群存儲集群存儲 NFSNFS 分布式并行文件系統分布式并行文件系統 LustreLustreGPFS/GPFS/PanasasPanasas典型典型HPCHPC集群集群的的架構組成架構組成ECS彈性裸金屬服務器,SCC+GPUIB vs.RoCEVPCNAS or.Lustre超算&AI系統軟件架構應用性能特征要求:HPC/AI/Bigdata?對外服務框架虛擬化2.0自動運維&伸縮EHPC PAASAI framework云平臺云平臺軟件軟件硬件硬件云超算技術、產品、方案E E-HPCHPC作為阿里云產品家族新成員作為阿里云產品家族新成員ConsoleCLIUsers Int
5、erface自建自建HPCHPCE E-HPCHPCFrom 0 to 1SDK管控平面API Gatewaybackend controlAgent control clusterMessage MiddlewareBackend DB部署,管控,任務調度服務平面HPC Parallel Apps.ApplicationsSaaSRMSimulationWorkflowBatch computeData visualizationAgentDomain ID serverAgentHPC Job schedulerRuntimeDeveloper ToolchainPerformance w
6、izardMPI/MKL/CUDA libs.IaaS layerSCCDBECSNAS parallel storageEGSOpen Source,In-house code,ISVs AppsApplicationsCompiler,Vtune,MPI,S/WDeveloper ToolsJob SchedulerSLURM,PBS Pro,PlatformOpenMPI,MPI,etc)Middle WareIB,ROCE,20GbEInterconnectCPU,GPU,FPGA,etc.Compute NodesResource manager,OSClients OSOpenHP
7、C CommunityE-HPC集成HPC技術棧E-HPC豐富軟件生態E-HPC管理功能作業創建作業創建作業提交作業提交作業執行作業執行結果下載結果下載作業控制臺作業控制臺用戶權限管理用戶權限管理商業商業LicenseLicense管理管理集群創建集群創建競價型實例競價型實例SCCSCC實例實例LustreLustre存儲存儲性能監控性能監控彈性伸縮彈性伸縮消息通知消息通知監控大盤監控大盤作業狀態監控作業狀態監控作業輸入輸出管理作業輸入輸出管理作業信息入庫作業信息入庫HPCHPC作業工作流作業工作流可視化工作流編排和發布管理基于應用負荷特征的自動伸縮AutoscaleCPU:MEM=1:8CP
8、U:MEM=1:7.5IDC/BGP/大規模自動化運維計算虛擬化/ECS/EGS網絡虛擬化+SCC 50Gb ROCE存儲虛擬化/NAS超級計算集群SCCGN5機型 76.4TFLOPSSSDGPU計算型GN5高主頻SCCH5機型彈性裸金屬(神龍)ebmg5SSDNvidia P100*8CPU:MEM=1:6CPU:MEM=1:4(8)NvidiaP100*8P100*8SSDSSDSkylakePlatinumSSDSSDE-HPC計算節點推薦配置彈性裸金屬服務器(神龍)虛擬機的外表物理機的心臟神龍云服務器彈性裸金屬服務器(神龍)特點既不是物理機也不是虛擬機,而是一個新物種神龍云主機支持和
9、所有云產品互聯互通任意ISA(x86,ARM)秒級交付(虛擬機鏡像啟動)+VNC遠程桌面體驗支持掛載云盤支持VPC/SLB網絡支持故障無縫遷移支持和ECS 實例無縫變配全自動運維虛擬機體驗物理機的特性物理CPU/內存體驗支持再次虛擬化(Powered by 阿里云 虛擬化2.0技術)支持和虛擬機同樣的IO接口功能分類功能彈性裸金屬服務器傳統物理機計算/內存無性能損失YY存儲完全兼容ECS云盤系統YN云盤啟動/系統盤快速重置YN復用ECS VM鏡像系統YN物理機和虛擬機之間相互冷遷移YN快速系統裝機YN免本地RAID,提供更高云盤數據保護YN網絡完全兼容ECS VPC網絡YY完全兼容ECS 經典
10、網絡YY物理機集群和虛擬機集群間VPC通信無需有性能瓶頸的集中式vxlan gatewayYN/Y管控完全兼容ECS現有管控系統YNVNC等用戶體驗和虛擬機保持一致YNBMC網絡安全性隔離,無需外部網絡功能假設無需暴露BMC網絡N彈性裸金屬服務器(神龍)特點EDA行業共建云場景解析阿里云自研網關設備阿里云NAS/CPFS共享文件存儲摩爾+阿里云共建EDA行業云阿里云自研虛擬交換機阿里云自研虛擬交換機客戶企業用戶科研用戶個人用戶彈性裸金屬(神龍)ebmg5實例組成HPC simulation集群CAD/3D處理集群阿里云EGS實例管理調度服務器/License服務器高速通道VPN連接云上HPC實戰篇 基于阿里云HPC的IT架構x云上HPC實戰篇 混合(阿里)云實例x云上HPC實戰篇 EDA研發環境x分論壇名稱BACKUP