1、企業上云最佳實踐分享工業富聯工程技術服務中心總監 毛艷清01020304云平臺現況目錄云平臺建設及上云策略案例分享上云趨勢云平臺建設概況:持續建設的高可用云平臺持續成長 四地五中心 高可用異地災備未來新增七地30K+vCore 83T RAM 3400T 存儲資源 服務可靠性云服務SLA 99.95%數據服務SLA 9個9云原生開發支持彈性伸縮AS服務微服務框架 容器編排服務云哨監控、存儲加密一站式服務門戶客戶主賬號自助管理,分鐘級自助開立新資源自動計費管理及標準CAM體系全新用戶中心多維度管理云平臺星級產品裸金屬物理高性能服務器大顯存 GPU 云服務器分布式容器云-工業云一體機數字化能力培訓
2、發布5大類30+課程觀看次數20W+云技術文檔中心Fii Cloud一站式云服務平臺服務集團80個單位部署500+系統應用云原生技術與服務運營能力擴展能力技術社區資源增長以 FiiCloud 為底座的云場景解決方案已得到了廣泛的應用和認證以云底座為支撐,為工廠的精益改善和可持續性改造提供快速、低成本的啟動路徑設備利用效率生產周期生產成本生產靈活度人員作業效率排產結果優化敏捷響應突發狀況PaaS平臺底座工業數據中臺(數據管理、建模、分析)企業DashboardSaaS服務開發工業應用低代碼開發平臺(SDK,流程引擎,規則引擎)邊緣云IaaS層工業PaaS層工業SaaS層裸金屬服務器微服務、中間件
3、、應用商店、知識庫服務組件、運維組件、應用組件數據分析建??焖俨渴饍x表盤供應鏈管理排產APS雙碳平臺生產智造管理應用安全管理應用質量管理應用決策中心運維部署人員內部及外部開發人員業務部門FiiCloud 云底座FiiCloud 2.0 邊緣云設備管理數據服務能源管理AndonWMSCorePro ServerCorePro ProxyCorePro AgentCorePro物聯網平臺FiiCloud 2.0 桌面云云原生組件基于云的場景解決方案企業云平臺建設要點云網融合云平臺 彈性、敏捷、穩定、區域協同架構標準高可用虛擬機遷移網絡適配多區域云平臺管理平臺與租戶隔離云平臺與集團網絡融合架構冗余高
4、可用集群雙活云中心多級云容災資源豐富高自動化體系開放高性能資源高性價比資源高擴展資源高安全資源應用自動編排資源彈性擴展自助式服務開源生態與兼容標準 API可定制開發大二層高性能交換矩陣分布式存儲資源池安全虛擬化資源池應對業務快速變化應用界面業務邏輯應用數據中間件數據庫應用系統A應用界面業務邏輯應用數據中間件數據庫應用系統B應用界面業務邏輯應用數據中間件數據庫應用系統計算虛擬化存儲虛擬化虛擬化應用界面業務邏輯應用數據應用系統A應用界面業務邏輯應用數據應用系統B應用界面業務邏輯應用數據應用系統計算資源池IaaS應用界面業務邏輯應用數據中間件數據庫操作系統網絡存儲服務器應用界面業務邏輯應用數據中間件
5、數據庫操作系統網絡存儲服務器應用系統A應用系統B網絡資源池存儲資源池安全資源池PaaS業務組件技術組件DevOps交付環境布署運行傳統系統建設模式基于虛擬化的建設模式基于“平臺+應用”的應用建設模式-采用“平臺+應用”的建設模式,充分利用云平臺提供的服務能力,減少重復建設,提高應用建設質量和效率-通過平臺支撐和管控,以“一切系統皆上云、一切開發上平臺”為目標,敏捷響應業務需求企業云平臺建設模式集團級分布式云架構公有云深圳中心云架構優勢:資源分時共享,跨中心實現資源彈性,降低用云成本 互相容災,降低容災成本 中心云提供邊緣云不具備的云產品,輔助邊緣云廠區創新邊緣云建設成本低,建設周期短鄭州中心云
6、周口邊緣云太原邊緣云xx邊緣云贛州中心云上云策略統籌全局,分步上云先從易于快速遷移的云服務器入手,再到云數據庫、分布式數據庫,最后將所有基礎設施云化部署。從簡單到復雜先從外圍系統著手,做系統改造或重構后上云,然后選擇一般性的業務上云,最后選擇核心業務系統上云。從外圍到核心訪問流量有突發變化或對數據融合處理有較高要求的系統,上云后能夠帶來明顯的效益提升,可優先上云。從彈性大的業務入手遷移上云流程示意業務架構評估方案設計方案評審1.系統架構2.流量特點3.數據特點4.網絡環境服務分層耦合依賴數據:UPV/TPS/QPS周期特點峰值情況數據體量讀寫頻率結構化、非結構化服務發現策略安全組配置流控策略防
7、火墻配置等1.POC測試2.性能壓測3.輸出checklist產品能滿足需求性能能達標功能驗證性能驗證評審合規性審計風險審計應急審計1.資源評估2.遷移方案設計3.網絡和時長單例性能增量buff停服方案流量切割方案回滾方案專線/公網/VPN專線帶寬停機時長評估遷移準備優化測試驗證1.連通測試2.遷移演練內網、外網安全策略封板停服回滾流量切割環境部署把握停服時長數據遷移文件遷移應用遷移大數據遷移遷移執行1.DNS切換2.數據庫切換長尾效應處理緩存讀寫流量專線壓力3.全功能驗證業務API驗證內部調用鏈驗證聯調測試驗證校驗/割接推薦配置【vCPU:內存】通用均衡型:1:4場景:建站、應用服務計算密集
8、型:1:2 or 1:1場景:科學計算、視頻編碼、代碼編譯內存優化型:1:8 及以上場景:數據庫、緩存服務、大數據分析12.6%改善對策建立CPU超分資源池,根據實際CPU和內存使用情況,動態調整資源池比例原因分析制造業企業的使用場景遷移上云用戶的使用習慣成效成效顯著,計算資源利用率提升12.6%實際使用情況【vCPU:內存】整體云平臺資源:1:4大部分用戶:1:2導致結果:CPU使用較多、內存大量剩余的情況計算資源利用率提升案例云GPU釋放云的價值項目背景 傳統GPU物理服務器采買周期長,響應需求速度慢。數據分散不易獲取且不安全,維護成本高。該客戶希望通過云GPU解決方案,構建敏捷交付體系,
9、實現降本增效和數據安全防護,支撐數字化轉型。技術方案 每臺CVM搭載GPU卡,提供一站式License 授權服務,滿足客戶需求。利用云端存儲對數據統一集中管理。結合云平臺負載均衡功能,實現GPU業務的高可用。通過云平臺實現GPU CVM的全生命周期管理。亮點效益增效:自助開通云GPU資源,GPU服務上線時間從三個月縮短到分鐘級,實現了敏捷交付。彈性:數據實現云端存儲,計算和存儲支持彈性擴容。安全穩定:數據 100%集中管理,可管可控;云平臺支撐業務的連續性和穩定性。降本:云數據存儲費用相較本地節約了 6 倍,同時降低了人工和維護成本。使用場景工業設計三維建模圖形渲染Unigraphics NX
10、SolidWorksAutoCADJMP用戶終端云GPU+云存儲FiiCloud生產線海量非結構化數據存儲場景特點:產線24小時不停大圖片持續讀寫,I/O吞吐量/帶寬大,穩定性要求高。初期幾條產線,未來會更多,存儲需求可能會到幾十PB,需要在線擴容,一定不能影響業務。圖片保存6個月,期間隨時追溯查看,到期自動刪除。海量數量下對存儲成本有更高要求。方案價值:支持上百GBps帶寬,存儲不同容量水位下性能均穩定不降低。存儲資源按需擴容,最小一臺起,集群最大容量可以到EB級,不用擔心分集群帶來管理復雜問題。數據管理方便,生命周期自動刪除和下沉,提高集群支持的業務范圍。高密度存儲節點,TCO降低20%以
11、上。HTTP/HTTPS接口:COS、S3協議,SDK開發包監控告警在線換盤其他硬件管理.讀寫接入權限管理數據核心存儲層數據寫入數據讀取對象存儲產線數據寫入產線數據讀取產線1數據存儲質檢抽查產線2數據存儲品質巡檢運維管理產線n數據存儲品質巡檢.QoS(頻控+流控)用戶/桶配額高速遍歷用戶管理生命周期刪除回收統一存儲池標準+低頻存儲9個9可靠性極致擴容能力追溯例行運維+巡檢云原生低代碼平臺開發時間30%開發人效40%需求響應速度50%系統缺陷數量70%低代碼開發飛輪釋放IT賦能OT告別重復的增刪改查集中研發能力攻堅克難低代碼自定義按需搭建快速開發功能適應市場 表單引擎 規則引擎 可視化引擎 流程
12、引擎 人員模塊 權限模塊 門戶引擎 數據連接器需求分析產品設計部署交付應用搭建用戶驗證適度二開雙AZ高可用容災案例AZ1AZ2底座支撐集群地域級產品可用區級產品可用區級產品WANDCIISP搬遷目標:AZ1 所有物理設施從一個機房搬遷到另外一個機房搬遷過程業務不中斷搬遷方案:業務遷移在不停機情況下,將AZ1網絡設備、產品服務器逐節點分批搬遷。利用雙AZ進行AZ主備切換,將AZ2作為主AZ,AZ1底座部分停機進行搬遷。方案優勢:利用雙AZ 底座容災,主備切換,搬遷過程中業務不中斷。每日自動化巡檢范圍工具規則定時指標腳本報告釋放巡檢人力自動化報告92人天/年降至0.5H效率提升巡檢工時降低90%實
13、現自動化巡檢租戶端運營端計算、存儲、網絡、數據庫產品資源生命周期自動化巡檢有效地提高云平臺的運維效率和穩定性,預防故障并提供全面的監控和報告,是保證云平臺正常運行和提供穩定服務的重要手段。平臺功能云業務穩定性和連續性保障Pre-MTBFMTTIMTTKMTTFMTTVPost-MTBFMTBFMTTRMTBF建設演練復盤改進應急響應故障預防故障發現故障定位故障恢復故障改進故障演練容量評估持續交付自動化架構設計AIOps輿情感知監控告警日志分析鏈路跟蹤根因定位故障復盤改進驗收故障模擬混沌工程容量壓測容災切換服務降級服務限流異常熔斷上云趨勢邊緣計算邊緣存儲邊緣云GPU 需求,圖形渲染,推理和訓練海量存儲特定場景需求應用容器化增多在云上開發、部署、上線和運維云原生THANKS感 謝 您 的 聆 聽!