云計算開源產業聯盟:2022云優化治理白皮書-第二部分:云資源效益優化(48頁).pdf

編號:86936 PDF 48頁 621.71KB 下載積分:VIP專享
下載報告請您先登錄!

云計算開源產業聯盟:2022云優化治理白皮書-第二部分:云資源效益優化(48頁).pdf

1、云優化治理白皮書第二部分 云資源效益優化云優化治理白皮書第二部分 云資源效益優化(2022年)(2022年)云計算開源產業聯盟OpenSource Cloud Alliance for industry,OSCAR云優化能力提升計劃Cloud Optimization Capability Enhancement Initiative,COCEI云計算開源產業聯盟OpenSource Cloud Alliance for industry,OSCAR云優化能力提升計劃Cloud Optimization Capability Enhancement Initiative,COCEI2022 年

2、 7 月2022 年 7 月前言前言近年來,隨著我國云計算領域的不斷發展以及政策的大力推動,企業在云端部署業務系統已經成為重要趨勢,越來越多的企業開始著手關鍵業務系統上云,用云逐步邁入深水區。云計算業務的快速發展催化了企業對云資源的巨大需求,云計算為企業 IT 基礎設施帶來敏捷性和效率提升的同時,深度用云環境下企業用云資源成本浪費、資源配置不合理、穩定性不足、安全合規不規范等現象普遍存在,加速了企業對云的優化和治理需求。本白皮書是云優化治理系列白皮書的第二部分云資源效益優化。云資源效益是衡量企業上云用云成效的關鍵因素,可以理解為企業使用各類云資源為業務發展帶來的貢獻度。本白皮書首先總結提出資源

3、效益優化參考框架,明確資源效益影響因素及對應優化路徑,從降低業務資源成本和提升資源業務價值兩個維度進行資源效益優化,在項目云 TCO、業務性能、業務安全三個方面給出了優化策略和方法,引導企業結合自身業務特性構建專屬高效的資源效益優化體系,通過合理的資源優化治理,提升業務的整體資源效益。參與編寫單位參與編寫單位中國信息通信研究院、富通云騰科技有限公司、中國移動通信集團浙江有限公司、北京聚云科技有限公司、阿里云計算有限公司、中移動信息技術有限公司、中電信數智科技有限公司、廣州青蓮網絡科技有限公司、浪潮云信息技術股份公司、聯通(廣東)產業互聯網有限公司、優刻得科技股份有限公司、廣州市品高軟件股份有限

4、公司主要撰稿人主要撰稿人栗蔚、馬飛、李哲、劉學森、王向花、張凌、邢毅彬、金天驕、朱艷濤、李彥超、劉建、阮前、馮詩淳、范麗麗、石泱泱、蘇超、穆國華、王明賢、江峰、劉鑫、孫紅立、梁高翔、茅曉清、陳侯炳,李劍君目錄目錄一、云資源效益優化背景.1(一)低碳時代到來,企業降本增效成為剛需.1(二)優化資源效益,助力企業充分釋放云效能.2二、資源效益優化參考框架.3(一)資源效益優化公式.4(二)云資源效益測算因素.5三、項目云 TCO 優化手段.9(一)資源用量治理.9(二)人力成本規劃.15(三)運營成本分配.16四、業務性能優化手段.16(一)現代化改造原則.17(二)現代化改造五大手段.18五、業

5、務安全優化手段.24(一)網絡資源安全優化.24(二)數據資源安全優化.25(三)應用資源安全優化.26(四)資源安全管理優化.27六、云資源效益優化案例展示.28(一)政務行業:云資源效益優化實踐.29(二)金融行業:云資源效益優化實踐.30(三)通信行業:云優化效益優化實踐.34(四)物聯網行業:云資源效益優化實踐.36(五)零售行業:云優化效益優化實踐.39云優化治理白皮書 第二部分:云資源效益優化(2022 年)1一、云資源效益優化背景(一一)低碳時代到來,企業降本增效成為剛需低碳時代到來,企業降本增效成為剛需我國高度重視低碳發展,云計算助力企業進入低碳時代。低碳意指較低的溫室氣體(二

6、氧化碳為主)排放,隨著世界工業經濟的發展、人口的劇增、生產生活方式的變革等,二氧化碳排放量越來越大。我國高度重地低碳發展,制定 2030 年“碳達峰”與 2060 年“碳中和”目標之后,“雙碳”被正式寫入 2021 年的政府工作報告。2022 年的全國兩會,政府工作報告再次就“雙碳”提出了多項具體任務。在“低碳”目標實現的過程中,技術創新起著至關重要的作用。云計算作為 IT 資源的新型服務形式,正加速成為各行業企業數字化與低碳發展的新引擎。云計算提高了計算、存儲、網絡等資源利用率,提高了社會整體的算力利用率,全面提升了全社會資源效能,為傳統企業變革軟件架構、創新管理模式、賦能業務生產加速提質。

7、企業用云效果不及預期,降本增效成為轉型剛需。隨著“雙碳”目標的推進,更多企業愿意選擇成本更低、更綠色的云計算代替傳統IT 基礎設備,讓企業生產效率、運維效率、能源效率最大化。然而隨著企業云化進程的不斷推進,資源效益問題日益顯現云資源投入與產出收益不匹配,其中較為典型的是工業行業。麥肯錫 2021 調查數據顯示,74%的企業云轉型未能獲取預期價值,受訪者認為,云技術比他們最初預期的更復雜,40%的受訪者認為云資源成本超出了企業的預算,而云轉型所帶來的 IT 價值與預期價值卻存在較大差距。云優化治理白皮書 第二部分:云資源效益優化(2022 年)2(二二)優化資源效益,助力企業充分釋放云效能優化資

8、源效益,助力企業充分釋放云效能云資源效益是衡量企業上云用云成效的關鍵因素。效益通常指效果和收益,是指消耗與收獲成果之間的比較,或者是消耗對成果的貢獻度。云資源效益可以理解為企業使用各種云資源為業務發展所帶來的貢獻度,或者理解為云資源投入與收益比。在企業用云過程中,云資源為上層業務提供支撐,云資源的使用與運營關乎著云平臺整體效能水平、云業務敏捷性、創新性和安全性等。優化云資源使用效益,可以使云資源為業務提供優質的支持,是企業用云管云能力提升的重要標志。企業云資源效益釋放不足,優化與治理勢在必行。企業云資源的盲目配置與運營導致企業云資源效益釋放不足。據公開數據整理,上云后有 72%的企業不清楚云最

9、佳實踐,有 67%的企業云成本高出預期,80%的企業按云服務商默認的配置選購,只有 10%的企業經過內部審核評估后采購云資源。企業雖然認識到了云資源效益會對用云效果產生重要影響,但因為其業務關聯度的復雜性,企業很難對眾多因素進行量化分析,結合業務狀態形成完整和準確的資源效益優化手段迫在眉睫。資源效益構成復雜,優化方向無法確定。當前企業已逐步重視資源效益,然而對于資源效益的理解仍然處于初期階段。資源效益對企業而言是一個相對復雜的概念,牽扯到資源價值、資源成本、業務價云優化治理白皮書 第二部分:云資源效益優化(2022 年)3值、業務特性等多個層面,因此企業無法確定資源效益內各因素的構成和關系,導

10、致企業無法確定資源效益優化的方向和方法。資源效益提升面臨多重挑戰,可變成本和低效資源加速企業云優化治理難度。一方面,企業云資源體量龐大,各成本中心、業務線積累的云資源日益增多,需要有效使用和管理,且企業有些云資源較隱蔽,容易產生閑置和低效率的情況。另一方面,云環境下存在共享資源,成本統計口徑難以精確,成本的健康度分析難度較大。且共享資源與可變成本帶來成本分攤、核銷和健康度分析等挑戰。二、資源效益優化參考框架明確影響因素是資源效益優化重點,優化參考框架助力企業優化體系構建。企業用云的最終目標是提升業務運行的績效,所以談到資源效益分析就不能只看用云的成本,也需要從用云業務性能和安全的變化同步進行分

11、析才符合企業用云的總目標。企業需先摸清資源效益中各影響因素構成情況,結合業務需求環境,針對每個因素規劃合理的優化方案,自建資源效益優化框架。本白皮書研究提出資源效益優化參考框架,旨在幫助企業明確資源效益優化方向,了解針對每一個資源效益優化因素的優化手段,為企業業務資源效益優化體系建設提供參考。云優化治理白皮書 第二部分:云資源效益優化(2022 年)4圖 1 資源效益優化參考框架(一一)資源效益優化公式資源效益優化公式資源效益優化公式明確效益因素構成與關系,為資源優化指明方向。業務效益的通常是指業務效果和收益,是消耗與收獲成果之間的比較,或是消耗對成果的貢獻度。資源效益則是將業務效益的概念限定

12、在資源范圍之內,通過收益比支出的形式得出資源效益的比值。資源效益優化公式將業務的資源效益進行拆解,為企業整體資源優化方向提供指導,其中包含兩個組成部分,一是資源效益中的云資源價值指云資源為業務帶來的價值,資源價值主要體現在云資源的使用對業務性能和安全性的提升。二是資源效益中的業務云成本指業務中的云成本總支出,包含項目中所涉及的云計算相關所有費用的項目云TCO(項目用云總成本)。資源效益可以理解為云資源價值與成本比值,云資源價值的提升或業務云成本的下降都將直接提高資源效益。業務云優化治理白皮書 第二部分:云資源效益優化(2022 年)5人員實施優化工作可將資源效益優化公式為指導方向,規劃實施以降

13、低云業務成本與提升云資源價值為目的的優化方案,持續提升資源效益。(二二)云資源效益測算因素云資源效益測算因素1.項目云項目云 TCO項目云 TCO 通常由資源、人力和運營成本三個部分組成,對業務資源效益產生直接影響。項目云 TCO 的是指以業務項目為單位涉及的用云總體成本,項目云 TCO 的變化將會直接對業務資源效益產生影響,然而項目云 TCO 的提高并不一定代表資源效益的下降,還需要業務人員根據成本價值、成本健康度等維度進行評估確定具體資源效益的變化情況。資源成本涵蓋企業公有云資源采購和私有云資源建設。企業公有云資源采購成本根據業務所需云資源用量和時長不同、云服務采購模式、計費方式、付費模式

14、和商務策略各不相同。公有云隨租隨用的資源成本使得成本支出變化幅度較大,具備較高靈活度的同時,如果管控不好將會無形之中增加大量資源成本浪費。企業私有云資源建設成本根據企業資源建設、虛機部署、資源分配、系統搭建等方面影響產生相應變化。私有云資源成本應綜合考慮構建云平臺的軟硬件成本,包括IDC 建設(或租用)成本、云平臺相關軟硬件設備的采購成本以及維持其持續運行的運維成本(如軟硬件維保費用、耗材、耗電費用等),云優化治理白皮書 第二部分:云資源效益優化(2022 年)6一般來講私有云的建設成本與傳統的數據中心建設成本構成較為一致。人力成本需包含人員雇傭成本與人員培訓管理成本兩個部分。資源相關人員通常

15、包括負責使用云資源的業務或開發人員、負責資源日常運行維護和優化管理工作的運維人員、以及負責分析規劃業務資源需求與發展的運營人員。人力資成本除了包含以上所有人員的雇傭總體費用以外,還需包括對資源相關人員投入的培訓與管理費用,提升資源優化人員技術能力,建設資源優化團隊。資源管理相關工具和咨詢是企業無法忽略的運營成本。企業通過購買或租用云服務商的資源運維工具如云管理平臺、成本優化工具等,可以有效支持對資源使用情況監控與統一運維管理。同時,企業對于資源使用和管理的咨詢費用能夠通過服務商的咨詢服務幫助企業調研業務優化需求,給予業務資源使用管理的建議和方案。運營成本成為當前企業重要的資源管理支出,依靠工具

16、服務能力提升資源運營效率。2.業務性能業務性能業務性能是資源價值的直接體現,是資源效益評估的重要因素。業務性能是業務判斷資源價值時優先考慮的因素,資源的使用為業務帶來的性能提升能夠直接體現資源價值在資源效益中的影響,明確并提升資源價值對于資源效益優化起到至關重要的作用。資源帶來的業云優化治理白皮書 第二部分:云資源效益優化(2022 年)7務性能主要體現在敏捷性和創新性兩個方面:業務敏捷性:業務敏捷性是指業務快速、經濟高效地適應業務環境變化的能力。在當今充滿挑戰的商業環境中,現代化進程與變化比以前更快更頻繁,云資源能夠幫助業務現有 IT 系統的工作變得更加簡單快捷,提升運營效率的同時提升業務的

17、敏捷性。資源帶來的業務敏捷性通常表現在:一是相比物理服務器的長時間配置流程,資源的快捷的采購與分配流程減少了業務 IT 基礎設施的準備時間,從而加快了重要 IT 項目的交付時間。二是資源自動化技術的使用,節省了IT 人員的時間并且提升了信息傳遞的效率,加快業務環境適應時間。三是云計算資源擴展和縮減的自由度,使業務能夠更好的應對突發性的流量變化,提升業務應用的敏捷性。業務創新性:業務創新性是指業務在服務、運營、產品等層面提升創新和產出的能力。數據中心的建造與規劃是一個耗時耗力的高成本工作,云計算資源的運用能夠有效地減少企業數字化轉型成本,降低企業轉型門檻,為企業提供基礎設施加快業務的創新能力。資

18、源帶來的業務創新性通常表現在:一是服務模式通過資源可逐步從線下轉為線上,服務平臺的搭建與用戶溝通的形式通過資源不斷進行創新。二是業務可以利用資源構建新型的運營模式和管理模式,打破物理場所的限制,利用自動化等技術實現更加精細化的業務運營。三是資源的可擴展性保障業務產品研發資源充足,另外云資源的使用也可以幫助業務進行實驗數據的全方位分析,提升產品的創新和產出能力。云優化治理白皮書 第二部分:云資源效益優化(2022 年)83.業務安全業務安全保障業務安全往往不會對資源效益產生直接的正面作用,但如果安全無法保障則一定會產生負面作用。業務安全是對業務運行效能評價的的前提,而在對在云平臺上運行的業務安全

19、進行評估時則離不開云計算對業務安全所帶來的總體影響評估。業務安全的提升通常從數據安全、資源隔離、權限控制、業務可用四個方面定義。數據安全:數據安全性主要包括數據保密、數據備份和恢復等方向。數據泄露、損毀對業務來說往往是致命的,因為業務數據最終會寫入云平臺所提供的存儲服務,所以云平臺在數據安全性保障則是數據安全的基礎保障。資源隔離:隔離性主要是指云平臺提供的租戶隔離或業務隔離特性,確保不同租戶或業務所使用的云資源相互獨立。多業務之間的資源隔離性、權限隔離性保障了各業務系統雖然同時運行在一個云平臺上但也不會相互產生影響,這是云服務的基本安全原則。權限控制:權限控制包括用戶認證、資源使用權管理、數據

20、權限控制等方面。各種權限隔離、權限控制以及授權管理機制方案,使業務安全得以保障。服務可用:服務可用性是指業務所使用的各類云資源和相關服務是否持續可用,是否達到可靠性指標要求,保障業務持續穩定運行。同時,在業務需要時,云平臺也可以持續提供更多資源。云優化治理白皮書 第二部分:云資源效益優化(2022 年)9三、項目云 TCO 優化手段(一一)資源用量治理資源用量治理1.分析業務特性,決策部署模式分析業務特性,決策部署模式根據業務特性決策合理的部署方式是資源用量治理的第一步。企業在上云前,應結合自身業務形態和云計算的技術特征,明確用公有云還是私有云的部署模式。兩種部署模式在成本構成、安全性、可擴展

21、性等方面存在明顯差異。成本構成方面:采用公有云的企業用云成本通常是購買云服務的運營性成本。公有云的資源或服務的種類、計價邏輯和優惠策略的復雜度導致企業對公有云成本管理與優化難度增大;采用私有云的企業用云成本通常包括運營性成本和資本性成本,運營性成本包括人工成本、維修維護成本、電費、公網等費用,這類費用屬于數據中心建設后的持續性投入,資本性成本包括機房建設、設備采購、專線鋪設、安全設備等費用,這類費用屬于前期一次性投入,通??梢允褂脭的?。運營性與資本性成本的組合導致私有云的成本較高。安全性方面:公有云上的資源分布于云端,不再處于數據中心邊界的防護屏障內,面臨更多安全信任危機,此外,公有云共享資源

22、的特性,流量峰值期間容易出現性能問題(如網絡阻塞問題);私有云資源獨享,單個企業是唯一可以訪問它的指定實體,能通過企業防火云優化治理白皮書 第二部分:云資源效益優化(2022 年)10墻和內部托管提供更高級別的安全和隱私,確保第三方提供商無法訪問操作和敏感數據,同時可以有效避免外部流量峰值的沖擊??蓴U展性方面:使用公有云,客戶可以快速訂購計算、存儲和網絡資源來應對激增的業務需求,而無需購買和部署新的硬件,公有云上的新技術、新產品、新工具不斷出現,企業可以快速購買和使用新技術架構和產品類型,來達到云效益的提高;私有云可以基于企業需求,產品和服務有更多的個性化定制,但擴展性受到了硬件資源、底層架構

23、等限制。2.關注最新技術,做好技術選型關注最新技術,做好技術選型做好技術選型是資源用量治理的技術底座。企業需關注云計算相關技術的最新發展趨勢,利用好技術紅利帶來的資源用量和成本治理。伴隨云計算的發展,新技術、新產品、新工具會不斷出現,無論是最新的硬件機型還是最新款的 PaaS 產品亦或是最新的 SaaS 軟件,往往都會帶來性能或效率上的提升,從而提升企業用云性價比和管理效率。如服務器、數據庫的升級,研發效能平臺的推出等,企業利用新技術架構或產品類型適配自身業務發展可提升用云效能。以下幾種技術架構是成本優化中的常見方案,包括在線/離線混合部署、冷熱數據分級存儲、采用云原生技術棧。在線/離線混部是

24、通過在在線業務運行過程中填充離線業務,來提高資源利用率。對于企業同時存在多種業務場景時,可以采取混布云優化治理白皮書 第二部分:云資源效益優化(2022 年)11方式,可以幫助企業提高云資源的利用率從而降低成本。在線型業務和離線業務具備資源互補的特點,從時間上和對資源的容忍度上可以結合互補。冷熱數據分級存儲技術通過合理配置業務冷熱數據存儲資源位置,在保證數據存儲效率和應用運行性能的基礎上,節省存儲資源成本。根據被訪問頻率的高低,數據可以被分為熱數據、溫數據和冷數據,其中,冷數據是指活動不頻繁或不會被訪問,但仍然需要保留的數據。企業大部分數據受到業務特征、用戶行為或監管政策的影響,都會在短時間內

25、變“冷”,這一部分數據集合通常占所有數據的 60%至80%,然而并不代表它們失去了價值,企業仍需大量資源來對其進行存儲。因此,通過數據分級存儲進行成本優化的重點是將冷數據識別并儲存在低性能存儲資源中。企業采用云原生技術可以構建彈性、松耦合應用系統,通過彈性擴縮容與資源調度機制提升企業用成本效率。一方面,云原生具有多維度彈性能力,容器啟停都在秒級,可以高效敏捷的進行擴縮容;且容器共享操作系統內核的設計,可以有效提升資源整體利用率。另一方面,Kubernetes 調度機制可保證資源合理分配,為每個集群找到最適合它的節點,動態調度機制幫助實現了應用層彈性伸縮到資源層彈性伸縮的過渡。通過合理利用 Ku

26、bernetes 提供的調度能力,根據業務特性配置合理的調度策略,也能有效提高集群中的資源利用率。云優化治理白皮書 第二部分:云資源效益優化(2022 年)123.綜合資源特點,規劃資源類型綜合資源特點,規劃資源類型合理的資源類型規劃為資源用量治理提供保障。同樣配置的實例,但由于類型不同則可能價格不同,如通用型、計算型、內存型等,這將直接導致用云成本產生很大差異。需要注意的是:評估時除了成本外更需要考慮云上技術紅利,包括 IaaS 層的更新換代帶來的性價比提升,PaaS 層帶來的穩定性、性能、研發效率的提升。企業應提前做好云資源的容量規劃,避免資源過度配置。企業云資源的申請普遍存在過度申請的情

27、況,通常情況下,企業可以通過壓測方式獲取單機和集群的最大容量,通過調研業務部門未來一段時間的業務規劃,梳理并列出適合業務并留有一定冗余量的資源規格和用量。同時設置容量水位線來實時監控集群負荷,一旦達到最高水位線,及時購買云資源或者提高資源配置。結合業務流量的周期性,用好彈性資源。業務的資源使用量會根據負載情況出現波動,所以在選擇云資源規格時應充分考慮其周期性特點,選擇更加合理或具備彈性的資源,以便在業務運行的低谷時間段可以降低資源使用成本,而在高峰期之前又能及時提升能力。這不僅關系到資源采購選擇,也需要與業務架構設計進行綜合考慮。4.兼顧業務模式,選擇靈活計費兼顧業務模式,選擇靈活計費根據業務

28、特性選擇靈活的付費方式是資源采購階段優化成本的直接手段。公有云服務有包年包月、按量付費、搶占式等多種計費模式,云優化治理白皮書 第二部分:云資源效益優化(2022 年)13在選擇資源時應結合業務運行特性選擇長期、低成本的云服務,綜合測算選擇更低成本的資源。長期使用的穩定性服務,可以使用包年包月的低成本計費方式,臨時測試、使用周期較短的服務可以使用按需付費的靈活計費方式,服務負載存在明顯的波峰波谷,可以采用彈性資源來應對業務高峰期。用云過程中,及時調整計費方式,獲取最高效益。在業務用云過程中,計費方式并不是一成不變的。隨著業務特性的變化,及時調整計費方式可以有效降低成本支出。例如,針對 CPU

29、利用率一直較高的后付費類(按量計費)云服務器,其連續兩個月使用時長產生的費用超過同規格預付費類(包年包月計費)費用,改變其計費模式為預付費。企業可以配置多種資源類型的組合來節約成本。根據服務的特性,選擇按需、預留、競價多種資源組合的形式來達到最低價的組合。最后,業務采用公有云時應充分考慮業務是否可以拆分運行在多個公有云上,除了保障業務連續性,在資源采購成本過程中企業擁有更大的靈活性和主動性。5.貫穿用云周期,構建運營體系貫穿用云周期,構建運營體系構建資源監控體系,根據監控數據分析存在優化空間的資源單元。云資源監控,持續監控系統與資源對應的各項指標,首先,需要監控各類云資源的使用情況,如監控云主

30、機 CPU 使用率、內存使用率等云優化治理白皮書 第二部分:云資源效益優化(2022 年)14指標,通過時間等維度配置策略。其次,需要根據監控數據分析出資源優化單元和優化空間,如某類云主機從創建后,一直處于關機狀態,此類云主機可判定為閑置資源,運維管理員可將云主機進行回收,釋放對應的 CPU、內存等資源,避免云資源浪費。此外,在監控的基礎上,企業可分析以往數據,有效預測云平臺容量未來變化,提前預警提醒企業運維人員??梢暬某杀痉治龉ぞ呤蔷毣\營的工具抓手,企業應通過可視化的分析工具,及時洞察成本使用情況,發現資源優化點??梢暬环矫鎽▽~單可視化的能力,查看賬單的各個分類明細,支持導出進

31、行統一匯總,另一方面應包括賬單歸屬劃分,按照事前的規劃,把賬單按照部門、業務進行劃分,從而精細化洞察支出是否與預期符合一致。加強 IT 資源運營管理,健全 IT 云運營管理體系,形成“事前、事中、事后”全生命周期運營管理機制,并持續進行優化。事前提供上云應用輔導,制定系統高可用模版與上云評估模型,優化部署方案,合理評估,按需分配,采用資源配額,實現資源自服務開通,賬號、資源、權限、配額合理分配。事中強化資源使用跟蹤,監控資源運行性能數據,按日發布資源利用率情況,按月發布租戶運營分析報告及綜合效能評分,協助租戶優化資源部署,提升資源效能。事后回收低效冗余資源,對達到回收標準的冗余資資源督促租戶進

32、行回收,并凍云優化治理白皮書 第二部分:云資源效益優化(2022 年)15結該業務系統資源申請權限,督促租戶通過容器化、虛擬化等技術優化低效資源使用。(二二)人力成本規劃人力成本規劃企業合理規劃資源相關人員建設,利用技術管理手段減少人力成本,提升資源管理效率。為了滿足業務平穩運行的需求,企業需要在云計算資源持續投入人力成本,由于人力成本也是業務云計算運營的成本之一,所以提升云資源效益同樣需要對相關人力成本進行治理優化。人力成本優化工作主要通過技術和管理兩個層面進行:1)技術層面主要通過利用電子化管理和自動化流程減少人力成本需求。采用更多云管理平臺或優化平臺的電子化管理在業務資源運營人員需求,降

33、低長期的資源人力成本。自動化技術與電子化管理平臺的結合將更多的固化知識、方案與流程從線下轉為線上,提升人員資源管理處理效率和信息傳達的準確率,減少線下文件流程處理人員需求。2)管理層面通過定期的培訓與資源優化團隊建設對人力成本進行優化。當前企業業務人員對于資源優化的認識和技術并未成熟,資源相關人員的技術和能力建設依舊有很大的提升空間。通過定期的培訓,員工學習資源使用管理知識、熟悉資源優化工作流程。云優化治理白皮書 第二部分:云資源效益優化(2022 年)16(三三)運營成本分配運營成本分配企業業務合理分配運營成本,全周期支撐企業資源使用效益。相關運營成本包括對企業用云的規劃、建設及優化等方面,

34、涵蓋了企業用云前、中、后各階段的云運營工作,主要目標是通過咨詢服務、云資源服務、云管理服務等提升企業用云收益。企業應更多的將人力和資源投入運營方面,確保用云績效的不斷提升。1)企業在用云、管云過程中應考慮采購第三方專業咨詢服務的成本,借助云專業服務對企業的云規劃、云建設和云運營等工作設定長期和階段性目標,明確相關工作的開展方案,降低云建設使用過程中產生失誤的可能性。采購專業服務一方面可以吸收業內的經驗和專業技術,另一方面可以通過咨詢達到鍛煉自己的隊伍,提升企業人員的能力和績效。2)工欲善其事,必先利其器,采用恰當的運營工具將對運營效率產生很大的影響。企業應采用適合自身云環境的管理工具,通過有效

35、的數據采集和管控能力,實現對云資源、云業務運行的狀態監控、數據跟蹤、大數據及人工智能分析等技術手段,實現持續性的云使用和運營可視化分析,擁有敏捷快速的調整能力和各層面聯動的協調能力。四、業務性能優化手段云優化治理白皮書 第二部分:云資源效益優化(2022 年)17(一一)現代化改造原則現代化改造原則現代化改造逐漸成為企業提升業務性能的關鍵工作。隨著業務上云范圍越來越廣泛,企業數字化轉型導致商業模式正在被重塑,業務間的競爭也在以更快的速度和更意想不到的來源出現。業務的敏捷性以及創新性的壓力不斷增加,對于云資源價值的需求也不斷提高,現代化改造成為企業解決業務性能問題的關注重點?,F代化改造主要是通過

36、新興技術或管理手段深度改造業務云計算的使用,發揮更高的云資源價值?,F代化改造這一概念的產生和發展主要依賴于兩個方面:一是近年來云計算相關技術不斷突破,新的創新性技術幫助企業更好的釋放云計算資源的價值,將云資源更便宜、更靈活、更快等特點釋放的更加充分。二是企業對于云資源的認識不斷加深,對于云資源的運用也逐漸熟悉,先進的資源管理體系的形成幫助業務更好的管理使用云資源?,F代化改造成功的規劃和執行需要遵循以下五大原則:1)關注長期價值,而不是短期成本?,F代化改造是一個需要經過仔細規劃的過程,它需要對業務現有的情況進行評估,以便對未來的目標進行規劃。除了短期的成本降低以外,考慮未來的資源價值才是至關重要

37、的。2)長期分階段進行,而不是短期改造。業務通常具備大量的資源和復雜的架構框架,現代化改造是一個長期的過程,短時間的大量改造會導致業務不兼容等一系列問題。將改造工作云優化治理白皮書 第二部分:云資源效益優化(2022 年)18分步進行,能夠保證現代化改造的效果以及業務的穩定性。3)獲得業務團隊支持,而不是獨立工作。IT 與業務的協調統一是業務性能的重要保障,在進行現代化改造的過程中,若無業務團隊的支持,便會導致云資源無法與業務適配。業務團隊的全程支持能夠在規劃、測試和運行各個階段保證現代化改造的成效。4)合理安排改造優先級,而不是亂序實施。在規劃現代化改造工作時需要根據業務實際情況進行改造工作

38、的先后順序,可以先從直接給業務性能帶來切實利益的方面進行規劃。同時,還需要盡可能避免后期的改造對前期的改造產生影響。5)按需選擇第三方工具,而不是完全依賴。第三方工具提供的技術和自動化能力可以有效地提升現代化改造速度,但是完全依賴于工具帶來的便利,業務人員的介入能夠更好的保障現代化改造的效果。(二二)現代化改造五大手段現代化改造五大手段1.性能瓶頸洞察,感知現狀與預測未來性能瓶頸洞察,感知現狀與預測未來性能瓶頸洞察能力是業務性能保障的前提。在上云后業務持續演進以及優化迭代中,企業人員需隨時感知業務的性能現狀,以及具有發現業務性能瓶頸的能力,同時參考未來的業務預估規模量,進行應用的性能容量預估。

39、云優化治理白皮書 第二部分:云資源效益優化(2022 年)19可觀測性改造,感知性能現狀,定位性能瓶頸??捎^測性的價值在于快速排障,通過 metrics(指標)、logs(日志)、traces(跟蹤)等數據,實現對系統的精確度量。業務應用自頂向下,從面向終端用戶到進入應用的內部,如前端、網關、集群運行環境、各微服務的分布式請求、以及底層數據庫、各中間件應用的調用等,業務真實性能瓶頸往往可能出現在以上鏈路的任意一環??捎^測性不僅了解到性能問題何時發生,還能進而分析出問題發生的原因。根據性能問題的不同,一般可以根據問題原因考慮從云資源角度、應用架構角度進行優化。云資源的優化,是從解決資源瓶頸的角度

40、來優化系統的訪問性能。一般通過云監控的一系列指標,分析得出垂直擴展或者水平擴展。垂直擴展指提升單機處理的能力,如升級云服務器、云數據庫等云資源的規格配置,提示 CPU、磁盤、帶寬、存儲等配置,水平擴展指增加云資源實例數量,從而線性提升系統性能。對于非資源問題導致的性能瓶頸,由于分布式架構中一個業務請求通常要經過多個服務節點后返回結果,定位問題難度增大,對可觀測性的要求更高。一般要通過一系列的監控日志數據,聯合上下游鏈路排查從而診斷出問題瓶頸和根因,從而進行針對性的優化。如修改底層代碼邏輯、優化慢 SQL 語句、增加異常限流策略、讀寫分離架構優化等等。業務流量壓測,預估未來業務規模,針對性進行資

41、源性能規劃。云平臺提供分布式性能壓測服務,模擬復雜的業務場景,并快速精準云優化治理白皮書 第二部分:云資源效益優化(2022 年)20地調度不同規模的流量,同時提供壓測過程中多維度的監控指標和日志記錄。通常企業無需準備資源,即可按需發起壓測任務,監控壓測指標,獲取壓測報告,進而能夠高效率、全方位地驗證業務站點的性能、容量和穩定性。2.應用架構改造,云原生擴大增效空間應用架構改造,云原生擴大增效空間采用云原生技術保證業務性能的提升空間,充分利用和發揮云平臺能力。業務系統采用微服務架構設計,其運行環境應配合采用云原生容器化部署,通過容器集群的高彈性和業務感知能力,實現微服務與底層容器資源的聯動,屏

42、蔽底層差異,大大簡化了開發工作量。依托于容器編排工具與微服務的組合,應用提升了自動恢復能力、容錯能力、故障隔離能力。微服務降低應用耦合,提升故障隔離能力和可擴展性。在業務系統設計時將業務系統拆分為獨立功能的微服務,各個服務是相互獨立和自治的系統,微服務之間通過服務調用,形成松耦合結構。一方面,當微服務架構隔離功能時,一個微服務中的問題也將被隔離在這個微服務區域中,而其他微服務將繼續運行。另一方面,微服務提升程序的擴展性,可以輕松地從應用中提取獨立功能,幫助在其他應用程序中重新利用,開發團隊可以輕松地實施和部署代碼,無需花費較大的IT 團隊或部門的時間。云優化治理白皮書 第二部分:云資源效益優化

43、(2022 年)21容器化部署輕量小巧,充分利用資源提高效益。應用形態改造,由傳統的單體應用改造為彈性和輕量的容器化應用。一方面,基于容器化部署,輕量級的容器腳本可以從性能和大小兩個方向使開銷更低,性能更優,系統負載更低,同等條件下可以運行更多的應用實例,可以更充分地利用系統資源,提升資源效益。另一方面,容器良好的跨平臺和可移植性,使企業在云端的遷入和遷出更加便捷,無需擔心受到云平臺的捆綁,同時也極大的促進了多云混合部署效率。3.資源選型策略,資源產品高效率使用資源選型策略,資源產品高效率使用結合業務特性合理適配資源使用類型與云產品服務能力,是提升業務性能方案的首要選擇。云資源適配與云產品選型

44、是在保障業務系統正常運行的前提下來優化云資源使用效益,進而提升云資源效益,所以在云資源選配和產品選型時必須根據業務的不同特性進行分析,發現業務對資源需求的規律、趨勢或特點,然后在從云資源供給策略和能力上給予滿足,讓云資源與業務協同運行,確保業務性能的同時降低云資源的使用成本。業務系統種類多樣,需按照業務類型選擇對應資源與產品配置。從業務云資源使用角度來分析,可以按照以下類型進行基本區分并選擇對應資源和產品:1)敏態/穩態:一般對敏態的理解是不確定性高、不可預測,穩態的理解是確定性高、可預測。業務的敏態或穩態導致了云優化治理白皮書 第二部分:云資源效益優化(2022 年)22他們對云資源使用量、

45、使用趨勢的確定性和可預測性方面是不同的。敏態業務可以選擇靈活性高的公有云資源與對應的動態調整工具產品來提升業務的綜合性能。穩態業務則可以使用穩定性高的資源來保障業務平穩運行。2)資源使用特性:業務或業務內的不同組件對不同類型的資源使用要求是不同的,有的偏重于 CPU 處理能力,有的偏重于內存或緩存能力,而集群環境或依賴業務間處理的又對網絡負載或負載均衡的要求很高。所以在資源和產品配置時,應該針對業務,選擇合適的資源與產品,解決業務關鍵需求。3)業務周期性:無論業務是敏態或穩態,從長期來看業務一般都會存在周期性特點,如每天、每月或年度周期、季節因素、生產訂單等,業務的周期性導致其對資源使用要求也

46、存在周期性,資源與產品的采購和使用周期也需對應進行調整。4)業務的關聯性:業務之間是存在關聯關系的,企業內或企業間的業務關聯變動也會造成具體的業務系統對資源使用的變化,需要在云資源供給方面進行分析和判斷。5)業務的重要程度:不同業務的重要程度主要是從其影響范圍和可能造成的損失這兩部分來評估的。企業應該區分不同業務的重要程度,對業務進行分級別的云資源和產品選配,這樣可以集中更多的資源來解決主要問題,實現快速效益提升。云優化治理白皮書 第二部分:云資源效益優化(2022 年)234.多云混合部署,混合云全面釋放價值多云混合部署,混合云全面釋放價值多云混合部署綜合各云優勢,全面提升資源的業務性能釋放

47、。公有云在資源擴展能力、敏捷型、網絡能力、PaaS 或 SaaS 服務等方面具有更大的優勢,私有云則在安全性、私密性、可控性等方面更具優勢。業務根據需要將不同的組件部署在混合云架構上,如對公眾服務的網站、運營門戶等部署在公有云資源上,充分利用其資源彈性和平臺總體性能來承擔可能會產生較大波動的并發服務。而對于需要穩定安全運行的數據庫等高度私密性服務組件部署在私有云資源中,之間通過業務架構的設計采用多級緩存等模式確保業務性能。這樣,企業就同時擁有了更多的用云的選擇,可以在不同的云之間進行資源的調配,提升業務的靈活性。特別是針對業務呈峰谷交替的場景建議采用混合云部署,應用資源部署在云端通過云專線等網

48、絡產品能力打通云上云下的網絡互聯,可以很好的解決傳統數據中心靈活交付、快速部署的問題,極大的減少費用支出和效率提升。5.組織團隊建設,業務資源雙團隊協同組織團隊建設,業務資源雙團隊協同業務能力與資源能力雙團隊協作,IT 全力輔助業務達成性能目標?,F代化改造不僅包括在資源技術層面的優化,業務組織團隊的建設也同樣需要符合現代化改造特點,提升業務性能。業務資源的使用不是單純的一次性工作,而是長期的運營管理,所以團隊的建設在這個流程中十分必要。未來使 IT 的工作與業務目標有更好的一致性,業務云優化治理白皮書 第二部分:云資源效益優化(2022 年)24內需包括兩個種類團隊的協作:一是業務能力團隊,由

49、業務利益關系人結合而成,負責業務服務和產品交付,專注于達成內外部客戶的需求,是業務性能的主要受益方。二是資源能力團隊,由資源使用管理和資源使用優化的負責人組成,主要對業務內資源相關的 IT 事務進行管理,不直接負責處理客戶的業務要求。這兩種類型的團隊需要在業務性能驅動下協作,注重長期的業務性能提升和資源管理。資源能力團隊將業務能力團隊視為客戶,負責滿足業務能力團隊的需求,朝著業務共同目標前進。五、業務安全優化手段(一一)網絡資源安全優化網絡資源安全優化網絡資源安全是業務安全的第一道安全屏障,網絡資源安全優化從內外部保障業務安全。網絡資源安全需要從不同維度進行優化進而對網絡竊聽、網絡嗅探、網絡截

50、獲、網絡篡改等攻擊行為進行防御,同時避免內部網絡串聯導致的信息安全風險。首先,安裝開啟防火墻能夠有效提升資源的安全防護等級,根據業務特點開啟防火墻的不同功能,通過防火墻的入侵檢測(IPS)功能和威脅情報能力,及時發現和清理危險流量的流入和流出,可以有效降低帶寬使用費用。另外因為云防火墻本身是根據相關安全法規制定,所以基本滿足網安法和等保2.0 的相關要求,減少了在等保檢測和加固上的成本。其次,利用網絡資源冗余保證網絡資源穩定性,規避業務停滯風險。云廠商擁有大量 BGP 帶寬,不僅全面覆蓋國內主流及中小運營商,帶來極速、穩云優化治理白皮書 第二部分:云資源效益優化(2022 年)25定的訪問體驗

51、,還結合云廠商安全技術優勢、算法優勢、以及 AI 識別的優勢,提供了一整套的精準識別和自動防護規則,保證網絡資源的穩定性,可以攻擊持續不斷的情況下,仍可以對外提供業務服務。在選擇防護等級時,可以先選擇一個低級別的防護,一般是 2G 的量,如果遇到了大量 DDOS 攻擊,再升配或是遷移。最后,通過網絡資源劃分進行資源安全隔離,避免網絡串聯導致的內外部安全問題。根據業務特點創建 VPC,通過 VPC 劃分對網絡資源做安全隔離,在云平臺資源中構建出多個獨立網絡空間,并自定義網段劃分和 IP 地址、自定義路由策略等。(二二)數據資源安全優化數據資源安全優化數據資源安全是業務安全的重點方向,運用資源優化

52、手段避免數據安全泄露風險帶來的成本損失。近年來,企業數據竊取和泄露的案件數量不斷升高,數據資源安全逐漸成為企業關注重點,在數據的傳輸與存儲過程中的安全措施應用至關重要,安全優化手段可以有效地避免數據泄露和異常風險,防御數據竊取。首先對數據的傳輸進行加密是數據資源安全的基礎防護,包括云產品為用戶訪問數據提供了SSL/TLS 協議來保證數據傳輸的安全,滿足敏感數據加密傳輸需求。還可以通過 VPN 將本地和云端連接起來,在傳輸過程中使用 IKE 和IPsec 協議對數據進行加密,從而防止數據包在傳輸過程中被劫持、竊取,最大限度的保護了數據安全,降低數據泄露的風險。其次,在數據傳輸前后通過分類脫敏對業

53、務隱私數據進行可靠保護,從海量數云優化治理白皮書 第二部分:云資源效益優化(2022 年)26據中找出需要保護的敏感數據,劃分級別,采取不同的措施進行保護。為保護數據隱私,用戶往往需要根據不同的業務場景對相關敏感數據進行脫敏后的使用,保留原有數據特征和分布,確保數據的有效性和可用性。用戶可以低成本、高效率、安全地使用脫敏數據完成業務需求。最后企業可以直接利用數據存儲服務提升數據資源的安全性能,業務相關文件存儲安全可以使用基于密鑰的云存儲服務,如加密強度在 256 位密鑰,使得數據訪問更加安全。數據庫數據安全的提升可以通過采用主從數據熱備、冗余存儲、多地備份等提高服務可靠性,同時數據存儲服務還能

54、夠對數據庫做實例隔離、數據庫身份鑒別和訪問控制和安全審計助力業務數據資源安全性提升。(三三)應用資源安全優化應用資源安全優化應用資源安全是保證業務安全運行的基礎保障,通過工具服務維護業務應用平穩運行。應用的平穩運行是在業務運行過程中較為直觀的安全表現,應用安全方面的風險將直接會反映出業務應用的問題。通過資源安全優化手段維護業務應用的平穩安全運行,企業首先利用漏洞掃描服務對應用漏洞進行安全掃描與修復避免應用安全風險,幫助用戶進行高效精準的自動化漏洞滲透測試和敏感內容監測,保障上線前和線上應用環境的安全性。同時針對掃描的結果會形成專業的風險掃描報告,對掃描出來的安全漏洞進行歸類,并提出修復建議。檢

55、查源代碼中的缺點和錯誤信息,分析并找到這些問題引發的安全漏洞并提供代碼修訂措施和建議。此外,應用安全配置也是避免應用安全云優化治理白皮書 第二部分:云資源效益優化(2022 年)27風險不可或缺的手段,從身份認證、網絡訪問控制、數據安全、日志審計、基礎安全防護五個維度,為用戶提供最佳安全配置實踐。對主機進行安全配置掃描,包括賬號安全、系統配置、數據庫風險、合規性等方面,提前修補系統潛在的各種高危漏洞和安全威脅,出具先關報告,在此技術上可以對基線進行修復,滿足總體安全合規要求。(四四)資源安全管理優化資源安全管理優化企業在進行網絡、數據、應用資源技術安全優化工作的同時,資源安全管理優化是配合技術

56、提升業務安全性的強力支撐。資源安全管理通常是從業務內部開展組織資源安全管理并建立完善的資源安全管理體系,從責任權限管理與審計監控管理兩大方向進行體系建設與運營,合理的管理體系建設能夠為企業提供平穩的業務資源安全保障。合理規劃資源使用業務各方的責任與權限,是業務應對和避免安全風險的基本條件。責任權限管理是企業對業務內人員、賬號等維度進行的安全責任權限分配管理,一方面細化資源安全責任人員,從組織個人角度對資源的使用安全進行管理,業務主管部門需對資源使用相關人員進行責任分配,針對安全風險問題設置對應責任人,對主動或被動安全風險進行及時性、針對性相應。另一方面限制賬號操作權限,避免各賬號因操作不當導致

57、的資源安全風險。部門負責人需對資源管理平臺、操作系統、數據庫及應用系統中各類賬號權限的分配以及分級授權,系統管理人員負責信息系統的具體用戶權限管理。信息系統的用戶管理需指定專人負責,根據用戶對系統資源的需求與最小云優化治理白皮書 第二部分:云資源效益優化(2022 年)28授權原則進行授權。嚴格執行資源管理審計流程并對資源操作進行監控,是建設長效資源安全管理體系的必要手段。審計監控管理是保證業務平穩運行的重要方式,對業務決策的審計和人員操作的監控能夠有效避免業務內部因為錯誤決策或操作失誤導致的安全問題。一方面,資源審計流程的設置能夠進一步保障資源使用管理的合理與合規。用戶對資源的增、刪、改需依

58、據各系統業務主管部門或系統使用部門的審計流程進行。負責人根據決策的類型與等級設計清晰的審計流程,將決策相關人員納入流程中,保證決策的合理性避免資源使用和管理過程中的安全風險,同時,審計流程中安全合規人員的加入能夠保障決策的合規性,防止因合規問題帶來的處罰或損失。另一方面,對資源操作日志的監控能夠隨時對資源業務安全情況進行診斷,以便實施資源安全優化方案。資源管理平臺應具備符合要求的日志文件,日志文件至少應記錄各公有云、私有云、業務平臺、APP 應用的用戶操作時間、重要數據的增刪改等內容。系統管理人員應定期檢查日志文件,并書面記錄檢查結果。資源安全監督管理人員至少每月對操作系統日志及直接訪問數據庫

59、的操作日志進行審核,發現異常情況及時上報負責人,同時查明原因并提出處理意見,記錄處理情況。六、云資源效益優化案例展示云優化治理白皮書 第二部分:云資源效益優化(2022 年)29(一)政務行業:云資源效益優化實踐(一)政務行業:云資源效益優化實踐1.案例背景1.案例背景某政府大數據中心搭建了私有云平臺,方便各委辦使用資源的同時,但也給中心的領導帶來諸多管理問題。雖然私有云屬于一次性固定費用,但隨著委辦申請資源的數量不斷增多,承載的宿主機面臨需要擴容的成本。同時中心缺乏對各委辦整體使用情況的了解,當各委辦申請資源時,粗放的審批流程導致過量的資源購買,造成了資源的浪費??蛻粜枨螅?)根據內部制定的

60、價格清單配置查看各委辦每月使用情況2)低效率和閑置資源自動發現,及時回收3)當委辦申請資源時,查看該委辦所有資源近 1 個月的使用情況,判斷是否予以批準。4)根據真實使用情況,進行周報匯報,了解每周資源變化情況2.云資源效益優化實施關鍵環節2.云資源效益優化實施關鍵環節首先我們把各委辦以二級組織的形式進行管理。在平臺內部配置計費規則,用于了解各委辦資源使用情況,進行內部結算,同時也一定程度上限制了資源的過量申請。云優化治理白皮書 第二部分:云資源效益優化(2022 年)30其次在 UCMP 平臺中對應制定優化策略:監測 30 天內使用率低下的云資源,及時進行回收或降配操作。最大程度上減少云資源

61、的浪費。除此之外,為配合中心的周報內容,UCMP 也制定了一定的數據匯報的內容,包括周期內每個委辦資源變化的數量、整體 CPU、內存、硬盤的使用率。形成匯報稅局,協助中心對各委辦資源使用情況進行監督。3.效果描述3.效果描述1)借助 UCloud 云管平臺成本優化的模塊,中心有效的控制資源的閑置率,資源的數量從原先的 900 多臺,控制到了如今的 800 多臺,減少了 10%;2)在平臺使用的 3 個月內,委辦申請的資源數量比使用之前的 3 個月減少了 60 次;3)UCMP 作為云資源線上統一入口,不斷融入新功能、資源,重新定義云業務價值。(二)金融行業:云資源效益優化實踐(二)金融行業:云

62、資源效益優化實踐1.案例背景案例背景客戶運行各類證券交易、資產管理、金融產品代銷等應用系統,除了自身的數據中心外,逐步創新的引入 AWS、Azure 等在內的公有云資源作為快速響應外部和周期性服務的基礎設施,但隨著金融產品增加帶來應用系統的增多,眾多業務系統需求產生了大量的跨數據中云優化治理白皮書 第二部分:云資源效益優化(2022 年)31心虛擬機、虛擬存儲等資源,一度達到數千臺規模,龐大 IT 系統資源存在管理、運營復雜繁瑣的難題,迫使公司從頂層設計考慮,構建統一管理的可持續運營的混合云平臺。經慎重考察選擇,客戶最終選擇品高部署云管理平臺,來提升 IT 管理效能。截至目前,品高已為客戶提供

63、了 6 年穩定、可靠的服務。需求與挑戰:資源分散,難以整合:客戶一開始擁有 3 個數據中心,約五千臺虛擬機,并且率先使用公有云 AWS 運行線上交易業務,后期又引入Azure 等公有云,在混合云使用中走在了前列,但資源的分散造成了IT 管理更大的困難和挑戰。同時不同的云資源平臺又提供了“各自為政”的資源管理工具需要重新熟悉,而客戶針對自己數據中心運維的風控、備份和安全等工具又沒有辦法與之聯動起來,產生了潛在的安全風險與資產建設浪費。業務需求增多,IT 人員有心無力:面對金融市場的激烈競爭和公司業務規模的增長,開發測試和業務部門對 IT 資源的需求越來越多,對 IT 部門交付效率要求也越來越高。

64、但此前客戶 IT 資源交付主要依賴人工完成,無法滿足迅速交付資源需求,IT 人員日常維護量大,造成 IT 環境資源交付緩慢,難以應對新業務上線的緊迫要求。2.云資源效益優化實施關鍵環節云資源效益優化實施關鍵環節1)構建異構混合云,實現資源統一管理云優化治理白皮書 第二部分:云資源效益優化(2022 年)32構建統一的管理平臺,將分布在多家公有云廠商(AWS、Azure)、公司內部各數據中心不同的云計算資源(Vmware、KVM)進行統一封裝,通過品高云管理平臺引入可靈活擴展的中間抽象層,屏蔽各類資源管理的差異性,構建具有業務交付能力的高級云服務,實現資源的統一調度管理,將各類資源作為模塊,形成

65、可靈活插拔、可橫向擴展的模式,使得運維人員從繁瑣工作中脫離出來,更關注上層業務發展。結合私有云的對業務個性化,將交易系統支撐平滑延伸向公有云,滿足金融業務快速上線要求。2)提供 IaaS+及部分 PaaS 服務。通過平臺的云服務編排和設計功能,設計構建的部署方案,創造高級服務。除了虛擬資源外,還支持對軟件進行編排,實現諸如軟件高可用、集群、升級等自動化能力。編排后的服務,可以上架服務目錄,形成企業獨有的個性化云服務??梢灾苯咏桓抖喾N常用的彈性計算實例、數據庫實例(Sql server、Mysql、Oracle 等)、開源中間件實例(包括 Tomcat、Nginx 等)、存儲(包括分布式對象存儲

66、,分布式塊存儲,FC 存儲)、數據備份(包括磁帶離線備份、一體機在線備份)等一系列 IaaS+及 PaaS 服務,用戶通過簡單的圖形界面上的勾選即可迅速獲得 IT 服務。3)用戶自助獲取資源,實現業務快速交付。利用平臺,業務和開發部門可以隨時申請資源配額,通過流程審批的方式自助式獲取所需要的資源和服務目錄中的各項高級服務,實現業務的快速化交付。云優化治理白皮書 第二部分:云資源效益優化(2022 年)334)和企業自動化運維生態圈高度整合,實現開發測試、生產、運維一體化。作為客戶運維平臺體系的重要組成部分,混合云管理平臺和客戶新型 CMDB、持續交付平臺高度集成,構建自動化的基礎資源交付、應用

67、編排部署、持續發布的流水線,真正做到 IT 資源按需獲取、彈性伸縮,解決軟件快速高質量交付,應用代碼快速迭代等需求,同時推動應用從 Scale-up 到 Scale-out,為后續進一步實現基于DevOps 的持續交付打下基礎,將傳統虛擬化的效率提升到更高層次。5)自動化運維,提升資產 ROI,增強多云安全保護力。利用品高云提供的自動化編排部署,自定義運維方案,實現自動化運維功能。同時接入客戶原有的 ITIL 流程,將風控、備份和安全等工具通過編排能力有效的集成融合起來,共同作用于不同的云平臺資源,帶來資源 ROI 的提升,減少運維壓力的同時,更重要的是提升了整體多云資源的安全保護能力。3.效

68、果描述效果描述平臺于 2016 年正式上線,支持大規模的跨云資源管理。云平臺具有技術前瞻性和開放性,解決了客戶多年積累的多年、規模龐大、內部異構的基礎設施資源難以管理的問題,其中包括大量的 X86 服務器、VMware/KVM 虛擬機、各類存儲設備(FC-SAN 和分布式存儲)、網絡設備、三大公有云(AWS、Azure、阿里云)、信創云(華為云、深信服云)。在平臺的管理能力方面,支持多種主流 CPU 架構和國產服務器硬件設備。具有完備的云服務目錄,具備 windows、Linux 等云優化治理白皮書 第二部分:云資源效益優化(2022 年)34各種操作系統、多種常用的數據庫和中間件產品的標準化

69、和自助化交付能力,包括:1)具備跨地域、跨平臺、跨云的管理能力,實現異構 IT 資源的整合;2)節省成本經濟效益明顯、節約資源、減少排放、更加充分利用資源,統一管理資源及全自動化交付節省運維成本,降低 TCO(Total Cost of Ownership,總擁有成本);3)標準化、自動化運維能力,提升運維資產 ROI(Return onInvestment,投資回報率),增強多云安全保護力;4)11 項集群化(數據庫、中間件)服務和大數據服務自動化交付,優化了周期性、突發性的業務使用成本,交付周期大大縮短,從原來的“2 天”時間,到“15 分鐘”完成基礎環境和集群服務交付,節約人力成本和減少

70、交付周期;與 VMware 對接架構升級后節省 126 臺集群控制服務器,416 核CPU、1160G 內存、19T 內存。(三)通信行業:云優化效益優化實踐(三)通信行業:云優化效益優化實踐1.案例背景案例背景隨著云計算技術、大數據、容器等新技術的發展,業務云化部署已經成為主流方向,業務上云數量持續增多,云資源規模迅速擴大,云資源運營管理壓力日趨凸顯,且各業務系統的資源配置方式復雜多云優化治理白皮書 第二部分:云資源效益優化(2022 年)35樣,且資源利用率參差不齊,運營人員整體資源管控難度較大,現有的評估方法效率較低、手段單一、缺乏多維度指標綜合分析機制,租戶無法實時了解業務系統所部屬資

71、源的效能情況。因此急需構建一套科學高效的資源使用效能評估方案,助力提升云資源運營管理能力,提云資源升資源使用效能。2.云資源效益優化實施關鍵環節云資源效益優化實施關鍵環節結合用戶和業務系統維度計算資源的 CPU 與內存的均峰值和均值,利用 AI 技術對多維指標集進行綜合分析和建模,并基于模型對各用戶和業務系統的資源使用情況進行效能評估,并定期面向用戶發布評估等級和成績,同時給出優化建議。優化流程分為數據獲取、AI 智能評估、評估結果展示及優化建議推送。1)數據獲?。簭馁Y源運營平臺獲用戶、業務系統每日 CPU 和內存的性能相關數據。2)AI 智能評估:將以獲取的數據輸入 AI 智能評估模型,輸出

72、評估等級和評估分數,評估等級分為優、良、中、差四個等級,評估成績為實際得分,評估的時間維度與數據源同步,目前是按月面向用戶發布。3)評估結果展示:與運營月報同步發布,用戶可從用戶和業務系統兩個維度對資源使用情況和資源使用效能評估結果進行全方位展示,有效增強運營可視化程度。4)優化建議推送:結合一定周期內用戶及業務系統的資源效能云優化治理白皮書 第二部分:云資源效益優化(2022 年)36評估結果,利用 AI 預測模型對未來一個時間段用戶及業務系統資源效能情況進行預測,并給出關于資源擴縮的建議,通過頁面展示、短信、郵件等方式推送給用戶。3.效果描述效果描述云資源效能 AI 智能評估模型,為云資源

73、管理的自動化工具,輔助云資源運營人員、用戶、業務系統管理管理人員等了解云資源使用情況以及如何進一下提升云資源效能。一方面可有效解決當前云資源效能評估方法半手工化、分析方法單一、效率低、可視化程度差等實際問題,節省人工分析成本,助力提升 IT 云資源運營管理能力;另一方面,評估結果可為云資源配置優化提供依據,從根本上提升 IT云資源使用效率,推動資源挖潛增效。同時評估結果也可以為業務系統擴容申請新資源提供評估依據,避免申請資源過多,節約投資成本。(四)物聯網行業:云資源效益優化實踐(四)物聯網行業:云資源效益優化實踐1.案例背景案例背景某全球化 IoT 整體方案服務商,其業務覆蓋全球數十個國家,

74、為數千家品牌客戶提供技術服務,為客戶解決成本高、效率低、運營弱等問題,深受客戶歡迎,業務也得到飛速發展。隨著業務快速發發展,其在 AWS 云上的各種資源使用量也大副增加,導致云資源效益下降,客戶降本增效的需求非常迫切??偨Y起來客戶的需求集中在降低云上資源成本和提升云資源利用率兩個方面。云優化治理白皮書 第二部分:云資源效益優化(2022 年)372.云資源效益優化實施關鍵環節云資源效益優化實施關鍵環節針對客戶痛點,我們為客戶制定的成本優化方案以 FinOps 思想做為指導,從調整資源規格、清理閑置資源、優化出向流量、優化應用架構、提升資源運行效率等幾個維度進行優化,大幅降低運營成本和提升資源利

75、用率。1)分析賬單通過列出客戶所有公有云賬單,找出費用過高的云賬號。2)分析總體成本拿到客戶最近半年的詳細賬單后,分別按照月賬單趨勢、云服務費用排名、Region 費用排名、購買方式的維度進行分析。3)提供成本優化建議1.非服務器實例優化經對帳單費用分析,首先發現跨區域流量費用過高,將流量過高的實例進行業務分析,改成單 AZ 的訪問模式。其次發現磁盤費用過高,根據過高的的磁盤卷 ID 進行業務分析,建議客戶根據不同業務特點,對碰盤的訪問需求,更換磁盤類型或縮減磁盤容量。最后是對 NAT 網關費用過高進行優化,經分析 NAT 形成的原因,我們建議在不同可用區創建獨立的 NAT,配置 VPC 終端

76、節點等方式可以降低費用。2.存儲架構優化列出 s3 總費用、存儲、Requests、Retrieval 的 top費用清單,建議客戶根據業務特點,將歷史數據進行分類、分級,根云優化治理白皮書 第二部分:云資源效益優化(2022 年)38據不同優先級制定不同存儲策略,將低優先級數據進行有效清理,從而大幅降存儲空間,降低存儲成本。3.實例架構優化因客戶部分服務器是按需實例,建議客戶優化工作負載,減少按需的比例,同時建議根據業務峰值特點,將低峰資源加入資源池,抵消高峰業務壓力,從而有效降低實例成本。4.數據庫優化部分數據庫還是按需實例,建議客戶優化工作負載,減少按需的比例。找出非數據庫實例費用 TO

77、P20 的資源 ID,包括數據庫存儲費、備份費、存儲 IO 費,供客戶評估數據庫使用情況。5.負載均衡優化列出負載均衡費用類型和地區分布,找出近期低流量負載均衡的實例 ID,供客戶評估是否可將負載均衡復用或回收。6.Redis 優化 Redis 按需費用較高,RI 覆蓋率低,建議購買一定比例的 RI。根據業務模型評估是否可以用數據分層的 r6gd 系列。7、費用周期優化列出 lambda 中 Saving plan 覆蓋率,供客戶評估是否可以購買部分 Saving plan,合理安排資源周期,降低成本。8、出向流量優化出向流量優化,從 CDN 入手,列出 TOP20 費用資源 ID,建議客戶提

78、高 CDN 緩存命中率,同時開啟壓縮功能,從而有效降低 CDN 節點回源帶寬成本。9.大數據資源優化根據客戶不同需求,配置不同實例。核心工作負載選擇按需實例,任務節點或成本敏感類工作負載選擇一定比例的spot 實例,從而節省了大數據平臺的實例成本。云優化治理白皮書 第二部分:云資源效益優化(2022 年)3910.監控成本優化降低第三方監控工具頻繁調用云監控服務,通過控制臺執行 ListMetrics 調用,而不要使用 AWS CLI。將多個請求批量轉換為一個 API 調用。使用這些最佳實踐可以減少 API 調用量,并減少相應的費用。另外,還對監控日志進行優化,為了降低提取成本,建議客戶可以重

79、新評估日志記錄級別并消除不必要的日志提取,并按需重新評估日志保留時長3.效果描述效果描述經過以上成本優化操作,不僅清理了部分閑置資源、降低了部分資源規格和配置,還把出向流量做了優化,加之數據庫和大數據等高消費資源的優化,客戶在 AWS 云上資源成本至少降低 15%,每年節省數百萬成本支出,客戶的收益如下:1)云資源使用成本降低 15%,每年節省數百萬2)因為有架構的優化,技術團隊的效率得到提升(五)零售行業:云優化效益優化實踐(五)零售行業:云優化效益優化實踐1.案例背景案例背景XX 生鮮連鎖有限公司是一個農副產品市場品牌,目前已在上海、杭州、寧波等城市設立了許多分店。其中在寧波共有 70 多

80、家分店。在生鮮電商領域,發展純生鮮、全品項的線上線下融合,并自主在寫字樓設立保溫自助柜業務模式。以社區冷鏈工作站為中心(服務半徑為 1 公里),建立 2-3 個實體商店,再設立 6-7 個城市公共自助柜從云優化治理白皮書 第二部分:云資源效益優化(2022 年)40而建立一個完整的生態圈。同時采取“背靠 1 個小區,輻射 2 個小區,管理 6 組城市公共自助柜”的思路,解決現代物流“最后一公里”的難題,嘗試用線上線下融合的商業模式為市區居民提供更加便捷的現代服務。目前每個門店有一臺主收銀電腦,包含在該門店辦理的會員卡數據庫,在該門店辦理的會員卡只能通過該數據庫進行增刪改操作;如跨門店使用會員卡

81、會通過 VPN 訪問歸屬門店數據庫。數據庫包含所有門店的會員卡信息和網上辦理的會員卡信息兩部分。其中門店會員卡信息僅用來備份和會員卡歸屬門店查找,不允許客戶層面的增刪改操作,門店數據庫向阿里云數據庫單向同步。網上辦理的會員卡信息支持通過 APP、小程序 H5 等進行增刪改操作??蛻粼谠丛破脚_上只有 12 臺單點服務器(9 臺為 40G+500G、3臺 40G+1T),其中 1 臺是備份機,其余 11 臺都部署數據庫(6 臺與線下門店相關=2 臺屬于線上門店+4 臺門店收銀、3 臺線上商城、1臺外部接口、1 臺內部接口),數據庫版本 sqlserver 2005,最大數據量 45G。門店數據庫有

82、 300 萬500 萬條數據,每年有 GB 級別的存儲,每年備份一次,存放到歷史庫中。設備最多的門店有 12 臺電腦、12 個打印機、1 個備份打印機、7個秤。通過交換機接入,大部分都是以有線的方式接入網絡,很少以無線的方式接入網絡??蛻裟壳懊媾R問題主要包含以下幾點:云優化治理白皮書 第二部分:云資源效益優化(2022 年)411)網絡故障率高。2)云網絡使用經典網絡,不支持彈性伸縮。3)缺少數據安全保護。4)業務高峰期難以擴容,無法有效支撐業務2.云資源效益優化實施關鍵環節云資源效益優化實施關鍵環節MSP 團隊分析客戶現有的業務架構和組網拓撲,對客戶的云上業務架構做了詳細的規劃以及在原有的基

83、礎了做了相關優化,具體內容如下:a)遷移范圍規劃遷移包括收銀會員系統從友商云遷移、數據庫從本地遷移至云上。由于涉及到網絡、應用架構改造,因此采用先割網絡后割應用的兩步遷移割接方案。b)業務遷移保障為保障業務連續性,云上部署完數據中心后,在非工作時間內對業務模塊逐個遷移并進行功能驗證,保證業務最小化遷移,遇到問題及時回退。c)業務架構優化優化現有業務架構,使數據歸集到云上,不再依賴門店。d)網絡優化設計采用 SD-WAN 架構進行組網,最后一公里采用雙鏈路保障客戶網絡可用性。云優化治理白皮書 第二部分:云資源效益優化(2022 年)42e)資源評估MSP 團隊根據客戶的現有的業務規模,以及業務增

84、長速率,評估業務云上所需要的計算資源,存儲資源,安全資源。f)資源部署規劃設計客戶當前應用系統分別是:線上門店系統、線上商城系統、門店收銀系統、訂貨系統、接口系統、備份系統共六大系統。部署在友商云上,各個應用系統的應用程序采用融合部署在有限的云主機上,存在相互影響的情況。本次遷移至移動云-寧波節點,進行架構調整。將各個應用系統進行獨立部署,依據應用系統的日訪問量以及日并發量進行評估,每個應用系統采用 2-4 臺云主機采用集群方式部署應用程序,數據庫采用主備模式。同時各個應用系統前端采用負載均衡(ELB)設置輪詢機制將流量分攤到集群當中的各個云主機中。采用 RDS 數據庫(主備),簡化運維以及管

85、理成本,相比與自建數據庫,性能得以提高,安全得以保障。中間件采用分布式數據庫 Redis(主從雙節點),在避免單點故障引起的服務中斷之外。在線上門店系統遇促銷、商展等活動時,將熱點數據緩存在 Redis 中來輕松應對高并發訪問。各門店訪問友商云由 VPN 模式,切換到智能云網模式訪問到移動云,門店互訪調整為 SD-WAN 模式,保障網絡質量,降低網絡時延,簡化網絡運維。云優化治理白皮書 第二部分:云資源效益優化(2022 年)43配備專業 MSP 服務團隊,支撐企業系統全生命周期上云服務,包含系統遷移咨詢,方案設計,遷移實施,云上驗證,云上系統管理,提供專線網絡支持,MSP 團隊提供專業高速遷

86、移工具,保證上云遷移質量和遷移效率。3.效果描述客戶價值:效果描述客戶價值:通過為客戶進行云資源優化,降低了客戶 22.5 萬的云預算投入,云資源部署周期縮短 80%、節省運維成本 40%,大大提高了企業信息化的運行效率。商業價值:商業價值:本次為客戶進行云資源優化使企業的原有 IT 架構變得更靈活,能夠及時解決運營峰值的壓力和快速適應市場環境的變化。另外云資源優化為客戶系統架構性能、業務性能帶來了明顯的改變:1)系統架構性能改變:)系統架構性能改變:類別性能優化前優化后類別性能優化前優化后業務層高可用性部分應用單點部署,無法熱遷移。由于經典網絡的擴展難度問題,不方便及時擴容新建資源池,任何時

87、間點均可以手動/自動遷移業務層穩定性本地門店數據庫所在的主機物理配置老化全部采用全新的虛擬機提供資源業務層服務連續性本地門店應用底層物理機計算資源故障恢復能力弱,對業務影響周期長虛擬化計算節點可實現熱遷移和快速恢復業務層數據服務數據分散在各個門店中,訪問流程長效率低,安全性通過主備方式部署實現數據的安全與實時服務能力云優化治理白皮書 第二部分:云資源效益優化(2022 年)44低。平臺層健壯性業務流量入口單點問題、網絡線路單點問題。業務、存儲、心跳、4 網分離,專業化數據隔離2)業務性能改變:)業務性能改變:類型操作動作描述優 化 前 響 應 時 間(秒)優化后預期結果(秒)類型操作動作描述優 化 前 響 應 時 間(秒)優化后預期結果(秒)登錄登陸 WEB 系統時間31登錄登陸客戶端時間60-180 不等10資源查詢數據模糊查詢時間(1 萬條內)8-60 不等5資源查詢數據模糊查詢時間(10 萬條內)28-120 不等7資源查詢查詢結果換頁時間3-8 不等2流程操作工單提交時間(系統外)8-50 不等5-8 不等統計月度統計表展開響應時間5-20 不等2統計日統計表展開響應時間5-20 不等2數 據 導 入 導出任一對象數據導入時間(100 條內)50-600 不等12數 據 導 入 導出任一對象數據導出時間(100 條內)10-60 不等5

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(云計算開源產業聯盟:2022云優化治理白皮書-第二部分:云資源效益優化(48頁).pdf)為本站 (淡然如水) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站