《企業發現云成本優化的新秘密武器-于功波.pdf》由會員分享,可在線閱讀,更多相關《企業發現云成本優化的新秘密武器-于功波.pdf(42頁珍藏版)》請在三個皮匠報告上搜索。
1、企業發現云成本優化的新秘密武器FinOps on cloud cost optimization Azul SystemsGC Tech VP/Gavin YuConfidential|Do Not Distribute2于功波于功波Confidential|Do Not Distribute3Confidential|Do Not Distribute4 KPI:FinOps 降本且增效20232023年終總結年終總結Confidential|Do Not Distribute5內卷的由來和內卷的由來和JavaJava的困境的困境Confidential|Do Not Distribute6
2、JDKJDK 2121的新特性的新特性AzulAzul platformplatform PrimePrime (JDK 8/11/17/21)(JDK 8/11/17/21)JavaJava的新武器的新武器(升級換代升級換代?)?)C4:The Continuously Concurrent Compacting CollectorReady Now OrchestratorFalcon:A better LLVM-based JIT compilerCNC:Cloud Native CompilerBug fixed in timeCVE fixed in timeConfidential
3、|Do Not Distribute7Performance EngineeringPerformance EngineeringJVM FinOps Solution JVM FinOps Solution Confidential|Do Not Distribute8提高生產效率、時間價值和性能提高生產效率、時間價值和性能利用利用 OpenJDK 直接替換,無需更改任何代碼直接替換,無需更改任何代碼提高人員生產效率提高人員生產效率減少工程時間、分類時間和操作/支持工單 提高時間價值提高時間價值釋放工程資源,專注于價值交付,縮短產品上市時間提高應用程序性能提高應用程序性能即使負載增加也能提高
4、 SLA,確保對延遲敏感系統最快響應立即減少立即減少 95%故障單,提高運營效率免去每年免去每年 2,190 小時小時 性能調整,在高容量下以微秒為單位 加速欺詐檢測提升提升 80%的微秒級性能 提升提升 50%十微秒內的極致穿透時延消滅毫秒級的延遲 Confidential|Do Not Distribute9云的成功通常伴隨高昂的成本云的成功通常伴隨高昂的成本缺點:缺點:成本超支成本超支缺乏或毫無云成本優化計劃的組織倉促上陣進行云技術投資 最終超支高達最終超支高達云的價值云的價值按需容量彈性敏捷性即付即用可用性可擴展性自動化70%來源:“在遷移到云后實現成本節約”,Gartner 金融研究
5、團隊,2021 年 4 月Confidential|Do Not Distribute10存儲存儲計算約占云支出的計算約占云支出的 60%網絡網絡計算計算計算實例計算實例共享服務共享服務1.https:/ Not Distribute11所需的云計算實例數量所需的云計算實例數量根據可接受的故障率提供實際負載根據可接受的故障率提供實際負載決定決定實際部署的計算實例數量實際部署的計算實例數量Confidential|Do Not Distribute12重新設計/重構/重組應用程序以提高效率和彈性使用更高效的 JDK調優和配置操作系統使用最新的處理器和計算實例類型如何減少云計算實例總數?如何減少云
6、計算實例總數?直接替換/無代碼更改。Confidential|Do Not Distribute13存儲存儲無需任何代碼更改即可將云計算減少無需任何代碼更改即可將云計算減少 20%-50%網絡網絡計算計算計算實例計算實例共享服務共享服務Confidential|Do Not Distribute1403:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Ju
7、n 1821:00Jun 1918:00Jun 180:00Jun 19云計算普遍云計算普遍的現實問題的現實問題*匿名客戶真實案例支付了支付了 100%實際使用率只有實際使用率只有 10%-30%CPU 利用率閾值通常設置在 35%-50%之間1實際利用率通常遠低于閾值2出于對彈性的考慮,實例通常不會在非高峰期停轉3Confidential|Do Not Distribute15投入考量,第一部分:投入考量,第一部分:更快的更快的 Java 應用程序應用程序更少的計算實例更少的計算實例更低的云成本更低的云成本Confidential|Do Not Distribute16投入考量,第二部分:投
8、入考量,第二部分:更高的實例利用率更高的實例利用率更少的計算實例更少的計算實例更低的云成本更低的云成本Confidential|Do Not Distribute17投入考量投入考量更高的實例更高的實例利用率利用率更快的更快的 Java 應用程序應用程序更少的計算實例更少的計算實例更低的云成本更低的云成本Confidential|Do Not Distribute18C1 compiled codeInterpreterC2 compiled code(with deoptimisations)GC pausesJVM Performance GraphJVM Performance Grap
9、hConfidential|Do Not Distribute19運行 Java 代碼的速度提高 20%-50%優化代碼執行以充分利用最新處理器 使用更好的基于 LLVM 的 JIT 編譯器改進推測優化 在較高負載下保持一致的服務水平隨著時間的推移減少 CPU 使用中的噪聲消除暫停、抖動和停滯利用 C4 世界上最好的無暫停垃圾回收器 顯著減少因添加新實例而引起的中斷和故障從一開始便全速運行使用 ReadyNow!技術調整、自學習和迭代優化配置文件 全球最快、最高效的全球最快、最高效的 JVM代碼執行更快,代碼執行更快,Java 應用程序更快應用程序更快一致性更高,利用率更高一致性更高,利用率更
10、高預熱改善,彈性增加預熱改善,彈性增加它是它是 OpenJDK 的增強版本,具有卓越的性能、一致性和承載能力的增強版本,具有卓越的性能、一致性和承載能力Confidential|Do Not Distribute20綜合投入考量綜合投入考量更高的更高的實例利用率實例利用率更快的更快的 Java 應用程序應用程序更少的計算實例更少的計算實例更低的云成本更低的云成本更快的更快的代碼執行代碼執行經過改善的預熱經過改善的預熱更高的一致性更高的一致性Confidential|Do Not Distribute2103:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715
11、:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19云計算的普遍現實云計算的普遍現實Azul Platform Prime 降低云成本的 4 個步驟*匿名客戶真實案例大多數公司將 CPU 閾值設置在 35%-50%容量之間,以應對負載的意外波動支付了支付了 100%實際使用率只有實際使用率只有 10%-30%Confidential|Do Not Distribute2
12、203:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19使用 Azul Platform Prime 時,由于代碼執行更快、更高效,初始 CPU 使用率會降低。1云計算的普遍現實云計算的普遍現實Azul Platform Prime 降低云成本的 4 個步驟*匿名客戶真實案例Con
13、fidential|Do Not Distribute2303:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19云計算的普遍現實云計算的普遍現實Azul Platform Prime 降低云成本的 4 個步驟*匿名客戶真實案例接下來,減少實例計數,使 CPU 使用率升至原始水平(節
14、省成本)2Confidential|Do Not Distribute2403:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19然后,由于一致性和更高負載下保持服務級別能力的提高,實例計數進一步減少,CPU 閾值增加(節省更多成本)3云計算的普遍現實云計算的普遍現實Azul Pla
15、tform Prime 降低云成本的 4 個步驟*匿名客戶真實案例45%Confidential|Do Not Distribute2503:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19*匿名客戶真實案例45%最后,由于實際彈性,在較低負載周期內,實例計數會進一步減少,這是因為
16、啟動時中斷顯著減少(支出與實際需求更匹配)(節省更多成本)4云計算的普遍現實云計算的普遍現實Azul Platform Prime 降低云成本的 4 個步驟Confidential|Do Not Distribute26案例分享案例分享1 1GC無憂Prime1.消除GC擾動2.增加訂單吞吐量3.免除開發JVM優化和測試JVM調優引入無暫停C4回收器采用更高效JIT編譯器ReadNow技術解決預熱問題收益收益痛點痛點1.訂單延遲抖動2.毛刺導致無法滿足SLA3.大量代碼優化和JVM調優Confidential|Do Not Distribute27 某頭部證券(自營自營交易系統交易系統)將Ho
17、tspot的GC延遲從幾百毫秒減少到幾毫秒 快速預熱提升業務處理性能滿足交易系統SLA的需求 提升Kafka吞吐量痛點痛點1.交易延遲抖動2.毛刺導致無法滿足SLA3.大量代碼優化和JVM調優1.消除GC擾動,并提供快速啟動2.增加兩倍吞吐量,節省服務器基礎架構3.免除開發JVM優化和測試JVM調優收益收益案例分享案例分享2 2Confidential|Do Not Distribute28更高的吞吐量;更少的基礎架構使用后使用后(With Azul Prime JDK)(With Azul Prime JDK)Producer ClientsProducer ClientsConsumer
18、ClientsConsumer ClientsProducer ClientsProducer Clients使用前使用前(No Azul JDK)(No Azul JDK)更高吞吐;更少規模;成本更低最終客戶更滿意;更多的營收;SLA保證易于管理;更高效Consumer ClientsConsumer Clients30003000 TPSTPSSLA P99.51ms,P99.910msKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka K
19、afka ServerServerKafka Kafka ServerServerKafka Kafka ServerServer10001000 TPSTPSSLA P99.51ms,P99.910msKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka
20、Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServer3000 TPS3000 TPS SLA P99.51ms,P99.910ms1000 TPS1000 TPS SLA P99.51ms,P99.910ms案例案例2 2分析分析某頭部證券某頭部證券OMSOMS系統系統Confidential|Do Not Distribute29FinOps on Kafka(Cloud Cost Saving Optimization)FinOps on Kafka(Cloud
21、Cost Saving Optimization)Confidential|Do Not Distribute3003:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19FinOps on Kafka(Cloud Saving Optimization)FinOps on Kafka
22、(Cloud Saving Optimization)Confidential|Do Not Distribute31行業專家對增強型行業專家對增強型 JVM/JDK 的看法的看法“IT 團隊正在應對嚴峻的預算環境和高性能應用程序需求的雙重挑戰。優化的 Java 虛擬機為兩者提供了解決方案”IDC 智能 CloudOps 研究副總裁,Jevin Jensen“Platform Prime 使 Java 開發人員能夠更高效地利用服務器資源或云實例。.Forrester 對四位現有客戶的訪談和隨后的財務分析發現,這些受訪客戶的組織獲得了 224%的投資回報率?!盕orrester總體經濟影響研究重
23、新評估云戰略的組織需要重新審視產品組合中的核心技術,并確定如何優化工作負載以在云中本地運行云原生 JVM 可以在不損失任何傳統功能或兼容性的情況下實現”-首席研究分析師,John Abbott“Azul Platform Prime 是一個高性能的基于 OpenJDK 的發行版本,具有優化的 JIT 編譯器、低延遲和高吞吐量的垃圾回收器、低內存使用率以及快速啟動和預熱等功能?!边x擇 Java 運行時,GartnerConfidential|Do Not Distribute32Platform Platform PrimePrime使得開源項目運行使得開源項目運行 更快、更穩和更安全更快、更穩
24、和更安全Prime Prime 對開源項目的性能提升對開源項目的性能提升可以比可以比OpenJDKOpenJDK提升多少性能提升多少性能?Cassandra+35%Elasticsearch/Solr+37%Kafka+45%Confidential|Do Not Distribute33Confidential|Do Not Distribute33Platform Prime Platform Prime 讓讓 AWS Arm64 Graviton AWS Arm64 Graviton 運行得更好運行得更好新新!支持 AWS 的 Graviton 3 處理器Graviton/Arm64 硬
25、件的最佳 JVM令人驚嘆的性價比組合20-29%比Corretto/OpenJDK更快的性能Confidential|Do Not Distribute34PerformancePerformance S-curveS-curve ChartChartConfidential|Do Not Distribute35下一步建議下一步建議估算您的 Java 資產和主要用例的大小 確認您所使用的技術 根據您的業務目標選擇如何使用云成本優化:立即節省運營費用:立即節省運營費用:關閉實例,用更少的資源滿足相同的需求12節省額外的運營費用:節省額外的運營費用:通過一致的性能和改進的預熱提高利用率3回收容量
26、回收容量,為未來增長提供動力:為未來增長提供動力:在容量受限的環境中釋放資源,用相同的資源滿足更多需求4充分利用已承諾的云支出:充分利用已承諾的云支出:在 AWS Marketplace 上輕松購買 Azul Platform Prime5降低每個增量單位的服務成本:降低每個增量單位的服務成本:隨業務增長提高盈利能力6投資新項目:投資新項目:釋放預算以推動更多自籌資金創新7支持您的支持您的 FinOps 戰略:戰略:將其作為下一步云成本戰略Confidential|Do Not Distribute36Azul Java PlatformAzul Java Platform 公眾號公眾號Con
27、fidential|Do Not Distribute38Confidential|Do Not Distribute39AzulAzul平臺平臺Azul Zulu Builds of OpenJDK全連接的運行環境Azul智能云Azul分析套件Azul優化套件Azul Platform Core(曾用名 Zulu Enterprise/Embedded)Azul Platform Prime(曾用名 Zing)AzulAzul支持支持技術支持,培訓支持,遷移服務GatewaysApplied Machine Learning瀏覽 客戶案例客戶案例GatewaysApplied Machine
28、 Learning瀏覽 技術技術Confidential|Do Not Distribute40客戶降低云成本客戶降低云成本服務器占用空間服務器占用空間 減少減少 30%以上以上節省了數百萬美元基礎設施將增加基礎設施將增加 5 倍倍無需借助 Azul Platform Prime回收回收 20%以上未使用的以上未使用的 CPU承載能力,改善玩家體驗借助基于云的財務系統借助基于云的財務系統 每筆交易的成本降低 85%通過提高性能通過提高性能基礎設施支出減少 38%回收回收 50%未使用的基礎設施用于電子交易 Confidential|Do Not Distribute41年云支出估算年云支出估算基于 HG Insights(Intricately)提供的數據進行估算您的年度成本借助成本借助 Azul 預預計可節省計可節?。?30-290 萬美元萬美元您每年在云和數據中心云和數據中心的總支出預計為的總支出預計為:*7,920 萬美元萬美元Confidential|Do Not Distribute42Azul Azul 是支持是支持JavaJava戰略的最佳合作伙伴戰略的最佳合作伙伴