《艾瑞咨詢:2022年企業應用運維管理指標體系白皮書(43頁).pdf》由會員分享,可在線閱讀,更多相關《艾瑞咨詢:2022年企業應用運維管理指標體系白皮書(43頁).pdf(43頁珍藏版)》請在三個皮匠報告上搜索。
1、企業應用運維管理指標體系 白皮書 2022.5 iResearch Inc. 2022 企業應用運維管理指標體系白皮書 1 目 錄 第一章 數字化時代企業 IT 運維的戰略轉型 . 3 一、企業 IT 運維概述 . 3 二、IT 運維背景:企業的數字化基礎設施和應用現狀 . 3 1、國家政策引導數字化支撐企業經營發展 . 3 2、云計算的普及形成了多樣化的 IT 基礎設施布局 . 4 3、云原生帶來了運維技術和理念的深刻變化 . 5 4、數字經濟環境下 IT 運維的價值創造屬性更加顯著 . 6 三、數字化時代企業 IT 運維的戰略部署 . 7 1、企業 IT 運維的全面戰略價值 . 7 2、企
2、業的 IT 運維組織架構革新 . 8 3、企業 IT 運維的成本效益考量 . 9 四、企業 IT 運維的需求和難點 . 11 1、數字化時代,企業更需要體系化的運維指導 . 11 2、IT 人才成本高企,企業運維需要系統性的知識沉淀 . 12 3、運維部門的戰略轉型需要疏通與其他部門的協作渠道 . 13 第二章 企業應用運維管理指標體系. 15 一、業務監測 . 16 1、業務數據價值 . 16 2、業務數據分析的作用 . 16 3、運營指標分類 . 17 4、業務分析常見指標說明 . 17 二、用戶端體驗監測. 19 1、用戶端體驗監測價值 . 19 2、用戶端數據分析作用 . 19 3、用
3、戶端監測實現形式 . 19 4、用戶端監測常見指標說明 . 20 三、應用端監測 . 21 1、應用端監測意義 . 21 2、應用監測價值 . 22 3、應用監測常見功能 . 23 4、應用監測常見指標說明 . 23 四、網絡監測 . 23 1、網絡監測價值 . 23 2、網絡監測常用實現方式 . 24 2022 企業應用運維管理指標體系白皮書 2 3、網絡監測常見指標說明 . 24 五、資源層監測 . 25 1、資源層監測價值 . 25 2、資源層監測包含內容 . 25 3、資源層監測常用指標 . 26 六、中間件監測 . 26 1、中間件價值 . 26 2、消息中間件常見指標 . 27 3
4、、交易中間件常見指標 . 27 七、數據庫監測 . 28 1、數據庫價值 . 28 2、數據庫分類 . 28 3、數據庫監測常用指標說明 . 29 第三章 企業應用運維管理指標體系建設實踐 . 30 一、企業應用運維管理指標體系建設指導思想 . 30 1、指導思想. 30 2、業務全面梳理 . 30 3、確定應用關鍵動作 . 31 4、預定義各關鍵指標 . 31 5、企業應用運維管理平臺 . 32 二、企業應用運維管理指標體系建設步驟 . 33 步驟一:調研 . 33 步驟二:驗證 . 36 步驟三:閥值 . 37 步驟四:評價體系 . 39 步驟五:閉環 . 39 三、指標體系常用場景 .
5、40 特別鳴謝 . 41 附:本報告專業名詞釋義 . 42 公司介紹/法律聲明 . 43 版權聲明 . 43 免責條款 . 43 聯系我們 . 43 微信公號 . 43 2022 企業應用運維管理指標體系白皮書 3 第一章 數字化時代企業 IT 運維的戰略轉型 一、企業 IT 運維概述 IT 運維是企業對其所擁有和管理的 IT 軟硬件資源設施進行監測、維護、優化的過程。企業的 IT 運維工作根據運維視角和對象的不同可以分為企業側的基礎設施運維、應用系統運維、網絡通信運維以及用戶側的用戶體驗管理等。 IT 基礎設施運維面向 CPU、 存儲器等基礎硬件操作系統, 中間件、 數據庫等基礎軟件,確保企
6、業 IT 系統的可用性、安全性和連續性,提高企業 IT 系統的運行效率和服務質量,是企業信息化依賴的基礎和根本。在 IT 基礎架構云化的背景下,面向基礎云服務的運維管理也被納入 IT 基礎設施運維的范疇中。應用系統運維主要面向企業的各項內外部數字服務,對其應用性能和表現進行監控和實時優化, 從而確保各項功能正常運作, 提升使用者的交互體驗。網絡通信運維面向企業的網絡架構,關注網絡通信的速度、穩定性和延遲等方面的表現,確保企業的網絡處于高質量運行水平,提供良好的信息傳輸體驗。 隨著互聯網服務深入千行百業, 數字化應用成為企業和機構為用戶提供服務的重要形式,直接對用戶體驗環節進行監測和優化成為 I
7、T 運維的新思路和途徑,相較于傳統的面向企業IT 資源的運維,面向用戶體驗的 IT 運維方式更加聚焦于前端業務側,能以更顯而易見的方式提升各項服務的表現。 隨著互聯網經濟的發展, 這一運維思路已在企業中得到了充分實踐。 二、IT 運維背景:企業的數字化基礎設施和應用現狀 1、國家政策引導數字化支撐企業經營發展 以數字化工具為代表的前沿科技已經成為企業經營發展的重要推動力以及社會重要生產力,一直以來國家政策對數字化建設保持著積極樂觀的支持態度,近兩個“五年規劃”均提及了支持企業通過數字化轉型升級提升經營能力和水平。 在此環境下, 各部委和地方政府也在不斷出臺鼓勵政策,支持數字經濟發展,推動數字能
8、力向傳統企業滲透,賦能傳統提升經營效率。 從細分領域上看, 近年來云計算仍然是國家和行業科技政策的重要方向, 由云計算帶來的企業 IT 基礎設施多樣化的問題將對 IT 運維持續產生需求。此外,近年來政策不斷強調企業應當在數字化建設的過程中更明確地確立數據的資產地位, 更有效地發掘數據的商業價值,以數據應用賦能企業的數字化建設乃至主營業務的發展, 對于金融等數字化深度融合的行業尤其如此,各行業主管部門也在加強對數據和智能應用的推進。 2022 企業應用運維管理指標體系白皮書 4 表 1:近年來與企業 IT 數字化建設相關政策梳理 2、云計算的普及形成了多樣化的 IT 基礎設施布局 近十年來基礎云
9、服務在國內企業間深度滲透, 各行各業和不同規模的企業以不同的方式部署了基礎云計算產品。其中,中小企業通常無力也無必要部署私有的服務器,更傾向于使用公有云服務獲取低成本的 IT 資源;而大型集團企業或者具備系統性重要性的行業企業出于合規和數據安全考慮, 更傾向于同時使用公有云和私有云, 將不同類型的數字功能部署在不同位置,由此,混合云成為了金融、交通、政務等關鍵行業企業的普遍選擇。 圖 1:2021 年全球企業的用云方式 2022 企業應用運維管理指標體系白皮書 5 圖 2:2021 年全球企業的混合云用云方式 多云和混合云使得企業的基礎 IT 資源架構復雜化,提升了企業運維的洞察力要求。此外,
10、 基礎云服務本身作為一種計算資源的獲取方式, 實際上是企業利用網絡通信資源來代替本地化部署的計算資源。因此,企業為了保障基于云服務的數字應用質量,需要同時對網絡通信的質量進行監控,構建全方位的 IT 資源監測和優化體系。 3、云原生帶來了運維技術和理念的深刻變化 云原生已經邁過了概念期,在各行業得到了充分應用,未來還將進一步推廣。云原生體現了云計算發展的下一階段的模式: 以容器技術以及微服務架構為基礎, 云原生模式下企業調用云資源的顆粒度和彈性都能夠得到顯著提升。同時,經微服務改造、運行在容器環境下的應用程序架構和管理也更加復雜, 需要更具深度和洞察能力的運維工具對其進行透視, 幫助企業監測云
11、原生應用的運營狀況。 圖 3:2019&2020 年中國企業容器使用方式 2022 企業應用運維管理指標體系白皮書 6 除了給企業的 IT 基礎架構以及運維手段帶來改變,云原生也對企業運維部門的工作方式方法造成了深刻影響,典型代表是 DevOps(開發運維一體化)理念和實踐的推行。 在 DevOps 推廣之前,企業 IT 部門下屬的軟件開發和運維部門是兩個比較獨立和割裂的體系,由不同的員工負責。在這種傳統模式下,兩部門各有不同的利益關切,在技術協調和工作協同方面的溝通受阻, 導致整體的工作效率不高。 DevOps 的首要作用在于通過云原生架構為開發和運維部門提供一致性的工作環境,使得開發人員能
12、夠便捷地參與運維工作,從而將原本割裂的兩個部門體系打通, 提升軟件工程的整體效率。 DevOps 的推廣與云原生架構的普及密切相關, 因此, 也可以認為云原生技術給企業運維部門的工作方式和流程帶來了改變。 4、數字經濟環境下 IT 運維的價值創造屬性更加顯著 除了 IT 基礎設施形式及技術更迭之外,企業應用層的變化也在影響著運維部門的任務與長期價值。 產業數字化和數字產業化在三次產業中的滲透率正在不斷提升, 其中尤其以第三產業最為突出。 數字經濟的深化發展使得企業經營活動的形態發生了顯著的變化, 以數字形態和互聯網渠道發生的經營合管理活動越來越多,形式創新也在不斷更迭。 圖 4:2016-20
13、20 年中國三次產業的數字經濟滲透率 2022 企業應用運維管理指標體系白皮書 7 圖 5:2013-2020 年中國有電子商務交易活動的企業數比重 企業經營活動的轉型使得運維工作的密集度、 重要性和戰略價值都出現了提升, 此前企業的 IT 系統主要面向內部使用,現在新增了大量面向客戶提供服務的模塊,從而使得企業的運維質量直接關系到客戶的使用體驗以及對企業的整體評價, 進一步影響企業的市場形象和品牌價值。 對于互聯網娛樂、 互聯網金融等體驗屬性較強的業務而言, 上述影響更加顯著,這也使得這些企業對數字化環境中的 IT 運維建設格外看重。 運維工作在直接影響數字服務質量的同時, 也會影響企業內部
14、系統的性能和穩定性, 尤其對于開發側而言, 能否獲得高效穩定的開發環境在一定程度上決定了企業的數字應用迭代效率,對于數字服務企業而言,這是構成其市場競爭力的重要方面。結合了大數據和人工智能算法之后, 企業能夠借助運維工具進一步提升運維工作的效率和準確率, 并為業務側帶來更富洞見的分析指標。 三、數字化時代企業 IT 運維的戰略部署 1、企業 IT 運維的全面戰略價值 整體來看, IT 運維工作能夠為企業帶來三方面的價值: 通過更加精確的資源需求統計,幫助企業降低冗余的 IT 投入,從而帶來直接的會計價值;企業在數字化環境下,運維部門通過業務大數據分析能夠指導業務部門的產品改良或創新,由此有望為
15、企業帶來業務創收,這部分價值也應當納入管理層對運維部門成本效益的考量; 此外, 由運維創新帶來的企業服務質量的提升能夠幫助企業提升市場形象, 由此帶來的品牌價值盡管無法估算, 但對于企業的經營和發展仍然有著重要意義。 2022 企業應用運維管理指標體系白皮書 8 圖 6:IT 運維創新給企業帶來的多重價值 為了充分發揮上述價值, 尤其是對業務部門和公司品牌的價值, 運維部門需要在運維工作的開展方式上進行優化。傳統視角下,運維部門著眼于歸屬企業的 IT 資產端,以保證在內部視角下 IT 系統穩定運行,但在數字化時代,運維工作更需要從用戶視角出發,也就是從應用端著手,將提升應用端的高質量體驗置于優
16、先地位, “自上而下”地進行從應用端到資源端的穿透,從而為企業整體帶來提升用戶粘性和品牌聲望的提升。 2、企業的 IT 運維組織架構革新 IT 運維部門在企業中的組織架構關系也體現著運維的具體工作內容以及對企業的意義。運維部門通常隸屬于 CTO, 與開發、 集成等其他信息技術部門并列。 在傳統的企業架構中,IT 運維屬于不直接創造價值、僅僅為支撐前端業務運營而存在的“后臺”部門,其支出也被理解為純粹的費用, 比較難以獲得企業的主動投入和規模建設。 隨著企業數字化轉型的開展,運維部門除了發揮固有的 IT 支撐作用之外,還開始通過業務系統數據洞察來幫助和指導企業的數字化業務創新,從而具備了一定的“
17、中臺”作用。 2022 企業應用運維管理指標體系白皮書 9 圖 7:企業 IT 運維部門的組織架構關系 運維部門要充分發揮對業務側以及企業整體的賦能價值, 在配備具備大數據、 智能分析等運維產品之外, 也需要在組織架構方面進行改良。 企業需要創設業務側與運維部門的溝通渠道, 并將之形成固有的制度體系, 使得運維部門的建議能夠傳達到業務側并有效落實由于涉及到企業的組織架構調整,這可能是一個相對緩慢的過程,但對于企業 IT 能力的充分發揮至關重要。 3、企業 IT 運維的成本效益考量 在 IT 運維充當“后勤”的時代,企業對于運維部門的成本效益考量相對簡單,主要參考的是運維產生的各項投入以及最終的
18、 IT 系統表現:基于傳統的 IT 基礎設施,企業通常采用橫向擴容的方式提升災備和可用性, 新一代運維服務能夠以更低的成本解決這些問題, 從而節省企業購置服務器、 網絡帶寬等基礎設施的費用, 形成前述的直接可見的部門內會計價值。 從運維部門的成本投入上看,以運維服務器(如監測服務器、備份服務器等)為代表的運維硬件的購置成本和設備運行過程中產生的電力及損耗占據 60-70%的比例, 其他成本主要包括運維軟件及 IT 人力投入。通過智能化、體系化的運維創新,企業能夠減少占較大比重的運維硬件固定投入,并降低重復性的人力投入,將優秀的 IT 設備和人才資源投入到更具創造性的開發工作中去。 2022 企
19、業應用運維管理指標體系白皮書 10 圖 8:企業運維部門成本結構估算 在新興的智能運維領域,在提升可用性、穩定性之外,智能運維的重要價值就在于減少重復的人工投入,提升自動化水平,因此企業在評估智能運維成效的時候,也需要綜合考慮智能運維的這一屬性為企業帶來的成本優化。 對于運維數據體系建設較完善的企業, 還應當將運維給業務部門帶來的價值增量納入考察范圍, 由于基線難以確認, 又涉及企業組織架構間的協調,這一指標相對難以構建,但管理層仍然需要注重這一價值,以便正確衡量智能運維投入的性價比。 圖 9:2021 年全球企業:智能運維效果評估指標選取調研 2022 企業應用運維管理指標體系白皮書 11
20、四、企業 IT 運維的需求和難點 1、數字化時代,企業更需要體系化的運維指導 進入數字化時代以來, 企業正在不斷提升軟硬件投入, 以強化自身的數字化能力。 2020年,盡管整體經濟發展狀況受到了疫情帶來的較大影響,但中國企業的 IT 支出水平仍然實現了小幅度上升。從結構上看,中國企業的 IT 支出主要流向通信服務、IT 設備兩大類,此外還有 IT 服務、數據中心系統和企業級軟件等,其中企業級軟件在疫情對數字化經營的刺激下于 2020 年后出現了較大增長。 相較于全球企業的平均水平,國內企業對 IT 設備的投入比例較高,從而帶來了后續面向設備的運維需求, 而在數字化經營的需求下, 企業級軟件的增
21、加也創造出了豐富的應用運維需求。而在通信服務等其他方面,服務商會為企業提供一定的基礎運維,企業也會結合自身的業務和 IT 架構狀況進行個性化的運維體系建設。整體來看,提升運維能力是數字化時代企業進行轉型和發展必然需求。 圖 10:2019-2021 年中國企業 IT 支出大類規模和結構 前文已經提及,前互聯網經濟時代,企業的運維體系是從內部視角出發構建的,現今需要向應用端視角轉變,二者的根本目雖然是一致的,但在運維工作的方法上需要更新,企業隨之產生了對新環境下的運維體系的方法論需求。此外,公有云、私有云、邊緣云等多種新型 IT 基礎設施的應用,給企業的 IT 資源帶來了全方位的復雜化、立體化革
22、新,數字經濟的滲透又給企業的運維提出了更高標準的要求。 結合下圖中國內某頭部廠商城商行的運維現狀、問題和發展規劃可見, 要適應上述的基礎架構和業務形式變化, 企業需要系統化的方法論指導、明確的指標體系的引導。這些前期工作的積累和沉淀,能夠為企業運維工作帶來執行效率和管理效率的提升。 2022 企業應用運維管理指標體系白皮書 12 圖 11:中國某銀行的 IT 運維體系和發展規劃 2、IT 人才成本高企,企業運維需要系統性的知識沉淀 隨著數字經濟的發展及其創造的社會經濟價值持續提升,我國的 IT 人才成本在市場需求的刺激下持續提升,國家統計局數據顯示,IT 行業(信息傳輸、計算機服務和軟件業)的
23、城鎮就業人員年均薪酬在所有宏觀大類行業中位居第一,保持較高的同比增速,且 IT 行業的平均薪酬自 2016 年首次超過金融行業以來就一直位居榜首位置,如果以 8%的復合增長率計算,到 2025 年 IT 行業人才平均年薪將超過 26 萬元。 圖 12:2020 年中國宏觀大類行業城鎮就業人員平均薪資 TOP5 及增速 2022 企業應用運維管理指標體系白皮書 13 圖 13:2011-2020 年中國 IT 行業城鎮就業人員平均年薪 IT 人才成本的提高, 給企業帶來的直接影響是增加了聘請包含運維在內的員工的成本。另一方面, 在社會分工細化和產業整合的大環境下, IT 人才更可能向專業的信息科
24、技企業流動,甲方企業更有可能面臨人才缺乏和流失問題。對于企業而言,減少對人力和經驗的依賴是應對上述問題的有效方法, 而為了達成這一目標, 企業需要為運維工作建設系統性的指標、流程和組織協作體系, 下圖所示的中國某傳統行業大型企業就采取了上述的發展戰略, 以構建體系的方式來提升運維工作的標準化程度,從而實現運維工作的降本增效。 圖 14:中國某傳統行業企業的 IT 運維體系和發展規劃 3、運維部門的戰略轉型需要疏通與其他部門的協作渠道 在數字化經營環境下,企業運維部門的價值不再限于運維本身,甚至也不僅限于 IT 領域,而是能夠透過 IT 系統數據洞察企業業務拓展和內部管理中存在的問題,幫助企業改
25、善經營質量和管理水平。 2022 企業應用運維管理指標體系白皮書 14 前文已經提及,要實現這一變革,企業不僅需要做好底層數據打通和分析框架構建,并為運維部門配備具備大數據分析功能的數字產品, 更需要就組織架構進行優化: 對于很多傳統企業來說,運維部門的定位仍然停留在企業后臺,對前端的經營管理幾乎沒有話語權,更容易因為暫時的經營困難面臨裁減預算和人員等難題。 為了發揮企業運維側的戰略價值, 企業需要自上而下地打通運維部門和其他部門之間的溝通渠道,形成合力,共同賦能于企業的數字化轉型升級。下圖展示了中國某頭部互聯網企業的運維發展狀況和未來規劃, 對于互聯網企業而言, 基于數據的運維技術相較其他傳
26、統行業更加程度,但由于互聯網業務的數字型,運維部門也承擔著更貼近業務側的職責,為了更好地賦能業務創新,運維部門不僅需要運維技術的迭代,也需要通過建立更完善的、能夠持續賦能和迭代的運維指標體系的方式,來疏通和業務部門、管理層溝通的渠道,使運維部門能夠充分發揮技術優勢和創新能力, 提升運維工作給企業都帶來的價值, 增加運維工作的投入產出比。 圖 15:中國某互聯網企業的 IT 運維體系和發展規劃 2022 企業應用運維管理指標體系白皮書 15 第二章 企業應用運維管理指標體系 本報告第一章闡釋了企業 IT 運維的內涵,以及在當前數字經濟發展的大環境下企業 IT運維工作在技術、戰略、組織架構等方面面
27、臨的變化,并就企業 IT 運維的戰略發展方向以及需要解決的需求和難點進行了列舉。前文已經提及,企業 IT 運維正在經歷從“后臺”向“中臺”的轉變,進一步發揮其在企業中“降本增效”的效果。艾瑞咨詢認為,為了提升運維的投入產出比并提升運維側對業務側的價值創造屬性, 企業的運維部門需要構建一套運維管理指標體系,這將幫助企業運維部門形成高效的工作流體系,提升日常運維工作的效率,減輕運維工作對人工和經驗的依賴, 并為基于大數據的智能運維應用的部署提供支持和引導。 圖 16:企業應用運維管理指標體系全局示意圖 上圖以博睿數據的企業應用運維指標體系為例,展示了一種的全新的企 IT 運維指標體系,這一體系從業
28、務視角切入,以業務場景為主題,以業務連續性為宗旨,通過直面業務場景、正向梳理 IT 調用鏈、逆向接入數據源等實施步驟,最終構建起具備概覽所有業務場景健康度、俯瞰多維立體化 IT 指標等能力的資源指標管理體系。本章后文內容基于這一指標體系,以業務端-用戶端-應用層-網絡層-資源層-中間件-數據庫的順序展示了各版塊主要的運維指標,并對各版塊運維的價值、作用和實現方式進行了說明。 2022 企業應用運維管理指標體系白皮書 16 一、業務監測 1、業務數據價值 業務端是企業應用運維指標體系的首要關注點。 對于企業來說, 業務狀況是企業管理者最關心的部分,也是企業所有決策的基礎,而隨著大數據和人工智能技
29、術的發展,大量企業借助信息技術實現轉型升級。 下圖展示了我們對業務端核心運維指標的分層以及實踐中部分企業的對業務端運維指標的關注點, 艾瑞咨詢認為, 業務數據指標能夠為業務側員工和管理者提供數據洞察,員工和管理者做決策時不再僅僅是按照經驗“拍腦袋”,而是基于數據分析的結果進行戰略調整及決策規劃。 圖 17:業務端核心運維指標體系及企業應用案例 2、業務數據分析的作用 尋找優質渠道:發現高量級、高質量渠道、發現真正價值來源。 提升關鍵轉化:探索發現用戶關鍵行為,建立業務關鍵路徑、提升用戶轉化效果、降低關鍵業務環節用戶流失。 識別高價值用戶:整合自有數據和第三方數據,掌握用戶全景畫像,識別高價值用
30、戶,并針對潛在購買人群進行產品升級營銷、交叉營銷、復購營銷,提升用戶粘性和全生命周期價值。 提升觸達效果:整合推送、郵件、短信類的多渠道對用戶進行全方位觸達,并基于數據 2022 企業應用運維管理指標體系白皮書 17 進行分群個性化觸達,真正實現千人千面,做到精準投放。 提升營銷效果:以推廣頁為起點進行轉化分析,提升營銷活動效果。針對未響應、未購買等人群,通過不同活動進行分層創意營銷,提升活動效果和 ROI4。 3、運營指標分類 運營指標是量化衡量標準、衡量目標的單位或方法,針對企業的 Web、APP、小程序上的指標通常分為以下幾種形式: 表 2:主要運營指標類型 其它常見的指標類型如下圖所示
31、: 表 3:其它常見指標類型 4、業務分析常見指標說明 轉化率: 轉化率指在一個統計周期內, 完成轉化行為的次數占推廣信息總點擊次數的比率。計算公式為:轉化率=(轉化次數/點擊量)100%。 例如 10 名用戶看到某個搜索推廣的結果,其中 5 名用戶點擊了某一推廣結果并被跳轉到目標 URL 上,之后其中的 2 名用戶有了后續轉化的行為。 點擊率: “點擊率” 來自于英文“Click-through Rate” (點進率) 以及“Clicks Ratio”(點擊率),是指網站頁面上某一內容被點擊的次數與被顯示次數之比,即 clicks/views,能夠反映網頁上某一內容的受關注程度,經常用來衡量
32、廣告的吸引程度。 UV(Unique Visitor)獨立訪客:統計 1 天內訪問某站點的用戶數(以 cookie 為依據),通常將訪問網站的一臺電腦客戶端計為一個訪客,可以理解為訪問某網站的電腦的數量。網站判斷來訪電腦的身份是通過來訪電腦的 cookies 實現的。若更換了 IP 后但不清除 2022 企業應用運維管理指標體系白皮書 18 cookies,再訪問相同網站,該網站的統計中 UV 數不變。若用戶不保存 cookies 訪問、清除 cookies 或者更換設備訪問,計數會加 1。 PV(Page View)訪問量:頁面瀏覽量或點擊量,衡量網站用戶訪問的網頁數量,在一定統計周期內用戶
33、每打開或刷新一個頁面就記錄 1 次,多次打開或刷新同一頁面則瀏覽量累計。 啟動用戶數:通對啟動用戶數跨天去重,從而反應真實的 UV。 留存率:互聯網行業通過拉新或推廣的活動把用戶引過來,用戶開始訪問網站/應用,但是經過一段時間可能就會有一部分客戶逐漸流失。 留存率定義為用戶在某段時間內開始使用網站/應用 (一般定義是注冊) , 經過一段時間后, 仍然繼續使用的人被認作是留存用戶。留存率體現了網站/應用的質量和保留用戶的能力。 七日留存: 指發生初始行為的用戶經過七天, 發生了回訪行為的用戶。 例如, 選擇條件:初始行為=點擊購買,回訪行為=點擊購買,4 月 1 日發生購買的用戶 200 人,這
34、 200 人中4 月 7 日再次購買的用戶有 50 人,則第 7 日留存用戶為 50。 活躍用戶數:傳統意義上是一段時間內有訪問行為的用戶數,對于網站來說是訪問,而對于 APP 來說是啟動;時間窗口往往是天或月,例如:按天統計時就是 DAU,按月統計時則是 MAU。 ROI:投資回報率, 對企業來說用于推廣效果評估, 可以助力企業實現一定程度的精準投放。 活躍用戶 ID 數:每一個用戶都會對應一個 ID。 活躍天數:通常指人均活躍天數。 老用戶數:通常指在特定分析時間段內,之前已經訪問過的用戶數量。 每日流失用戶:當天沒有訪問網站的老用戶。 平均停留時間:平均每位訪問者在網站上停留的時間 。
35、人均使用時長:常見于對 APP 數據統計,人均使用時長 = 總使用時長 / 使用人數。 觸發次數:觸發一個事件的次數,比如點擊登錄、加購等按鈕次數。 周活躍率:去重后的周活躍用戶數量 / 歷史累計去重后的用戶數量。 日活躍率:去重后的日活躍用戶數量 / 歷史累計去重后的用戶數量。 達成人數:完成特定流程或事件的人數。 頁面訪問次數:特定頁面的打開次數。 新增用戶占比:特定時間段內,新用戶與總人數的比值。 2022 企業應用運維管理指標體系白皮書 19 二、用戶端體驗監測 1、用戶端體驗監測價值 用戶端(APP、小程序、網站等)是企業與用戶的數字觸點,同時也是企業獲客、留客的重要途徑。 在互聯網
36、/數字化服務的整個鏈條上, 客戶需首要關注的是用戶端體驗及表現,從而使得用戶端體驗成為數字化經營中企業產品力和市場競爭力的重要組成部分。 下圖展示了用戶端核心運維指標體系及部分企業的關注點, 艾瑞咨詢認為, 以提升體驗為核心的用戶端運維質量會直接影響用戶對企業的印象和評價,是企業開展運維工作良好的著力點。 圖 19:用戶端核心運維指標體系及企業應用案例 2、用戶端數據分析作用 分析客戶端的性能及可用性表現,全面掌握不同終端、不同地域、不同運營商網絡中的業務體驗差異, 快速定位問題成因是外部網絡問題還是終端問題, 確保業務在全國范圍的終端側可用。 3、用戶端監測實現形式 用戶端真實用戶體驗監測通
37、用方案有兩種: 無侵入式模擬監測和代碼注入式的體驗監測。 無侵入式監測也稱作模擬監測,采用分布在全國不同地區、不同運營商監測點,定時動態地訪問網站服務及應用;代碼注入式監測則是對全量用戶數據的收集,通過 SDK 注入的 2022 企業應用運維管理指標體系白皮書 20 方式全面掌握用戶的感知和行為數據, 不僅可以及時發現網頁/APP/小程序上線后存在的應用性能不良、崩潰、卡頓等問題的原因,還可以真實反映用戶的留存與操作情況,幫助開發者對 APP 進行優化,提高用戶粘性。 4、用戶端監測常見指標說明 可優化延時:衡量會話受可優化問題的影響的時間量,如果解決了相應的可優化問題,用戶就可以在更短的時間
38、內完成會話。使用投影法可以計算會話可優化延時。 體驗評分:以百分制計算會話的綜合體驗評分。體驗評分 =(執行通過率/100%)舍尾取整(1-可用性)100(1-可優化延時/會話整體耗時權重 A+(1-請求錯誤率)權重B+(1-請求警示率)權重 C,不可用或非 100%通過的會話,會話體驗評分為 0。權重使用主客觀綜合賦權法確定,權重=0.8主觀權重+(1-0.8)客觀權重,0.8 為初始權重參數。 首屏時間:用戶訪問網站時,頁面第一屏的打開展現時間。 可用性:網站打開成功率,是反映網站是否穩定的重要指標。 ANR1:指在 Android 上,應用程序響應不夠靈敏時,系統會向用戶顯示的一個對話框
39、,通常關注指標有 ANR 次數、ANR 率等。 整體性能:頁面全部加載完成的時間,即頁面打開的耗時。 崩潰:APP 崩潰是導致用戶流失的重要因素之一。由于大多數公司在 APP 上線之前無法做到在各種環境下的全面適配測試, 出現崩潰在所難免。 快速定位問題點及問題復現是崩潰分析的意義所在, 公司常需要關注崩潰次數及崩潰率, 通過崩潰堆棧進行問題分析與定位。 白屏時間:即用戶點擊一個鏈接或打開瀏覽器輸入 URL 地址后,從屏幕空白到顯示第一個畫面的時間。白屏時間的長短將直接影響用戶對該網站的第一印象。 首次渲染時間:從開始瀏覽到實際渲染出第一個像素之間的時間間隔。 卡頓:如果出現出現 jank(F
40、PS 突降)、幀渲染緩慢、FPS 長期過低三者之一,則會出現屏幕卡頓問題,可以通過查看受此問題影響的時間區域的 FPS、幀渲染時間,確定具體的卡頓原因。 可交互時間: 網頁第一次完全達到可交互狀態的時間點, 可交互的狀態下瀏覽器可以持續性地響應用戶的輸入。 通過率: 以百分率表示在規定的時間內, 會話未出現致命問題的情況下的動作執行通過性,通過率=會話預設交互已執行次數/總預設交互次數100%。 用戶端訪問過程中的錯誤情況也需要關注, 常見的錯誤包括 JS 錯誤、 請求錯誤率、 400錯誤率、500 錯誤率、600 錯誤率等。 2022 企業應用運維管理指標體系白皮書 21 DNS3時間:指頁
41、面或元素訪問過程中 DNS 解析所用的時間。 劫持比率:瀏覽過程中發生 DNS 劫持或頁面劫持的總監測次數占總訪問次數的比率。 首包時間:從頁面瀏覽開始到接收到第一包數據(通常為基礎文檔數據)返回之間的時間差。 應用安裝耗時:應用在安裝過程中消耗的時間。 信息量:頁面上顯示的信息量,以圖像判斷所傳遞的信息量。 響應時間: 指客戶端發送調度請求之后到接收到調度服務器返回第一包數據之間的時間差。 TCP2鏈接時間:下載該元素過程中建立 TCP 連接所用的時間。 SSL 建連時間:下載元素所需的 SSL 握手用時。 CDN: 構建在現有網絡基礎之上的智能虛擬網絡, 依靠部署在各地的邊緣服務器, 通過
42、中心平臺的負載均衡、內容分發、調度等功能模塊,使用戶就近獲取所需內容,降低網絡擁塞,提高用戶訪問響應速度和命中率。是目前常用的網站加速技術。國內 CDN 廠商眾多,企業每年在 CDN 服務方面投入從千萬級到十萬級不等,因此 CDN 服務質量也是各類網站的關注重點,了解其服務質量主要通過 CDN 請求性能、CDN 運營商匹配率、CDN 城市匹配率來評估。 三、應用端監測 1、應用端監測意義 了解應用訪問情況是企業 IT 運維的基礎。艾瑞咨詢認為,用戶端指標所反映的訪問情況只是一個表象, 用戶端真正所訪問到的其實是網站的后臺應用, 當前企業面臨著日益激增的 IT 復雜性和業務需求的快速變化,IT
43、應用在運行過程中發生性能下降或者服務不可用等故障的可能性大大增加,從而影響業務服務的正常運行。 下圖展示了應用端核心運維指標體系及部分企業的關注點: 企業的數字化業務正在不斷增加,業務系統之間的關聯性也在持續提升,同時,企業的 IT 系統的規模和架構的復雜度也在提升, 傳統企業可能缺乏專業的運維團隊以及專業的業務應用監控工具來應對。 隨著敏捷開發與開發運維一體化時代的到來, 越來越多的企業采用應用容器化部署, 龐大的分布式服務集群包含了成千上百的容器實例, 而這些實例都是可隨時進行銷毀和創建的。 由于虛擬化和云技術的高速發展、終端設備類型的增加和網絡接入方式的多樣化,如何更高效、智能地在應用容
44、器中部署和管理探針, 成為各大企業運維人員更加關心的問題, 而有效地管理這 2022 企業應用運維管理指標體系白皮書 22 些應用,保證業務的連續性和 IT 系統的穩定性是業務發展的迫切需要,企業需要對軟件應用程序的可用性進行監視和管理。 圖 20:應用層核心運維指標體系及企業應用案例 2、應用監測價值 應用監測能夠幫助企業快速定位問題和節約成本:通過應用監測,探針對慢請求進行深度分析, 讓企業能夠在幾秒鐘內了解性能問題的根本原因, 并深入到最小維度發掘特定調用的堆棧跟蹤信息, 只需幾秒鐘就能找出關于響應時間延遲的類目和方法; 運維人員可以清晰地了解當前應用性能情況, 例如是否是代碼原因導致的
45、應用用戶體驗下降, 進一步導致客戶的流失;針對業務工程的全部代碼(包括用戶級別代碼)進行全程自動跟蹤,且無需研發團隊配合,既高效又節約了成本。 協助企業持續關注應用性能狀態, 并獲取實時反饋: 企業通過監測平臺開始對應用進行檢測后,系統會持續地接收所采集的樣本數據,采集數據最小周期為 1 分鐘,保證用戶每次看到的報告數據都是最新的, 真正做到對應用的實時跟蹤。 當監測平臺發現潛在的服務器處理問題達到一定標準時,會以報警的形式第一時間通知運維人員,引起運維人員的重視,及時處理,從而最大限度降低損失。 助力企業應用容器化部署:對于采用應用容器化部署的公司來說,應用架構較為復雜,版本的迭代和功能更新
46、頻率較高。采用 SmartAgent 技術的應用監控,可自動對宿主機上所有目標應用進程進行自動識別和探針部署、配置,整個過程無需用戶任何手工干預,實現服務端應用性能監測的探針自動化部署和配置。 2022 企業應用運維管理指標體系白皮書 23 3、應用監測常見功能 應用邏輯拓撲發現與可視化:以業務視角透視 IT 系統架構,通過應用拓撲完整展現 IT系統架構,幫助用戶掌握業務在各個環節的性能表現。 用戶事務剖析: 對指定的用戶事務請求進行完整的追蹤, 包括在整個請求過程中調用的所有服務和組件。 應用組件深入鉆?。褐С謱τ脩艏壌a進行分析,可呈現每一個類、每一個方法的執行效率,幫助研發團隊了解業務性
47、能表現的每一個細節。 4、應用監測常見指標說明 健康度:應用健康度的標示,展示應用當前是否有性能問題。常分為四個等級:正常、較慢、很慢、停滯。 Apdex:全稱是 Application Performance Index,是由 Apdex 聯盟開發的用于評估應用性能的工業標準。Apdex 標準從用戶的角度出發,將對應用響應時間的表現,轉為用戶對于應用性能的可量化范圍為 0-1 的滿意度評價。 響應時間:應用的平均響應時間。 錯誤率:發生錯誤的請求占比,即所選時間范圍內,業務過程錯誤數量之和總請求數100%。 吞吐率:包含自身調用、數據庫調用、NoSQL 調用、第三方服務調用過程中所傳輸的數據
48、量。 慢請求次數:發生慢請求的次數,需要進一步定位慢請求所對應的業務、容器、容器集和集群。 慢請求占比:發生慢請求次數占所有請求次數的比例。 此外, 企業還需要關注數據庫的調用數據庫錯誤率、 調用數據庫次數及調用數據庫響應時間;除了企業的自身調用需要關注外,其外部調用同樣也需要,常見指標包括:調用外部服務次數、調用外部服務響應時間、調用外部服務錯誤率等。 四、網絡監測 1、網絡監測價值 各個應用之間的調用通過網絡來實現,各個企業 IT 建設的規模與復雜度與日俱增,需要通過網絡監測對現有運維流程進行優化, 不斷提升管理和運維水平。 下圖展示了用戶端核 2022 企業應用運維管理指標體系白皮書 2
49、4 心運維指標體系及部分企業的關注點,艾瑞咨詢認為,網絡設施銜接著企業的 IT 基礎資源和用戶端的使用體驗,也能夠反映企業的客戶數量、業務流量和業務的時間、地域等特征,在特殊場景下更牽涉數據安全等問題, 能夠在很大程度上幫助提升企業數字化服務的創新力和產品力。 圖 21:網絡側核心運維指標體系及企業應用案例 2、網絡監測常用實現方式 業內常用的網絡性能分析通過自動采集網絡中傳輸的數據包, 提煉加工出網絡側的指標數據進行分析展示,具備數據回溯、定位故障、告警、分析報告等功能。 3、網絡監測常見指標說明 流量:傳輸數據的總量 (單位 Byte)。 吞吐量:傳輸數據的速率(單位 bps)。 建連成功
50、率:建連成功次數占總請求次數的比率。 客戶端傳輸時延:服務側丟包時,客戶端傳輸停頓到重傳包的平均時間。 丟包率:數據交互過程中丟包數與總包數的比率。 客戶數:訪問源客戶端總個數。 流入包數:流入傳輸數據總包數。 流出字節:流出數據的字節數。 2022 企業應用運維管理指標體系白皮書 25 包大?。簲祿笮?。 服務器延時:數據包從服務端傳送到客戶端的平均耗時。 其它常關注指標有:流出吞吐量、重傳時延、大包占比、0 窗口(TCP 報頭結構中有 16位的窗口大小, 由接收方填充用來告知發送方當前本端還能接收的數據長度。 如果接收方不斷從網絡中接收并緩存數據, 但是應用程序并沒有處理緩存的數據, 直