1、 中石油勘探開發夢想云打造敏捷響應的 PaaS 能力 統一數據庫、技術平臺、標準規范和技術框架 等大量標準化工作 實現應用的高效迭代交付 推動中石油上游業務服務和應用共享及運營 能源行業數字化需求和挑戰 加強企業集中管控能力,提升信息共享水平,形成規?;洕?,成為能源企業信息化建設的重點。能源信息化建設經歷了從分散到集中,再到復雜的過程。能源企業規模龐大,由眾多分子單位組成,管理復雜。傳統的能源信息系統建設相對分散,資源、數據無法共享,極大增加運營成本和難度。因此,企業需要通過信息化手段加強管控能力,滿足集團管理下的信息化要求。能源行業規模大、點多、線長、面廣,對全產業鏈的協同發展有很強的需求
2、。能源作為高科技密集型行業,信息化成效在很大程度上影響著 整個行業的競爭力。以石油行業為例,石油行業數字化是一個萬億美元級的市場。新一輪成本競爭的支點在于數字化技術的采用,企業對數字技術的應用速度與水平 將決定未來的能源版圖。能源數字化轉型需要打破各種業務“豎井”,統一數據庫、技術平臺、標準規范和技術框架等大量標準化工作??碧介_發夢想云起飛 2016 年,中石油提出了“共享中國石油”戰略,“勘探開發夢想云平臺”是在 中國石油上游業務信息化建設藍圖指導下,以“兩統一、一通用”為核心,以集成與共享為目標,建立上游業務統一數據庫、統一技術平臺,提供開放、穩定、高效、安全的 統一標準規范和技術框架。經
3、過持續建設推廣,夢想云 1.0 于 2018 年正式上線。夢想云是中石油主營業務第一個共享智能平臺,也是國內油氣能源行業主營業務 第一個共享數字智能平臺。夢想云 2.0 于 2019 年 11 月正式發布,夢想云 2.0 遵循“一朵云、一個湖、一個平臺、一個門戶”建設原則,打造了面向油氣田勘探、開發、生產 一體化的協同工作平臺。夢想云 2.0 突破了“數據難以共享、業務難以協同”的瓶頸,支撐油氣勘探、開發生產、協同研究、生產運行、經營管理、安全環保 6 大業務應用。助力打造敏捷響應的 PaaS 能力 3 作為支持夢想云落地的唯一 容器 PaaS 和云原生技術領域合作伙伴,靈雀云從夢想云平臺打造
4、之初就協助中油瑞飛 全程深度參與了夢想云 PaaS 平臺的建設,為夢想云2.0 打造敏捷響應 PaaS 能力。首先,夢想云平臺以云原生技術棧為核心,以容器云平臺為基礎,支撐業務應用環境快速構建及自適應的彈性調整,實現從資源交付到應用交付的模式轉變。第二,平臺運維基于 DevOps 理念,提供完整的一體化工具鏈,支撐應用的全生命周期統一管理,實現開發運維從傳統模式到敏捷模式轉變。第三,平臺構建完全基于服務化的技術框架,提供完善的微服務治理工具及相關開發規范,支撐云原生應用開發和傳統應用集成,實現從傳統應用架構到云原生架構的過渡。第四,基于開放服務框架,提供勘探開發專業軟件集成接口?;趹蒙痰?,
5、為合作伙伴提供業務應用及服務組件 在線運營環境,支撐上游業務應用共享生態建設。實踐效果見真章 第一,快速搭建了集中共享平臺,將勘探開發相關的業務規則及成果標準化、組件化、引擎化,實現 IT 資產化管理,推動中石油上游業務服務和應用共享及運營。第二,通過應用服務目錄提供可依賴的服務組件,為上游業務用戶提供統一 APP 式自助服務入口,提升了業務應用交付效率與質量。第三,通過 DevOps 的落地,實現了應用交付過程的規范化,流水線的高度自動化,實現應用的高效迭代交付,提升業務需求的響應速度。第四,通過應用運行管理,低成本高效率地實現了可視化運營。4 資源利用率提高20-50%部署時間從數小時縮短
6、至 5-10 分鐘 僅 5 名員工,就可以實現多個系統維護 中國聯通如何利用 Kubernetes 提高效率和降低 IT 成本 業務挑戰 中國聯通是中國三大電信運營商之一,為了服務其 3 億用戶,該公司自 2016 年以來使用 Docker 容器化和 VMWare 以及 OpenStack 基礎設施運行多個數據中心,每個數據中心擁有數千臺服務器。不幸的是,“資源利用率相對較低?!逼脚_技術研發部門負責人 Chengyu Zhang 說,“我們沒有云平臺來容納我們的數百個應用程序?!敝袊撏ㄒ郧笆且患彝耆珖械墓?,近年來從 BAT(百度、阿里巴巴、騰訊)和京東公司獲得私人投資,目前正專注于使用開
7、源技術而非商業產品的內部開發。因此,Chengyu 的中國聯通實驗室團隊開始尋找其云基礎設施的開源協調。解決方案 由于其快速增長和成熟的開源社區,Kubernetes 是中國聯通的自然選擇。該公司的Kubernetes 云平臺現在有 50 個微服務和所有新的開發?!癒ubernetes 改善了我們使用云基礎架構的經驗?!盋hengyu 說?!澳壳皼]有能替代它的技術?!敝袊撏ㄒ膊捎肐stio 于其微服務框架、Envoy、CoreDNS 和 Fluentd。影響 Kubernetes 幫助中國聯通提升了運營和開發效率。資源利用率提高了 20-50%,IT 基礎設施成本顯著降低,部署時間從數小時縮
8、短至 5-10 分鐘。張呈宇表示:“借助自我修復和可擴展性,我們大幅提高了運營和維護效率。例如,我們目前只需 5 名員工來維護我們的多個系統。在這么短的時間內實現這樣的可擴展性是我們不敢想象的?!敝袊撏〒碛谐^ 3 億用戶,是全國三大電信運營商之一 中國聯通擁有超過 3 億用戶,是中國三大電信運營商之一。為了提供優質服務,該公司設立了多個數據中心,每個數據中心配有數千臺服務器;此外,該公司從 2016 年起開始使用 Docker 容器化及 VMWare 和 OpenStack 基礎設施。平臺技術研發室主任張呈宇表示:“遺憾的是,資源利用率相對較低,我們缺乏一款能夠支持我們數百個應用的云平臺。
9、”張呈宇帶領團隊開展新技術和平臺研發,希望獲得一款理想的 IT 管理解決方案。中國聯通以前是一家國有獨資企業,近年開始吸收 BAT(百度、阿里巴巴、騰訊)和京東等私企的投資,如今正著手使用開源技術而非商用產品加強內部開發。有鑒于此,該團隊開始為其云基礎設施部署開源編排功能。5 盡管中國聯通已經使用 Mesos 建設其核心電信運營商系統,但該團隊認為 Kubernetes 是這一全新云平臺的天然之選。張呈宇表示:“Kubernetes 的主要優勢是擁有成熟的社區,而且增勢強勁,有助于我們充分借鑒他人的最佳實踐?!敝袊撏ㄟ€將 Istio、Envoy、CoreDNS 和 Fluentd 用于其微服
10、務框架。該公司支持 Kubernetes 的云平臺現在托管了 50 項微服務,正助力其邁向新的發展階段。中國聯通開發人員可通過 API 輕松利用這一技術,無需自行開展開發工作。這一云平臺提供了 20-30 項連接該公司數據中心 PaaS 平臺的服務,支持其遍布中國 31 個省級行政區域的分支機構的內部用戶實施大數據分析等功能。張呈宇表示:“Kubernetes 使用云基礎設施幫助我們改善了體驗。該技術目前在市場上是無可替代的?!薄癒ubernetes 使用云基礎設施幫助我們改善了體驗。該技術目前在市場上是無可替代的?!敝袊撏ㄆ脚_技術研發室主任張呈宇 實際上,Kubernetes 幫助中國聯通
11、提升了運營和開發效率。資源利用率提高了 20-50%,IT 基礎設施成本顯著降低,部署時間從數小時縮短至 5-10 分鐘。張呈宇表示:“借助 Kubernetes 的自我修復和可擴展性,我們大幅提高了運營和維護效率。例如,我們目前只需 5 名員工來維護我們的多個系統?!痹谥袊撏ㄊ褂?Kubernetes 取得重大成效之后,張呈宇及其團隊渴望回饋社區。為此,他們開始參加各種見面會和會議,為其他考慮相似路徑的企業提供寶貴建議。張呈宇表示:“對于使用傳統云計算系統的企業,我尤其建議他們加入云原生計算社區。平臺技術研發團隊成員 Jie Jia 補充道,盡管“這一技術較為復雜,但在習慣之后,開發人員就
12、可充分發掘該技術的優勢?!苯Y合自己使用虛擬機云的經驗,張呈宇指出“Kubernetes 和這些云原生技術其實更為簡單?!薄霸谶@么短的時間內實現這樣的可擴展性是我們不敢想象的?!敝袊撏ㄆ脚_技術研發室主任張呈宇 展望未來,中國聯通計劃在 Kubernetes 上開發更多應用,專注于推動大數據和機器學習發展。該團隊將繼續優化其構建的云平臺,并希望通過一致性測試,以加入 CNCF 的 Kubernetes 一致性認證計劃。他們還希望有朝一日能夠為社區貢獻代碼。他們心懷感激之情確立了這一宏大志向,以回饋 Kubernetes 為他們帶來的超乎想象的效益。張呈宇表示:“在這么短的時間內實現這樣的可擴展性
13、是我們不敢想象的?!? 中海地產中臺實踐:加速地產數字化創新 業務中臺+技術中臺;數據中臺;AI 中臺全搭建,實現業務一體化 支撐多業態協同發展 多業態客戶資源整合共享 經過多年迅猛發展,我國房地產行業從噴發期進入調整期,管理和運營方式發生了明顯變化。地產行業開始擺脫野蠻生長,向管理要效益,通過極致的運營效率、極低的成本代價 和創新管理工具,實現精細化運營。地產行業發展新訴求:開放和連接 地產公司開始呈現“去中心化”,企業邊界開始模糊,整體趨向平臺和服務公司,開放和連接成為地產行業新的發展訴求。連接、智能和快速創新也構成了 地產數字化運營的顯著特征。該知名地產公司是一家老牌央企地產公司,于 1
14、992 年在香港上市,是中國內地房地產行業的開拓和引領者。擁有近 40 年的房地產開發與不動產運營管理經驗,業務遍布紐約、倫敦、悉尼、港澳及內地 60 余城市,累計開發項目超過 500 個。迄今已建立了“住宅開發”、“城市運營”、“創意設計及現代服務”三大產業群。自 2018 年起,該老牌房企開始了 企業中臺項目的需求調研和藍圖研討。企業中臺建設規劃為三階段實現:1.首先搭建業務中臺+技術中臺,通過搭建統一架構和標準,實現業務協同。2.然后打造數據中臺,為企業精細化運營和輔助決策提供數據支持。3.遠期目標打造企業 AI 中臺,搭建 AI 能力,賦能業務創新。業務中臺:實現業務打通,高效協同 業
15、務中臺圍繞“四中心、兩應用”展開,分別打造了客戶中心、產品中心、用戶中心和流程中心四大業務中心,及產品中心管理、會員運營管理兩大管理系統。其中,客戶中心以統一客戶數據、客戶洞察、客戶服務和運營基礎為目標,著力打通客戶數據,實現客戶服務協同,提升客戶洞察力。產品中心旨在構建“一房一檔”數據全局共享,統一標簽,管理輔助產品決策。用戶中心主要基于統一身份權限平臺匯集用戶和組織架構信息,進行數據標準化維護。流程系統對接十數個上下游系統,對外提供流程能力服務接口。業務中臺的打造實現了多方面顯著成果:1.實現了地產業務的全方位集成,地產項目從拿地到物業業務全生命周期的集成,企業基于數字化手段管理,保證了信
16、息的實時、透明和聯動。2.實現業務一體化,財務、設計、招采、工程、運營等條線 緊密協作,高效協同運行。全景業務聯動,減少手工干預,實現交叉管控。3.基于全數字化平臺,實現與客戶的連接,支撐多業態協同發展,多業態客戶資源整合共享。4.實現與伙伴的連接,改變項目現場交互方式,內外高效協同。智慧工地物聯應用將物聯網設備分散接入、統一管理的方式,構建智慧工地。數據中臺:疏通業務血液 數據中臺是加速企業從數據到業務價值的中間層。地產公司從數據層面對內部企業業務進行了梳理,對歷史數據進行清洗歸一,與上游系統對接。將企業的碎片化數據統一匯聚、存儲,形成規?;瘮祿?。通過數據開放共享、價值挖掘,轉變為數據資產,
17、為企業決策和運營提供支撐。該地產公司打通了包括潛在購房者、購物中心會員、養老會員、公寓租客、酒店會員、寫字樓人員等在內的各板塊客戶數據,建立統一客戶檔案及客戶畫像數據。從產品層面,建立統一產品檔案,構建產品標簽體系。此外,還建立了完善統一的積分和結算體系,提升會員忠誠度。技術中臺:保障業務需求的敏捷底座 技術中臺以微服務、容器技術 和 DevOps 云原生“三駕馬車”為核心,支撐地產萬億級別業務需求。在企業中臺搭建之初,騰訊云即參與進來,參與了該地產公司企業中臺項目的整體架構設計。新平臺架構要能夠為未來業務提供支持,保障技術領先,同時提升企業 IT 服務效率,支持創新業務模型?;隍v訊云 TS
18、F 服務化架構解決方案,平臺從規劃之初就基于微服務進行設計。采用分布式架構,解決單體架構系統的性能問題。通過中臺提供輕量級 API 服務和分布式調用,保證服務高可用,提供高并發處理能力,為未來業務擴張奠定基礎。騰訊云 TSF 提供了統一服務治理框架、統一配置管理,日志、監控、告警、調用鏈等,實現應用解耦?;?DevOps 平臺,實現應用的全生命周期管理,開發測試過程工具自動化,應用版本快速迭代和上線。容器云平臺解決了應用環境差異性,實現跨云資源管理,快速部署和彈性伸縮,幫助地產公司構建敏捷基礎設施。8 50%以上新項目基于容器化開發和部署 平臺代碼倉庫數量400 個 容器規模超過 2000
19、投入 CPU 核數超3000 PaaS 平臺建設因情施策,新興互聯網應用直接基于容器平臺上云。面對企業內部長期形成的傳統應用和服務,采取循序漸進的方式,進行試點和嘗試,打破原來的組織、流程,以及技術架構體系,以點帶面進行容器和服務化改造,從而完成架構轉型。騰訊云和地產客戶共同梳理了 DevOps 規范標準,沉淀了大量符合業務場景需求的DevOps 規范。還幫助地產公司進行了微服務框架的設計和實施,平臺深入支持SpringCloud 微服務框架,實現業務服務化和云化。在 PaaS 平臺之上,地產客戶還將打造數據湖,實現數據全面入湖。通過構建跨業務協同,快速創新的企業中臺,整合和拉通業務板塊及客戶
20、資源,支撐起該知名地產公司地產、物業、商業、創新等板塊業務協同發展,助力企業十三五戰略目標的高效達成。一汽集團云原生實踐:企業智能化、數字化轉型的有力支撐 伴隨新興業務模式的挑戰,軟件成為許多傳統行業的核心能力。對汽車行業來說,汽車制造本身的技術壁壘不斷降低,汽車企業比拼的不再是硬件本身,而是車聯網、AI、自動駕駛等不斷帶來 用戶體驗提升的技術能力。這些新技術的不斷發展和應用,也將汽車行業的數字化轉型帶向深入。布局技術中臺建設 中國第一汽車集團公司(以下簡稱一汽)經過五十多年的發展,已經成為國內最大的汽車企業集團之一。2019 年,中國一汽實現整車銷售 346.4 萬輛,營業收入 6200億元
21、、利潤 440.5 億元,位居財富世界 500 強第 87 位。近年來一汽開始布局智能網聯、移動出行、車聯網等領域,希望由傳統汽車制造企業轉變為快速創新、敏捷高效的數字化企業。數字化轉型的關鍵就是要具備 像互聯網公司一樣的快速創新能力,而以云原生為代表的云計算技術則是突破轉型瓶頸,打磨數字化能力的重要路徑。2018 年起,一汽集團開始布局技術中臺的建設,為企業數字化提供統一支撐平臺。技術中臺基于容器、DevOps、微服務等 云原生技術和架構,支撐各種微服務應用,并將應用編排成企業所需要的各種應用場景,通過 DevOps 實現對全過程的敏捷支持。為了支持智能網聯平臺、大營銷領域開發等需求,滿足數
22、字業務中臺公共基礎服務,2018 年起,一汽集團和騰訊云合作,引入容器云平臺和微服務架構,希望實現基 9 于容器平臺的應用全生命周期管理,基于微服務架構的應用快速交付,提升效能和數據化運營,從而更好地支持業務發展和創新,提升集團核心競爭力。微服務平臺賦能新興業務場景創新 借由車聯網項目,一汽基于騰訊微服務平臺 TSF,對原有微服務開發、部署環境進行了改造升級,并實現微服務組件的私有化部署。TSF 是騰訊云打造的微服務解決方案,其核心能力包括:服務治理、應用生命周期管理、配置中心、分布式事務、數據化運營能力(日志/監控/告警/調用鏈等)。同時提供了中間件平臺,包括分布式計算調度、配置和事務能力、
23、API 網關、Spring 框架層面打通消息隊列 CMQ/CKafka。其中在微服務開發框架方面,兼容 Spring Cloud 及 Istio 框架,提供完全兼容 Istio 的 Service Mesh 微服務平臺能力,支持服務注冊發現、服務限流、服務鑒權、服務路由、調用鏈、API 上報等。一汽微服務架構改造將 企業里大量單體應用升級為微服務應用,實現多個微服務組件獨立部署,滿足了車聯網項目需求,支持高并發、高吞吐等場景,并保證了車聯網高可用與高安全性。目前一汽智能網聯平臺通過 TSF 已實現 測試環境近百個微服務的開發、測試。預計智能網聯平臺正式上線時,生產與測試環境將總計產生近 240
24、 個服務。目前微服務已經超過 1000 個,包括車聯網,營銷,辦公協同等各個領域。隨著大營銷場景需求的攀升,TSF 也逐漸從私有云環境部署,提升到混合云環境可用,提供更全面的應用微服務化運維和管理能力。50%以上新項目基于容器化開發與部署 同時,微服務架構底層支撐基于容器平臺,TKE 容器服務平臺基于原生 Kubernetes,提供完整的 Kubernetes 集群部署能力,包括集群管理、服務管理、配置和鏡像管理等功能。集群管理支持集群動態伸縮,節點支持升降配,集群內節點跨可用區管理部署,支持自定義集群告警策略。服務管理提升了服務部署效率,支持服務發現、微服務化,支 持動態擴縮服務,秒級部署服
25、務容器,滾動升級不中斷業務更新服務。配置管理支持部署相同應用的不同環境,方便更新和回滾應用,提供安全、可靠的私有鏡像倉庫,支持微服務開發部署環境。實現了現有環境和新環境的平滑穩定升級,同時支持多云部署。2018 年容器化之初一汽首先選擇幾個項目 進行容器化開發部署試點。到 2019年,50%以上的新立項 IT 項目 均采用容器化部署,運行中的 K8S 集群超過 8 個,容器規模超過 2000,投入 CPU 核數超 3000 核。10 40 多個系統運行在磐基容器云上 集群規模約 6600臺服務器,業務容器數近 4 萬個 IT 系統軟件資產的自主可控能力增強 DevOps 撬動 IT 生產力大幅
26、提升 在此過程中,一汽還開始探索敏捷項目管理,篩選多個項目試點敏捷項目管理方法,實現開發方式由瀑布轉向敏捷。DevOps 工具鏈是研發與運維博弈的產物。長長的工具鏈條會導致反饋很慢,審批節點多,且各節點無法完全透明化。一汽基于開源工具自研 DevOps,統一 DevOps 工具鏈和環境,加速 DevOps 工具鏈部署及調優。據悉,接下來一汽還將基于騰訊容器服務平臺 TKE,打通核心流水線,打造從需求管理到 開發、測試、上線、運維、容災的完整工具鏈。同時實現工具鏈的數據打通和整合,平滑向 DevOps 平臺遷移,滿足業務的快速穩定交付。隨著持續的技術路線、產品跟蹤、運營,DevOps 工具鏈使用
27、頻率大幅增加,一汽DevOps 平臺日構建次數 500 次,日鏡像推送數 80 個,代碼倉庫數量 400 個,日代碼提交行數 800 行,實現了 IT 生產力的大幅提升。據悉,未來一汽還將建設 滿足多云使用需求的全新云平臺。這一平臺不僅僅包括多云管理平臺,更涵蓋 PaaS+DBaaS 的跨云管理,實現整體技術架構的多云化,使應用跨云平穩漂移成為可能。對話中國移動:支撐數億用戶的基礎設施如何實施云原生改造?近幾年,數字化轉型和云原生改造成為業界兩大熱詞,運營商也開始了與技術的又一次較量。作為支撐數億用戶日常生活的必備基礎設施平臺,其改造難度是非常大的。本文,InfoQ 走進中國移動信息技術中心,
28、一起聊聊他們如何看待數字化轉型與云原生的意義。為什么要做云原生改造?決定改造后,人從哪找?團隊 KPI 咋定?流程是什么樣的?傳統企業有必要自研嗎?轉型過程中有哪些注意事項.為什么需要云原生?如何推進?從 2008 年開始,中國移動就一直在探索轉型升級之路,試圖抓住“數字經濟”帶來的發展機遇。2008 年,電信運營商按照“六合三”的方案進行了重組,進一步加劇了三大運營商之間的競爭,中國移動憑借著 2G 時代語音業務的網絡效應迅速成為佼佼者。隨著 3G 時代的到來,整個行業又開始面臨語音業務增長緩慢和收入減少的壓力。2013 年 12 月,中國移動獲得固網寬帶牌照成為全業務運營商。至此,三家運營
29、商正式 11 開啟全業務領域競爭。4G 時代,面對更加激烈的競爭局勢,中國移動提出“三條曲線”的發展策略,即:第一條曲線是中國移動語音和短彩信;第二條曲線是流量經營,主要是依靠 4G 的拉動;第三條曲線則是數字化服務。中國移動明確從網絡、終端和營銷三個方面向流量經營轉型,并且更注重第三條數字化服務曲線的發展。5G 時代,基于 5G 數字化網絡基礎設施,中國移動打造泛在接入、泛在聯接、泛在算力的信息高速,深化智慧運營創新,實現體驗經營躍升,更加有效保障數字經濟戰略落地。2019 年,中國移動決定從通信服務向空間更廣闊的信息服務轉型升級,圍繞“力量大廈”的總體思路,以高質量發展為主線,打造基于規模
30、的融合、融通、融智價值經營體系,構建高效協同的能力、合力、活力組織運營體系。對于體量巨大的中國移動來說,轉型并不容易,這背后到底有哪些考慮呢?您對數字化以及數字化轉型的理解是什么?這在中國移動內部是如何執行的?A:我之前也在想到底什么是數字化,“轉型”二字又意味著什么。眾所周知,中國移動是運營商,而運營商最開始做的事情在我看來就是數字化的,就是跟數字打交道的。那么,數字化轉型是什么呢?轉型意味著變革,我覺得可以從三個層面理解:一是戰略層面的轉型,公司全力推進智慧中臺構建,持續匯聚共性能力、對內支撐更多的業務場景、對外實現能力共享,促進公司數智化運營和全社會數智化轉型;二是技術層面的轉型,雖然以
31、前也用到很多數字化的技術,但傳統的 IT 技術與現在的云計算、人工智能相比有很大不同,解決的問題和關注的重點都不相同,這是技術層面的轉型;三是業務轉型,運營商早期的主要業務是電話、短信,現如今隨著 5G 的出現,我們的業務越來越豐富。綜上,中國移動明確了總體發展目標,即創世界一流企業,做網絡強國、數字中國、智慧社會主力軍。確立通過推進數智化轉型,實現高質量發展的發展主線,結合經濟社會數字化轉型“五縱三橫”的特征,形成中國移動的戰略內核。圍繞戰略目標,我們開始更加關注數字化的價值。以往我們關注的是技術本身可以解決的問題,現在把重心更多地放在數字化如何賦能業務發展,如何賦能商業模式轉型。這對 IT
32、 提出了更高要求即需要通過組織變革來支撐更高的目標,實現更高能力的鍛造。注:五縱三橫指經濟社會數字化轉型呈現“五縱三橫”的新特征。其中的五縱指的是基礎設施數字化、社會治理數字化、生產方式數字化、工作方式數字化、生活方式數字化;三橫指的是線上化、智能化、云化。12 我們做云原生化改造的背景是什么?這和數字化轉型的關系是什么?A:多年前,我們的 IT 系統承載在小型機、磁盤陣列、傳統商業數據庫上,傳統的 IT 架構,應用橫向擴展能力較差;2008 年起,我們從小型機向 X86 演進,大型的企業級應用向分布式服務化架構升級;2010 年左右,我們引入虛擬化技術,大力推進基礎設施云化,業務規?;瘮U展和
33、靈活性得到提升,實現了底層資源的共享;2015 年前后,我們逐漸從虛擬化向容器化過渡,不只是基礎架構在快速變革,應用架構和交付也在升級,把大型復雜軟件應用拆分成多個簡單應用,各應用之間松耦合,從而降低了系統復雜度,還可以做到獨立發布部署、獨立擴展和跨語言編程,當然這一切的變化也將驅動我們研發、運維工作模式的轉變。在我看來,以往通過虛擬化技術將一臺 X86 服務器虛擬化為多個虛機,當成物理機使用,這樣的模式只解決了資源共享的問題,而云化不僅僅是基礎設施和平臺的變化,應用也需要做出調整,在架構設計、開發方式、部署維護等各個階段都基于云的特點進行構建。云原生正是以應用為中心,應用開發之時便基于云的方
34、式。只有這樣才能更好地發揮出云的優勢,更好地賦能業務發展。具體來講,我們對于應用的要求主要是指:敏捷。隨著市場的快速發展,競爭日益激烈,對新功能的上線速度要求越來越高,我們需要化解高速的業務發展和系統穩定之間形成的矛盾,讓“大象”能夠起舞。海量。我們需要支撐更多的互聯網新業務、新玩法,需要足以支撐海量、高并發、高性能的業務系統架構。簡單。提高運維效率,解放勞動力。在這樣的背景下,中國移動 IT 系統建設全面擁抱云原生技術。通過云原生改造,原本直接運行在虛擬機或者物理機上的業務系統,如今以高內聚、低耦合的應用獨立運行在在容器里。以前一個新的應用系統需要從下到上完全自己重新搭建,現在大部分底層共性
35、能力可以復用,極大地提高了開發效率,降低了成本,這就是我們所說的厚 PAAS、薄應用。根據多年的實踐經驗,我們打造了磐基容器云,以及磐舟云交付平臺,面向內部 IT 系統提供承載和服務支撐,主要包括面向客戶服務和業務管理的業務支撐系統(簡稱 BSS 或 B 域)、面向通信網絡管理的網管支撐系統(簡稱 OSS 或 O 域)、面向企業內部管理的管理信息系統(簡稱 MSS 或 M 域)。您方便介紹下整個云原生的改造歷程是什么樣的?A:中國移動是首個完成大規模、分布式電信業務支撐系統 X86 化、容器化改造的運營商,領先同行業近兩年時間。最早啟動云原生改造的系統叫網狀網,這個系統支撐了 200 多個業務
36、平臺,700 多個業務,包括金融類、互聯網類、全網業務訂購類、客 13 服類、實時鑒權類、區塊鏈等業務,峰值交易量為 75 萬筆/分鐘。完成改造后,在高可用、故障自愈等方面效果尤為突出,當應用模塊升級或某個服務不可用時,服務可快速從容災節點拉起,用戶訪問無感知。另一個實現云原生改造的系統是中國移動集中化物聯網支撐系統。這個系統是物聯網產品集中化管理能力一點接入、統一運營的業務支撐系統,提供了端到端的業務受理、服務開通、計費賬務和綜合結算等能力,支撐億級連接高效運營。系統采用微服務化的設計理念,基于我們團隊自研的磐基容器云平臺,快速構建敏捷開發和智能化運營的容器化業務系統。截至目前,共有 40
37、多個系統運行在磐基容器云上,集群規模約 6600 臺服務器,業務容器數近 4 萬個。在業務遷移上云方面,我們總結并形成標準化的上云規范和云原生改造優秀實踐案例。跟業務部門對接的過程中,前期會有個布道的過程,對租戶進行相關培訓,同時了解業務需求,完成梳理架構、容量預估,提供針對性的解決方案和指導;其次,業務部門采用微服務的設計理念,遵循“前端橫向整合,后端縱向解耦,服務提供與應用分離”的原則進行架構設計,完成容器化改造及微服務拆分;最后,逐步分離松耦合業務,完成部分流量切換驗證,最終完成業務部署上線。在指導業務遷移上云的過程中,我們非常重視提前介入和收尾復盤,做到三同步:同步監控、同步高可用、同
38、步安全。您方便簡單介紹下目前我們部門的人員組成嗎?主要工作是什么?A:我們部門是中國移動信息技術中心(公司)下屬研發創新中心,還有一個牌子叫平臺能力共享中心。目前部門共 300 余人,作為公司創新驅動的引領者、核心能力的內化者、技術演進的研究者、共性能力平臺的運營者、核心測試能力的提供者,全面負責 IT 領域 PAAS、AI、區塊鏈、IPA 等平臺級產品的研發、測試、維護和運營推廣;云原生平臺的研運工作是我們部門的核心工作之一。承擔云原生改造的團隊人員大概來源是什么?A:云原生平臺核心研發團隊近 50 人,包括架構設計、開發、運營、運維人員,承擔整體架構設計,演進方向及新技術跟蹤,容器云、De
39、vOps 以及智能運維等模塊研發集成,為各業務部門提供云原生改造解決方案咨詢、支撐、部署和維護服務。團隊成員一部分來源于公司內部,在建設電信業務過程中多年積累的 IT 人才,抽調并重組,另一部分來源于社會招聘和校園招聘,我們也通過獵頭專門招聘有經驗的架構師。我們更希望團隊員工知識更加全面。不僅對容器等云原生技術方面有要求,也希望員工更多的了解中國移動為什么要做數智化轉型,要對運營商業務應用架構演進敏感,熱愛新技術,真正解決好現有系統的問題。綜上,我們對人才的整體要求可以概括為“四懂”:懂需求,懂市場,懂客戶,懂技術。14 您方便介紹下內部是如何對人員進行培訓的嗎?A:數字化戰略方面,公司內部會
40、定期組織“知識賦能行動”等系列培訓;云原生技術分享方面,我們會請內部人員或者外請一些大廠的技術專家做分享;應用上云改造和實踐方面,基于磐基容器云平臺,為租戶提供體系化的培訓課程,包括 K8S 應用管理及云原生技術實踐。后面也會逐步完善認證體系,為架構設計、開發、運維人員提供相應的培訓及認證服務,云原生技術更新太快,需要我們的員工終身學習。業務方的態度如何?A:基于技術發展趨勢和公司戰略要求,各租戶對于數字化轉型意義的理解在逐漸深化,目前公司有序推進系統全面上云,各部門積極配合 IT 系統云原生改造。通過云原生改造,租戶發現上云可以明顯提升資源使用率、提高應用高可用性,加快迭代上線速度;另外,部
41、分開發運維工作可以交由云原生平臺實現,業務部門可以更專注業務創新,創造更多的業務價值。云原生改造的整個過程對業務人員來說,也是學習提升、能力鍛造的過程,畢竟,云原生技術是未來的發展趨勢。你們整個團隊的 KPI 是什么?A:我們團隊的 KPI 有以下三個部分:一是研發方面,重視需求采集分析,以應用為中心規劃、設計產品,解決業務問題并且完成升級,跟隨云原生社區的技術發展,提升產品開發、交付效率。二是推廣應用方面,整個平臺在公司內部支撐系統的規模要不斷的提升,成為 IT 系統的技術底座。三是穩定支撐方面,要求能快速定位故障,并對 故障快速排查解決(單體應用或 SOA 架構,故障定位相對容易,應用微服
42、務化改造后存在大量的微服務,故障很難快速定位、對癥下藥,需要構建完善的監控體系和端到端服務跟蹤工具;我們想到另一個比較好的解決方案是智能運維AIOps,進一步提升故障定位和解決效率),真正實現我們團隊提出的“乘舟上云,穩如磐基”。公司層面對完成云原生改造有什么目標嗎?A:我們的目標是通過磐基容器云平臺和磐舟云交付平臺的打造,助力 IT 系統完成云原生改造,逐步實現全云化演進。對于新建應用,要求云上構建;對于存量的業務系統,云原生改造是循序漸進的。結合云原生價值和業務痛點,對于需求頻繁變更、大規模、分布式架構的業務支撐系統優先改造;對于一些缺乏開發團隊維護的遺留系統、需求很少變化,以及業務邏輯耦
43、合緊密、比較大的存量單體應用,暫緩改造。另外,考慮到改造代價和價值,全部“重構應用代碼”,并不是應用改造的唯一途徑,對很多仍然在發揮作用的存量應用來說,重構封裝應用代碼的“應用運行時”也是一種更穩妥、有效的形式。15 自研的動力是什么?如何選型?在轉型的過程中,中國移動基于云原生的理念,采用 K8S 和容器技術,自主研發了磐基容器云以及磐舟云交付平臺。磐基容器云已經獲得 CNCF 的一致性認證和可信云容器平臺的認證,磐舟云交付平臺也獲得平臺級的 DevOps 解決方案先進級認證。目前,磐基容器云平臺已經支撐內部 IT 系統 40 余個,覆蓋 BMO 三域;磐舟云交付平臺也逐步規?;\營,已有
44、30 余個系統正在使用這個平臺,實現了 X86、ARM 雙平面研發運行,大大增強了我們對 IT 系統軟件資產的自主可控能力。磐基容器云平臺架構圖 作為傳統企業,為什么我們有動力自研核心技術?A:可以從兩個層面來看,在宏觀層面,國家鼓勵自主可控和科技創新,我們中國移動積極響應國家號召,大力推進核心能力內化,增強“端到端”自主可控能力,不斷培養科技創新人才。在需求層面,外部產品更加通用,平臺的定制化程度及開發響應速度比較弱;不能很好的滿足我們的業務場景、運營運維流程、研發規范要求,業務系統共性能力也很難得以快速的沉淀。云原生改造的道路上,在構建、發布、運行三大領域都有更多的開源項目可以選擇,我們可
45、以站在巨人的肩膀上,引入、集成、優化和增強,讓自研過程更加輕松。作為傳統企業,為什么我們有動力自研核心技術?A:可以從兩個層面來看,在宏觀層面,國家鼓勵自主可控和科技創新,我們中國移動積極響應國家號召,大力推進核心能力內化,增強“端到端”自主可控能力,不斷培養科技創新人才。16 在需求層面,外部產品更加通用,平臺的定制化程度及開發響應速度比較弱;不能很好的滿足我們的業務場景、運營運維流程、研發規范要求,業務系統共性能力也很難得以快速的沉淀。云原生改造的道路上,在構建、發布、運行三大領域都有更多的開源項目可以選擇,我們可以站在巨人的肩膀上,引入、集成、優化和增強,讓自研過程更加輕松。自研之前有做
46、過選型對比嗎?A:以往,合作伙伴開發的業務支撐系統在開發,運行過程中用到了容器云產品。在生產過程中,我們發現通過容器云平臺很好的解決了彈性伸縮、故障自愈、容災等問題;同時,我們對 K8S 的特性、包括一些關鍵組件的選型有了一定的積累。在此基礎上,我們開始自研,并對 K8S、容器底層技術,做了一些封裝和優化,以提高其穩定性和安全性。事實上,PaaS 的范圍太大了,也不可能完全自研。我們也會根據租戶的需求,引入部分優秀組件快速地解決生產問題,如國產數據庫、國產中間件以及容器安全方面的能力。我們會通過聯合創新的方式,引入一些合作伙伴的高質量產品,實現生態鏈企業合作共贏。容器云研發期間,我們也在打造全
47、棧全場景的混合架構,業務可以根據場景需求,在雙算力的平臺下融合部署,混合調度,實現業務能力互備,資源共享。硬件層面,在 X86 基礎上引入 ARM 算力,并向互聯網公司學習,結合云原生改造需求,研發定制了云原生容器服務器。在操作系統層面,積極擁抱開源社區,中國移動擁有自研的操作系統,也在積極探索 openEuler 開源操作系統部署應用,并嘗試多元化容器運行時部署。中間件層面,我們與東方通、中科院軟件所、電子技術標準化研究院、國家信息中心、工商銀行等單位一起中標了國家 2020 年基礎支撐軟件中間件項目,推動定制化中間件的研發和應用。數據庫層面,聯合了業內 5 家企業進行聯合創新,在應用場景中
48、進行測試驗證。通過不斷的驗證打磨,推動自主可控國產數據庫的成熟落地。作為親身實踐者,中國移動又有哪些好的建議呢?我們可以理解為云原生平臺是某種形式的中臺嗎?A:云原生平臺實現了底層技術能力的復用,加快了應用上線速度,我們都認為是一種形式的技術中臺,或者說數字化轉型的技術底座。17 對于希望做云原生改造的企業而言,您有哪些建議呢?A:一是對于云原生改造,企業需要有自己的總體規劃。系統整體架構未來要如何演進,各業務系統現存哪些問題和痛點,有哪些新的需求;二是云原生改造對人員的要求比較高,要具備架構的自主掌控力;三是云原生改造要循序漸進,平臺部門要制定明確的研發、交付、運維規范,指導業務系統有序上云;四是要及時復盤,及時評估上云之后的效果和指標量化價值;五是運維支撐一定要跟上,包括安全體系,要構建完善的運維監控工具,解決好故障定位和監控難的問題;最后,構建一個成熟的系統往往需要一個相對比較長的運維和迭代過程,我們積極擁抱云原生的同時,也要做好踩坑的準備,穩步前行。18