《靈雀云:2022金融行業云原生技術實踐案例匯編(14頁).pdf》由會員分享,可在線閱讀,更多相關《靈雀云:2022金融行業云原生技術實踐案例匯編(14頁).pdf(14頁珍藏版)》請在三個皮匠報告上搜索。
1、 光大銀行落地容器云 PaaS 平臺敏捷應用架構轉型 全行資源交付效率 提升了 52 倍 支撐總行 2000+開發人員的開發服務 支撐移動互聯、區塊鏈等新興項目落地。經濟進入數字經濟時代,新商業模式要求 IT 具備新的支撐能力。在銀行向金融科技轉型的過程中,云計算等新興技術成為重要的賦能工具。Fintech 賦能金融服務場景變革 在金融科技推動下,金融服務呈現場景化、平臺化、智能化,這對 IT 響應和交付效率提出更高要求,金融服務要更高效、更實時。金融上云,主動實施架構轉型,明確得到國家政策層面的大力支持。中國金融業信息化“十三五”發展規劃強調“科學利用云服務,提升金融服務能力和效率”;中國銀
2、行業信息科技“十三五”發展規劃監管指導意見提出,穩步開展云計算應用,主動實施架構轉型?!皵底止獯蟆暗纳顚釉妇笆?,助力光大打造一流財富管理銀行。光大銀行踐行“敏捷、科技、生態”發展理念,發揮科技創新優勢,建立“一個大腦、兩大平臺、三項能力”的全方位科技能力建設支撐體系。2019 年在科技能力建設方面,光大銀行提出 10T(Technology)和 10B(Business)計劃。前者致力于打造技術掌控能力、著眼未來,為后者提供源源不斷的驅動力;后者立足當下,創造價值,賦能業務快速實現數字化轉型成果轉化。其中,10T 能力之一是建設分布式 PaaS 云平臺,奠基服務化轉型。攜手靈雀云打造 PaaS
3、 開發平臺云 云原生應用服務需要一個構建和運行云原生應用和服務的平臺,來自動執行并集成DevOps、持續交付、微服務和容器等概念,這背后就是由光大銀行科技信息部孵化的CPAAS 容器云平臺支撐的。光大銀行容器云 PaaS 平臺 CPAAS 平臺于 2019 年 4 月實現了開發測試、準生產、生產三大基礎環境全面投產,為應用互聯網化、微服務化、云化提供了適配。容器云 PaaS 平臺的創新價值主要體現在三方面:3 第一,利用互聯網技術架構支持銀行應用架構轉型。運用微服務、云中間件、容器、DevOps 等云原生技術,搭建 PaaS 級云平臺,推動光大銀行從傳統架構向互聯網架構演進。第二,降低 IT
4、資源運行和集成成本,提升研發效能。容器云 PaaS 平臺提供靈活的以容器為單位的資源調度能力,輕松應對微服務化帶來的服務數量飆升,有效提高 IT資源利用率,降低成本。建設容器化云服務環境,提高服務發布效率。建立了一套以容器鏡像為基礎的應用開發、測試、運維流水線,大幅縮短應用 第三,交付周期,提高響應速度,為業務轉型和創新提供敏捷支持??傊?,容器云 PaaS 平臺的建設,釋放出了微服務+容器+IaaS 云平臺 1+1+1 大于 3的技術紅利。云上光大,云引金融 光大銀行容器云 PaaS 平臺項目,具有明顯的示范意義。首先,容器云 PaaS 平臺目前已投產區塊鏈 BaaS 平臺、光大家移動辦公平臺
5、、資金監管系統等項目,同時支撐手機銀行等 20 余個應用系統的開發測試工作。全行資源交付效率提升了 52 倍,縮短至分鐘級交付,支撐總行 2000+開發人員的開發服務,支撐移動互聯、區塊鏈等新興項目落地。其次,平臺架構前瞻,技術先進。在基礎架構層面,為向互聯網金融轉型提供了最適配的平臺。為持續推進“一大腦二平臺三能力”打下堅實基礎。也為打造“國內最具創新能力銀行“添磚加瓦?!霸粕瞎獯?,云引金融”。光大銀行通過云轉型重塑銀行數字化能力,為打造“一流財富管理銀行”奠定堅實技術基石。中國民生銀行借助 Kubernetes 實現了舊有應用程序轉型,將其轉向人工智能、區塊鏈和大數據 讓傳統的舊有應用程序
6、能夠適應云原生環境 中國民生銀行的主要應用程序是以 C 語言和 Java 語言編寫的,采用傳統架構?!拔覀兠媾R的最大挑戰是怎么讓傳統的舊有應用程序能夠適應云原生環境,”民生容器云技術負責人 Zhang Li 說,“我們想要做分布式應用程序,是因為我們以前用過 VM,很貴?!? 資源利用率:翻了一倍有余 開發、運營和維護效率:提高了 3 倍 部署時間:從若干小時,到若干分鐘 引入 Kubernetes 開發新的微服務 民生引入阿里云,協助云原生轉型?,F在公司正在分解舊有的應用程序,把它們轉移到 Kubernetes 平臺上去,同時還要在平臺上開發新的微服務。借助 Kubernetes 平臺,交付
7、效率提高了 3-4 倍 借助 Kubernetes 平臺,交付效率提高了 3-4 倍,資源利用率翻了一番?!艾F在,我們正在開發 AI 應用程序,一個區塊鏈應用程序,還有部分云原生平臺上的大數據分析應用,”Zhang 先生介紹說。Zhang 先生堅信 Kubernetes 是建立云原生環境的關鍵,因此選擇和阿里云合作?!鞍⒗镌剖?Kubernetes 和其他 CNCF 項目在中國的主要貢獻者,所以我們非常信任他們,”Zhang 先生說。從 2019 年開始,“他們幫我們啟動了這次轉型,我們也給他們反饋意見,這樣他們就能根據反饋優化其他行業的產品和服務?!逼駷橹?,約有 20 個應用程序在 Kub
8、ernetes 平臺上實現生產。30 個新的應用程序在積極開發,準備采用 Kubernetes 平臺?!鞍⒗镌迫萜鞣諑椭裆鷮崿F創新業務的快速增長,”阿里云容器服務 Kubernetes 高級架構師 Eric Li 說?,F在,所有用于 AI、區塊鏈和大數據分析的應用程序都要建在平臺上。因此,開發、運營和維護效率提高了 3 倍,CPU 的資源利用率和存儲翻了一番有余。部署時間從若干小時縮短到若干分鐘?!拔覀兓▋赡陼r間做了大量實踐,從失敗和成功當中吸取經驗教訓,最終成為云原生。這需要我們解放思想、打開視野,去了解當今世界的狀況。我們需要隨時跟蹤技術發展,取得其他團隊的信任?!泵裆y行容器云技術負
9、責人 ZHANG LI 此外,故障時間也減少了 50%?!拔覀兊囊粋€支付應用有將近 30 個模塊,”Zhang 先生說,“以前,在一個模塊上做一個很小的改動,就需要上傳整套應用程序?,F在,我們把這些模塊分別放在 Kubernetes 的 30 個微服務中,這樣就可以按照自己的意愿,隨時更新任何一個模塊?!盳hang 先生帶領的團隊面臨著一個巨大的挑戰,就是要把舊有的 C 語言應用程序改成云原生應用程序。這是“一個名副其實的舊有應用,使用 C 語言和進程間通信(IPC)架構,”他說,“這個應用程序很難改成微服務。我們必須要改變整個架構,把 IPC 改成遠程過程調用?!盳hang 先生帶領的 8
10、人平臺團隊展示實際應用案例和真實使用結果,說服行里的 100名工程師,“你可以選擇一個真實的典型案例,讓他們去開發或者轉型一個云原生應用,”他說,“行里的開發人員都很愿意把自己的應用轉成云原生應用。但我們面臨的 5 打造金融級容器云基建 通過 PaaS 層能力為研發提供統一技術服務 安全合規下的高效交付體系 建立企業級云原生知識體系 挑戰就是沒有足夠的人手去做這個工作,因為大家都要花大把時間去維護舊有應用。后來,他們就在工作之余做這個事情?!北M管存在這樣的局限,Zhang 先生說:“所有的技術和業務部門都覺得這次轉移到云原生環境是一次重大變革?!钡D型并沒有就此結束。他們已經開始使用 Envo
11、y,也正在考慮 Istio 做服務網格。他們計劃增加聯邦,使用更多的云?!拔覀兓▋赡陼r間做了大量實踐,從失敗和成功當中吸取經驗教訓,最終成為云原生?!盳hang 先生說,“這需要我們解放思想、打開視野,去了解當今世界的狀況。我們需要隨時跟蹤技術發展,取得其他團隊的信任?!迸d業銀行:適用于大中型銀行的云原生技術體系建設方案 在數字化轉型新形勢下,銀行信息系統面臨諸多訴求和考驗。銀行的業務應用目前以多種形態運行在不同的技術棧上,包括互聯網技術棧和商業技術棧。大多數系統已經完成新一代的升級,但是隨著云原生技術的發展,很多銀行開始試水分布式架構體系改造。由于銀行交易往往比較重要,有哪些系統最適合云原生
12、容器化改造,應用在進行改造后如何符合銀行現有規范等問題也顯露出來:云原生新技術難:對容器技術沒接觸或接觸少的研發部門會面臨新技術的學習成本高,改造難度大等問題。上云高可用及安全管控難:互聯網技術棧產品直接進入不符合銀行的高可用及安全要求等。不同技術棧應用上云治理難:容器改造期間可能涉及到除容器以外的其他平臺或云產品。制品管理及投產流程繁瑣:投產審核開發測試環節中生成的制品、編排文件需要經過安全審核再投產。多云資源管理難:資源申請面臨不同云平臺產品的統一供給問題。運維難度大:運維部門需要在現有運維框架下如何更快上手,并減少運維難度問題。金融級云原生平臺,一站式上云體系化支撐 為了更好的保障銀行業
13、務應用的穩定性以及滿足技術先進性的需求,容器云平臺需便捷支持上云業務高可用部署,滿足銀行級業務的的高可用需求;適用于多種業務場景且滿足不同技術棧產品的快速遷移需求;具備統一化規范化管理的能力實現技術支撐降本增效。6 一是需在建設一套滿足不同項目使用需求的容器云管平臺,實現對多容器環境資源的統一管理;二是集成主流容器編排引擎和容器主機、存儲、網絡、服務發現等組件,實現多環境下容器的統一管理、調度和彈性伸縮;三是強有力的云原生存儲及網絡方案加持,實現容器云基礎設施更強的擴展性,可有力支撐各類型企業級 PaaS 服務建設。合規、便捷的研發交付體系,能支撐銀行業務快速轉型上云 為實現銀行業務基于容器實
14、現快速、標準化交付,交付體系建設在平臺功能上、流程設計上都需要進行考慮。在功能性方面。一是實現基于容器的應用編排和應用生命周期管理,實現應用一鍵部署和升級,實現應用可視化管理、智能調度、彈性伸縮、健康檢查,監控和告警;二是集成常用容器管理工具,包括容器鏡像倉庫、應用商店、CICD 工具、集中監控告警、日志采集分析等,以提高容器應用的管理和運維水平;三是便于研發人員導出統一的編排文件、配置文件以及制品;四是提供常用的基礎技術 PaaS 服務;五是具備不同技術棧應用上云且在多集群環境下的通用服務治理能力;六是統一的云原生應用開發平臺,便于銀行自研應用從研發即云原生,為 Serverless 奠定基
15、礎。在流程設計方面。一是統一制品發布流程,制定制品和編排文件規范,在投產前完成安全合規檢查;二是統一的 CI/CD 流程,在流程中支持自動制品規范掃描、安全掃描等步驟,并滿足快速發布到不同測試環境,并經過投產流程的自動審核。通過自動化降低運維復雜度 云基礎設施向下與存儲、網絡架構關系緊密,向上與應用的耦合度也比傳統虛機、物理機 IaaS 更緊密,技術復雜度高,運維難度大。一是資源管控,統一資源申請平臺,基于標準化的模板滿足測試和生產環境不同環境下多平臺資源的統一供給能力;二是通過技術手段加強可觀測性,便于快速故障排查;三是通過企業級 CMDB,推動運維自動化及 AIOPS 提升運維效率。云原生
16、架構轉型下的全員新知識體系推廣 企業的 IT 基礎架構轉型,需要研發、運維人都對云原生技術有正確的認識和理解。建立統一知識庫,滿足研發部門的快速上手等需求,同時建立運維知識體系,使問題解決方案隨時可查是一個有效策略,并建議加以體系化培訓、技能認證等手段支撐。通過指引以點到面推廣,如新建系統應直接采用云原生架構設計,避免歷史技術債,降低遷移成本,為各類型業務上云鋪路;根據應用實際場景定位是否符合云原生場景,劃分為敏態、穩態,從對應技術架構和服務響應角度綜合考慮哪些節點適合容器部署;逐步實現全面云化轉型。通過規范保障研發、交付、運維流程的合理運行,更好發揮云基礎設施的效能。7 方案建設 打造金融級
17、容器云基建 銀行 IT 基礎設施對高可用、穩定可靠有較高的要求,基于傳統的 IaaS 部署應用已有相對成熟的解決方案,如存儲層鏡像復制、虛擬機漂移、全局 DNS 切換等?;谌萜骷夹g建設的云基礎設施具備更優的資源利用率和彈性優勢,但云原生技術體系仍在快速發展過程中,如何利用容器技術打造高可用、穩定可靠的 IT 基礎設施,各企業需求存在不同的解法,本文方案設計了多云管理、Runtime 改進、高性能云原生存儲、金融級容器網絡、容器云容災系統等系列方案進行容器云基礎設施建設,并使其具備支撐企業級 PaaS 的擴展性能力。通過 PaaS 層能力為研發提供統一技術服務 一是通過基礎技術平臺為上云業務一
18、鍵提供常用開源中間件服務,省去業務系統建設重復造輪子的過程;二是提供不同技術架構分布式體系的多云環境下的服務治理能力,為不同技術棧的系統上云掃清障礙。安全合規下的高效交付體系 銀行業務較多且復雜,很難迅速規?;栈?,欲快速規?;七M銀行的傳統業務系統容器化遷移,發揮云化基礎設施效能,建立切實可行且便于研發、管理、運維人員上手的交付體系也非常關鍵。通過統一的云原生應用開發平臺使自研應用從頭云原生,為 Serverless 奠定基礎;企業制品倉庫(Artifactory)為交付體系的中樞,搭建 DevSecOps 體系打通應用上云的制品流轉、自動化安全合規審核。加強云原生運維手段 容器云基礎設施
19、上應用以進程形式存在,與基礎設施耦合性增強,變化性也較強。本文方案建設企業級 CMDB 對接容器云基礎設施,針對上云的應用建設適配的監控告警平臺、統一日志平臺,保障在應用部署形態發生變化下的可觀測能力,基于 EBPF 技 8 部署從 90 分鐘減少到 15 分鐘 成本效率提高了 30%每周可部署 700 次 術進一步增強可觀測性,使用 AIOPS 技術自動化實現應用上云的資源分配、管理流程,智能進行故障分析處理,提升運維效率。企業級云原生知識體系建設 技術轉型,意識先行,云原生技術體系重塑企業 IT 基礎設施的同時,也涉及銀行科技條線各職能人員的習慣與職責變化,各個崗位人員對云原生技術正確的認
20、識,才能落地好云原生全面提升 IT 效能。本文方案通過建立云原生 Wiki、知識迭代體系,結合學習、培訓、認證機制,來實現上述目標。云原生標準建設 通過研發側規范制定應用容器改造、構建、部署要求,保障應用設計的云原生化,可較好適應基礎設施的彈性、韌性特點;通過交付規范保障上云生命周期的安全合規即高效;通過運維側規范優化容器云資源管理,提升利用率降本增效,保障容器平臺層、PaaS 層、應用層可靠運行。Kubernetes 助力 Nubank 一周部署 700 次 業務激增帶來的基礎設施之困 過去幾年中,隨著 Nubank 客戶基數達到 2300 萬,工程團隊從最初的 30 人增至 520 人,這
21、家金融科技初創企業面臨不可變基礎設施帶來的挑戰?!拔覀兊牟渴鹨啃D整個堆棧,或克隆整個基礎設施才能迭代所有開發,”Nubank 工程總監 Renan Capaverde 說,“因此,隨著時間推移,會變得越來越慢,越來越痛苦?!盞ubernetes 是最佳解決方案 公司在早期就已經使用了 Docker 容器?!拔覀兇_信,Docker 對我們大有裨益,我們希望進一步容器化,”Capaverde 說。選擇一個編排器是接下來要做的工作,團隊最終選擇了 Kubernetes。Nubank 云原生平臺包括監控用 Prometheus、Thanos 和 Grafana,還有日志用 Fluentd。降本增效
22、:一周部署 700 次不是問題 開發者體驗大大改善;生產環境的開發時間從 90 分鐘減少到 15 分鐘。今天,Nubank 工程師一周能部署 700 次。此外,團隊估算 Nubank 的成本效率提高了大約 30%。9 作為一家金融科技企業,Nubank 不會被歷史遺留的基礎架構所累 Nubank 開始向 Kubernetes 遷移時,“我們首先想要實現的就是助力開發者運行應用軟件,”Capaverde 說,“我們的應用都是云原生應用,對項目來說這是很好的架構,可按需進行擴展?!弊畛?,團隊考慮過在開發者環境中使用 Minikube,用 Kubernetes 做測試和 staging,然后在生產環
23、境中做架構分區。后來,他們覺得先遷移 staging 環境,就能在早期加速采用 Kubernetes。但這樣會在 staging 階段導致一個 Kubernetes 集群用于所有分區,出于單點可能失敗的考慮,以及團隊缺乏 Kubernetes 相關經驗,最終放棄了該計劃?!拔覀優?Kubernetes 部署了 kops 解決方案,采用 kops 確認逆向工程,試圖了解 Kubernetes 的具體情況,以及配置的復雜細節,”Capaverde 說,“我們自己做的自動化,所以有自己的 Kubernetes 發行版,不是 kops,也不是 Kube-aws?!焙髞?,“我們看到了 Kubernete
24、s 項目的發展方向,”他說,團隊開始使用 kubeadm 來創建?!拔覀冇蒙a工具創建新的集群,這樣就能了解整體運行狀況,”軟件工程師 Yago Nobre 說。大約 20 個客戶參與了新分區測試,幾個月后,“在這個點上,我們確信解決方案的效果,然后開始一個一個地遷移其他分區?!盢ubank 云原生平臺上還包括監控用 Prometheus、Thanos 和 Grafana,還有日志用 Fluentd?!坝辛?Kubernetes 和金絲雀部署,撤銷一個變更容易了很多,因為部署更快了。大家部署得更頻繁,信心也更足?!盢UBANK 工程總監 RENAN CAPAVERDE 為了幫助工程師使用新的平
25、臺,團隊在第一年舉辦了全公司范圍的培訓活動。同時開發了叫做 NuCLI 的命令行界面,包括 500 多個自動化快捷方式,比如從應用軟件或硬件部署提取日志?!斑@種抽象更加簡便,在遷移初期,能夠緩解大家缺乏 Kubernetes 專業知識的問題,”Capaverde 說。最初階段,Nubank 作為一家 Clojure 商店,總是有 CPU 設置和 JVM 的問題,資源配置上總要采取保守方法,才能避免風險,運行得更快一些。這樣就無法帶來 Kubernetes 能夠解決的成本節約效應了。大約過了一年半時間,團隊進一步調整了橫向擴展和預算,估算 Nubank 的成本效率提高了大約 30%。但這僅僅是開
26、始而已?!拔覀冋谑瘴惨淮涡碌?Kubernetes rollout,移至 1.16,還有一個能和 JVM 更好整合的新版本內核,這樣 JVM 就能受益于容器支持標簽了,同時還能調整應用程序的請求和范圍,”Capaverde 說。10 此外,還有其他好處?!癒ubernetes 有大量優質的抽象方法,如就緒探針和存活探針,”Capaverde 說,“不需要啟動,我們采用藍/綠部署策略。我們有 400 多個微服務,所以你可以想象我們必須等著 EC2 實例才能啟動、然后啟動容器時的部署情況。有了 Kubernetes,只需要啟動容器就好了?!币虼?,生產環境的部署時間從 90 分鐘減少到 15 分鐘
27、。Nobre 說,這就是“最大的好處,因為這樣能提升開發者的體驗?!爆F在,Nubank 工程師每周能部署 700 次?!皩︺y行來說,你可能覺得這有點過于瘋狂,”Capaverde 笑著說,“但實際上并不瘋狂,因為有了 Kubernetes 和金絲雀部署,撤銷一個變更容易了很多,因為部署更快了。大家運送得更頻繁,信心也更足?!盞ubernetes 還幫助 Nubank 拓展到其他國家,2019 年最先拓展到墨西哥?!叭绻愕乃泄ぷ鞫荚谠粕贤瓿?,我們就需要設置新的 AWS 賬戶,了解新的 AWS 賬戶有什么局限,”Capaverde 說,“用 Kubernetes 抽象方法更便于迭代基礎設施和應
28、用程序,速度更快,開發基礎設施也更簡單?!痹谶^去 3 年中,Nubank 已經由 5 人組成的 Kubernetes、Kafka、監控和其他任務平臺團隊發展成為 50 人的專業基礎團隊,團隊中不乏擁有豐富 Kubernetes 經驗的成員。在發展過程中,他們已經積累了一些經驗教訓,可以和要使用 Kubernetes 的機構分享?!伴_始遷移的時候,就開始分享經驗,讓大家都參與進來,”Nobre 說,“從 staging 遷移到 prod 遷移期間,我們得到了很多反饋信息,因為大家都在用,所以我們能改進基礎設施、工具和進入生產環境前的一切?!痹?Capaverde 看來,“人們說起 Kuberne
29、tes 就像是在談論一種包治百病的良方。而事實恰恰相反:Kubernetes 是一只野獸、一個大怪物。它的確能幫到我們很多,但你必須要了解它、控制它、馴服它?!边@是一個持續的過程。擺在 Nubank 面前的,是要在服務間溝通和安全性,以及提高資源使用效率等方面做出決策?!拔覀兊陌l展非常喜人,”Capaverde 說,“所有的決策都把重點放在長期的可擴展性和創建正確的抽象方法上。這樣,我們下一個階段就要應付更多增量,而非顛覆了。所以,持續進步、實現目標也更容易了呢?!?1 運營效率提高至少 10 倍 數十個集群,其中一個最大的集群有數萬個節點 螞蟻金服使用 Kubernetes 推進超速增長戰略
30、 挑戰以全新方式處理數據 螞蟻金服于 2014 年 10 月正式成立,起步于 2004 年成立的全球最大在線支付平臺支付寶。除金融服務外,該公司還利用科技創新提供了眾多其他服務。支付寶擁有 9 億多用戶,每天都有海量的交易通過其本地和全球合作伙伴達成。2017 年雙十一高峰期的每秒交易量高達 256,000 筆,2018 年雙十一的商品成交額更是高達 310 億美元。除了支撐這些交易外,支付寶同時還提供有許多其他的服務。存儲和計算集團產品管理負責人 Haojie Hang 對此表示,螞蟻金服面臨著“以全新方式處理數據的挑戰。我們認為這一處理規模會帶來三個嚴峻挑戰:1.如何提供實時計算、存儲和處
31、理能力,以便開展為欺詐檢測提供實時建議等工作;2.如何從這些數據中挖掘智能,盡管當前我們有很多數據,但我們并未能從中獲得足夠的洞察;3.如何在應用程序級別、中間件級別、系統級別甚至是芯片級別保證安全性?!睘榱讼蚩蛻籼峁┛煽亢鸵恢碌姆?,螞蟻金服于 2014 年初開始采用容器,并且很快開始需要一款編排解決方案,來支持其數據中心內擁有數萬個節點的集群。選擇 Kubernetes 作為解決方案 在評估了多項技術后,團隊最終選擇使用 Kubernetes 提供編排服務,同時還決定采用其他多個 CNCF 項目,包括 Prometheus、OpenTracing、etcd 和 CoreDNS。Hang 指
32、出:“2016 年底,我們認為 Kubernetes 將成為事實上的標準回顧過去,我們做出了正確的選擇,選擇了正確的技術。但之后,我們需要將生產工作負載從傳統基礎設施轉移到支持 Kubernetes 的最新平臺,由于我們非常注重可靠性和一致性,這一工作著實花費了一些時間?!八泻诵呢攧障到y都在 2017 年 11 月完成了容器化處理,向 Kubernetes 的遷移工作正在進行之中。運營效率至少改進了十倍 Hang 表示:“通過使用云原生技術,我們發現運營效率至少改進了十倍,這意味著我們的產能也能夠實現相同倍數的提升?!蔽浵伣鸱€向全球的業務合作伙伴提供了完。全集成的金融云平臺,并希望憑借自身
33、在服務創新方面的豐富經驗和雄厚技術專業知識,為打造下一代數字化銀行賦能。Hang 表示,其團隊還沒有開始著手優化 Kubernetes 平臺:“因為我們還處于超速增長階段,還沒有進入成本節約階段?!蔽浵伣鸱蛟圃夹g增長迅速 作為跨國集團阿里巴巴成立的分支公司,螞蟻金服增長迅速,估值超過 1500 億美元。這家金融科技創業公司于 2014 年成立,旗下包含全球最大的在線支付平臺支付寶,同時還通過充分利用科技創新推出了多項其他服務。支付寶擁有 9 億多用戶,每天都有海量的交易通過其本地和全球合作伙伴達成。2017 年雙十一高峰期的每秒交易量高達 256,000 筆,2018 年雙十一的商品成交
34、額更是高達 310 億美元。螞蟻金服以 12 “為世界帶來更多平等的機會”為使命,致力于通過科技創新能力,搭建一個開放、共享的信用體系和金融服務平臺。除了金融服務外,螞蟻金服還運營著其他業務,例如花唄在線信用系統、借唄借款服務、以及擁有 3.5 億用戶的螞蟻森林綠色能量移動應用。存儲和計算集團產品管理負責人 Haojie Hang 對此表示,螞蟻金服面臨著“以全新方式處理數據的挑戰。我們認為這一處理規模會帶來三個嚴峻挑戰:1.如何提供實時計算、存儲和處理能力,以便開展為欺詐檢測提供實時建議等工作;2.如何從這些數據中挖掘智能,盡管當前我們有很多數據,但我們并未能從中獲得足夠的洞察;3.如何在應
35、用程序級別、中間件級別、系統級別甚至是芯片級別保證安全性?!睘榱藨獙@些挑戰并為其客戶提供可靠和一致的服務,螞蟻金服在 2014 年采用了 Docker 容器化技術。但很快,他們便意識到需要一款編排解決方案,來支持公司數據中心內擁有數萬個節點的集群。該團隊研究了多項技術,包括 Docker Swarm 和 Mesos 等。Hang 指出:“我們開展了大量的概念驗證(POC)工作,在選擇生產系統方面我們非常謹慎,我們希望確保不會丟失任何數據。一分鐘的服務中斷對于我們來說是無法接受的,即使是一秒鐘的中斷也會導致非常嚴重的影響。我們每一天都面臨著沉重的壓力,需要為中國和全球的消費者與企業提供可靠、一
36、致的服務?!弊罱K,螞蟻金服選擇了 Kubernetes。在 Hang 看來,Kubernets 很好地滿足了他們的全部需求。它擁有一個強大的社區,“技術在未來三到五年內仍然能夠滿足需求”,同時公司的工程師團隊也熟悉該項技術。Hang 指出:“2016 年底,我們認為 Kubernetes 將成為事實上的標準回顧過去,我們做出了正確的選擇,選擇了正確的技術。但是這之后我們需要將生產工作負載從傳統基礎設施轉移到支持 Kubernetes 的最新平臺。我們花了很多時間學習,然后培訓我們的員工,以便在 Kubernetes 上很好地構建應用程序?!彼泻诵呢攧障到y都在 2017 年 11 月完成了容器
37、化處理,向 Kubernetes 的遷移工作正在進行之中。螞蟻金服的平臺還利用了多個其他 CNCF 項目,包括 Prometheus、OpenTracing、etcd 和 CoreDNS。全球技術合作與發展負責負責人 Ranger Yu 表示“在今年的雙十一中,我們有大量的節點在 Kubernetes 上運行,但與我們基礎設施的整體規模相比,需要做的工作還有很多?!碑斍暗牟渴鹨呀洖槲浵伣鸱砹孙@著的改進。Hang 表示:“云原生技術使我們在效率方面獲益匪淺??偟膩碚f,我們希望確?;A設施靈活敏捷,能夠輕松應對未來可能出現的狀況。這是我們最重要的目標。通過使用云原生技術,我們發現運營效率至少改
38、進了十倍,這意味著我們的產能也能夠實現相同倍數的提升。舉例來說,假設您現在每個人可以管理 10 個節點。借助云原生技術,未來每個人將可以管理 100 個節點?!?3 螞蟻金服還向全球的合作伙伴提供了金融云平臺,并希望憑借自身在服務創新方面的豐富經驗和雄厚技術專業知識,為打造下一代數字化銀行賦能。Hang 表示,其團隊還沒有開始著手優化 Kubernetes 平臺:“因為我們還處于超高速增長階段,還沒有進入成本節約階段?!痹谖浵伣鸱捎迷圃夹g的過程中,CNCF 社區也有著重要影響。Hang 指出:“如果您正在應用一項新技術,能夠在社區中與其他用戶討論技術問題將會大有裨益。CNCF 和這一令人
39、驚嘆的技術讓我們獲益匪淺,讓我們能夠在全球持續擴展業務。毋庸置疑,我們肯定會在未來繼續加強與社區的合作,擁抱開源技術?!蔽覀冊谖磥韺臃e極主動。CNCF 提供了一個絕佳的平臺,讓每個人都可以發布或使用組件。這是一種非常好的開源治理模式?!闭雇磥?,螞蟻金服團隊將繼續評估其他 CNCF 項目。該團隊在中國建立了一個服務網格社區,匯集了許多中國公司和開發人員,共同探討該技術的潛力。Hang 表示:“對于中國的開發人員和最終用戶而言,服務網格非常具有吸引力。由于我們現在有很多傳統系,它是將新系統和傳統系統整合在一起的理想中間層。對于新技術,我們會緊密關注它們是否能夠持續很長時間?!盞ubernetes 以出色的成績,通過了螞蟻金服的測試。團隊建議其他公司也可以加以考慮。Hang 指出:“在中國,我們是金融和其他相關服務創新領域的領導者。我們也希望通過在技術領域的投資,確保自己在未來 5 到 10 年能夠繼續保持這一領導地位?!?4