1、中國通信運營商AI+DevOps實踐報告|1參編單位:中國聯合網絡通信集團有限公司軟件研究院中國通信標準化協會 TC628 標準推進委員會|中國通信運營商AI+DevOps實踐報告2前 言在 21 世紀的科技洪流中,人工智能(AI)與研發運維一體化(DevOps)的深度融合(即AI+DevOps),正引領著現代化軟件工程的新一輪變革。這股力量不僅重塑了技術應用的邊界,更為通信行業帶來了前所未有的發展機遇與挑戰。在國家“十四五”規劃的宏偉藍圖下,加速“數字經濟”發展,構建數字中國,成為國家戰略的重要一環?!笆奈濉睌底纸洕l展規劃明確指出,數字經濟是國民經濟中最為活躍的部分,強調了數字經濟安全體
2、系的重要性,并提出了企業數字化轉型升級的路徑。在此背景下,通信運營商作為信息社會的基礎設施提供者,其數智化轉型的每一步都備受矚目,承載著推動經濟社會高質量發展的重大使命。AI+DevOps 模式的融合,不僅標志著技術上的革新,更是軟件開發理念的一次重大飛躍。借助智能算法優化決策過程,結合 DevOps 的高效開發與運維機制,企業能夠實現從產品設計、開發、測試到部署的全鏈條自動化與智能化。例如,根據谷歌云 DORA 團隊的調查,76%的開發者和 IT 專業人士正積極利用 AI 進行代碼編寫、信息總結及代碼解釋,這顯著提升了代碼質量與開發效率。此外,AI 工具的普及,如微軟的 Visual Stu
3、dio Intellicode,已被安裝超千萬次,進一步證明了 AI 在 DevOps 中的應用能夠提高生產效率和準確性。企業通過采用AI+DevOps 模式,能夠極大地提升服務響應速度與質量,同時降低運營成本,增強市場競爭力。AI+DevOps 不僅是提升企業競爭力的關鍵,更是推動社會經濟發展的新動力。借助持續的技術革新與模式優化,通信運營商得以在智慧城市、遠程教育、遠程醫療等多個領域展現更大作為,推動資源高效配置,提高公共服務質量,為構建更加包容、更可持續的社會貢獻力量。本報告旨在深入剖析 AI+DevOps 模式在中國通信運營商中的實踐應用現狀、面臨的挑戰以及成功路徑。報告將通過案例分析
4、,揭示我國通信運營商如何通過 AI+DevOps 實現軟件研發運營流程的重塑與優化,進而提升用戶體驗,加速產品迭代創新,同時確保數據安全與合規性的探索之路。報告還將探討在實施過程中遇到的關鍵挑戰,如技術整合難度、組織文化變革需求及人才短缺等,并提出相應的解決策略。本報告不僅是對過往實踐的總結,更是對未來方向的探索與啟示。我們期待通過分享成功經驗和挑戰應對策略,為中國通信運營商乃至整個行業的數智化轉型提供寶貴的參考與指導,共同開啟 AI+DevOps 引領下的新篇章。中國通信運營商AI+DevOps實踐報告|3目 錄第一章 AI+DevOps 是通信運營商在數字智能時代轉型升級的戰略需求.41.
5、1 數字智能時代AI技術作為國家戰略正在飛速發展.41.2 AI+DevOps已在各行業初見規模.51.3 AI的深度應用已成為電信運營商數字化轉型的核心引擎.7第二章 AI 深度賦能 DevOps 技術演進與發展.102.1 需求階段的技術賦能.102.2 設計階段的技術賦能.102.3 開發階段的技術賦能.102.4 測試階段的技術賦能.102.5 部署/發布階段的技術賦能.112.6 運維階段的技術賦能.11第三章 電信運營商面臨 DevOps 數智化轉型瓶頸.123.1 內外環境激變促使企業亟須借助先進技術提質增效強化產品競爭力.123.2 面對市場波動企業亟須重塑投資組合以實現高效配
6、置與抗風險能力.13第四章 AI+DevOps 戰略指導下的通信運營商落地實踐.144.1 落地策略.144.2 核心能力建設.174.3 下一步規劃.22第五章 電信運營商 AI+DevOps 智能化轉型未來演進方向.255.1 實施路徑.255.2 風險應對.27第六章 典型實踐案例-某通信運營商基于大模型的開發流程管理實踐.28|中國通信運營商AI+DevOps實踐報告4第一章AI+DevOps是通信運營商在數字智能時代轉型升級的戰略需求黨的十九大報告明確提出“推動互聯網、大數據、人工智能和實體經濟深度融合”,這意味著人工智能的發展上升至國家戰略層面。2024 年的中國政府工作報告首次引
7、入了“人工智能+”的概念,從國家層面提出人工智能技術要與各行業進行深度融合。此舉標志著我國將深化人工智能技術的研發與應用,并全力推動其與經濟社會各領域的深度融合與創新發展。1.1數字智能時代 AI 技術作為國家戰略正在飛速發展在全球范圍內,人工智能技術也正受到各國政府的高度重視,被視為推動國家經濟發展、增強國際競爭力的關鍵戰略領域。國際數據公司(IDC)于 2024 年 10 月發布的最新全球人工智能和生成式人工智能支出指南顯示,到 2028 年,全球在人工智能(AI)方面的支出(包括支持 AI 技術的應用程序、基礎設施以及相關的 IT 和商業服務)將增加一倍以上,預計將達到 6,320億美元
8、。從政策制定到資金投入,從技術研發到人才培養,各國都在不遺余力地加速 AI 技術的布局與發展,以期在這場全球性的科技革命中占據先機,把握未來發展的主動權。長期維持人工智能基礎研究投資是美國人工智能研發八大戰略方向之首。以美國為例,其人工智能項目預算逐年攀升,2024 年 7 月底,美國兩黨參議員提出了人工智能創新未來法案,與此同時,美國人工智能安全研究所(Institute)在國家標準與技術研究院(NIST)正式成立,負責制定確保國家安全、公共安全和個人權利的人工智能標準。2024 年 10 月,韓國人工智能(AI)研究主管機構“國家人工智能實驗室”在首爾揭牌成立,截至 2028 年,共將有
9、946 億韓元(約合人民幣 4.9 億元)資金投入到研究所開展各種項目。2024 年 4 月,加拿大政府公布了價值 24 億加元的一攬子人工智能領域相關的發展聲明,為加拿大世界領先的人工智能研究人員、初創企業和規?;髽I建設并提供計算能力和技術基礎設施,以推動人工智能初創企業將新技術推向市場,并加速人工智能在農業、清潔技術、醫療保健和制造業等關鍵領域的應用。2024年 3 月,歐盟委員會通過其第二個戰略計劃“地平線歐洲”20252027 年戰略計劃,確定了新階段“地平線歐洲”開展研究與創新資助戰略方向。20212027 年,“地平線歐洲”將至少投入 130 億歐元用于發展核心數字技術,歐盟將以
10、卓越的人工智能和值得信賴的人工智能雙原則為指導,實施有利于創新的全面監管框架。盡管我國在人工智能技術攻關和產業應用方面起步較晚,但在國家多項政策和科研基金的扶持下,近年來其發展勢頭強勁,人工智能相關發明專利授權量已躍居世界第二位。如今,中中國通信運營商AI+DevOps實踐報告|5國人工智能領域正在頂層設計與實踐落實兩個方面努力發展,抓住機遇,蓄勢待發,開啟新一輪的沖刺。1.2 AI+DevOps 已在各行業初見規模隨著 AI 技術的不斷成熟與普及,其在 DevOps(研發運維一體化)領域的應用正逐步展現出巨大潛力與價值。DevOps 作為一種強調開發(Development)與運維(Oper
11、ations)緊密協作的理論方法,旨在通過自動化、持續集成/持續部署(CI/CD)等手段,加速軟件交付周期,提高產品質量與用戶體驗。AI 技術賦能 DevOps 在開發階段落地最快,智能測試和智能運維已在多個點狀場景中試點應用,而智能需求管理領域則處于積極探索階段,涵蓋了智能監控、故障預測、自動化測試、代碼審查等方面,這些創新極大地提升了 DevOps 的智能化程度,使得系統能夠更加高效地自我優化、自我修復,并基于數據分析做出更加精準的決策。在金融、通信、互聯網等多個行業中,AI 賦能的 DevOps 實踐已初見規模,不僅顯著提升了業務敏捷性,還降低了運營成本,增強了企業的市場競爭力。這一趨勢
12、預示著 AI 與 DevOps的深度融合將成為未來產業數字化轉型的重要方向。1.2.1 金融行業:安全為先,大模型工具助力研發全流程優化依據國際數據公司(International Data Corporation)的預測分析,到 2027 年,全球人工智能相關的軟件、硬件及服務市場銷售額有望達到 4000 億美元以上。其中,金融業預計將占據 970 億美元的市場份額,其復合年增長率高達 29%,成為增長速度最快的行業之一,人工智能技術正在深刻改變金融業的運作模式。隨著數字化轉型的不斷推進,金融機構在追求效率提升與創新的同時,對數據安全與隱私保護的關注度日益增加。因此,在將人工智能技術應用于
13、DevOps 的過程中,金融行業特別強調在確保安全的前提下,利用大型模型工具全面支持研發的全流程。在金融服務領域,人工智能技術已廣泛滲透至智能投資研究、合規性質控、風險智能管控、客戶服務智能化、市場分析及保險理賠等多個關鍵環節。大型模型工具不僅助力金融機構自動化代碼生成、智能測試部署等流程,還能深度挖掘金融大數據,精準識別風險與欺詐,進而強化金融機構的風險防控能力。同時,金融機構通過加強數據加密技術和訪問控制機制,確保在處理敏感數據時保護用戶隱私,為金融服務的連續性與穩定性提供堅實保障。|中國通信運營商AI+DevOps實踐報告6據麻省理工科技評論發布的全球金融機構大模型榜單,我國有 12 家
14、金融機構進入全球TOP20,其中螞蟻集團、平安集團、工商銀行、建設銀行、中國銀行、馬上消費金融、農業銀行位居全球 TOP10。郵儲銀行宣布已完成大模型算力云資源池的試點建設,其大模型異構算力集群已初步具備支持千億級規模的大模型訓練能力。在場景應用層面,“郵儲大腦”正逐步向生成創作領域拓展,為員工提供了多種智能辦公助手。具體而言,在遠程銀行客戶投訴分析場景中,該助手可輔助座席進行投訴內容的監管報送分類,準確率高達 93%;在文檔內容審核方面,它能有效幫助業務需求管理人員快速理解與審核需求內容,業務標簽提煉的準確率可達 84%,功能點抽取的準確率則高達 96%。建設銀行表示,其正持續推進金融大模型
15、的建設及應用,全面賦能公司金融、個人金融、資金資管、風險管理、科技渠運以及綜合管理六大業務板塊中的 79 個行內業務場景。通過提升文圖輸出質量,該行有效支撐了客戶營銷的提質增效;同時,通過優化檢索增強生成應用模式,該行成功支撐了授信審批的財務分析工作,將客戶財務分析報告的工作用時由數小時大幅縮短至分鐘級別。農業銀行在其 2024 半年報中披露,在人工智能技術應用方面,該行正加快以 AI 技術為驅動的智慧銀行建設步伐,密切跟蹤大模型技術趨勢,持續完善 AI 軟硬件支撐體系,并穩妥推動AI+應用場景的落地實施。交通銀行在其 2024 年半年報中提及,該行正積極探索 AIGC 前沿技術,并制定了生成
16、式人工智能的建設規劃,同時組建了 GPT 大模型的專項研究團隊。此外,交通銀行還與科大訊飛聯合成立了創新實驗室,以進一步推動大模型技術的研發與應用。1.2.2 互聯網行業:自研大模型產品,實現研發高度智能化互聯網行業作為技術創新的前沿陣地,其應用 AI 賦能 DevOps 的實踐尤為突出。依托自身強大的技術研發力量,各互聯網企業積極布局并應用自研的大模型產品,促使研發流程朝著高度智能化的方向深度演進。AI 在 DevOps 實踐進程中的融合主要體現在以下幾個核心范疇:其一,實現 DevOps 流程自動化,包含代碼審查流程自動化、測試用例生成與執行自動化等關鍵環節;其二,憑借對海量歷史數據的深度
17、挖掘與分析,達成對未來業務需求與系統性能的精確預測;其三,優化團隊成員間的溝通協作模式與流程;其四,構建完備且高效的自動化代碼審查機制;其五,打造智能化部署策略體系,以應對復雜多變的業務部署需求。中國通信運營商AI+DevOps實踐報告|7在互聯網行業中,諸多企業已成功開展 AI+DevOps 實踐。以字節跳動為例,其云雀模型在多業務展現賦能效能。代碼審查時,深度剖析抖音等項目代碼邏輯與語義,精準識別代碼規范、邏輯及安全問題,審查效率較傳統提升約 40%。測試用例生成環節,基于字節多元產品數據生成高覆蓋測試用例集,檢測出多個隱匿功能缺陷,使異常反饋率降低超 30%。以百度為例,其已深入開展大模
18、型與 DevOps 工具鏈的深度融合,百度的千帆大模型開發與服務平臺集成了AI 大模型與 DevOps 工具鏈,提供了從模型訓練、部署到監控的全流程服務,簡化 DevOps流程,提供如自動化代碼審查和測試等的功能支持,從而加速軟件交付。1.2.3 通信行業:研發大模型賦能研發模式轉型在通信行業,技術的快速迭代和業務需求的不斷變化對研發流程提出了更高要求。面對這些挑戰,運營商企業積極尋求提升研發效率與質量之道,專用研發大模型的誕生為此提供了堅實助力。運營商企業普遍已經建立了較為完善的 DevOps 平臺,平臺覆蓋了從代碼開發、測試、部署到運維的全鏈條管理,確保了研發流程的順暢與高效。通過整合多種
19、工具和技術,DevOps平臺不僅實現了研發流程的自動化與智能化,還支持了多種研發管理場景和開發模式,如敏捷開發、持續集成和持續部署等。隨著 AI 技術的日益成熟,運營商企業著手將 AI 融入 DevOps 平臺,力求研發流程更加智能化。在通用大模型的基礎上,運營商企業結合通信行業的特點與需求,精心打造專用研發大模型。在 DevOps 平臺中,運營商企業引入了機器學習、自然語言處理等 AI 技術,用于自動化代碼審查、智能測試、故障預測等方面。自動化代碼審查能夠快速發現代碼中的潛在問題,提高代碼質量;智能測試則能夠根據歷史測試數據和項目需求,自動生成測試用例,提高測試效率;故障預測則能夠通過分析系
20、統日志和運行數據,提前發現潛在的故障點,降低運維成本。1.3 AI 的深度應用已成為電信運營商數字化轉型的核心引擎在全球數字化轉型加速、云計算與大數據技術日新月異的背景下,通信運營商正經歷一次深刻的變革與戰略升級,向 AI+DevOps 模式轉型。這一轉型不僅響應了數字化轉型的全球趨勢,也體現了運營商在云計算、大數據和 5G 等技術領域的積極布局。面對日益增長的用戶需求、復雜多變的業務場景以及激烈的市場競爭,傳統 DevOps 實踐雖已在一定程度上提升了開發與運維的協同效率,但面對大規模數據處理、快速迭代更新以及智能化運維的迫切需求,其局限性逐漸顯現。AI 技術的引入為通信運營商的研發運維體系
21、注入了新的活力與可能。通過AI+DevOps 深度融合,運營商不僅能加速開發與部署流程,減少人為錯誤,還能夠分析預測潛|中國通信運營商AI+DevOps實踐報告8在問題、優化資源配置、實現預測性維護。同時,AI 增強了系統監控與告警能力,可有效應對業務擴展帶來的復雜性和規模性挑戰,為通信運營商提供了更為穩定、高效且智能的研發運維解決方案,推動了業務的持續創新性發展。1.3.1 應對業務復雜度與規模性挑戰隨著通信運營商業務的不斷擴展,運維環境變得越來越復雜,數據量也呈指數級增長。傳統的 DevOps 實踐在應對大規模數據處理、多環境部署以及快速迭代更新方面存在局限性。AI技術的融入,為運營商企業
22、開辟了一種全新的解決方案路徑。借助智能化分析技術,AI 能夠精準識別并高效處理復雜的運維任務,諸如環境配置、代碼部署等,從而大幅提升了運維效率。同時,AI 還能通過機器學習算法,預測未來可能出現的運維問題,并提前采取措施進行預防,從而降低了故障發生的概率和影響。此外,AI 技術還能幫助運營商更好地管理云資源,實現資源的動態調整和優化配置,以應對業務規模的不斷擴大。1.3.2 大幅提升研發及運維階段的效率與質量AI+DevOps 模式通過自動化流程與智能決策,顯著提升了研發運維環節的效率與質量。在研發方面,AI 輔助代碼生成技術通過理解開發者的需求,能夠自動生成高質量的代碼片段或功能模塊。這一能
23、力顯著地降低了開發者的勞動強度,縮短了手動編碼的時間,進而提升了開發效率。開發者可以更加專注于業務邏輯的實現和創新功能的開發。此外,AI 技術能夠實時檢測代碼中的錯誤并提供修復建議,從而減少調試時間和修復成本,例如,AI 驅動的靜態代碼分析工具可以快速識別常見的安全問題,如 SQL 注入、跨站腳本(XSS)等,并提供自動化的修復建議;在運維方面,AI 技術能夠自動處理大量重復性的運維任務,如日志分析、性能監控等,減少了人工干預和錯誤。這不僅降低了運維成本,還提高了運維效率。同時,AI 還能通過智能分析預測潛在問題,提前采取措施進行預防,從而降低故障發生的概率。根據谷歌 2024 年 DevOp
24、s 狀態報告,全球超過 75%的技術人員依賴 AI 處理至少一項專業任務。具體而言,76%的開發者和 IT 專業人士使用 AI 工具來完成代碼編寫、信息摘要和代碼解釋等關鍵任務。此外,AI 的應用不僅提高了工作效率,還顯著提升了文檔質量(提升 7.5%)和代碼質量(提升 3.4%),這表明 AI 技術在軟件開發與運維領域正發揮著革命性的作用。這些調研數據表明 AI 在代碼生成方面的應用已經相當廣泛,并顯著提升了開發效率。1.3.3 優化資源配置與成本管控在資源管理方面,AI+DevOps 模式通過智能分析歷史數據和預測未來需求,可實現資源的優化配置和動態調整。AI 技術能夠精準識別并有效消除資
25、源浪費的根源,例如,閑置的云資中國通信運營商AI+DevOps實踐報告|9源及低效運行的服務器,進而顯著提升資源的整體利用率。這不僅可幫助降低運營成本,還能為業務的持續增長提供有力的資源保障。1.3.4 推動業務創新與持續增長AI+DevOps 模式下,通過智能化手段深入分析用戶行為、市場需求及競爭對手動態,運營商企業能更精確地洞察市場趨勢與用戶需求,有力推動產品與服務的不斷創新。同時,AI 技術還能幫助運營商優化業務流程、提升客戶體驗,為業務的持續增長提供動力。例如,通過智能客服系統,運營商能夠為用戶提供更加個性化、高效的服務體驗,從而增強用戶黏性,促進業務的持續增長。|中國通信運營商AI+
26、DevOps實踐報告10第二章AI深度賦能DevOps技術演進與發展2.1 需求階段的技術賦能在需求管理階段,自然語言處理(NLP)和機器學習(ML)技術的應用可以深入解析用戶反饋和市場趨勢,識別出潛在的需求和改進點。自然語言處理(NLP)技術能夠解讀用戶的自然語言輸入,并將其高效轉化為結構化數據,隨后,機器學習(ML)模型對這些數據進行分析,精準預測用戶行為及需求變化趨勢。這些技術的應用極大地提升了需求管理的精準度和效率,為開發工作后續階段打下了堅實的基礎。例如,通過分析社交媒體、用戶論壇和客戶支持對話,通過自然語言處理(NLP)可以識別出用戶對產品或服務的常見問題和痛點,從而幫助團隊優先處
27、理最關鍵的需求。2.2 設計階段的技術賦能在設計階段,生成式人工智能(Gen AI)和強化學習(RL)技術可以輔助設計決策,優化系統架構。生成式人工智能(Gen AI)能夠自動生成設計模式和架構藍圖,而強化學習(RL)則通過模擬環境測試各種設計方案,從而找到最優系統架構。這些技術的應用不僅提高了設計的效率,還確保了設計的質量和系統的可擴展性。例如,生成式人工智能(Gen AI)可以根據歷史項目數據生成初始的系統架構圖,而強化學習(RL)可以在模擬環境中測試這些架構的性能,以預測在高負載情況下的表現。2.3 開發階段的技術賦能在開發階段,深度學習(DL)和代碼生成技術的應用可以顯著提高代碼的生成
28、速度和質量。深度學習(DL)模型通過大量代碼樣本的學習,能夠預測代碼的結構和邏輯,而代碼生成技術則根據開發人員的指令,直接生成所需的代碼片段。這些技術的運用大幅減輕了手動編碼的負擔,顯著提升了開發效率,同時有效降低了代碼中的錯誤率。例如,深度學習(DL)模型可以學習一個項目的歷史代碼庫,以預測和生成新的函數和類,而 AI 增強的代碼生成技術能依據開發者的需求描述自動產出代碼,極大地加速了開發進程。2.4 測試階段的技術賦能在測試階段,AI 驅動的測試自動化工具如 Applitools、Functionize 和 Mabl,利用視覺人工智能模型和機器學習技術,可以自動化測試用例的創建和執行。這些
29、工具能根據代碼變更中國通信運營商AI+DevOps實踐報告|11智能生成測試用例,顯著提升測試覆蓋率與效率,并大幅削減人工編寫測試用例所需的時間與成本。例如,人工智能模型可以分析代碼變更,識別出受影響的功能,并自動生成相應的測試用例,確保變更不會破壞現有的功能。2.5 部署/發布階段的技術賦能在部署/發布階段,對于軟件常見的部署/發布策略,人工智能技術可發揮不同的作用。例如藍綠發布是一種零宕機的部署方式,通過維護兩個生產環境(藍色和綠色)來確保服務的連續性。在部署新版本時,可以利用深度學習技術預測流量模式,優化流量切換的時間點,從而減少對用戶體驗的影響。一旦新版本部署完成,系統將智能監控藍色環
30、境下的性能指標,快速識別并處理任何問題。如果出現異常情況,系統能夠自動回滾到綠色環境,確保服務不受影響?;叶劝l布意味著將新版本逐步釋放給一小部分用戶,通過自然語言處理(NLP)技術,基于用戶行為和特征進行智能分組,以收集最具代表性的用戶反饋。同時,對灰度版本的性能和用戶反饋進行實時監控,迅速識別并分析問題,為團隊提供決策支持,判斷是否需要繼續推廣。滾動更新涉及逐個或逐批更新服務實例,以減少停機時間。引入強化學習(RL)技術可根據監控數據動態調整更新速度,以應對不同的服務負載和性能變化。2.6 運維階段的技術賦能在運維階段,AI 增強的監控和故障預測平臺,如 Moogsoft、Dynatrace
31、 等,可提供高級異常檢測和故障根因分析。這些平臺可以實時分析運營數據,預測潛在的系統故障,并自動執行故障響應流程。這些技術的應用提高了系統的穩定性和可靠性,減少了故障發生的概率和負面影響。例如,AI 可以分析服務器日志和性能指標,預測即將發生的硬件故障或性能瓶頸,并在問題發生前進行干預。|中國通信運營商AI+DevOps實踐報告12第三章電信運營商面臨DevOps數智化轉型瓶頸3.1 內外環境激變促使企業亟須借助先進技術提質增效強化產品競爭力3.1.1 內部流程效率亟待提升隨著 DevOps 方法和技術的深入應用,電信運營商內部的 IT 系統和運營模式正在經歷重大變革。數字化、網絡化、智能化、
32、綠色化的浪潮迎面而來,對數字信息基礎設施提出了更高要求。2024 年 7 月 19 日,中國聯通總經理簡勤發布中國聯通人工智能創新成果元景 2.0 和算力智聯網(AINet)。簡勤指出,元景 2.0 展現了文生視頻、圖像可控生成等多項業界先進的多模態能力,取得了 35+行業大模型、100+標桿應用的落地成果。并表達了中國聯通希望與合作伙伴一起,讓人工智能重塑千行百業、普惠千萬場景、走進億萬客戶的愿景。這表明,電信運營企業正積極投身于利用科技創新手段,以優化內部運作流程,并推動業務模式創新,致力于實現效率與質量的雙重飛躍。然而,傳統的電信運營商往往存在著流程繁瑣、決策鏈條長、市場響應慢等問題。這
33、些問題在面對新興的數字化服務需求時顯得尤為突出。例如,新興的云服務和大數據業務要求運營商能夠快速部署資源、靈活調整服務,而傳統的 IT 架構和管理模式往往難以滿足這些需求。因此,電信運營商必須通過優化內部流程,提高決策效率,加快市場響應速度,以提升整體運營效率。3.1.2 外部產品創新速度加快在外部環境方面,電信運營商面臨著來自互聯網企業和科技巨頭的激烈競爭。這些跨界競爭者以其強大的技術創新能力和平臺優勢,在云計算、大數據、物聯網等新興業務領域占據領先地位。他們能夠快速推出新產品和服務,滿足消費者多變的需求,這對電信運營商構成了巨大的挑戰。同時,消費者對通信服務的需求日益多樣化和個性化。消費者
34、不僅需要基礎的通信服務,還期待更多的增值服務和解決方案。例如,企業客戶對于云計算和大數據服務的需求日益增長,他們希望通過這些服務提高運營效率、降低成本。個人用戶則更加注重服務的便捷性和體驗感,他們期待電信運營商能夠提供更加智能化、個性化的服務。此外,5G 和 6G 技術的發展為電信中國通信運營商AI+DevOps實踐報告|13運營商帶來了新的機遇和挑戰。5G 技術的廣泛應用將推動電信運營商行業向數字化、智能化、融合化轉型,同時也將帶來技術升級和成本投入的壓力。6G 技術預計將在傳輸速率、時延等方面較 5G 有顯著提升,開啟“萬物智聯”的新時代。電信運營商必須加快產品創新速度,以把握這些新技術帶
35、來的機遇。因此,電信運營商必須加快產品創新速度,以滿足消費者的期待并保持市場競爭力。這不僅意味著要推出新的產品和服務,還要通過技術創新來提升現有服務的質量和效率,以保障電信運營商在外部激烈的市場競爭中始終保持領先地位。3.2面對市場波動企業亟須重塑投資組合以實現高效配置與抗風險能力市場方面,因政策調整、技術迭代速度加快、消費者行為變化等因素導致電信運營商的傳統業務收入增長放緩,需要尋找新的增長點;在運營商投資組合方面,因部分傳統業務領域已陷入增長瓶頸,資源投入與收益回報嚴重失衡,且雖新興業務領域具有較大增長潛力,但投資風險較高,很難一次性投入大量資金。在此背景下,繼續重塑投資組合策略,加強內部
36、項目的精細化管理,全面落實 DevOp 方法論提升產品交付的敏捷性和靈活性以快速響應市場變化,并積極探索新的業務領域,形成多元化的收入來源;同時運用數據分析、市場調研等工具,精準衡量各領域業務的增長潛力與抗風險能力,確保資源得以高效部署于潛力最大的業務領域。|中國通信運營商AI+DevOps實踐報告14第四章AI+DevOps戰略指導下的通信運營商落地實踐4.1 落地策略隨著人工智能(AI)技術的快速發展,以及 DevOps 理念在軟件開發領域的深入應用,電信運營商正面臨著前所未有的機遇與挑戰,AI+DevOps 的深度融合,將為電信運營商帶來更高效的軟件開發、更智能的網絡運維以及更優質的用戶
37、體驗。本章節將主要介紹通信運營商在落地 AI+DevOps 時采用的具體策略和舉措。4.1.1 建立 AI+DevOps 組織架構AI+DevOps 的落地需要組織架構的強力支撐,一個高效的組織架構可以促進跨團隊協作,加速創新,并確保 AI 模型在生產環境中的順利部署和維護。組織架構建立通??紤]以下主要原則??缏毮軋F隊:打破傳統部門壁壘,組建由開發、運維、數據科學家、AI 工程師等組成的跨職能團隊,共同負責產品的全生命周期;敏捷性:采用敏捷開發方法,鼓勵快速迭代、持續交付;自治性:賦予團隊足夠的自主權,讓他們能夠快速響應變化,做出決策;端到端負責:團隊對產品的整個生命周期負責,從需求分析到上線
38、運維。在電信運營商行業常見的組織架構模式主要包括中心化模式、去中心化模式、混合模式。中心化模式是指揮決策權、資源配置和控制權高度集中于總部,下級部門嚴格執行總部指令的一種組織結構。與中心化模式相反,去中心化模式是指將決策權下放給組織中的各個部門或團隊,鼓勵員工參與決策,提高組織的靈活性和適應性。在這種模式下,總部主要負責制定戰略方向,而具體的業務運營和決策則由各部門或團隊自主完成?;旌夏J绞且环N將中心化和去中心化組織架構的優點結合起來的一種組織形式。它通過靈活地調整組織結構,以適應不同業務的需求和市場環境。這種模式既能保證組織的整體協調性和效率,又能激發員工的創新性和積極性。三種模式的優缺點對
39、比如下:中國通信運營商AI+DevOps實踐報告|15模式優勢劣勢使用場景中心化模式資源集中,有利于統一標準和技術棧靈活度較低,可能導致響應速度慢大型企業,需要對 AI 能力進行統一管理去中心化模式靈活度高,能夠快速響應業務需求容易導致資源重復建設,技術標準不統一中小型企業,業務線較多,需要快速試錯混合模式兼顧中心化和去中心化的優點,靈活性和控制力兼具組織結構較為復雜,需要平衡各方的利益大多數企業,根據業務需求靈活調整在整個組織架構中,AI 工程師負責 AI 模型的開發、訓練和優化,數據科學家負責數據清洗、特征工程、模型評估等工作,DevOps 工程師負責構建 CI/CD 流水線,實現自動化部
40、署和運維,產品經理負責定義產品需求,協調各方資源。4.1.2 打造 AI+DevOps 平臺AI+DevOps 平臺的建設是將人工智能技術深度融入 DevOps 流程,以實現更智能、更高效的軟件交付。平臺主要由三部分組成,分別包括模型層、工具層和應用層,應用層的能力是模型層和服務層能力的組合體現。圖 1 某通信運營商 AI+DevOps 平臺功能架構圖模型層以各類 AI 模型為主體,為智能研發提供 AI 底座能力。本層建設目標是在基座大模型的基礎上訓練調優生成電信行業具備 DevOps 相關知識的研發大模型,研發大模型主要由|中國通信運營商AI+DevOps實踐報告16代碼大模型和研發問答大模
41、型兩部分組成。代碼大模型的任務是代碼生成與補全、代碼解釋、單元測試用例生成及代碼質量檢測等,由于其使用頻率最高,通常選擇參數規模較小但推理速度較快的小型模型,以匹配編碼速度;研發問答大模型的任務是應對更為復雜的研發問答、需求生成、故障定位等各類任務,通常設計為參數量更龐大的較大規模模型,以滿足復雜的軟件開發需求。工具層依托 AI 底座能力,運用更多技術手段增強或調度大模型能力。數據管理主要是對采集來的數據進行清洗、去重、填充缺失值等處理后,存儲在可靠、安全的數據倉庫中,并提供智能數據標注能力,為后續模型預訓練或微調做數據準備。通過搭建模板工程,豐富用戶提問的表達方式,使模型能更好地理解用戶需求
42、,從而實現更全面的信息獲取和更準確的推理。利用編排調度工程,根據不同工具的需求,動態分配模型資源,確保模型能夠高效協同,完成復雜任務?;趯崟r、細粒度的安全審計模塊,通過記錄、分析用戶對私域數據和模型的訪問行為,及時發現異常操作,主動防御潛在安全風險,顯著提升私域數據及模型訪問的安全管控水平。應用層以用戶為核心提供各類智能開發功能,主要包括智能編碼、智能代碼安全檢測、需求內容生成及流水線排錯等功能。其中智能編碼和智能代碼安全檢測兩類功能可集成進本地 IDE插件等工具中為用戶直接提供服務。應用層作為大模型能力的直接承載者,通過與工具層的緊密協作,實現了對大模型能力的有效增強。一方面,應用層通過上
43、下文感知技術,提升了模型對代碼的理解能力;另一方面,應用層還通過適配多種開發環境和優化用戶交互,為開發者提供了更好的用戶體驗,從而構建了一個高效、智能的開發平臺。4.1.3 優先選擇落地場景電信運營商在 AI+DevOps 的落地過程中,選擇合適的場景至關重要,這不僅能快速實現業務價值,還能為后續的 AI+DevOps 轉型提供寶貴經驗。在場景選擇過程中主要考慮以下主要原則。(1)高價值業務場景:優先選擇對業務影響大、能產生直接經濟效益的場景;(2)數據豐富度:選擇數據量大、質量高、類型豐富的場景,以充分發揮 AI 的優勢;(3)技術成熟度:選擇技術相對成熟、容易實現的場景,降低實施難度;(4
44、)可衡量性:選擇有明確的衡量指標的場景,便于評估效果;中國通信運營商AI+DevOps實踐報告|17(5)快速見效:選擇能夠快速看到成效的場景,提升團隊的信心。首先,網絡優化與運維方面,可優先選擇網絡故障預測和網絡流量預測兩類場景,網絡故障預測主要是基于歷史數據和實時監控數據,預測網絡故障,提前采取措施,網絡流量預測主要是預測網絡流量,優化資源配置,提高網絡利用率。其次,客戶服務方面,可選擇智能客服和個性化推薦兩類場景,用自然語言處理技術,實現智能客服,提高服務效率?;谟脩粜袨閿祿?,為用戶推薦適合的產品和服務。最后,在軟件研發方面,可利用 AI 基于歷史數據預測用戶需求,指導產品研發;可以生
45、成/補全代碼,提高編碼效率;并通過智能靜態代碼分析,提供代碼問題定位及優化修復建議,提高代碼質量;利用智能故障分析定位,縮短問題解決時長。4.2 核心能力建設在電信運營商的 AI+DevOps 實踐中,軟件過程轉型的重難點在于智能研發能力的建設,在這一歷程中,無論是企業開發者還是個人開發者均可能面臨需求不明確、代碼冗余、代碼質量差、研發知識無法共享以及生產故障定位困難等問題,從而導致產品研發效率低下或質量風險。因此,智能研發能力的建設往往以優先構建核心能力入手,實際落地中,則是以智能問答、需求助手、編碼助手及安全助手為代表的大模型賦能軟件研發能力。4.2.1 智能問答智能問答,也稱為問答系統,
46、是一種能夠理解和響應人類語言的計算機程序。它通過分析用戶提出的自然語言問題,從知識庫中搜索并提取相關信息,并以自然語言的形式給出準確、簡潔的答案。圖 2 某通信運營 RAG 落地流程示意圖智能問答的關鍵能力:|中國通信運營商AI+DevOps實踐報告18(1)知識圖譜:構建涵蓋產品、服務、資費、故障處理等領域的知識圖譜,作為智能問答系統的“大腦”;(2)查詢語句解析能力:主要包括分詞、詞性標注、命名實體識別、句法分析、語義理解等,用于理解用戶問題;(3)對話管理:負責對話流程的控制,包括對話狀態追蹤、意圖識別、歷史查詢等;(4)知識推理:基于向量庫和知識圖譜,針對用戶問題進行推理實現所問即所答
47、。智能問答的擴充能力:(1)理解對話歷史,根據上下文提供更準確的答案;(2)根據用戶歷史記錄和偏好,提供個性化的答案;(3)通過與用戶的交互不斷學習,提升系統的性能及問答準確性;(4)支持文本、語音、圖像等多種形式的知識輸入和輸出;(5)對接 Agent 技術,支持針對非文件形態信息的快速檢索,覆蓋復雜問答場景。智能問答能力建設的主要難點:(1)高質量數據集構建:在智能問答能力建設中,高質量數據集構建是建設重點,其中包括表格提取、圖片處理、數據分段等;(2)知識圖譜構建:通過知識圖譜進行推理,進而回答復雜的問題,因此知識圖譜構建是重點建設內容,主要包括實體抽取、實體關系抽取、數據存儲等;(3)
48、多語言支持:支持多語言問答需要大量的語言資源和模型。4.2.2 AI 需求助手AI 需求助手是一種利用人工智能技術來輔助需求管理的工具,包括需求分析、需求生成、需求拆分等,通過提供自動化和智能化的功能來提高需求管理的效率和質量。AI 需求助手的關鍵能力:中國通信運營商AI+DevOps實踐報告|19(1)高級自然語言處理(NLP)功能:AI 需求助手能夠從各種來源(如文檔、文件和對話)中提取和解釋需求,理解上下文,識別關鍵信息,并自動對需求進行分類和排序;(2)智能需求分析:提供高級分析功能,利用 AI 從需求數據中獲取有價值的見解,識別模式、趨勢和潛在風險,以優化需求管理流程;(3)需求質量
49、分析:利用人工智能算法評估需求的質量,識別潛在問題,如歧義、不一致、不完整和不清晰,提高需求的整體質量和可靠性;(4)需求內容生成:基于歷史數據及用戶輸入的需求簡單描述,預測生成詳細的需求內容,最終形成標準的需求文檔。AI 需求助手的擴充能力:(1)智能需求溯源:使用 AI 算法在需求和其他工件(如測試用例、設計元素和風險)之間建立和維護可追溯性鏈接,以跟蹤變更的影響、確保覆蓋范圍并管理依賴性;(2)人工智能驅動的需求驗證:結合人工智能和機器學習技術對需求執行自動驗證檢查,實時識別不一致、沖突和潛在錯誤,為利益相關者提供即時反饋;(3)報告和指標:提供全面的報告和指標功能,允許用戶隨時間跟蹤和
50、衡量需求的質量,提供對需求波動、質量趨勢和準則遵守情況等指標的洞察,支持數據驅動的決策制定。AI 需求助手建設的主要難點:(1)自然語言理解的深度:準確理解用戶提出的開放式、模糊的需求,需要 AI 助手具備深度的自然語言處理能力。這包括識別用戶意圖、提取關鍵信息、處理歧義等。(2)AI 技術選型與組合:針對不同類型的業務需求,需要選擇合適的 AI 技術并進行合理的組合。這涉及對各種 AI 算法、模型的深入了解,以及對不同場景下技術優劣的權衡。(3)知識庫的構建與動態更新:AI 需求助手需要具備具有領域知識的知識庫,涵蓋垂直領域的業務說明、應用場景、行業動態等。同時,知識庫需要不斷更新,以適應
51、AI技術的快速發展及領域知識快速更新迭代。|中國通信運營商AI+DevOps實踐報告20(4)人機交互的優化:建立流暢、自然的人機交互體驗是 AI 需求助手的關鍵。這包括對話管理、情感識別、個性化推薦等。(5)需求轉化與落地:將用戶提出的抽象需求轉化為可行的 AI 解決方案,需要 AI 助手具備一定的領域知識和工程能力。這涉及需求分析、方案設計、項目管理等環節。4.2.3 AI 編碼助手AI 編碼助手就是利用人工智能技術在編碼過程中為開發人員提供各種輔助,主要包括代碼生成、代碼補全、錯誤檢查、代碼注釋等,幫助開發人員更高效、更準確地編寫代碼。AI 編碼助手的關鍵能力:(1)代碼補全:輸入部分代
52、碼,AI 編碼助手能預測接下來要寫的代碼,自動補全,提高編碼效率;(2)代碼生成:描述需要實現的功能,AI 編碼助手就能生成相應的代碼片段,甚至整個函數或類;(3)單元測試用例生成:根據函數級或文件級代碼,生成單元測試用例,提高單元測試覆蓋率;(4)代碼解釋與注釋:根據給定的代碼,提供準確的解釋/注釋內容,提高代碼的可讀性和可維護性,幫助開發人員生產和維護更符合規范的代碼資產。AI 編碼助手的擴充能力:(1)依據多模態輸入生成代碼能力;(2)知識庫接入能力,可提供更符合企業內部業務邏輯或規范的代碼或用例;(3)生成的單元測試用例包含較為清晰的注釋,且執行性能較好;(4)第三方工具對接能力,如
53、GitLab 對接,支持代碼合并沖突時提出解決和修復建議。AI 編碼助手建設的主要難點:中國通信運營商AI+DevOps實踐報告|21(1)自然語言到代碼的轉換:將自然語言描述的編程需求準確地轉化為可執行的代碼,需要 AI 編碼助手具備深度的自然語言理解和代碼生成能力。這涉及語義分析、代碼結構生成、錯誤處理等多個方面。(2)代碼的上下文理解:編碼是一個上下文高度相關的任務。AI 編碼助手需要理解代碼的上下文,包括變量、函數、類、模塊等,才能生成符合邏輯的代碼。(3)多樣化的編程風格和范式:不同的編程語言、框架和開發風格對代碼的表達方式有不同的要求。AI 編碼助手需要適應各種編程風格,并生成符合
54、特定規范的代碼。(4)代碼的優化與重構:生成的代碼不僅要正確,還要高效。AI 編碼助手需要具備代碼優化和重構的能力,以提高代碼的性能和可讀性。(5)實時反饋與迭代:在編碼過程中,開發者會不斷地調整和完善代碼。AI 編碼助手需要能夠提供實時的反饋,并根據開發者的修改進行迭代。4.2.4 AI 安全助手AI 安全助手是指對代碼進行相關問題的檢查,并根據檢查出的問題結合大模型能力進行自動修復。通過代碼檢查,可幫助開發人員發現代碼中存在的問題,如靜態缺陷、運行時錯誤、安全漏洞、架構問題等,通過代碼修復,可幫助開發人員解決問題并提高代碼質量。AI 安全助手的關鍵能力:(1)代碼檢查能力:根據給定的代碼,
55、進行代碼規范性問題、代碼異味、代碼語法錯誤、代碼邏輯錯誤、代碼安全漏洞等問題的檢查;(2)代碼修復能力:根據檢查出的問題,提供代碼修復建議及修復后的代碼;(3)檢查和修復的質量能力:代碼檢查的錯誤檢出率和誤報率達到要求,修復后的代碼需滿足基本的質量規范要求,且保留了原代碼功能。AI 安全助手的擴充能力:(1)對多文件的工程級代碼進行問題檢查和修復;(2)代碼檢查規則的自定義能力;|中國通信運營商AI+DevOps實踐報告22(3)對污點類問題進行檢查,可跟蹤和分析污點數據(或輸入)在代碼中的流動情況,定位可能污染的關鍵位置。AI 安全助手建設的主要難點:(1)代碼語義的深度理解:AI 安全助手
56、需要深入理解代碼的語義,包括變量、函數、控制流等,才能準確識別潛在的安全漏洞。這要求 AI 助手具備強大的代碼分析能力和對編程語言的深刻理解。(2)安全威脅模型的構建:構建一個全面的安全威脅模型是關鍵。模型需要涵蓋各種常見的和新型的安全威脅,并能夠隨著威脅形勢的變化不斷更新。(3)上下文信息的有效利用:代碼安全往往與上下文息息相關,如代碼庫、開發環境、運行環境等。AI 助手需要能夠有效利用這些上下文信息,才能更準確地評估代碼的安全性。(4)誤報與漏報的平衡:在代碼安全檢測中,誤報和漏報都是需要避免的問題。AI 助手需要在兩者之間找到一個平衡點,既能發現真正的漏洞,又能避免過多的誤報。(5)適應
57、性與可擴展性:隨著編程語言、開發框架和攻擊技術的不斷發展,AI 助手需要具備良好的適應性和可擴展性,才能應對不斷變化的安全威脅。4.3 下一步規劃隨著人工智能技術的快速發展,更好地提升研發效率、達到研發過程管理的可視化、智能化,研發過程生產智能化,構建一個高效、靈活、可擴展的智能開發中臺迫在眉睫。它通過提供預訓練模型、AI 應用開發工具、數據服務等,構建兩大階段的數智化場景,很好地將 AI 技術服務于 DevOps,大幅降低開發門檻,提高開發效率。本章將圍繞智能開發中平臺的核心能力展開分析。構建兩大階段的數智化應用場景:(1)需求階段,從智能需求生成邁向依據需求智能生成偽代碼。從創意的生成、概
58、念的定義,到需求的生成通過產品的歷史功能、痛點智能分析到自動生成需求,依據生成需求,自動生成偽代碼,輔助研發組長進行技術選型等的決策。中國通信運營商AI+DevOps實踐報告|23(2)編碼階段,從靜態代碼建模邁向軟件開發過程長鏈推理。軟件開發過程長鏈推理是指在整個軟件開發生命周期中,通過集成多種工具和技術,實現從需求分析、設計、編碼、測試到部署和運維的全鏈條自動化和智能化。它不僅僅是對代碼的靜態分析,而是涵蓋了整個開發過程的各個環節,并通過推理和優化來提升整體效率和質量。圖 3 某通信運營商智能開發中臺功能架構圖4.3.1 模型管理模型庫提供豐富的預訓練模型,涵蓋自然語言處理、計算機視覺、語
59、音識別等多個領域,可以快速應用到各種業務場景。支持靈活接入各種模型,平臺支持與魔塔社區等平臺深度集成,用戶可直接從平臺接入開源模型,也可直接接入自訓練模型。提供豐富的自定義模型配置能力,平臺提供靈活的配置界面,用戶可以對接入的模型進行配置微調,例如調整參數、設置輸入輸出格式等。4.3.2 數據服務數據服務提供數據清洗、數據增強、數據標注等服務,幫助企業更好地利用數據。數據清洗用于過濾低質量數據,主要包括數據過濾、數據去重、敏感數據處理、許可協議過濾等,不同的數據可采用不同的處理方式。數據增強是通過對現有預訓練數據執行有意義的變換和擴充生成新的數據樣本,增加數據集的多樣性和豐富度,提高模型泛化能
60、力和魯棒性。數據標注是|中國通信運營商AI+DevOps實踐報告24通過對未經處理的數據進行分類、標記或注釋的過程,使其能夠被機器學習模型理解和利用,可支持圖形標注、文本標注等。圖 4 數據處理流程圖4.3.3 知識庫應用快速創建知識庫應用能力,用戶可在知識庫頁面快速創建及管理個人或團隊知識庫,支持通過拖拽或選中本地文件進行文件上傳,批量上傳的文件數量支持可配置。若沒有準備好知識文檔,也支持創建空的知識庫。知識庫參數配置能力,可配置知識庫中文檔的分段和清洗策略,如自動分段與清洗、自定義分段與清洗;也可配置知識內容的索引方式,如高質量、經濟等。知識處理能力,知識庫內上傳的每個文檔都會按照配置的分
61、段規則自動分段,并以文本分段(Chunks)的形式存儲,支持在線查看文本分段、檢查分段質量、編輯文本分段及手工添加文本分段等。知識庫 API 管理能力,知識庫提供標準的 API,用戶可通過 API 調用對知識庫內的文檔、分段進行增刪改查等日常管理維護操作。4.3.4 智能體應用快速創建智能體應用能力,用戶可在智能體頁面快速創建及管理個人或團隊智能體應用,可在線編排智能體的工作流。智能體參數配置能力,在智能體指令編寫頁面,可以手工為智能體添加需要的工具,可關聯已有的知識庫,配置對話開場白,配置智能體的推理模型等。工具集管理能力,提供外部接口 API 管理頁面,可快速關聯智能體,允許用戶借助外部能
62、力,創建出更加強大的智能體應用??梢暬ぷ髁骶幣拍芰?,平臺提供可視化流程編排界面并提供豐富的流程節點供用戶選擇,幫助用戶將復雜的任務分解成較小的步驟(節點)降低智能體開發復雜度。應用調試與發布能力,開發完成的智能體應用不僅支持在線調試預覽,還提供快速發布上線的功能。用戶可以通過直觀的界面實時調試和優化性能,確保應用在正式環境中的穩定運行。發布功能使用戶能夠輕松將智能體應用部署為公開網站,嵌入現有網站,或通過 API 接口與其他系統集成。此外,平臺提供詳細的發布歷史記錄和版本管理,確保每次更新都可追溯,從而保障應用的安全性和可靠性。中國通信運營商AI+DevOps實踐報告|25第五章電信運營商A
63、I+DevOps智能化轉型未來演進方向隨著人工智能(AI)和 DevOps 技術的不斷成熟,電信運營商正在加速推進智能化轉型,以提升運營效率、降低成本、提高服務質量,并為用戶提供更加個性化、智能化的服務。本章將從關鍵路徑和風險應對兩個方面深入探討電信運營商 AI+DevOps 智能化轉型的未來演進方向。5.1 實施路徑5.1.1 算力資源治理利用云原生、容器化、人工智能等先進技術,構建一個彈性可擴展、自適應、智能化的算力調度平臺。該平臺將具備實時調度、負載均衡、故障自愈等功能,能夠根據業務需求動態調整算力資源的分配,實現算力資源的最優化利用。圖 5 某通信運營商算力調度平臺框架統一彈性基座,形
64、成“通智超”一體化算力封裝能力,進行混合異構算力的統一適配和服務編排;同時雙引擎基座中的容器形態更適合于智算場景使用。內生分布式能力,分布式服務、分布式網絡、廣域分布式存儲與生俱來,全域內可基于時延、地理位置、成本進行調度,方便為智算提供中訓邊推一體化協同。AI 全流程廣域閉環,依托運營商在算網融合方面的優勢,以及廣域范圍內訓/推的調度能力和數據自流動能力,將模型開發、訓練、驗證及發布的全流程數據在廣域內形成流通閉環。5.1.2 數據安全治理|中國通信運營商AI+DevOps實踐報告26數據安全治理應考慮從數據源頭到應用全過程的安全可控,以保證用于大模型訓練和調優的訓練數據集安全。數據采集階段
65、確保從可信數據倉庫獲取源數據,防止版權風險;數據處理階段通過清洗與過濾等技術,精準剔除敏感數據,并對訓練數據進行分類與標注,便于后續的差異化管理和使用;數據安全評估階段作為質量門禁,對擬入庫并共享發布的數據集進行審查;數據管理階段可通過存儲層加密等手段確保數據存儲安全,以版本控制和訪問控制等手段確保數據可追溯,并通過定期安全評估開展數據健康狀況監控,及時處理安全風險。同時,承載數據采集、處理等全過程的工具鏈,需具備任務隔離和嚴格的訪問控制機制,確保其自身的安全,保證數據開發過程的安全可控。圖 6 某通信運營商數據安全治理流程示意圖5.1.3 模型安全治理模型安全治理應考慮大模型在開發、管理及運
66、行階段安全可控。開發階段,即大模型調優階段,首先應保證數據和基礎模型的來源可信,同時對模型進行安全標識和分類分級;其次通過相關數據集對大模型開展安全可信評估,確保模型推理結果滿足基礎安全要求。管理階段,應對大模型進行安全性存儲和加密傳輸,并加強模型版本管理實現模型溯源,確保合理的權限約束。同時,對于承載大模型開發全過程的工具鏈,需具備任務隔離和嚴格的訪問控制機制,確保其自身的安全,保證大模型開發過程的安全可控。運行階段,面向大模型推理服務,一是確保推理接口安全,通過通信加密協議、安全訪問機制等方式,防止未授權訪問及 API 濫用等情況;二是確保提示詞數據安全(如提示詞不被篡改等)、知識庫數據安
67、全,并對 RAG 檢索的知識附帶來源,降低運行時推理風險;三是對推理資源做合理分配,防止推理資源的過度消耗;四是確保運行環境安全,防止模型泄露或被篡改,通過實施沙箱隔離及強化訪問控制等措施,確保只有經過認證的用戶和應用程序才能訪問大模型。中國通信運營商AI+DevOps實踐報告|27圖 7 某通信運營商模型安全治理架構圖5.1.4 應用安全治理應用安全治理是對基于大模型的智能開發工具的安全保障,一是關注應用安全防護,如 部署 DDoS、WAF 等網絡安全防護技術;二是強化敏感信息檢測機制,對用戶輸入及模型輸出內容實施敏感信息檢測和內容安全防控,以防范敏感信息及關鍵資產的泄露,并保障內容合法性和
68、適宜性;三是保證用戶數據隱私安全,用戶數據應嚴格按照授權內容存儲,或者不存儲,確保私有數據安全;四是可考慮模型領域隔離,僅限定于研發領域的應用,不提供其他無關領域的內容生成等功能;五是健全安全審計機制,通過系統請求和操作等審計日志的管理,確保智能開發工具使用安全性。圖 8 某通信運營商應用安全治理框架圖5.2 風險應對技術風險方面,隨著 AI 技術發展迅速,新技術不斷涌現,需要持續學習和跟蹤最新的技術發展趨勢,培養一批具備 AI、大數據、云計算等多方面技能的復合型人才。數據安全方面,由于數據泄露、隱私侵犯等問題可能對企業聲譽造成嚴重影響,需要加強數據安全防護,加強數據加密、訪問控制、入侵檢測等
69、安全措施。組織變革方面,組織結構、流程和文化需要適應AI+DevOps 的變革,需要加強員工培訓和組織文化建設,鼓勵員工積極擁抱新技術,建立扁平化、敏捷化的組織結構。合規監控方面,AI 應用可能涉及法律法規的合規問題,需要建立完善的合規監控機制,跟蹤相關法律法規的變化,及時調整業務流程和風險管理措施。|中國通信運營商AI+DevOps實踐報告28第六章典型實踐案例大模型正蓬勃發展,軟件研發可以說是真正進入智能研發時代,如何用好 AI 能力,用 AI 升級已有的 IT 系統成為企業探索的主題。在此背景下,以某通信運營商的數字化研發平臺項目為例,本章主要介紹該項目大模型的開發流程管理實踐。項目組基
70、于依托 AI+DevOps 落地策略,總結出大模型在數字化研發平臺落地的總體思路,主要包括尋找明星場景、依據場景設計功能、大模型能力調用、場景鏈路前后擴展四部分,接下來將依據上述思路逐一深入介紹。案例:某通信運營商基于大模型的開發流程管理實踐項目組基于依托 AI+DevOps 落地策略,總結出大模型在數字化研發平臺落地的總體思路,主要包括尋找明星場景、依據場景設計功能、大模型能力調用、場景鏈路前后擴展四部分,接下來將依據上述思路逐一深入介紹。圖 9 某通信運營商大模型落地思路(一)業務痛點分析項目組按照上述思路,深入分析數字化研發平臺存在的業務痛點問題,尋找可用AI 落地解決的明星場景。目前平
71、臺存在的主要業務痛點如下:(1)高頻咨詢由于平臺中集成了數量繁多的系統功能,操作手冊內容較為繁雜,用戶在使用過程中頻繁遇到操作類問題,導致咨詢量激增,進而大量占用人力資源,降低工作效率。(2)研發管理流程效率低下中國通信運營商AI+DevOps實踐報告|29現有的研發管理流程中,需求轉化為研發任務的過程復雜,涉及多次人工溝通和大量手工操作。這將導致任務分配不及時,嚴重影響研發效率和項目進度。(3)安全測試滯后傳統的安全測試通常在軟件開發的后期甚至產品發布后進行,這導致發現安全漏洞后修復成本高昂,且事后修復可能導致用戶數據泄露、服務中斷等嚴重后果,從而影響用戶體驗。(4)流水線構建復雜軟件開發流
72、水線是確保軟件質量和提升交付效率的關鍵。在這一過程中,依賴沖突、編譯錯誤、環境問題等問題難以避免,而這些問題通常需要開發人員手動排查和解決,耗費大量時間和精力。(5)度量評估滯后在軟件研發過程中,度量是評估項目狀態、識別潛在風險和優化管理策略的重要工具。然而,傳統的度量方法往往側重于事后評估,即在項目完成后才進行數據分析,這種滯后性使得改進措施難以及時實施,可能導致不可挽回的后果。(二)解決方案通過構建一個適用于數字化研發平臺的智能助手,借助大模型的通用能力和智能體的功能框架,為軟件開發流程的全生命周期賦能。圖 10 某通信運營商智能助手交互示意圖當用戶通過數字化研發平臺喚起智能助手時,用戶以
73、自然語言表達其需求(例如:|中國通信運營商AI+DevOps實踐報告30“查詢 id 為 xxx 的故事信息”)。隨后,Supervisor Agent 對用戶輸入進行解析,并根據用戶的需求匹配相應的功能 Agent(如查詢、需求創建、任務管理、代碼安全、流水線糾錯、度量評估)。如果 Supervisor Agent 無法準確識別用戶需求,它會利用提示工程的能力對用戶進行提示,引導他們以更加明確的方式重新表述。圖 11 某通信運營商多智能體架構示意圖確定用戶需求之后,Supervisor Agent 提取其中的關鍵信息,并傳遞給對應的功能 Agent。功能 Agent 接收并處理這些信息,然后
74、自動決定如何解決用戶的需求。如果是查詢 Agent,則使用 RAG 技術在預先構建的向量知識庫中進行檢索;如果是設計研發平臺事務的需求,則調用相應的工具接口進行處理。功能 Agent 完成任務后,將結果返回 Supervisor Agent,由其判斷用戶訴求是否得到滿足,如果未完成,Supervisor Agent 將再次調用匹配的功能 Agent。最后,Agent 將對結果進行處理,并將應答以自然語言形式反饋給用戶。(三)價值和效益該實踐案例帶來以下多方面的效益:(1)提升效率優化流水線構建過程,流水線平均構建時長縮短至 147 秒,項目的版本發布時間縮短至 30 分鐘內,整體交付效率提升
75、60%。(2)風險防控盡早發現和修復代碼中的安全漏洞和潛在問題,及時發現并處理故障,降低業務中國通信運營商AI+DevOps實踐報告|31中斷的風險。累計軟件成分分析 15W+次,及時發現及閉環解決包括 Log4j 等主流嚴重漏洞 100+,發現及閉環解決總漏洞數 3W+,代碼質量提升 86%,工程安全性提升 52%。(3)創造營收通過提高開發效率和產品質量,同時減少后期維護成本和運營成本,最終提升項目的盈利能力。(四)下一步推廣展望該實踐案例中提出的智能研發過程管理助手通過引入 AI 技術,幫助企業提高研發效率、降低成本、改進產品質量,從而滿足市場對高效、高質量產品的需求。該實踐的可推廣性主
76、要表現在以下幾個方面。(1)技術復用盡管該方案專注于為數字化研發平臺提供 AI 賦能,但其包含的許多技術和工具經過適當的調整后,可以被廣泛應用于其他平臺的智能化場景中,從而節約研發的人力和時間成本,提升研發的效率。(2)業務流程復用研發過程的管理通常涉及復雜的業務流程,而這些流程在不同項目間存在共通性。因此,該方案的案例可以被輕松推廣到其他有類似需求的項目中,為企業整體工作效率的提升做出貢獻。(3)成功案例的示范效應該案例完全契合現有的數字化研發平臺全生命周期,并為其他項目提供了可借鑒的模板。同時,該項目展現出的優勢和效益價值,可以激發其他項目對于 AI 技術賦能的興趣,進一步推動智能研發過程管理的推廣應用。|中國通信運營商AI+DevOps實踐報告32聯系我們:劉老師電話(同微信):13021060029郵箱:武老師電話(同微信):13261896800郵箱:更多行業 AI+DevOps 相關資訊,請關注“CAICT 數字化治理”公眾號。