《中國聯通&中興:網絡人工智能應用白皮書2019(35頁).pdf》由會員分享,可在線閱讀,更多相關《中國聯通&中興:網絡人工智能應用白皮書2019(35頁).pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、網絡人工智能應用白皮書 網絡人工智能應用白皮書 Whitepaper on Network AI Applications (Rev. 20190626) 中 國 聯 通 中 興 通 訊 股 份 有 限 公 司 2019 年 6 月 網絡人工智能應用白皮書 (Rev. 20190626) iii 目目 錄錄 第一章人工智能技術簡介與前沿進展 . 71.1人工智能發展歷史 . 71.2人工智能前沿進展 . 81.3網絡人工智能(Network AI) . 8第二章標準組織與開源組織進展 . 102.1標準組織 . 102.1.13GPP . 102.1.2ETSI . 102.1.3ITU-T
2、. 112.1.4CCSA . 112.1.5O-RAN . 112.2開源組織 . 122.2.1Linux 基金會(Linux Foundation)8 . 122.3產業聯盟 . 142.3.1中國人工智能產業發展聯盟(AIIA) . 14第三章人工智能在通信網中的主要應用場景 . 153.1網絡規劃 . 153.1.1智能化容量評估 . 153.1.2自動站址規劃及覆蓋效果評估 . 153.2網絡運維 . 153.2.1智能故障溯源 . 163.2.2智能健康度預測 . 173.2.3智能工單管理 . 183.2.4智能 DevOps . 193.3網絡優化 . 19第四章人工智能在運
3、營商業務創新中的應用 . 224.1邊緣智能 . 224.1.1無線感知服務 . 224.1.2應用使能服務 . 234.2物聯網 . 24 iv 4.3創新業務 . 254.3.1自動駕駛 . 254.3.2VR/AR . 254.3.3智慧家庭 . 26第五章面向 5G 的人工智能應用 . 275.15G 網絡編排 . 275.25G 網絡節能 . 275.2.1基于人工智能的網絡節能 . 275.35G 基站調優 . 28第六章網絡 AI 能力平臺 . 296.1中國聯通 AI 人工智能平臺系統架構 . 296.2基于人工智能網絡平臺的應用實現流程 . 31總結 . 33縮略語 . 35
4、參考文獻 . 36致 謝 . 37 網絡人工智能應用白皮書 (Rev. 20190626) v 圖圖 目目 圖 1 網絡故障溯源方案示意圖 . 16圖 2 網絡故障預測方案示意圖 . 17圖 3 智能工單管理方案示意圖 . 19圖 4 無線覆蓋智能優化方案示意圖 . 20圖 5 智能流量預測及路徑調優方案示意圖 . 21圖 6 異系統頻譜資源共享示意圖 . 22圖 7 TCP 跨層優化示意圖 . 24圖 8 網絡人工智能平臺參考架構 . 29圖 9 智立方平臺功能架構(截至 2019 年 6 月 27 日) . 30圖 10 人工智能端到端實現流程 . 31 網絡人工智能應用白皮書 (Rev.
5、 20190626) 7 第一章 人工智能技術發展與前沿進展 1.1 人工智能發展歷史 1955 年,麥卡錫(John McCarthy) 、明斯基(Marvin Minsky) 、羅切斯特(Nathaniel Rochester)和香農(Claude Shannon)等科學家在美國達特茅斯學院開會研討“如何用機器模擬人的智能” ,首次提出“人工智能”這一概念,標志著人工智能學科的誕生1。 維基百科將人工智能(AI: Artificial Intelligence)定義為由人制造出來的機器所表現出來的智能,一般情況是指通過普通計算機程序來呈現人類智能的技術1。 人工智能 60 余年的發展歷程劃
6、分為以下 6 個階段: (1) :1956 年至 20 世紀 60 年代初期:人工智能概念在 1956 年首次被提出后,涌現出系列研究成果,如機器定理證明、跳棋程序、LISP 表處理語言等,掀起了人工智能發展的第一個高潮。 (2)20 世紀 60 年代至 70 年代初期:科學家們嘗試更具挑戰性的任務,并提出了一些不切實際的研發目標,從而導致目標難以達成,使人工智能的發展走入了低谷。 (3)20 世紀 70 年代初至 80 年代中期:此階段出現了專家系統,通過模擬人類專家的知識和經驗解決特定領域的問題, 實現了人工智能從理論研究走向實際應用的重大突破。專家系統在輔助醫療、商業決策等領域取得成功。
7、 (4)20 世紀 80 年代中期至 90 年代中期:隨著應用規模不斷擴大,專家系統內在的知識獲取困難、推理方法單一等問題不斷顯露,從而限制了基于專家系統的人工智能應用發展。 (5)20 世紀 90 年代中期至 2010 年前后:伴隨高性能計算、分布式計算技術的發展, 人工智能應用所需的算力水平得到提升, 推動人工智能技術進一步走向實用化。 1997年,IBM 公司的深藍超級計算機戰勝了國際象棋世界冠軍卡斯帕羅夫,向全世界證明對于特定問題,機器在單一領域的“智能”能夠達到或者超過人類的最高水平。 (6) 2011 年迄今: 經過 60 多年的演進, 特別是在移動互聯網、 大數據、 超級計算、傳
8、感網、腦科學等新理論、新技術以及經濟社會發展強烈需求的共同驅動下,人工智能技術也正在加速發展,呈現出深度學習、跨界融合、人機協同、群智開放、自主操控等新特征。受腦科學研究成果啟發的類腦智能蓄勢待發,芯片化、硬件化、平臺化趨勢更加明顯,人工智能發展進入新階段。當前,新一代人工智能相關學科發展、理論建模、技術創新、 軟硬件升級等整體推進, 正在引發鏈式突破, 推動經濟社會各領域從數字化、 網絡人工智能應用白皮書 (Rev. 20190626) 8 網絡化向智能化加速躍升。 同時,通過開源組織、公有云服務商的努力,人工智能應用的構建變得日趨簡單。人工智能技術在信息和通訊、工業制造、安防、金融、自動駕
9、駛、醫療健康等眾多領域取得切實應用,人工智能賦能的產品、業態創新帶來生態和商業模式的全新變革。 1.2 人工智能前沿進展 全球產業界充分認識到人工智能技術引領新一輪產業變革的重大意義, 紛紛調整發展戰略。 比如, 在其2017年的年度開發者大會上, 谷歌明確提出發展戰略從 “Mobile First”(移動優先)轉向“AI First” (AI 優先) ;微軟 2017 財年年報首次將人工智能作為公司發展愿景。 人工智能當前前沿的發展方向包含數據平臺、開源算法、計算芯片、基礎軟件、圖形處理 GPU 服務器等技術生態系統和智能制造、智能醫療、智能安防、智能零售、智能家居等商業和應用生態系統。 在
10、技術生態方面,人工智能算法、數據、圖形處理器(Graphics Processing Unit,簡稱GPU) /張量處理器 (Tensor Processing Unit, 簡稱TPU) /神經網絡處理器 (Neural network Processing Unit,NPU)計算、運行/編譯/管理等基礎軟件已有大量開源資源,例如谷歌的 TensorFlow 第二代人工智能學習系統、 臉書的 PyTorch 深度學習框架、 微軟的 DMTK分布式學習工具包、 IBM 的 SystemML 開源機器學習系統等; 此外谷歌、 IBM、 英偉達、英特爾、蘋果、華為、中國科學院的寒武紀等積極布局人工智
11、能領域的計算芯片。在人工智能商業和應用生態布局方面, “智能+X”成為創新范式,例如“智能+制造” 、 “智能+醫療” 、 “智能+安防”等,人工智能技術向創新性的消費場景和不同行業快速滲透融合并重塑整個社會發展, 這是人工智能作為第四次技術革命關鍵驅動力的最主要表現方式。 1.3 網絡人工智能(Network AI) 電信運營商作為信息與通信產業生態的主體之一, 堅持推進人工智能技術與網絡運營和業務創新相結合,使得通信產業成為人工智能技術落地應用的主要領域之一。 在信息通信向人類生產、 生活方方面面滲透的過程中, 電信運營商一直扮演著 “水”的角色,在 AI 向各行各業滲透時亦如是,不可或缺
12、。 “上善若水,大有可為” 。在 2017年 12 月烏鎮世界互聯網大會人工智能分論壇上,中國聯通總經理陸益民將中國聯通在人工智能中的作用定位為:不僅僅是網絡基礎設施的提供者、數據管道的提供者, 網絡人工智能應用白皮書 (Rev. 20190626) 9 也是人工智能計算能力的提供者、海量數據的提供者。 2019 年 6 月 6 日,工業和信息化部向中國聯通辦了 5G 牌照;如果說 3G、4G 開啟了移動互聯網時代,那么 5G 將開啟人工智能時代。因此,5G 網絡與人工智能的結合將成為必然命題,運營商應緊緊抓住國家人工智能發展規劃帶來的歷史性機遇,充分利用各方技術、產品、運營實力,促進通信行業
13、向網絡智能化、業務個性化、行業應用智慧化和管理智能化轉型。通過人工智能技術,提高網絡規劃、建設、維護等效率,增強網絡智能組網、靈活運作、高效支撐業務等能力,降低網絡建設維護成本和管理成本,提升用戶體驗和行業、個人、家庭業務的競爭力,實現網絡智能化的轉型。 從學科分類來看, 人工智能技術是計算機科學的一個分支, 致力于了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器, 感知環境并采取行動以最大限度地實現目標。 網絡人工智能(Network Artificial Intelligence)是指將人工智能技術應用在運營商網絡中,通過網絡的智能化或智能子系統替代或優化目前依靠人
14、工進行的工作,使運營商能夠更加便捷、高效的提供更加優質的網絡服務2。 網絡人工智能化演進是個分階段實現的長期過程, 基于人工智能技術應用的不斷深度,大體可分三個階段: 第一階段主要是實現網絡資源的統一部署、控制和管理,實現軟件定義的業務敏捷部署,釋放大量重復、低效的手工勞作和人工交互; 第二階段引入大數據分析和機器學習等 AI 技術,提供網絡預測性感知和前瞻性的保障能力,確保網絡可靠、平穩運行并提供優化建議; 第三階段需要匹配高層次運營意圖和策略,網絡在自動管控、深度感知基礎上,通過對這些意圖的持續驗證和綜合優化,實現運營意圖驅動的智能閉環自治,在極大降低OPEX 的同時最大釋放網絡潛能和效益
15、。 網絡人工智能應用白皮書 (Rev. 20190626) 10 第二章 標準組織與開源組織進展 2.1 標準組織 2.1.1 3GPP 3GPP SA2在2017年5月的杭州會議上成立了關于5G網絡智能化的研究項目 “Study of enablers for Network Automation for 5G(eNA) ”3。該項目是 3GPP Rel 16 的項目,SA2 已在 2018 年 1 月的哥德堡會議上正式展開項目討論。 該項目的立項背景是 3GPP SA2 在 Rel 15 的 5G 核心網中引入了一個 NWDAF(Network Data Analysis Function
16、)的網絡功能。目前該功能主要應用于部署了網絡切片的場景,通過對網絡切片相關的網絡數據的自動化分析,向 PCF 和 NSSF 提供網絡切片狀態分析結果。 另一方面, 在 Rel 15 的 5G 網絡架構研究中, SA2 引入了一些新的需求,例如按需移動性管理、非標準化 QoS、流量分流和卸載等,在沒有網絡數據分析的情況下,這些需求難以實際部署和運行。因此,為了讓 5G 網絡能夠更靈活更智能的提供服務,華為在 SA2 牽頭成立了 eNA 項目。 eNA 項目的研究目標是,通過 NWDA 對網絡數據的收集和分析,生成分析結果,然后利用分析結果進行網絡優化,包括定制化的移動性管理,5G QoS 增強,
17、動態流量疏導和分流,UPF 選擇,基于 UE 業務用途的流量策略路由,業務分類等。 在 2018 年 6 月的 RAN#80 全會上通過了 “RAN-centric Data Collection and Utilization SI”立項,研究面向網絡自動化與智能化的無線大數據采集與應用,并且探索在 RAN側引入數據分析的潛在影響。 在 2018 年 9 月的 SA WG5#81 會上通過 “Intent driven management service for mobile networks” 立項, 調查意圖驅動的移動網絡管理場景, 研究可用于實現移動驅動目標的、包括 SON 在內的自
18、動化機制,以及描述意圖的適當機制。 2.1.2 ETSI 2017 年 2 月歐洲電信標準化協會 ETSI 正式批準成立了新的行業標準組 ENI(全稱“Experiential Networked Intelligence” )4。該工作組的工作目標是就網絡智能化的場景和需求達成一致并定義基于“觀察-判斷-決策-行動” 這種模擬人腦決策的閉環控制模型, 通過對網絡環境持續學習和決策結果的持續優化等手段來有效應對復雜的網絡管控挑戰、提升網絡運營管理效率和體驗。研究范圍包括分析運營商傳統網絡和 SDN/NFV網絡中運營運維需求,引導構建包括自適應感知、支撐靈活策略定義以及智能化決策和執行的體系架構
19、。該體系架構應能充分支撐運營商靈活的業務策略和自動化、自優化、 網絡人工智能應用白皮書 (Rev. 20190626) 11 自治的智慧網絡理念。同時,該架構還將推動創新的遙測遙感、合理的大數據采集和管理、機器學習算法等技術來支撐智能分析和決斷,統一的策略模型。 2017 年 12 月歐洲電信標準化協會 ETSI 正式批準成立了新的行業標準組 ZSM(全稱“Zero touch network & Service Management” ) 。ZSM 最初將專注于 5G 端到端網絡和服務管理,如網絡切片管理,并將擴展未來網絡世代的管理。 目標是讓所有操作流程和任務 - 交付,部署,配置
20、,保證和優化 - 自動執行,理想情況下 100自動化。該小組將定義一個新的,面向未來的,橫向和縱向的端到端可操作框架,以實現新興和未來網絡和服務的靈活, 高效和定性管理和自動化。 橫向端到端是指跨域, 跨技術方面。 垂直端到端是指跨資源方面,從面向資源的層到面向客戶的層。 ZSM 小組還將促進相關標準化機構與開源項目之間的協調與合作。 2.1.3 ITU-T 在 2017 年 11 月召開的 ITU-T SG13 會議期間,來自德國、韓國、中國、突尼斯、非洲等不同國家地區建議成立機器學習-網絡焦點組,經 SG13 全會討論正式批準成立。焦點組正式名稱為 Machine Learning for
21、 Future Networks including 5G, 簡稱 FG-ML5G5。 FG-ML5G 是一個對 ITU 成員和非 ITU 成員都開放的工作平臺,目標是分析如何在未來網絡特別是 5G 網絡中應用機器學習來提升網絡性能和用戶體驗,包括分析目前業界標準組織相關工作并與之合作,研究機器學習在未來網絡的應用場景、潛在需求、架構,以及具體接口、協議、算法、數據結構和個人信息保護等方面,并分析機器學習對自主網絡控制和管理方面的影響。 FG-ML5G 目前作為 SG13 下設的焦點組, 研究期為 1 年, 如果有必要也可以由 SG13決定是否延期。FG-ML5G 輸出的研究報告和標準草案可以
22、作為后續 SG13 相關研究的輸入。 2.1.4 CCSA 已經在多個應用領域展開相關研究工作,在 2017 年 7 月的 TC1-WG1#58 會上討論通過了“人工智能在電信網絡演進中的應用研究”課題立項。2017 年 12 月的 TC5-WG6 #47 會上通過“人工智能和大數據在無線通信網絡中的應用研究”課題立項。2017 年 12月的 TC5-WG12#2 會上通過“智能化 5G 核心網絡切片技術研究”課題立項。2018 年 8月的 TC5-WG6#49 次會議上通過“移動通信網絡智能化能力分級研究”課題立項6。 2.1.5 O-RAN 2018 年 2 月,中國移動、美國 AT&am
23、p;T、德國電信、日本 NTT DOCOMO 以及法國 網絡人工智能應用白皮書 (Rev. 20190626) 12 Orange 等 5 家電信運營企業宣布聯合成立開放無線接入網絡(O-RAN)聯盟,目標是使無線網絡實現標準化、通用化、開源化、智能化。該聯盟計劃引入 RAN 智控平臺,通過實時數據分析、機器學習及人工智能技術,讓網絡更具智慧性7。 2.2 開源組織 2.2.1 Linux 基金會(Linux Foundation) 2.2.1.1 Linux 人工智能基金會(LinuxFoundationAI)2018 年 3 月,Linux 基金會下成立了專門研究人工智能技術的深度學習基金
24、會(LFDL: Linux Foundation Deep Learning) ,以支持人工智能、機器學習和深度學習方面的開源創新,如 Acumos AI、Angel ML 等8。 2019 年 5 月,Linux 基金會正式宣布將 Linux 基金會深度學習基金會更名為 LFAI基金會(LF AI Foundation),以支持開源 AI,ML 和 DL,并創建可持續的開源 AI 生態系統, 使用開源技術輕松創建 AI 產品和服務, LFAI 的成員包含 AT&T、 Orange 等運營商、華為、中興、愛立信、諾基亞等設備商以及騰訊、百度、滴滴、紅帽等互聯網企業和 IT企業。 截至
25、2019 年 6 月,Acumos AI 是 LFAI 首個和唯一的孵化晉級的開源項目,該項目的初期源代碼由 AT&T 和 Tech Mahindra 聯手研發并貢獻給 Linux 深度學習基金會。該項目旨在針對現代企業引入 AI 技術的共性需求,提供一個共同的架構和平臺,以幫助建立和管理人工智能平臺。 2018 年 11 月 7 日,Acumos AI 的首個版本 Athena 發布,提供編輯、集成、組合、包裝、培訓和部署 AI 微服務,基于平臺提供的微服務,開發人員能夠連接各個應用程序來創建 AI 和機器學習產品。 截至 2019 年月,LFAI 還有 4 個開源項目在孵化中9,分
26、別是: (1)Angel-ML 該項目旨在提供基于參數服務器(Parameter Server)理念開發的高性能分布式機器學習平臺。Angel-ML 由騰訊和北京大學聯合開發,由騰訊貢獻給 Linux 深度學習基金會,基于騰訊內部的海量數據進行了反復的調優,并具有廣泛的適用性和穩定性,模型維度越高,優勢越明顯。 Angel 的核心設計理念圍繞模型。它將高維度的大模型合理切分到多個參數服務器節點,并通過高效的模型更新接口和運算函數,以及靈活的同步協議,輕松實現各種高 網絡人工智能應用白皮書 (Rev. 20190626) 13 效的機器學習算法。 當前,Angel 基于 Java 和 Scala
27、 開發,能在社區的 Yarn 上直接調度運行,并基于PS Service,支持 Spark on Angel,集成了部分圖計算和深度學習算法。 (2)Elastic Deep Learning (EDL) 該項目將基于百度開發的 PaddlePaddle 框架的開發的 AI 模型和應用與 Kubernetes提供的資源管理、作業調度相結合,通過 Kubernetes controller, PaddlePaddle auto-scaler組件實現優化的作業調度,從而實現集群硬件資源利用率的最大化。 (3)Horovod 該項目旨在為基于 TwnsorFlow 的模型訓練提供分布式訓練的加速方式
28、,該項目的初期源碼由 Uber 貢獻給 Linux 深度學習基金會。 (4)Pyro Pyro 是基于 Python 和 PyTorch 實現的深度概率建模工具庫,幫助開發人員為 AI 研究創建概率模型。該項目由 Uber 貢獻給 Linux 深度學習基金會。 2.2.1.2 LFN(LFNetworkingFund)2018 年 1 月,Linux 基金會為整合產業資源,平衡不同網絡開源項目的生態系統,消除不同項目之間的重疊或冗余,創建更高效的流程,加快網絡開源發展進程,成立了網絡基金組織 LFN(Linux Foundation Networking Fund) ,旨在通過統一的董事會管理
29、,協調網絡相關的開源項目。 截至 2019 年 6 月,LFN 管理的開源項目報告:ONAP、Open Daylight、OPNFV、FD.io、PNDA、SNAS、Tungsten Fabric 等 7 個網絡相關的開源項目。 ONAP 目前是全球最大的 SDN(Software Defined Networks,軟件定義網絡)/NFV(Network Function Virtualization,網絡功能虛擬化)網絡協同與編排器開源平臺,面向5G、企業和家庭寬帶等場景,打造網絡全生命周期管理平臺,包括 SDC(Service Design and Creation, 服務設計和創建) 、
30、 SO (Service Orchestration, 網絡服務編排) 、 VF-C (Virtrual Function Control,虛擬功能控制) 、AAI(Active and Available Inventory,活動和可用目錄) 、DCAE(Data Collection Analytics and Events,數據采集分析和事件處理)等項目。在 ONAP Amsterdam 開源平臺虛擬網元部署過程中,通過 SDC 上載各類虛擬網絡功能并進行服務編排, 然后由 SO 調用 VF-C 進行虛擬網元實例化, 其中 Multi-VIM (Multiple Virtualized
31、Infrastructure Management, 多虛擬基礎設施管理) 負責電信云平臺選擇, VIM 網絡人工智能應用白皮書 (Rev. 20190626) 14 (Virtualized Infrastructure Management,虛擬基礎設施管理)負責具體虛擬計算、虛擬存儲、 虛擬網絡資源池的管理和調度。 虛擬網元配置信息, 如 vCER (Virtualized Cloudify Enterprise Router,虛擬云化企業路由器)需要的內存、 CPU 核數等以 TOSCA(Topology and Orchestration Specification for Clou
32、d Application,面向云應用的拓撲和編排規范)或Heat(開源云計算平臺 OpenStack 的一個子項目,用于進行資源和應用編排)模板文件上傳至 SDC,而具體的虛擬網元鏡像 image 直接上傳到 VIM 平臺中。ONAP 通過對接廠商自有管理器,實現對虛擬網絡功能的全生命周期管理。 2.3 產業聯盟 2.3.1 中國人工智能產業發展聯盟(AIIA) 為加快推動我國人工智能產業發展,搭建人工智能產業發展公共服務平臺,提升產業發展能力與應用水平,按照 “互聯網+”人工智能三年行動實施方案有關部署,在國家發展改革委、科學技術部、工業和信息化部、中央網信辦四部委共同指導下,2017年
33、10 月 13 日,中國人工智能產業發展聯盟(AIIA)在北京宣布成立,中國工程院院士潘云鶴當選為第一屆理事長,中國工程院院士高文當選為專家委員會主任10。 中國人工智能產業發展聯盟以國家產業政策為導向, 以市場為驅動, 以企業為主體,搭建產學研用合作平臺,促進聯盟成員的研發、設計、生產、集成、服務等水平,構建我國人工智能產業生態,提升我國人工智能產業的競爭力,強化人工智能與經濟社會各領域深度融合, 促進技術進步、 提高生產效率, 推動傳統行業數字化轉型, 支持新技術、新產業、新業態、新模式加快發展。 中國人工智能產業發展聯盟的發起單位包括中國信息通信研究院、百度、阿里、騰訊、清華、浙大、科大
34、訊飛、奇虎 360、中科院自動化所、沈陽新松、中興通訊、上海儀電、中國電力科學研究院、航天科工集團、中國聯通、電子四院、電子一所等積極推動人工智能產業發展的代表性企業、高校、科研院所、社會組織。 網絡人工智能應用白皮書 (Rev. 20190626) 15 第三章 人工智能在通信網中的主要應用場景 3.1 網絡規劃 5G 網絡規劃的考慮因素相比 4G 有大幅增加,比如有 SA 和 NSA 兩種組網方式,需要考慮低、中、高頻及非授權頻譜多種頻段,存在 4G/5G 頻譜共享、多陣列天線等多樣站型。這一系列新變化給 5G 網絡規劃帶來的復雜性呈指數級增長。 而基于 4G 現網積累的容量、覆蓋等方面的
35、歷史數據,再結合 5G 新特性,借助 AI技術進行關聯分析、學習訓練、智能推理,將有效指導 5G 無線網絡規劃。 3.1.1 智能化容量評估 對于 5G 高帶寬業務場景,可以以 4G 現網的網管、MR 等數據為基礎,結合工參、用戶業務模型、套餐、網絡性能負荷等信息,利用 AI 算法分析熱點場景的特性,建立用戶需求預測模型,為 5G 網絡的容量規劃及建設提供指導。 3.1.2 自動站址規劃及覆蓋效果評估 5G 剛開始建網時,可利用 AI 技術基于 4G 現網 MR 數據進行 5G 站址規劃和覆蓋評估。綜合考慮 5G 覆蓋強度及質量要求、室內外覆蓋特性、4G/5G 頻段與功率差異、現網工參等因素,
36、利用 AIshai 最優化算法從現有 4G 站址中篩選出推薦列表,優先納入5G 站址規劃。 基于 4G 現網的 MR 數據、頻段、鄰區關系、鄰區信號、高精電子地圖、遮擋物位置及高度等信息,利用 AI 算法對無線覆蓋特性進行學習訓練和建立模型,然后結合 5G頻段、環境等特性對 5G 網絡的覆蓋效果做出評估,并可根據實際覆蓋效果對所建立的模型做進一步的迭代優化。 3.2 網絡運維 隨著電信網絡云化和 ICT 融合日益加速,加之 5G、IoT、AI、大數據等新興技術的引入, 電信網絡的規模和復雜度與日俱增, 運營商在網絡運維方面面臨越來越大的壓力: (一)5G 網絡相對于 4G,技術架構革命性變化,
37、導致網絡復雜性加大 虛擬化層、硬件層、應用層、管理層等完全解耦,且可能來自不同廠商,原來一個系統內部的問題外化成互聯互通問題,增加了故障定位、根因追溯的難度。 云化業務要求支持遷移,軟硬件一一對應關系變為軟硬件多對多關系,故障線索鏈存在動態變化的可能。 網絡服務化、 切片化架構, 使得系統日志, 告警數量激增, 定位根因故障難度加大。 網絡人工智能應用白皮書 (Rev. 20190626) 16 (二)新業務無歷史運維經驗:5G 需要支持萬物互聯,很多業務領域無成熟經驗借鑒 而目前以人工為主的傳統運維模式已不能適應網絡的先進性, 傳統網絡運維困境日益凸顯。為解決這些問題,需要借助 AI 能力進
38、行復雜信息處理,從而提升運維效率。依托機器學習/深度學習, 可以在海量運維數據中抽取隱含的關聯特征和規則, 進而追溯事件根因、精準定位故障。同時,通過共性特征的提取,可以對未來事件進行預測,變被動響應式運維為主動式。 3.2.1 智能故障溯源 故障根因分析是網絡運維工作的重要方面?,F網中故障多種多樣,單一故障告警已不能反映出準確的故障根源。這種情況下,運維人員也難以根據經驗進行判斷,快速準確定位根因。引入 AI 智能分析后,可以從多種多樣告警信息中提取共性特征,快速收斂到共性故障點,從而提升處理效率,降低運維難度。 智能故障溯源基于大數據分析和 AI 特征挖掘等技術,依據網絡及業務流程上下游關
39、系,結合多個維度的歷史數據進行分析,挖掘出依靠傳統人工經驗很難發現的潛在特征和規則,輸出故障和特征匹配的規則庫。實際網絡中,系統可以根據故障特征自動進行規則匹配和診斷,并給出處理建議。另外,智能故障溯源還可以跟 BOSS 系統配合,精準定位故障并觸發工單。如圖 1 所示。 圖圖 1 網絡故障溯源方案示意圖網絡故障溯源方案示意圖 智能故障溯源診斷,包括兩大部分: 基于機器/深度學習生成診斷規則庫 通過獲取多維度歷史數據,如 KPI、告警、性能、配置、日志、故障記錄、工單等,基于這些數據,借助 AI 算法實現特征及規則挖掘。 網絡人工智能應用白皮書 (Rev. 20190626) 17 診斷規則的
40、運行 第一步,通過現網監控獲取實時故障及告警;第二步,匹配規則庫進行根因分析,智能診斷故障,關聯工單系統觸發派單;第三步,故障維護完成后,進行維護有效性的反向修正,強化現有規則庫,實現自優化閉環。 智能故障溯源極大提升了告警處理及故障診斷效率,典型應用場景有:瞬斷告警、告警頻發、網元內故障關聯分析、上下層業務故障關聯分析、跨子網故障分析等等。 3.2.2 智能健康度預測 傳統運維關注發現異常及根源,借助運維工具進行異常處理,恢復網絡正常運行,保障網絡服務體驗。在實際網絡中,異常發生后通常網絡質量和用戶體驗會受到不同程度影響,網絡恢復如果需要調配設備,則時間耗費更長。另外,為保證故障及時恢復,設
41、備資源冗余、人員技能提升等方面也是不小的成本。 網絡運維如果從事后被動處理轉為事前主動預測/預防, 運維成本和用戶體驗將大幅提升。 智能健康度預測基于 AI 的機器學習/深度學習技術,分析海量運維數據,對故障發生前某一段時間內的網絡特征等進行抽取, 從而有效進行網絡監控、 預測/預防網絡故障發生。 如圖 2 所示,預測系統通過線下歷史數據訓練,得到預測模型;線上部署系統后,定期采集數據,檢測健康度,并用訓練好的預測模型進行故障預測。有未預測到的故障發生,則以該故障時間點前的某一階段數據作為輸入,重新訓練預測模型,從而實現不斷迭代優化。 圖圖 2 網絡故障預測方案示意圖網絡故障預測方案示意圖 網
42、絡人工智能應用白皮書 (Rev. 20190626) 18 智能健康度預測有幾類典型應用場景:指標趨勢及指標異常預測,設備關鍵模塊故障預測等。詳細介紹如下: 指標趨勢及指標異常預測 線下通過歷史數據分析, 挖掘網絡健康度的指標趨勢與網絡數據的深層次關聯特征。線上通過對網絡健康度及關聯指標的實時監測,利用訓練好的的特征規則進行匹配,預測網絡健康度指標趨勢。 根據預測出的中長期網絡健康走勢, 可估測網絡未來落入健康閾值以下的可能時間點,提前進行資源預留及相應處理。因此,指標趨勢預測可彌補網絡規劃的不足,指導網絡擴容、備品備件儲備等。 另外,系統還能夠預測中短周期內下一步的指標狀態,根據指標預測值是
43、否超過閾值來預判故障會否發生,實現事前故障預防。 關鍵模塊故障預測 業務處理芯片、光模塊等關鍵模塊的穩定性對電信設備非常重要,一個關鍵模塊故障就會導致大量業務癱瘓。 關鍵模塊發生故障前,通常會存在一些特征性的異常,而特征性異??梢酝ㄟ^特定的指標來表征。比如:芯片故障通常跟寄存器異常有關,光模塊故障通常跟光功率異常有關。 通過機器學習/深度學習, 挖掘關鍵模塊故障與特征性異常之間的深度關聯關系, 從而實現關鍵模塊故障預測,提前進行預防。 3.2.3 智能工單管理 工單管理是運維的核心,工單將運維人員和組織有效串聯起來,形成任務驅動的運維體系。而運維人力合理調度就成為工單調度的重點。 智能工單管理
44、系統基于電子化數據、準確的位置定位、豐富的交互以及接口能力,實現運維全過程的可視化、可管可控、可分析,從而做到主動運維。 智能運維調度,主要包括兩個部分: 基于 AI 的故障工單預警 從歷史工單中提取與故障發生有關的特征向量, 利用 AI 預測算法, 如多項式擬合、神經網絡等,生成故障預警模型。通過該預警模型,智能工單管理系統根據當前特征可預判故障發生率。 實時智能調度 網絡人工智能應用白皮書 (Rev. 20190626) 19 根據工單類型、工單技能要求、人員資質、工單優先級、站點位置、運維車輛等信息,采用遺傳算法自動規劃車輛行駛最佳線路,高效安排外線運維。 圖圖 3 智能工單管理方案示意
45、圖智能工單管理方案示意圖 3.2.4 智能 DevOps DevOps 結合 AI 能力之后,可以實現業務開發端的價值最大化,業務運維端的自動化,業務使用端的體驗最優。 業務在線設計階段,通過分析軟件倉庫的調用行為數據、網絡實例運行數據等,獲得應用的價值分布。結合流量趨勢,利用機器學習可以預測未來市場熱點?;谠擃A測結果,再疊加 DevOps 能夠快速進行業務設計及部署的優勢,可以快速開發、上線符合市場熱點需求的應用,使得業務開發端價值最大化。 業務上線運營階段, 利用 AI 驅動的 RCA 技術可快速進行根因定位, 再結合 DevOps策略平臺及自動彈縮、自愈等技術,可實現基于策略的運維自動
46、化閉環。 通過對業務實例和資源動態數據的學習分析, 可預測與業務需求最匹配的資源分配,再結合 DevOps 的自動編排功能,能夠做到最優選路、用戶面資源適時下沉等等,從而實現用戶體驗最優。 3.3 網絡優化 網絡優化是運營商投入大量人力的重點工作,也是提升網絡 KPI、保障用戶體驗的重要一環。 網絡優化涉及面很廣, 既包括無線網絡優化, 也包括網絡各層級的 KPI 優化、網絡策略優化、傳輸路由優化等。 網絡人工智能應用白皮書 (Rev. 20190626) 20 3.4.1 無線覆蓋智能優化 無線覆蓋質量一直是屢遭用戶投訴的原因之一,弱覆蓋、過覆蓋等問題直接影響用戶體驗。對于覆蓋問題,傳統上主
47、要依賴路測、呼叫跟蹤、投訴處理、人工經驗等手段來解決,往往投入成本高、處理周期長、優化效果不理想。 基于 AI 的無線覆蓋智能優化,利用 AI 及大數據技術,根據歷史上的覆蓋數據、關聯數據進行學習、訓練,生成優化控制模型,可以自動輸出參數規劃及調優建議,從而實現無線覆蓋智能優化。 圖圖 4 無線覆蓋智能優化方案示意圖無線覆蓋智能優化方案示意圖 如圖 4 所示,整個流程主要包含如下步驟: 網絡綜合數據采集:提供現網 KPI、工程參數、性能/配置管理、MR 報告、呼叫跟蹤、DPI 等多個維度的歷史數據給大數據平臺。 數據處理:大數據平臺對多個維度的原始數據進行數據分析和預處理。 AI 模型訓練和輸
48、出:AI 平臺利用大數據系統預處理后的數據進行模型訓練,模型訓練好后可以進行預測、推理,給出無線覆蓋參數優化建議。 參數優化實施:根據大數據和 AI 平臺提供的優化建議實施網絡優化調整。調整方式可以是自動下發執行優化參數,也可以是人工執行的物理調優。 3.4.2 智能流量預測及路徑調優 隨著網絡規模的增長,IoT、網絡切片等新興技術的引入,網絡復雜度越來越高。未來網絡要滿足高帶寬、低時延、隨需而動的業務需求,在流量調度和路徑規劃方面使用傳統方式已很難實時給出最優方案?;?AI,可以利用歷史數據進行數據分析和模型訓練,結合實際網絡需求進行流量預測和路徑優化推理。 網絡人工智能應用白皮書 (Re
49、v. 20190626) 21 圖圖 5 智能流量預測及路徑調優方案示意圖智能流量預測及路徑調優方案示意圖 智能流量預測及路徑調優方案如圖 5 所示。 流量預測:可適用于中長期流量增長預測、短期峰值評估、區域仿真等,進行擴容支撐、規劃支撐、主動運維。 流量預測能力建立需要兩個階段工作: (1)算法探索階段:利用各地網絡歷史數據,對多種算法模型進行訓練,訓練效果好的算法模型納入算法庫。 (2)現網應用階段:將現網歷史數據按地域、業務分組等做預處理,獲得訓練數據;然后對算法庫中的多種預測模型作進一步訓練,得到現網各地區各業務的最佳預測模型。 最后, 根據現網預測需求, 選擇最佳模型進行推理預測,
50、獲得最終的流量預測結果。 路徑優化: 根據網絡狀況, 動態優化路由策略, 提高傳輸效率, 同時動態調度資源,提高網絡使用效率。 路徑優化能力建立需要對流量、性能、拓撲、路由等網絡狀態數據進行采集和實時監控,結合業務、負載、冗余等策略規則,以及上文提到的流量預測結果,共同作為路徑優化算法模型的輸入,將模型推理結果用于現網執行。并且,對執行效果進行反饋,從而不斷迭代優化算法模型。 網絡人工智能應用白皮書 (Rev. 20190626) 22 第四章 人工智能在運營商業務創新中的應用 4.1 邊緣智能 MEC(多接入邊緣計算)作為 5G 關鍵技術之一,在靠近用戶側的位置上提供 IT服務環境和云計算能力,能更好地支持 5G 網絡低