《百度智能云:2021年“云智一體”技術與應用解析系列白皮書——全場景智能視頻篇(56頁).pdf》由會員分享,可在線閱讀,更多相關《百度智能云:2021年“云智一體”技術與應用解析系列白皮書——全場景智能視頻篇(56頁).pdf(56頁珍藏版)》請在三個皮匠報告上搜索。
1、4.1 云智一體的視頻技術推動泛媒體產業升級 4.1.1 泛媒體產業格局:應對新挑戰、把握新動能 4.1.2 泛媒體產業演進的三條增長曲線 4.1.3 智能媒體解決方案全景圖 4.1.4 泛媒體客戶案例解析4.2 云智一體的視頻技術推動泛互聯網產業升級 4.2.1 智能小視頻解決方案:快速上線視頻業務 4.2.2 全鏈路編解碼優化方案:降低成本、提升畫質 4.2.3 新零售直播 SaaS 解決方案:助力商家裂變獲客、流量變現 4.2.4 在線社交解決方案 4.2.5 泛互聯網客戶案例解析4.3 云智一體的視頻技術推動泛產業的視頻場景升級 4.3.1 產業類視頻與消費類視頻的區別 4.3.2 視
2、聯網發展的三大階段 4.3.3 百度智能云視聯網感知平臺 4.3.4 視聯網感知平臺架構的三大特點 4.3.5 產業類客戶案例解析四、智能視頻云 3.0 的三大行業應用場景3232333436393941424344454546474852313.1 5G+AI 驅動下的視頻行業發展趨勢 3.1.1 消費類視頻的云智一體化訴求 3.1.2 產業類視頻的云智一體化訴求3.2 智能視頻云 3.0 全景圖 3.2.1 智能視頻 3.0 的特點 3.2.2 智能視頻 3.0 背后的端邊云一體化基礎架構 3.2.3 基于云智一體的雙平臺3.3 智能視頻云 3.0 中的“云”能力 3.3.1 視頻分發基礎
3、設施 CDN 3.3.2 智能編碼 3.3.3 智感超清 3.3.4 實時音視頻通訊 3.3.5 低延時直播 3.3.6 智能視頻 SDK 矩陣3.4 智能視頻 3.0 的“智”能力 3.4.1 智能理解分析 3.4.2 智能視頻生產 3.4.3 視頻交互生成一、云智一體,促進數字化轉型與智能化升級一步到位030304101011121414151717181921232425252727目錄CONTENS1.1 產業智能化,數字經濟發展新階段1.2 百度智能云戰略升級1.3 云智一體的百度智能云架構 2.0,加速產業智能化二、云智技術大發展讓視頻應用與體驗躍入新階段三、云智一體的全場景視頻技
4、術解析020609五、更多行業案例參考六、關于本報告54554.1 云智一體的視頻技術推動泛媒體產業升級 4.1.1 泛媒體產業格局:應對新挑戰、把握新動能 4.1.2 泛媒體產業演進的三條增長曲線 4.1.3 智能媒體解決方案全景圖 4.1.4 泛媒體客戶案例解析4.2 云智一體的視頻技術推動泛互聯網產業升級 4.2.1 智能小視頻解決方案:快速上線視頻業務 4.2.2 全鏈路編解碼優化方案:降低成本、提升畫質 4.2.3 新零售直播 SaaS 解決方案:助力商家裂變獲客、流量變現 4.2.4 在線社交解決方案 4.2.5 泛互聯網客戶案例解析4.3 云智一體的視頻技術推動泛產業的視頻場景升
5、級 4.3.1 產業類視頻與消費類視頻的區別 4.3.2 視聯網發展的三大階段 4.3.3 百度智能云視聯網感知平臺 4.3.4 視聯網感知平臺架構的三大特點 4.3.5 產業類客戶案例解析四、智能視頻云 3.0 的三大行業應用場景3232333436393941424344454546474852313.1 5G+AI 驅動下的視頻行業發展趨勢 3.1.1 消費類視頻的云智一體化訴求 3.1.2 產業類視頻的云智一體化訴求3.2 智能視頻云 3.0 全景圖 3.2.1 智能視頻 3.0 的特點 3.2.2 智能視頻 3.0 背后的端邊云一體化基礎架構 3.2.3 基于云智一體的雙平臺3.3
6、智能視頻云 3.0 中的“云”能力 3.3.1 視頻分發基礎設施 CDN 3.3.2 智能編碼 3.3.3 智感超清 3.3.4 實時音視頻通訊 3.3.5 低延時直播 3.3.6 智能視頻 SDK 矩陣3.4 智能視頻 3.0 的“智”能力 3.4.1 智能理解分析 3.4.2 智能視頻生產 3.4.3 視頻交互生成一、云智一體,促進數字化轉型與智能化升級一步到位030304101011121414151717181921232425252727目錄CONTENS1.1 產業智能化,數字經濟發展新階段1.2 百度智能云戰略升級1.3 云智一體的百度智能云架構 2.0,加速產業智能化二、云智技
7、術大發展讓視頻應用與體驗躍入新階段三、云智一體的全場景視頻技術解析020609五、更多行業案例參考六、關于本報告5455031.1 產業智能化,數字經濟發展新階段1.2 百度智能云戰略升級當前,我們正處在科技創新和產業發展最好的時代,以人工智能、大數據、云計算、5G 等為代表的新一代信息技術蓬勃發展,驅動新一輪科技革命和產業變革。在產業應用新興技術和數據資源轉型升級的過程中,數字化是基礎;而隨著人工智能等新一代信息技術的發展,以及數據的爆發式增長,產業加快應用智能技術,從海量數據中發現規律、訓練模型、提煉知識,促進產出增加和效率提升,實現企業生產經營的智能化,進而實現整個產業的智能化升級。因此
8、,數字經濟既包括數字化轉型,也包括智能化升級,產業智能化是數字經濟發展的新階段。百度是擁有強大互聯網基礎的領先 AI 公司。從成立的第一天起,百度搜索引擎就與人工智能、云計算等技術息息相關。經過多年的技術積累和產業實踐,百度已形成了全面布局,從基礎的算力和數據技術、深度學習算法及框架,到語音、視覺、自然語言處理等感知、認知技術,以及飛槳深度學習開源開放平臺等,具備云智一體的獨特優勢?;诎俣鹊募夹g優勢和對產業發展的洞察,經過跟合作伙伴的共同成長與產業實踐,百度智能云的戰略升級為:以“云計算為基礎”支撐企業數字化轉型,以“人工智能為引擎”加速產業智能化升級,云智一體“賦能千行百業”,促進經濟高質
9、量發展。云智一體,促進數字化轉型與智能化升級一步到位 031.1 產業智能化,數字經濟發展新階段1.2 百度智能云戰略升級當前,我們正處在科技創新和產業發展最好的時代,以人工智能、大數據、云計算、5G 等為代表的新一代信息技術蓬勃發展,驅動新一輪科技革命和產業變革。在產業應用新興技術和數據資源轉型升級的過程中,數字化是基礎;而隨著人工智能等新一代信息技術的發展,以及數據的爆發式增長,產業加快應用智能技術,從海量數據中發現規律、訓練模型、提煉知識,促進產出增加和效率提升,實現企業生產經營的智能化,進而實現整個產業的智能化升級。因此,數字經濟既包括數字化轉型,也包括智能化升級,產業智能化是數字經濟
10、發展的新階段。百度是擁有強大互聯網基礎的領先 AI 公司。從成立的第一天起,百度搜索引擎就與人工智能、云計算等技術息息相關。經過多年的技術積累和產業實踐,百度已形成了全面布局,從基礎的算力和數據技術、深度學習算法及框架,到語音、視覺、自然語言處理等感知、認知技術,以及飛槳深度學習開源開放平臺等,具備云智一體的獨特優勢?;诎俣鹊募夹g優勢和對產業發展的洞察,經過跟合作伙伴的共同成長與產業實踐,百度智能云的戰略升級為:以“云計算為基礎”支撐企業數字化轉型,以“人工智能為引擎”加速產業智能化升級,云智一體“賦能千行百業”,促進經濟高質量發展。云智一體,促進數字化轉型與智能化升級一步到位“云智一體”技
11、術與應用解析系列白皮書 智能視頻篇04051.3 云智一體的百度智能云架構2.0,加速產業智能化基于百度智能云的戰略升級,云智一體的百度智能云架構 2.0 同時發布,包含數字化底座、智能化引擎和全場景應用(如圖 1.3-1 所示)。數字化底座,包括基礎云、數據庫、物聯網、邊緣計算、區塊鏈等基礎平臺,以及視頻云、大數據、云原生開發和地圖服務等;同時還有安全模塊,為技術創新和產業轉型升級保駕護航。在數字化底座之上是智能化引擎,百度自主研發的飛槳深度學習平臺為核心,軟硬一體 AI 大生產平臺-百度大腦為支撐,包括 AI 中臺和知識中臺等。智能化引擎與行業深度融合,幫助企業建設自己的智能化中臺,助力智
12、能化升級。我們希望以百度智能云為紐帶,聯合技術和產業生態伙伴,通過開源開放平臺降低 AI 開發的門檻,加快人工智能融入傳統產業,幫助越來越多的行業大步快跑,加入產業智能化的大潮。(圖1.3-1 百度智能云全新架構2.0)基于數字化底座和智能化引擎,百度智能云深入行業場景,打造智能應用,同時與生態伙伴一起,在制造、能源、城市、金融、醫療、媒體等領域,助力數字化轉型和智能化升級一步到位。云智一體的“云”為數字化轉型提供安全、穩定、靈活的數字化底座,“智能化引擎”為智能化升級提供領先的創新技術和平臺。我們推薦客戶數字化轉型與智能化升級一起做,一步到位,這樣效率更高,效果更好。同時,如果客戶只做數字化
13、轉型,我們有豐富的云計算產品可以支持;或者客戶已經有了數字化基礎,我們的智能化引擎也可以助力智能化應用。百度智能云的“云”,不僅為數字化轉型提供安全穩定、彈性靈活的云計算服務,同時也是適合跑AI 的云,我們稱之為“AI 原生云”,繼承云原生的優勢,面向 AI 場景,提供極致彈性的高性能異構算力,打造簡潔、高效的 AI 應用開發架構?!霸浦且惑w”的智,是百度將深耕十余年的 AI 技術,以及 AI 賦能產業的實踐經驗,沉淀為助力產業智能化升級的技術、平臺及方法論,是以加速產業智能化升級為己任、懂場景的 AI?!霸浦且惑w”技術與應用解析系列白皮書 智能視頻篇04051.3 云智一體的百度智能云架構2
14、.0,加速產業智能化基于百度智能云的戰略升級,云智一體的百度智能云架構 2.0 同時發布,包含數字化底座、智能化引擎和全場景應用(如圖 1.3-1 所示)。數字化底座,包括基礎云、數據庫、物聯網、邊緣計算、區塊鏈等基礎平臺,以及視頻云、大數據、云原生開發和地圖服務等;同時還有安全模塊,為技術創新和產業轉型升級保駕護航。在數字化底座之上是智能化引擎,百度自主研發的飛槳深度學習平臺為核心,軟硬一體 AI 大生產平臺-百度大腦為支撐,包括 AI 中臺和知識中臺等。智能化引擎與行業深度融合,幫助企業建設自己的智能化中臺,助力智能化升級。我們希望以百度智能云為紐帶,聯合技術和產業生態伙伴,通過開源開放平
15、臺降低 AI 開發的門檻,加快人工智能融入傳統產業,幫助越來越多的行業大步快跑,加入產業智能化的大潮。(圖1.3-1 百度智能云全新架構2.0)基于數字化底座和智能化引擎,百度智能云深入行業場景,打造智能應用,同時與生態伙伴一起,在制造、能源、城市、金融、醫療、媒體等領域,助力數字化轉型和智能化升級一步到位。云智一體的“云”為數字化轉型提供安全、穩定、靈活的數字化底座,“智能化引擎”為智能化升級提供領先的創新技術和平臺。我們推薦客戶數字化轉型與智能化升級一起做,一步到位,這樣效率更高,效果更好。同時,如果客戶只做數字化轉型,我們有豐富的云計算產品可以支持;或者客戶已經有了數字化基礎,我們的智能
16、化引擎也可以助力智能化應用。百度智能云的“云”,不僅為數字化轉型提供安全穩定、彈性靈活的云計算服務,同時也是適合跑AI 的云,我們稱之為“AI 原生云”,繼承云原生的優勢,面向 AI 場景,提供極致彈性的高性能異構算力,打造簡潔、高效的 AI 應用開發架構?!霸浦且惑w”的智,是百度將深耕十余年的 AI 技術,以及 AI 賦能產業的實踐經驗,沉淀為助力產業智能化升級的技術、平臺及方法論,是以加速產業智能化升級為己任、懂場景的 AI?!霸浦且惑w”技術與應用解析系列白皮書 智能視頻篇0607視頻作為人類最直接、最容易感知世界的一種方式,已廣泛應用在日常生活和工作中。從整個視頻發展史來看,過去的很長一
17、段時間,最喜聞樂見的視頻應用場景,主要集中在傳媒業、娛樂業等大眾消費領域。而在最近的 10 年內,隨著長視頻、短視頻、直播等行業應用的高速發展,加速了互聯網內容的視頻化趨勢。人們在互聯網上獲取信息和娛樂的方式也開始更多的基于視頻資源,但這些應用還是更多集中在消費互聯網領域,屬于一種視頻化業務。但在最近兩三年,視頻應用領域進一步擴大,進入到越來越多的行業日常業務中,更多業務正在視頻化。例如在智慧城市領域,基于視頻數據進行的污染治理、消防預警等;在電力領域,基于視頻信息進行的線路自動巡檢、風險預判;在交通領域,基于視頻信息進行的擁堵治理和優化;在教育領域,特別是疫情出現后,很多課程以線上視頻形式進
18、行,企業內部溝通及知識分享培訓也基于直播或在線視頻進行。云智技術大發展讓視頻應用與體驗躍入新階段“云智一體”技術與應用解析系列白皮書 智能視頻篇0607視頻作為人類最直接、最容易感知世界的一種方式,已廣泛應用在日常生活和工作中。從整個視頻發展史來看,過去的很長一段時間,最喜聞樂見的視頻應用場景,主要集中在傳媒業、娛樂業等大眾消費領域。而在最近的 10 年內,隨著長視頻、短視頻、直播等行業應用的高速發展,加速了互聯網內容的視頻化趨勢。人們在互聯網上獲取信息和娛樂的方式也開始更多的基于視頻資源,但這些應用還是更多集中在消費互聯網領域,屬于一種視頻化業務。但在最近兩三年,視頻應用領域進一步擴大,進入
19、到越來越多的行業日常業務中,更多業務正在視頻化。例如在智慧城市領域,基于視頻數據進行的污染治理、消防預警等;在電力領域,基于視頻信息進行的線路自動巡檢、風險預判;在交通領域,基于視頻信息進行的擁堵治理和優化;在教育領域,特別是疫情出現后,很多課程以線上視頻形式進行,企業內部溝通及知識分享培訓也基于直播或在線視頻進行。云智技術大發展讓視頻應用與體驗躍入新階段“云智一體”技術與應用解析系列白皮書 智能視頻篇0809這種發展趨勢的技術驅動力是云計算和人工智能技術的空前發展,推動視頻的應用和體驗進入到新階段。該階段的核心特點如下:相比文字和圖片數據分析,視頻數據的分析有著更高的復雜度,過去對于視頻內容
20、的理解分析往往依賴人工。隨著人工智能技術的發展,對于視頻這類非結構化數據的分析處理也上了新臺階,可以實現自動化對視頻內容進行結構內容提取、審核及知識挖掘等。最新的 CDN、邊緣計算、低時延通信、RTC、編解碼、AR/VR、5G 和AI 等技術的發展,讓人們在觀看視頻時,真正可以身臨其境,實現與視頻內容的全方位互動。全景沉浸式視頻正在電視、直播及游戲等更多場景中得到應用。視頻是一個“重”數據應用,“重”在兩塊:一方面,是對海量視頻數據的采集、存儲、傳輸和分發提出了極高的訴求;另一方面,是需要強大的數據智能化分析與處理能力,對語音、圖像、OCR、知識圖譜等全面的智能化技術非常依賴。視頻數據作為一種
21、專門類型的數據資產,在企業中占比越來越高,為了更好的管理好視頻數據資產,挖掘其中的業務價值,更好的幫助業務發展,企業開始統一規劃與構建云智一體的視頻平臺。而百度在視頻領域有著長期豐富的業務實踐,在長視頻、短視頻、直播,以及自動駕駛、智能交通等業務領域都有相應的技術積累。同時,百度在長期實踐中構建了業界最全面、最領先的 AI 能力,再加上優秀的云、邊、端等資源和能力,百度已然具備云智一體的完整能力,是幫助企業實現業務視頻高清化、沉浸化、智能化的最佳合作伙伴。百度智能云期望能夠和企業、開發者及合作伙伴一起,在視頻領域共同創新、共同進步,加速產業的智能化轉型。人們對于內容高清化的需求越來越高,甚至可
22、以說是永無止境;隨著 5G 及超分技術的發展,視頻正在逐步從高清升級到 4K/8K 超高清階段。內容高清化體驗沉浸化分析智能化云智一體的全場景視頻技術解析“云智一體”技術與應用解析系列白皮書 智能視頻篇0809這種發展趨勢的技術驅動力是云計算和人工智能技術的空前發展,推動視頻的應用和體驗進入到新階段。該階段的核心特點如下:相比文字和圖片數據分析,視頻數據的分析有著更高的復雜度,過去對于視頻內容的理解分析往往依賴人工。隨著人工智能技術的發展,對于視頻這類非結構化數據的分析處理也上了新臺階,可以實現自動化對視頻內容進行結構內容提取、審核及知識挖掘等。最新的 CDN、邊緣計算、低時延通信、RTC、編
23、解碼、AR/VR、5G 和AI 等技術的發展,讓人們在觀看視頻時,真正可以身臨其境,實現與視頻內容的全方位互動。全景沉浸式視頻正在電視、直播及游戲等更多場景中得到應用。視頻是一個“重”數據應用,“重”在兩塊:一方面,是對海量視頻數據的采集、存儲、傳輸和分發提出了極高的訴求;另一方面,是需要強大的數據智能化分析與處理能力,對語音、圖像、OCR、知識圖譜等全面的智能化技術非常依賴。視頻數據作為一種專門類型的數據資產,在企業中占比越來越高,為了更好的管理好視頻數據資產,挖掘其中的業務價值,更好的幫助業務發展,企業開始統一規劃與構建云智一體的視頻平臺。而百度在視頻領域有著長期豐富的業務實踐,在長視頻、
24、短視頻、直播,以及自動駕駛、智能交通等業務領域都有相應的技術積累。同時,百度在長期實踐中構建了業界最全面、最領先的 AI 能力,再加上優秀的云、邊、端等資源和能力,百度已然具備云智一體的完整能力,是幫助企業實現業務視頻高清化、沉浸化、智能化的最佳合作伙伴。百度智能云期望能夠和企業、開發者及合作伙伴一起,在視頻領域共同創新、共同進步,加速產業的智能化轉型。人們對于內容高清化的需求越來越高,甚至可以說是永無止境;隨著 5G 及超分技術的發展,視頻正在逐步從高清升級到 4K/8K 超高清階段。內容高清化體驗沉浸化分析智能化云智一體的全場景視頻技術解析“云智一體”技術與應用解析系列白皮書 智能視頻篇1
25、0113.1 5G+AI 驅動下的視頻行業發展趨勢如今在消費類視頻應用領域,沉浸式視頻體驗和智能化數字孿生成為主流趨勢。在趨勢的裹挾下,消費類視頻面臨著諸多挑戰:一是隨著超高清時代的來臨,4K/8K 等超高清視頻的市場需求每年都在萬小時量級以上,而目前量級只有千小時級別,視頻內容的數量和質量都無法滿足超高清時代的需求。二是隨著視頻內容的海量增長,傳統的人工編目效率根本無法跟上視頻增長速度,視頻內容的生產、管控和播放等環節都迫切需要更智能化、自動化和更豐富的技術手段來支持。三是針對視頻內容,需要解析更多的結構化信息,才能實現更精準的算法推薦。面對上述挑戰,只有依托云的大規模算力,用 AI 技術帶
26、動內容生產與管播等環節的智能化升級,消費類視頻才能實現內容質量與數量上質的飛躍。目前,很多行業互聯網企業都已經意識到并開始積極應對這些挑戰,但離成功依然遙遠。3.1.1 消費類視頻的云智一體化訴求視頻應用在產業類服務場景的外延化趨勢明顯。早期在傳統產業里,“視頻+聯網”主要是在監控場景中使用。如今,視頻應用已經深入到生產、工作、管理等產品場景的方方面面,工藝優化、質量檢測、安全巡檢等都是目前比較成熟的產品類視頻應用場景。除了服務場景的外延化,視頻的產業參與度也越來越深。傳統的視頻監控,只解決了視頻的接入問題,后續仍然需要由人來查看和判斷。而隨著“業務流程數字化與智能化”概念的提出,視頻正在逐漸
27、成為一種對物理世界進行智能化改造的手段:通過對設計、生產、運維與分析決策等全場景進行視覺感知,生成海量視頻圖片等多維度數據并接入邊云平臺,由云邊端算力來承載和調度,由人工智能技術處理視頻內容的結構化,對視頻語音語義進行自動化理解,實現智能化決策?!皹I務流程數字化與智能化”的實現,需要大帶寬、低延時、高安全存儲和高并發算力的“云”來承載,還需要端智能檢測、多模搜索、輔助分析與自動化決策的“智”來引領。3.1.2產業類視頻的云智一體化訴求(圖3.1.1-1 消費類視頻應用的云智一體化訴求)(3.1.2-1 產業類視頻應用的云智一體化訴求)“云智一體”技術與應用解析系列白皮書 智能視頻篇10113.
28、1 5G+AI 驅動下的視頻行業發展趨勢如今在消費類視頻應用領域,沉浸式視頻體驗和智能化數字孿生成為主流趨勢。在趨勢的裹挾下,消費類視頻面臨著諸多挑戰:一是隨著超高清時代的來臨,4K/8K 等超高清視頻的市場需求每年都在萬小時量級以上,而目前量級只有千小時級別,視頻內容的數量和質量都無法滿足超高清時代的需求。二是隨著視頻內容的海量增長,傳統的人工編目效率根本無法跟上視頻增長速度,視頻內容的生產、管控和播放等環節都迫切需要更智能化、自動化和更豐富的技術手段來支持。三是針對視頻內容,需要解析更多的結構化信息,才能實現更精準的算法推薦。面對上述挑戰,只有依托云的大規模算力,用 AI 技術帶動內容生產
29、與管播等環節的智能化升級,消費類視頻才能實現內容質量與數量上質的飛躍。目前,很多行業互聯網企業都已經意識到并開始積極應對這些挑戰,但離成功依然遙遠。3.1.1 消費類視頻的云智一體化訴求視頻應用在產業類服務場景的外延化趨勢明顯。早期在傳統產業里,“視頻+聯網”主要是在監控場景中使用。如今,視頻應用已經深入到生產、工作、管理等產品場景的方方面面,工藝優化、質量檢測、安全巡檢等都是目前比較成熟的產品類視頻應用場景。除了服務場景的外延化,視頻的產業參與度也越來越深。傳統的視頻監控,只解決了視頻的接入問題,后續仍然需要由人來查看和判斷。而隨著“業務流程數字化與智能化”概念的提出,視頻正在逐漸成為一種對
30、物理世界進行智能化改造的手段:通過對設計、生產、運維與分析決策等全場景進行視覺感知,生成海量視頻圖片等多維度數據并接入邊云平臺,由云邊端算力來承載和調度,由人工智能技術處理視頻內容的結構化,對視頻語音語義進行自動化理解,實現智能化決策?!皹I務流程數字化與智能化”的實現,需要大帶寬、低延時、高安全存儲和高并發算力的“云”來承載,還需要端智能檢測、多模搜索、輔助分析與自動化決策的“智”來引領。3.1.2產業類視頻的云智一體化訴求(圖3.1.1-1 消費類視頻應用的云智一體化訴求)(3.1.2-1 產業類視頻應用的云智一體化訴求)“云智一體”技術與應用解析系列白皮書 智能視頻篇12133.2 智能視
31、頻云 3.0 全景圖隨著時代的發展,全面視頻化的時代線條越來越清晰,為了應對海量數據接入并提升應用效率,視頻數據的數字化與智能化成為必然趨勢。首先,從技術角度來看,數據密集型和人工智能密集型的工作場景已然大規模出現。但由于終端設備型號各異、數據采集規模異常巨大,故而要求設備接入、數據采集與解析等環節都需要更高的異構融合性、算力高并發性以及自動化等能力,這對端邊云的承載和大規模算力都提出了嚴峻挑戰。而視頻數據要實現自動化解析、智能化建模與應用,也需要強大的算力和傳輸能力做支撐。最終,這些雙向需求推動了端、邊、云、智的充分融合,端邊云逐漸一體化、云智逐漸一體化。其次,從業務流程來看,人工智能技術已
32、經可以作用到業務流程的各個階段。有了顆粒度更細的場景算力與人工智能算法做加持,問題的解決能力也會持續提升,逐漸由只能解決通用場景問題,發展到可以解決更細分、更個性化的場景問題??梢哉f云智技術的發展,一方面擴展了視頻應用的外延范圍,另一方面也加深了視頻在傳統應用領域的作用和價值。需要注意的是,雖然視頻領域有了更多的新技術,但企業卻面臨著如何低成本、高效率的利用這些技術去實現業務創新的問題。因為,視頻技術的種類非常多、復雜程度高,企業盲目創新會造成研發成本和資源投入的高企,普通企業從時間、成本、資源等方面都無法承受。那么,如何消除架在企業視頻創新需求與資源成本投入間的鴻溝呢?百度智能云給出了答案:
33、智能視頻云 3.0云智一體的、端到端的、全場景的智能視頻平臺級解決方案。為什么說是智能視頻云 3.0 呢?1.0 時代解決的是視頻傳輸問題,2.0 時代更多的提供針對單一場景的功能化組件。而 3.0 時代是視頻技術與能力的全面升級,百度智能云希望用深入到傳統與新興視頻領域的、云智一體的、一站式平臺方案,推動企業視頻應用的可持續創新。(圖3.2-1 智能視頻云3.0全景圖)“云智一體”技術與應用解析系列白皮書 智能視頻篇12133.2 智能視頻云 3.0 全景圖隨著時代的發展,全面視頻化的時代線條越來越清晰,為了應對海量數據接入并提升應用效率,視頻數據的數字化與智能化成為必然趨勢。首先,從技術角
34、度來看,數據密集型和人工智能密集型的工作場景已然大規模出現。但由于終端設備型號各異、數據采集規模異常巨大,故而要求設備接入、數據采集與解析等環節都需要更高的異構融合性、算力高并發性以及自動化等能力,這對端邊云的承載和大規模算力都提出了嚴峻挑戰。而視頻數據要實現自動化解析、智能化建模與應用,也需要強大的算力和傳輸能力做支撐。最終,這些雙向需求推動了端、邊、云、智的充分融合,端邊云逐漸一體化、云智逐漸一體化。其次,從業務流程來看,人工智能技術已經可以作用到業務流程的各個階段。有了顆粒度更細的場景算力與人工智能算法做加持,問題的解決能力也會持續提升,逐漸由只能解決通用場景問題,發展到可以解決更細分、
35、更個性化的場景問題??梢哉f云智技術的發展,一方面擴展了視頻應用的外延范圍,另一方面也加深了視頻在傳統應用領域的作用和價值。需要注意的是,雖然視頻領域有了更多的新技術,但企業卻面臨著如何低成本、高效率的利用這些技術去實現業務創新的問題。因為,視頻技術的種類非常多、復雜程度高,企業盲目創新會造成研發成本和資源投入的高企,普通企業從時間、成本、資源等方面都無法承受。那么,如何消除架在企業視頻創新需求與資源成本投入間的鴻溝呢?百度智能云給出了答案:智能視頻云 3.0云智一體的、端到端的、全場景的智能視頻平臺級解決方案。為什么說是智能視頻云 3.0 呢?1.0 時代解決的是視頻傳輸問題,2.0 時代更多
36、的提供針對單一場景的功能化組件。而 3.0 時代是視頻技術與能力的全面升級,百度智能云希望用深入到傳統與新興視頻領域的、云智一體的、一站式平臺方案,推動企業視頻應用的可持續創新。(圖3.2-1 智能視頻云3.0全景圖)“云智一體”技術與應用解析系列白皮書 智能視頻篇1415構建智能視頻 3.0 平臺的核心驅動力是數據和應用的分布式需求,不同時延和算力層次也對基礎架構提出了高要求。為滿足以上需求,百度智能云構建了完整的端邊云一體化基礎架構體系:端側,提供輕量級終端,如 AI 攝像頭和邊緣盒子,并提供輕量級的算力環境;邊緣側,提供小算力環境,滿足長距離場景的低時延需求,如移動邊緣 IME 和 BE
37、C(CDN 邊緣產品);云側,提供全棧的大數據分析、AI 計算、高性能存儲等產品矩陣。這樣的一整套算力分布式基礎架構,既可滿足端側預處理與邊緣側匯聚計算的需求,也可確保視頻數據在云中心的各種復雜運算。3.2.2 智能視頻3.0背后的端邊云一體化基礎架構智能視頻云 3.0 中的“云”,通過端邊云一體、異構融合的基礎架構提供先進的云計算能力;“智”則以業界領先的 AI 能力完成對視頻語音、圖像、文字等多模態信息的智能分析、理解、生成。同時,基于云智一體的基礎架構,智能視頻云 3.0 打造了面向不同場景應用的視頻雙平臺視頻創作分發平臺和視聯網感知平臺,為企業提供一站式和平臺化的技術服務。視頻創作分發
38、平臺視頻創作分發平臺面向泛互聯網、泛媒體等行業,聚焦業務流和媒資管理,覆蓋視頻的接入、生產、處理、審核分析和個性化推薦等全流程,實現媒資管理和工作流的智能化改造。通過媒資結構化處理和多摸精準搜索,媒資利用率可提升 40%,盤活媒資,最大化發揮內容價值。相對于傳統采編發的管理軟件,視頻創作分發平臺利用 AI 能力對數據進行深度理解分析,加快數據流動,盤活媒資數據利用率;并為業務流提供可視化控制臺,用戶可以通過簡單靈活的視頻編排配置流程,輕松應對業務的個性化需求,適配移動化、多終端、多形態的業務場景。3.2.3 基于云智一體的雙平臺云智一體的 3.0:百度智能云開放了智能編碼處理、智感超清、低延時
39、直播等 10 余種云智產品組件、100 多個 API,以及視頻創作分發平臺與視聯網感知平臺等兩大場景平臺,希望借助全場景與平臺化的智能視頻技術,為企業提供更完整豐富、一站式的視頻平臺開發與應用集成能力。生態開放的 3.0:百度智能云攜手眾多合作伙伴,共同打造“智能視頻云 3.0”,用“平臺+應用”的模式,為企業提供端到端的解決方案。目前,已形成覆蓋互動娛樂、實時通訊、生產管理,安全監管等 10 多個視頻場景的解決方案,助力企業快速、高效的實現視頻應用的落地和交互。3.2.1智能視頻3.0的特點(圖3.2.2-1 端邊云一體的基礎架構)(圖3.2.3-1 視頻創作分發平臺)VideoWorks
40、作為百度智能云的音視頻統一入口,提供了音視頻上傳存儲、生產處理、媒資管理、分發播放等覆蓋視頻全生命周期的 PaaS 服務,主要適用于視頻點播分發、視頻生產處理、媒資智能管理三大應用場景?!霸浦且惑w”技術與應用解析系列白皮書 智能視頻篇1415構建智能視頻 3.0 平臺的核心驅動力是數據和應用的分布式需求,不同時延和算力層次也對基礎架構提出了高要求。為滿足以上需求,百度智能云構建了完整的端邊云一體化基礎架構體系:端側,提供輕量級終端,如 AI 攝像頭和邊緣盒子,并提供輕量級的算力環境;邊緣側,提供小算力環境,滿足長距離場景的低時延需求,如移動邊緣 IME 和 BEC(CDN 邊緣產品);云側,提
41、供全棧的大數據分析、AI 計算、高性能存儲等產品矩陣。這樣的一整套算力分布式基礎架構,既可滿足端側預處理與邊緣側匯聚計算的需求,也可確保視頻數據在云中心的各種復雜運算。3.2.2 智能視頻3.0背后的端邊云一體化基礎架構智能視頻云 3.0 中的“云”,通過端邊云一體、異構融合的基礎架構提供先進的云計算能力;“智”則以業界領先的 AI 能力完成對視頻語音、圖像、文字等多模態信息的智能分析、理解、生成。同時,基于云智一體的基礎架構,智能視頻云 3.0 打造了面向不同場景應用的視頻雙平臺視頻創作分發平臺和視聯網感知平臺,為企業提供一站式和平臺化的技術服務。視頻創作分發平臺視頻創作分發平臺面向泛互聯網
42、、泛媒體等行業,聚焦業務流和媒資管理,覆蓋視頻的接入、生產、處理、審核分析和個性化推薦等全流程,實現媒資管理和工作流的智能化改造。通過媒資結構化處理和多摸精準搜索,媒資利用率可提升 40%,盤活媒資,最大化發揮內容價值。相對于傳統采編發的管理軟件,視頻創作分發平臺利用 AI 能力對數據進行深度理解分析,加快數據流動,盤活媒資數據利用率;并為業務流提供可視化控制臺,用戶可以通過簡單靈活的視頻編排配置流程,輕松應對業務的個性化需求,適配移動化、多終端、多形態的業務場景。3.2.3 基于云智一體的雙平臺云智一體的 3.0:百度智能云開放了智能編碼處理、智感超清、低延時直播等 10 余種云智產品組件、
43、100 多個 API,以及視頻創作分發平臺與視聯網感知平臺等兩大場景平臺,希望借助全場景與平臺化的智能視頻技術,為企業提供更完整豐富、一站式的視頻平臺開發與應用集成能力。生態開放的 3.0:百度智能云攜手眾多合作伙伴,共同打造“智能視頻云 3.0”,用“平臺+應用”的模式,為企業提供端到端的解決方案。目前,已形成覆蓋互動娛樂、實時通訊、生產管理,安全監管等 10 多個視頻場景的解決方案,助力企業快速、高效的實現視頻應用的落地和交互。3.2.1智能視頻3.0的特點(圖3.2.2-1 端邊云一體的基礎架構)(圖3.2.3-1 視頻創作分發平臺)VideoWorks 作為百度智能云的音視頻統一入口,
44、提供了音視頻上傳存儲、生產處理、媒資管理、分發播放等覆蓋視頻全生命周期的 PaaS 服務,主要適用于視頻點播分發、視頻生產處理、媒資智能管理三大應用場景?!霸浦且惑w”技術與應用解析系列白皮書 智能視頻篇1617視聯網感知平臺視聯網感知平臺面向傳統產業,核心價值是對泛視頻設備和數據流實現統一的連接、分析和管理,打造面向生產/控制/治理場景的通用基礎平臺,為企業生產、園區管理、城市治理等場景提供平臺化支撐。該平臺特點如下:開放性。廣泛的設備接入兼容性,支持 10 種+主流視頻協議和多廠商設備;具備高擴展的處理和分析能力,涵蓋 20 種+媒體處理能力和可擴展性,為業務生態提供統一和開放兼容的平臺化服
45、務。全面智能化。依托 200 種+AI 視覺感知能力,可對視頻數據進行結構化解析,滿足千億級特征數據規模的毫秒級查詢,實現對視頻內容的高效語義化理解和獲??;依托百度強大的知識圖譜能力,與應用融合,實現對感知內容的知識化處理,提升視頻應用的認知能力。端邊云融合。融合邊緣,提供最優的云智一體架構,使資源、數據、感知能力在端邊云充分融合,提升管理便捷性和秒級告警能力,降低網絡成本。3.3 智能視頻云 3.0 中的“云”能力1000+大節點,100T+帶寬儲備智能視頻云 3.0 的視頻分發基礎設施 CDN,具有靈活的資源擴展能力,在已有的 1000+標準節點基礎上,資源的使用能力持續下沉,可以與邊緣計
46、算的資源深度結合,做到流量和算力的雙加速,還將一些視頻編解碼能力下沉至邊緣節點。全球智能調度+低時延感知智能視頻 3.0 的視頻分發基礎設施,擁有全球智能調度系統和低時延質量感知系統,能做出近乎實時的智能調度,實現就近 CDN 節點的內容調度和快速觸達。同時,通過對中間協議和多級緩存的優化,大大提升了視頻內容在不同場景要求的訪問體驗水平。系統可編程與分場景協議調優智能視頻 3.0 的視頻分發系統具有可編程特性,這意味系統可實現自生長,從而更好的應對視頻應用的多樣化場景需求,提升系統的敏捷開發水平,支撐起整個智能視頻云 3.0 包括智能編碼、智感超清等在內的幾十種產品能力。3.3.1 視頻分發基
47、礎設施CDN(圖3.2.3-2 視聯網感知平臺)(圖3.3.1-1 視頻分發基礎設施CDN)“云智一體”技術與應用解析系列白皮書 智能視頻篇1617視聯網感知平臺視聯網感知平臺面向傳統產業,核心價值是對泛視頻設備和數據流實現統一的連接、分析和管理,打造面向生產/控制/治理場景的通用基礎平臺,為企業生產、園區管理、城市治理等場景提供平臺化支撐。該平臺特點如下:開放性。廣泛的設備接入兼容性,支持 10 種+主流視頻協議和多廠商設備;具備高擴展的處理和分析能力,涵蓋 20 種+媒體處理能力和可擴展性,為業務生態提供統一和開放兼容的平臺化服務。全面智能化。依托 200 種+AI 視覺感知能力,可對視頻
48、數據進行結構化解析,滿足千億級特征數據規模的毫秒級查詢,實現對視頻內容的高效語義化理解和獲??;依托百度強大的知識圖譜能力,與應用融合,實現對感知內容的知識化處理,提升視頻應用的認知能力。端邊云融合。融合邊緣,提供最優的云智一體架構,使資源、數據、感知能力在端邊云充分融合,提升管理便捷性和秒級告警能力,降低網絡成本。3.3 智能視頻云 3.0 中的“云”能力1000+大節點,100T+帶寬儲備智能視頻云 3.0 的視頻分發基礎設施 CDN,具有靈活的資源擴展能力,在已有的 1000+標準節點基礎上,資源的使用能力持續下沉,可以與邊緣計算的資源深度結合,做到流量和算力的雙加速,還將一些視頻編解碼能
49、力下沉至邊緣節點。全球智能調度+低時延感知智能視頻 3.0 的視頻分發基礎設施,擁有全球智能調度系統和低時延質量感知系統,能做出近乎實時的智能調度,實現就近 CDN 節點的內容調度和快速觸達。同時,通過對中間協議和多級緩存的優化,大大提升了視頻內容在不同場景要求的訪問體驗水平。系統可編程與分場景協議調優智能視頻 3.0 的視頻分發系統具有可編程特性,這意味系統可實現自生長,從而更好的應對視頻應用的多樣化場景需求,提升系統的敏捷開發水平,支撐起整個智能視頻云 3.0 包括智能編碼、智感超清等在內的幾十種產品能力。3.3.1 視頻分發基礎設施CDN(圖3.2.3-2 視聯網感知平臺)(圖3.3.1
50、-1 視頻分發基礎設施CDN)“云智一體”技術與應用解析系列白皮書 智能視頻篇1819為了匹配超高清時代的視頻體驗極致追求,百度智能云打造了“智感超清”產品。核心價值就是利用去噪、去劃痕、上色、畫質增強、超分辨率等手段進行老片修新,實現對視頻畫質的提升和超高清內容的轉換。智感超清背后涉及的技術眾多,具體如下:超分辨率基于 U 型神經網絡框架,提出一整套級聯提升網絡框架,可對視頻空間分辨率進行從粗到細地提升。自適應去燥視頻數據中的噪聲模式難以人工模擬,通過自研的無監督去噪算法,可以擺脫有監督神經網絡訓練對成對噪聲與干凈圖像的依賴;模型還設計了可用戶交互的控制參數,支持用戶調節適應不同噪聲。畫質增
51、強細節紋理增強,采用深度殘差卷積神經網絡,對視頻內容進行特征提取與重建,對畫面的飽和度與原畫質視頻的壓縮失真進行細節還原;感興趣區域(ROI)增強與編碼,通過 ROI 區域的實時檢測與跟蹤技術,對 ROI 區域進行局部畫質增強,同時編碼時碼率分配進行 ROI 區域優化,保證 ROI區域視覺主觀質量的提升。SDR 轉 HDR基于全局與局部信息融合的門控殘差網絡單元,構建端到端的 SDR 視頻源到符合 HDR 標準視頻信號的上變換網絡模型,高效地將傳統 8bit 位深 BT.709 色域空間的信號,上變換到 BT.2020 色域空間下 10bit 及以上位深的信號。高幀率重制基于 MEMC(運動估
52、計與運動補償)的高幀率提升技術,通過對運動方向預判,據此進行插幀,提升畫面流暢度與觀屏舒適度。超高清編碼采用異構計算 4K 編碼技術,基于 CPU+GPU+ASIC 的異構加速計算框架,對視頻的處理和編碼進行加速處理。3.3.3 智感超清為幫助視頻生產者在低成本與視頻極致體驗間取得最優解,百度智能云提出了 BD265 智能編碼方案。BD265 智能編碼技術利用深度學習網絡提取視頻特征,生成自適應編碼參數,降低碼率的同時提升視頻的主觀體驗。BD265 研發了 60 多種算法,在視頻質量、編碼速度和編碼碼率間取得一個優化解;采用了多層并行構架包括SIMD指令并行、WPP幀內并行、幀間并行等,提高編
53、碼速度。質量方面,BD265 采用自適應量化、碼率分配、主觀優化來提升視頻質量。相比于業界通用的開源編解碼技術 X265,BD265 在視頻編碼速度上提升了 2-4 倍,碼率節省30%,帶寬成本節省 25%+。以好看視頻為例,BD265 在實際應用中節省帶寬成本 25%+,同步提升了視頻畫質??梢哉f,BD265 智能編解碼技術在視頻內容的質量、碼率和速度之間取得了最優解。在全球頂尖的 MSU2020 世界視頻編碼器大賽中,BD265 獲評“最優編碼器”。目前,這套智能編解碼技術已經廣泛應到點播/直播等視頻應用場景中,得到用戶的高度認可。3.3.2 智能編碼智能編碼BD265,同畫質降低碼率30
54、%+,提速2x+(圖3.3.2-1 智能編碼BD265)“云智一體”技術與應用解析系列白皮書 智能視頻篇1819為了匹配超高清時代的視頻體驗極致追求,百度智能云打造了“智感超清”產品。核心價值就是利用去噪、去劃痕、上色、畫質增強、超分辨率等手段進行老片修新,實現對視頻畫質的提升和超高清內容的轉換。智感超清背后涉及的技術眾多,具體如下:超分辨率基于 U 型神經網絡框架,提出一整套級聯提升網絡框架,可對視頻空間分辨率進行從粗到細地提升。自適應去燥視頻數據中的噪聲模式難以人工模擬,通過自研的無監督去噪算法,可以擺脫有監督神經網絡訓練對成對噪聲與干凈圖像的依賴;模型還設計了可用戶交互的控制參數,支持用
55、戶調節適應不同噪聲。畫質增強細節紋理增強,采用深度殘差卷積神經網絡,對視頻內容進行特征提取與重建,對畫面的飽和度與原畫質視頻的壓縮失真進行細節還原;感興趣區域(ROI)增強與編碼,通過 ROI 區域的實時檢測與跟蹤技術,對 ROI 區域進行局部畫質增強,同時編碼時碼率分配進行 ROI 區域優化,保證 ROI區域視覺主觀質量的提升。SDR 轉 HDR基于全局與局部信息融合的門控殘差網絡單元,構建端到端的 SDR 視頻源到符合 HDR 標準視頻信號的上變換網絡模型,高效地將傳統 8bit 位深 BT.709 色域空間的信號,上變換到 BT.2020 色域空間下 10bit 及以上位深的信號。高幀率
56、重制基于 MEMC(運動估計與運動補償)的高幀率提升技術,通過對運動方向預判,據此進行插幀,提升畫面流暢度與觀屏舒適度。超高清編碼采用異構計算 4K 編碼技術,基于 CPU+GPU+ASIC 的異構加速計算框架,對視頻的處理和編碼進行加速處理。3.3.3 智感超清為幫助視頻生產者在低成本與視頻極致體驗間取得最優解,百度智能云提出了 BD265 智能編碼方案。BD265 智能編碼技術利用深度學習網絡提取視頻特征,生成自適應編碼參數,降低碼率的同時提升視頻的主觀體驗。BD265 研發了 60 多種算法,在視頻質量、編碼速度和編碼碼率間取得一個優化解;采用了多層并行構架包括SIMD指令并行、WPP幀
57、內并行、幀間并行等,提高編碼速度。質量方面,BD265 采用自適應量化、碼率分配、主觀優化來提升視頻質量。相比于業界通用的開源編解碼技術 X265,BD265 在視頻編碼速度上提升了 2-4 倍,碼率節省30%,帶寬成本節省 25%+。以好看視頻為例,BD265 在實際應用中節省帶寬成本 25%+,同步提升了視頻畫質??梢哉f,BD265 智能編解碼技術在視頻內容的質量、碼率和速度之間取得了最優解。在全球頂尖的 MSU2020 世界視頻編碼器大賽中,BD265 獲評“最優編碼器”。目前,這套智能編解碼技術已經廣泛應到點播/直播等視頻應用場景中,得到用戶的高度認可。3.3.2 智能編碼智能編碼BD
58、265,同畫質降低碼率30%+,提速2x+(圖3.3.2-1 智能編碼BD265)“云智一體”技術與應用解析系列白皮書 智能視頻篇2021百度智能云自研的智感超清技術,在 CVPR、ECCV 等全球大賽上均取得了好成績。同時,百度智能云也在牽頭智能視頻處理系統通用技術規范產業標準的組織工作,致力于制訂出普惠大眾的通用標準技術。目前,智感超清技術已經廣泛應用在電影頻道、得物 APP 等泛媒體與泛互聯網場景中。幫助電影頻道完成了眾多老舊影片的修復換新工作,在提供更好用戶主觀體驗的同時,減少了人工逐幀修復的成本,提升處理效率 10 倍+。畫質增強:深度殘差神經網絡,內容特征提取與重建飽和度與壓縮失真
59、還原ROI 區域增強與編碼超高清編碼:采用 CPU+GPU+ASIC 的異構加速計算框架支持國產昆侖 K200 芯片 AI 推理超分辨率:U 型神經網絡框架,級聯提升網絡框架,從粗到細提升自適應去燥:無監督去噪聲算法可交互控制參數,支持用戶調節高幀率重制:基于 MEMC 高幀率提升技術2020 年整個世界遭遇了“新冠”黑天鵝事件,在疫情期間,人們的工作與生活中迫切需要解決物理距離的問題,實時音視頻通訊正是在這個背景下獲得了高速發展。比如視頻會議、百度無人駕駛,都是通過云端對視頻應用進行管理,實現低延時的互動體驗。智能視頻云3.0中的“實時音視頻通訊”產品具有支持即時通訊、Android/iOS
60、/Windows/Web/小程序等跨平臺互通、屏幕分享、旁路直播及云端錄制等特點?!皩崟r音視頻通訊”產品具備抗弱網、端到端延時性能監控、高質量音視頻通話等特點,具體如下:弱網支持自研抗弱網算法,根據上下行網絡鏈路惡化程度因子,調整FEC、NACK、碼控、超清權重選擇因子,進行抗弱網抖動算法,使視頻抗弱網可達 60%、音頻可達 80%,弱網環境下保證高質量通信。高性能通過優化后的混沌神經網絡算法規劃最短路徑、實現動態平衡路由選擇,將端到端延時穩定收斂到200ms 左右,并在單個節點故障時,自動重建路由,保障 Server 的可用性。3.3.4 實時音視頻通訊(圖3.3.3-1 智感超清技術)(圖
61、3.3.3-2 國際比賽獎項及第三方權威認證)智感超清,大幅提升畫質,加速超高清發展“云智一體”技術與應用解析系列白皮書 智能視頻篇2021百度智能云自研的智感超清技術,在 CVPR、ECCV 等全球大賽上均取得了好成績。同時,百度智能云也在牽頭智能視頻處理系統通用技術規范產業標準的組織工作,致力于制訂出普惠大眾的通用標準技術。目前,智感超清技術已經廣泛應用在電影頻道、得物 APP 等泛媒體與泛互聯網場景中。幫助電影頻道完成了眾多老舊影片的修復換新工作,在提供更好用戶主觀體驗的同時,減少了人工逐幀修復的成本,提升處理效率 10 倍+。畫質增強:深度殘差神經網絡,內容特征提取與重建飽和度與壓縮失
62、真還原ROI 區域增強與編碼超高清編碼:采用 CPU+GPU+ASIC 的異構加速計算框架支持國產昆侖 K200 芯片 AI 推理超分辨率:U 型神經網絡框架,級聯提升網絡框架,從粗到細提升自適應去燥:無監督去噪聲算法可交互控制參數,支持用戶調節高幀率重制:基于 MEMC 高幀率提升技術2020 年整個世界遭遇了“新冠”黑天鵝事件,在疫情期間,人們的工作與生活中迫切需要解決物理距離的問題,實時音視頻通訊正是在這個背景下獲得了高速發展。比如視頻會議、百度無人駕駛,都是通過云端對視頻應用進行管理,實現低延時的互動體驗。智能視頻云3.0中的“實時音視頻通訊”產品具有支持即時通訊、Android/iO
63、S/Windows/Web/小程序等跨平臺互通、屏幕分享、旁路直播及云端錄制等特點?!皩崟r音視頻通訊”產品具備抗弱網、端到端延時性能監控、高質量音視頻通話等特點,具體如下:弱網支持自研抗弱網算法,根據上下行網絡鏈路惡化程度因子,調整FEC、NACK、碼控、超清權重選擇因子,進行抗弱網抖動算法,使視頻抗弱網可達 60%、音頻可達 80%,弱網環境下保證高質量通信。高性能通過優化后的混沌神經網絡算法規劃最短路徑、實現動態平衡路由選擇,將端到端延時穩定收斂到200ms 左右,并在單個節點故障時,自動重建路由,保障 Server 的可用性。3.3.4 實時音視頻通訊(圖3.3.3-1 智感超清技術)(
64、圖3.3.3-2 國際比賽獎項及第三方權威認證)智感超清,大幅提升畫質,加速超高清發展“云智一體”技術與應用解析系列白皮書 智能視頻篇2223實時音視頻通訊實現了線上超低延時的互動體驗,但面對千萬級并發量,如何應對?“低延時直播”就是滿足此類場景的視頻產品,其背后核心是百度智能云自研的通訊格式封裝和協議棧優化技術。直播包括采編碼、推流、分發、接受、解碼和渲染等環節,要在直播中實現時延的突破、分發和接收的時延變動等需求,主要取決于鏈路時延的抖動、協議棧的優化以及 CDN 節點資源等情況?!爸悄芤曨l云 3.0”低延時直播產品采用全鏈路 SRT 協議技術傳輸方案,用戶從推流、播放及CDN 內部傳輸等
65、都采用 SRT 協議和 MPegTS 封裝,從而將網絡丟包的可能性降到最低,把延遲做到最小。在用戶通過 SRT 推流到 CDN 后,CDN 內部支持 SRT 流轉成主流格式的直播協議,用戶也可以使用http-flv、hls、rtmp等格式完成播放、錄制、轉碼、截圖等操作。相比傳統的rtmp和flv存在5-10s的延遲,SRT 有效把時延控制在 1s 以內?;?SRT 協議的低延遲方案不僅時延低,結合 BD265 后,在同等清晰度下,帶寬可節省 30%。3.3.5 低延時直播WHIP 協議轉換解決了信令交互復雜、房間管理業務量大、數據庫操作頻繁等問題,可支撐每個房間在線人數達百萬級別。首屏秒開
66、處理關鍵幀緩存算法,保證 800ms 左右拿到首幀并渲染到屏幕,大幅提升用戶體驗。AI 能力支持實時美顏、濾鏡、貼紙、AR特效等娛樂場景玩法;提供人臉識別、語音識別等技術,用于身份核驗、學生狀態監測等更多場景。端到端性能監控-端到端實時監控設備運行狀態、QoE、QoS 以及用戶行為。高質量音視頻通話-音頻 3A 優化,支撐超高清 4K 畫質,自動適配多分辨率。全球節點就近接入-遍布全球 1000+節點,就近接入、專線互聯。(圖3.3.4-1 實時音視頻通訊)(圖3.3.5-1 低延時直播)卓越抗弱網能力:自研 mpegts 數據格式封裝、SRT 協議推流,將網絡丟包的可能性降到最低,改善弱網環
67、境推流服務品質。首屏秒開:CDN 1 級先將編碼參數信息發給播放器,播放器解析到編碼信息,待下個關鍵幀到達后即可快速播放。協議兼容:實現多種視頻流協議的輸入與輸出,UDP 和 RTMP 流能夠順利融入 SRT 系統,視頻轉發更靈活性。規模并發:與 Http/flv 支持的并發規模一致,支持千萬級規模并發?!霸浦且惑w”技術與應用解析系列白皮書 智能視頻篇2223實時音視頻通訊實現了線上超低延時的互動體驗,但面對千萬級并發量,如何應對?“低延時直播”就是滿足此類場景的視頻產品,其背后核心是百度智能云自研的通訊格式封裝和協議棧優化技術。直播包括采編碼、推流、分發、接受、解碼和渲染等環節,要在直播中實
68、現時延的突破、分發和接收的時延變動等需求,主要取決于鏈路時延的抖動、協議棧的優化以及 CDN 節點資源等情況?!爸悄芤曨l云 3.0”低延時直播產品采用全鏈路 SRT 協議技術傳輸方案,用戶從推流、播放及CDN 內部傳輸等都采用 SRT 協議和 MPegTS 封裝,從而將網絡丟包的可能性降到最低,把延遲做到最小。在用戶通過 SRT 推流到 CDN 后,CDN 內部支持 SRT 流轉成主流格式的直播協議,用戶也可以使用http-flv、hls、rtmp等格式完成播放、錄制、轉碼、截圖等操作。相比傳統的rtmp和flv存在5-10s的延遲,SRT 有效把時延控制在 1s 以內?;?SRT 協議的低
69、延遲方案不僅時延低,結合 BD265 后,在同等清晰度下,帶寬可節省 30%。3.3.5 低延時直播WHIP 協議轉換解決了信令交互復雜、房間管理業務量大、數據庫操作頻繁等問題,可支撐每個房間在線人數達百萬級別。首屏秒開處理關鍵幀緩存算法,保證 800ms 左右拿到首幀并渲染到屏幕,大幅提升用戶體驗。AI 能力支持實時美顏、濾鏡、貼紙、AR特效等娛樂場景玩法;提供人臉識別、語音識別等技術,用于身份核驗、學生狀態監測等更多場景。端到端性能監控-端到端實時監控設備運行狀態、QoE、QoS 以及用戶行為。高質量音視頻通話-音頻 3A 優化,支撐超高清 4K 畫質,自動適配多分辨率。全球節點就近接入-
70、遍布全球 1000+節點,就近接入、專線互聯。(圖3.3.4-1 實時音視頻通訊)(圖3.3.5-1 低延時直播)卓越抗弱網能力:自研 mpegts 數據格式封裝、SRT 協議推流,將網絡丟包的可能性降到最低,改善弱網環境推流服務品質。首屏秒開:CDN 1 級先將編碼參數信息發給播放器,播放器解析到編碼信息,待下個關鍵幀到達后即可快速播放。協議兼容:實現多種視頻流協議的輸入與輸出,UDP 和 RTMP 流能夠順利融入 SRT 系統,視頻轉發更靈活性。規模并發:與 Http/flv 支持的并發規模一致,支持千萬級規模并發?!霸浦且惑w”技術與應用解析系列白皮書 智能視頻篇2425在全民拍攝的泛直播
71、時代下,輕量化美顏、智能剪輯、低碼率高品質推流、沉浸式播放體驗等成為音視頻終端業務不可或缺的基礎能力。因此,百度智能云面向不同業務,提供豐富的SDK解決方案,支持業務發展。受益于終端算力的不斷釋放,使得終端設備運行如 PaddleLite 的人臉算法、語音增強算法、視覺增強算法、BD265 編碼算法及全景渲染算法等百度自研算法變為現實。在這些底層算法的加持下,終端能力得到大幅提升。智能視頻終端框架正在經歷從模塊化向智能化的演進歷程。平臺接入層通過模塊化解決多 SDK 復用和數據管線組合的問題,提高內部協同效率,提升產品按需交付的靈活度;輔以橫貫模塊間的數據監控,運行質量可一目了然??缙脚_層重點
72、解決多終端數據處理一致性體驗的問題?;谏a消費模型,將自研算法抽象成獨立算子(如人臉算法),經過管線中不同處理節點,最終將數據轉化為業務效果(如美顏等)。針對終端數據的高效率處理,離不開平臺引擎層提供的持續動力。終端并行計算技術,讓 CPU 與GPU 在時間和空間上得到更好的協同。3.3.6 智能視頻SDK矩陣3.4 智能視頻 3.0 的“智”能力視頻中的單模態理解視頻理解分析時常會遇到兩個挑戰:一是需要處理的視頻中對象太多,比如各種環境下拍攝的人臉,處理方法也不盡相同;二是視頻樣本素材少,無法支撐起一個有效的訓練模型,這在工業場景尤為明顯。挑戰帶來的問題是,需要針對每個場景都單獨建模,而素
73、材稀少又造成模型訓練效果不理想?;谝陨咸魬?,百度智能云提出了一套“預訓練-小型化-定制化”的研發流程:預訓練以視頻中的人物理解為例,通過百度資源庫獲取海量視頻場景的人臉數據,依托百度飛槳平臺提供的大規模訓練框架,基于所有場景圖像、視頻等有監督數據和無監督數據進行混合訓練,打造預訓練模型。由于該訓練框架的訓練 ID 數可達千萬級,因而訓練出的模型具有強大的鑒別性能?;诎俣群A繑祿娜四樧R別預訓練模型,人物識別全場景錯誤率相對降低 40%+,模型速度提升50%。小型化與定制化模型訓練只是手段,應用才是目標。由于設備端規格多種多樣,計算能力千差萬別,邊緣側適配性成了關鍵?;诎俣蕊w槳 Paddl
74、eSlim 套件,可以對模型進行搜索壓縮與量化,將大模型蒸餾為小模型??s小后的模型,既具備大模型的知識結構,又有通用性特點,結合特定場景的少量樣本,即可進行自適應遷移學習,實現完美適配。相比于傳統模型訓練,基于 PaddleSlim 套件的模型訓練,速度提升了兩倍。而在游戲、動漫、體育等垂類場景中,識別準確率可達 90%+,訓練數據標注量減少 40%?;仡櫚俣戎悄芤曨l云 3.0 的全景架構圖可以發現,智能視頻技術在其中起著承上啟下的重要作用,智能理解分析、智能視頻生產與智能交互生成等關鍵 AI 技術充當著平臺化與場景化創新應用的技術基石。3.4.1 智能理解分析(圖3.3.6-1 智能視頻SD
75、K矩陣)“云智一體”技術與應用解析系列白皮書 智能視頻篇2425在全民拍攝的泛直播時代下,輕量化美顏、智能剪輯、低碼率高品質推流、沉浸式播放體驗等成為音視頻終端業務不可或缺的基礎能力。因此,百度智能云面向不同業務,提供豐富的SDK解決方案,支持業務發展。受益于終端算力的不斷釋放,使得終端設備運行如 PaddleLite 的人臉算法、語音增強算法、視覺增強算法、BD265 編碼算法及全景渲染算法等百度自研算法變為現實。在這些底層算法的加持下,終端能力得到大幅提升。智能視頻終端框架正在經歷從模塊化向智能化的演進歷程。平臺接入層通過模塊化解決多 SDK 復用和數據管線組合的問題,提高內部協同效率,提
76、升產品按需交付的靈活度;輔以橫貫模塊間的數據監控,運行質量可一目了然??缙脚_層重點解決多終端數據處理一致性體驗的問題?;谏a消費模型,將自研算法抽象成獨立算子(如人臉算法),經過管線中不同處理節點,最終將數據轉化為業務效果(如美顏等)。針對終端數據的高效率處理,離不開平臺引擎層提供的持續動力。終端并行計算技術,讓 CPU 與GPU 在時間和空間上得到更好的協同。3.3.6 智能視頻SDK矩陣3.4 智能視頻 3.0 的“智”能力視頻中的單模態理解視頻理解分析時常會遇到兩個挑戰:一是需要處理的視頻中對象太多,比如各種環境下拍攝的人臉,處理方法也不盡相同;二是視頻樣本素材少,無法支撐起一個有效的
77、訓練模型,這在工業場景尤為明顯。挑戰帶來的問題是,需要針對每個場景都單獨建模,而素材稀少又造成模型訓練效果不理想?;谝陨咸魬?,百度智能云提出了一套“預訓練-小型化-定制化”的研發流程:預訓練以視頻中的人物理解為例,通過百度資源庫獲取海量視頻場景的人臉數據,依托百度飛槳平臺提供的大規模訓練框架,基于所有場景圖像、視頻等有監督數據和無監督數據進行混合訓練,打造預訓練模型。由于該訓練框架的訓練 ID 數可達千萬級,因而訓練出的模型具有強大的鑒別性能?;诎俣群A繑祿娜四樧R別預訓練模型,人物識別全場景錯誤率相對降低 40%+,模型速度提升50%。小型化與定制化模型訓練只是手段,應用才是目標。由于設
78、備端規格多種多樣,計算能力千差萬別,邊緣側適配性成了關鍵?;诎俣蕊w槳 PaddleSlim 套件,可以對模型進行搜索壓縮與量化,將大模型蒸餾為小模型??s小后的模型,既具備大模型的知識結構,又有通用性特點,結合特定場景的少量樣本,即可進行自適應遷移學習,實現完美適配。相比于傳統模型訓練,基于 PaddleSlim 套件的模型訓練,速度提升了兩倍。而在游戲、動漫、體育等垂類場景中,識別準確率可達 90%+,訓練數據標注量減少 40%?;仡櫚俣戎悄芤曨l云 3.0 的全景架構圖可以發現,智能視頻技術在其中起著承上啟下的重要作用,智能理解分析、智能視頻生產與智能交互生成等關鍵 AI 技術充當著平臺化與
79、場景化創新應用的技術基石。3.4.1 智能理解分析(圖3.3.6-1 智能視頻SDK矩陣)“云智一體”技術與應用解析系列白皮書 智能視頻篇2627知識增強的視頻理解基于知識的視頻語義理解技術,充分利用豐富、全面的知識圖譜提升視頻理解效果。該技術通過對視覺、語音、文本的多模態內容進行解析與融合,基于知識關聯技術建立與視頻理解知識圖譜的連接,通過對背景知識的計算與推理,實現對視頻的深度語義理解。知識增強的視頻理解技術,突破了傳統的基于感知的視頻內容分析的局限性,實現對視頻的深度結構化語義理解,大幅提升視頻理解效果,標簽召回量提升 140%。目前基于知識的視頻理解技術,已在百度的搜索、推薦、好看視頻
80、等多個重要業務中得到大規模應用,取得了顯著效果。智能理解分析綜合應用的一個典型案例就是視頻智能編目。面對海量信息,廣電行業遇到的一大挑戰就是在保證準確率的前提下,提升編目效率。視頻智能編目通過對視頻的多模態理解,算法能自動識別一系列的編目項,編目平均準確率超過 90%,相比于人工編目,效率能提升 6 至 8 倍。一段 30 分鐘時長的新聞,人工編目需 4 小時,而智能編目只需要 30-40 分鐘。視覺模態創新技術旨在將多種內容載體向視頻形式自動轉換,提升傳播效率。目前百度智能云可提供多種視頻生產方式,如圖文/圖表/圖集靜態圖片等轉視頻、長視頻拆短視頻以及 Video-in(內容智能嵌入)等。知
81、識增強的視頻生產基于知識圖譜的視頻生產技術是百度智能云視頻生產技術的差異化亮點,主要包括三種:實體盤點視頻:借助知識圖譜的海量事實,生產關于實體屬性、關系的各種知識類、趣味性的盤點視頻。脈絡視頻:基于知識圖譜中一項核心技術能力多輪問答技術,可實現事件監測和事件論元抽取能力;通過事件識別、聚類、歸一等技術總體構建事件脈絡生成技術,達到對客觀事件的動態理解?;谑录}絡能力,可生成關于熱點事件來龍去脈的報道視頻。場景聚合視頻:通過對影視劇的多模語義理解,能自動將某一類場景鏡頭進行聚合,呈現作品的精彩片段。3.4.2 智能視頻生產(圖3.4.1-2 知識增強的視頻理解)(圖3.4.2-1 知識增強的
82、視頻生產)(圖3.4.1-1 視頻模態理解框架重磅升級)智能視頻云 3.0 擁有豐富的技術能力,全新構建了交互與生成 AI 能力矩陣,從 AR 特效技術到新型驅動特效、風格特效和多模態生成,全面支持各類泛娛樂場景的視頻交互與生成需求。特別是數字人技術,融合了眾多業界領先的語音、視覺和自然語言理解等方面的 AI 技術,是百度 AI 技術的集中呈現。3.4.3 視頻交互生成“云智一體”技術與應用解析系列白皮書 智能視頻篇2627知識增強的視頻理解基于知識的視頻語義理解技術,充分利用豐富、全面的知識圖譜提升視頻理解效果。該技術通過對視覺、語音、文本的多模態內容進行解析與融合,基于知識關聯技術建立與視
83、頻理解知識圖譜的連接,通過對背景知識的計算與推理,實現對視頻的深度語義理解。知識增強的視頻理解技術,突破了傳統的基于感知的視頻內容分析的局限性,實現對視頻的深度結構化語義理解,大幅提升視頻理解效果,標簽召回量提升 140%。目前基于知識的視頻理解技術,已在百度的搜索、推薦、好看視頻等多個重要業務中得到大規模應用,取得了顯著效果。智能理解分析綜合應用的一個典型案例就是視頻智能編目。面對海量信息,廣電行業遇到的一大挑戰就是在保證準確率的前提下,提升編目效率。視頻智能編目通過對視頻的多模態理解,算法能自動識別一系列的編目項,編目平均準確率超過 90%,相比于人工編目,效率能提升 6 至 8 倍。一段
84、 30 分鐘時長的新聞,人工編目需 4 小時,而智能編目只需要 30-40 分鐘。視覺模態創新技術旨在將多種內容載體向視頻形式自動轉換,提升傳播效率。目前百度智能云可提供多種視頻生產方式,如圖文/圖表/圖集靜態圖片等轉視頻、長視頻拆短視頻以及 Video-in(內容智能嵌入)等。知識增強的視頻生產基于知識圖譜的視頻生產技術是百度智能云視頻生產技術的差異化亮點,主要包括三種:實體盤點視頻:借助知識圖譜的海量事實,生產關于實體屬性、關系的各種知識類、趣味性的盤點視頻。脈絡視頻:基于知識圖譜中一項核心技術能力多輪問答技術,可實現事件監測和事件論元抽取能力;通過事件識別、聚類、歸一等技術總體構建事件脈
85、絡生成技術,達到對客觀事件的動態理解?;谑录}絡能力,可生成關于熱點事件來龍去脈的報道視頻。場景聚合視頻:通過對影視劇的多模語義理解,能自動將某一類場景鏡頭進行聚合,呈現作品的精彩片段。3.4.2 智能視頻生產(圖3.4.1-2 知識增強的視頻理解)(圖3.4.2-1 知識增強的視頻生產)(圖3.4.1-1 視頻模態理解框架重磅升級)智能視頻云 3.0 擁有豐富的技術能力,全新構建了交互與生成 AI 能力矩陣,從 AR 特效技術到新型驅動特效、風格特效和多模態生成,全面支持各類泛娛樂場景的視頻交互與生成需求。特別是數字人技術,融合了眾多業界領先的語音、視覺和自然語言理解等方面的 AI 技術,
86、是百度 AI 技術的集中呈現。3.4.3 視頻交互生成“云智一體”技術與應用解析系列白皮書 智能視頻篇2829視覺模態的任意風格化視覺模態的任意風格化有兩大挑戰:一是形成任意風格之前都要先學習一個元模型;二是要在有限樣本的條件下進行模型遷移。智能視頻云 3.0 可以完美解決這些問題,基于元學習、多風格Adaptation 技術、Few-shot Learning 等技術,使元模型具備多任務學習和快速自適應學習能力,實現元模型的快速遷移,從而可根據需求快速定制不同風格的高質量視頻。數字人技術區別于傳統的文字、語音等對話服務,數字人技術以更加擬人或還原真人的形式,提供更有溫度的服務。智能視頻云 3
87、.0 的多模態技術,將虛擬數字人形象與語音合成、唇動生成等技術相結合,低成本制作形象豐富靈動、線上線下多端適配的數字人。并可通過智能對話引擎直達用戶需求,更快速、直接的解決用戶問題或輔助用戶決策。領先的數字人技術需要解決四大挑戰:交互自然百度智能云擁有業界首個基于RNN的工業級在線實時語音合成技術,讓數字人的語音合成更擬人、更自然、更動聽;同時融合了下巴、面部唇動合成技術,通過高精度的紋理合成,讓語音驅動的唇動自然度更高。語音和唇動的匹配準確率可達 98.4%,幾乎可達到完美的口型聲音一致。形象豐富目前數字人的形象分為 2D 卡通、2D 真人影像、3D 卡通、3D 高精建模等 4 種。其中應用
88、最廣泛的是 3D 高精建模人像,一方面可高度還原真人,實現風格定制,另一方面可避免肖像權問題。其次廣泛應用的是 2D 真人影像,制作成本相對比較低,但需要模特肖像授權,一般應用在替代真人的嚴肅場景?!?D 高精建?!狈譃橹匦聵嫿ê臀⒄{兩種制作方式,模型構建需要大量真人原型數據采集,基礎人像構建完成后則需要針對面部、皮膚、發型服裝等元素進行材質貼圖方面的調整?!?D真人影像”采集綠幕影像數據,通過唇部摳圖、打點切分等數據處理步驟,完成模型的構建。(圖3.4.3-1 交互生成矩陣)(圖3.4.3-2 視覺模態的風格化)(圖3.4.3-3 數字人的四大挑戰-交互自然)數字人“云智一體”技術與應用解析
89、系列白皮書 智能視頻篇2829視覺模態的任意風格化視覺模態的任意風格化有兩大挑戰:一是形成任意風格之前都要先學習一個元模型;二是要在有限樣本的條件下進行模型遷移。智能視頻云 3.0 可以完美解決這些問題,基于元學習、多風格Adaptation 技術、Few-shot Learning 等技術,使元模型具備多任務學習和快速自適應學習能力,實現元模型的快速遷移,從而可根據需求快速定制不同風格的高質量視頻。數字人技術區別于傳統的文字、語音等對話服務,數字人技術以更加擬人或還原真人的形式,提供更有溫度的服務。智能視頻云 3.0 的多模態技術,將虛擬數字人形象與語音合成、唇動生成等技術相結合,低成本制作
90、形象豐富靈動、線上線下多端適配的數字人。并可通過智能對話引擎直達用戶需求,更快速、直接的解決用戶問題或輔助用戶決策。領先的數字人技術需要解決四大挑戰:交互自然百度智能云擁有業界首個基于RNN的工業級在線實時語音合成技術,讓數字人的語音合成更擬人、更自然、更動聽;同時融合了下巴、面部唇動合成技術,通過高精度的紋理合成,讓語音驅動的唇動自然度更高。語音和唇動的匹配準確率可達 98.4%,幾乎可達到完美的口型聲音一致。形象豐富目前數字人的形象分為 2D 卡通、2D 真人影像、3D 卡通、3D 高精建模等 4 種。其中應用最廣泛的是 3D 高精建模人像,一方面可高度還原真人,實現風格定制,另一方面可避
91、免肖像權問題。其次廣泛應用的是 2D 真人影像,制作成本相對比較低,但需要模特肖像授權,一般應用在替代真人的嚴肅場景?!?D 高精建?!狈譃橹匦聵嫿ê臀⒄{兩種制作方式,模型構建需要大量真人原型數據采集,基礎人像構建完成后則需要針對面部、皮膚、發型服裝等元素進行材質貼圖方面的調整?!?D真人影像”采集綠幕影像數據,通過唇部摳圖、打點切分等數據處理步驟,完成模型的構建。(圖3.4.3-1 交互生成矩陣)(圖3.4.3-2 視覺模態的風格化)(圖3.4.3-3 數字人的四大挑戰-交互自然)數字人“云智一體”技術與應用解析系列白皮書 智能視頻篇3031制作高效百度智能云數字人技術可以基于 5 分鐘的視
92、頻物料就能定制一套自有 IP 的真人形象。同時,還提供快速復制多 IP 真人形象的技術,將單張人像遷移到虛擬人,就能生成多個不同 IP 的真人形象。環境普適目前數字人的應用載體較為廣泛,除了PC端和手持移動端設備以外,百度智能云還自研了智能云屏、智能云席等數字人載體。為更好模擬真人交互,云屏、云席都集成了用來檢測人臉和唇動的定制攝像頭及拾音麥克風,可更好的識別主說話人,解決“雞尾酒會問題”。云屏高度 170 厘米左右,1:1還原真人大小,可批量在網點鋪設。今年兩會期間,百度智能云與央視網合作推出虛擬數字人小 C,策劃了“兩會 C+真探”的虛擬記者采訪項目,一時受到市場廣泛關注。(圖3.4.3-
93、4 數字人的四大挑戰-制作高效)(圖3.4.3-5 數字人的四大挑戰-環境普適)PC端移動端云屏云席智能視頻云3.0的三大行業應用場景“云智一體”技術與應用解析系列白皮書 智能視頻篇3031制作高效百度智能云數字人技術可以基于 5 分鐘的視頻物料就能定制一套自有 IP 的真人形象。同時,還提供快速復制多 IP 真人形象的技術,將單張人像遷移到虛擬人,就能生成多個不同 IP 的真人形象。環境普適目前數字人的應用載體較為廣泛,除了PC端和手持移動端設備以外,百度智能云還自研了智能云屏、智能云席等數字人載體。為更好模擬真人交互,云屏、云席都集成了用來檢測人臉和唇動的定制攝像頭及拾音麥克風,可更好的識
94、別主說話人,解決“雞尾酒會問題”。云屏高度 170 厘米左右,1:1還原真人大小,可批量在網點鋪設。今年兩會期間,百度智能云與央視網合作推出虛擬數字人小 C,策劃了“兩會 C+真探”的虛擬記者采訪項目,一時受到市場廣泛關注。(圖3.4.3-4 數字人的四大挑戰-制作高效)(圖3.4.3-5 數字人的四大挑戰-環境普適)PC端移動端云屏云席智能視頻云3.0的三大行業應用場景“云智一體”技術與應用解析系列白皮書 智能視頻篇3233為充分發揮云智技術的價值,百度智能云深度到參與視頻相關產業的智能化升級中,基于云智一體的智能視頻云 3.0 平臺,為泛互聯網、泛媒體和泛產業等領域,提供產業類智能視頻應用
95、解決方案,覆蓋互動娛樂、內容生產、智能分析、遠程實時通訊、生產管理和安全管理等場景。在全面視頻化的時代,政策驅動傳統媒體向融合、智慧、移動、高清化轉型,傳統媒體正在向自主可控、互動、智能型媒體發展。百度智能視頻云 3.0 以及智能視頻全鏈條 AI 技術,為泛媒體視頻的發展注入生命力,助力產業全面升級。新挑戰競爭加劇。當前流量紅利已經見頂,用戶運營轉向存量運營,媒體行業對增量用戶的爭奪日趨白熱化。需求多元化與傳播碎片化。用戶的個性化需求增長迅速,多元化趨勢顯著;同時,隨著傳播渠道的形式與數量直線增加,中心化傳播逐漸弱化,傳播碎片化加劇。新動能新內容。當前,直播、短視頻等新媒體內容成為主流,AR/
96、VR/AMR 等新內容供給機制躍躍欲試。新方式。車載、家庭等多屏交互終端持續涌現,更有數字人等新交互技術加持。新業態。面對新的業務模式,媒體+政務/服務/商務等泛媒體組合出現了新的業務機會,內容逐漸成為一種新產品業態。比如金融媒體,基于專業的內容生產,為銀行、證券等金融機構提供垂類內容服務。4.1.1 泛媒體產業格局:應對新挑戰、把握新動能4.1 云智一體的視頻技術推動泛媒體產業升級泛媒體產業存在著用戶驅動、科技引領的三條增長曲線,不同的媒體形態和媒體階段,都在這三條曲線上發展。信息化增長曲線為實現提質增效的目標,傳統廣電媒體正在做辦公、采編、傳播等環節的信息化轉型。網絡化增長曲線完成信息化升
97、級的媒體機構,開始朝著網絡化新媒體矩陣方向發展,廣電、報業等諸多機構都在謀劃自己的新媒體矩陣,一些省市廣電傳媒希望打造出超級 APP,并嘗試通過 MCN 渠道來聚合更多內容。智能化增長曲線人工智能引領的產業轉型,產生了很多新的業務形態,既有內容+政務/服務/商務的新業務模式探索,也催生了更多內容的場景化服務。一些內容科技類企業把內容的全鏈條生產和全渠道分發作為立足點,為內容的供給方和消費方提供技術服務。4.1.2 泛媒體產業演進的三條增長曲線(圖4.1.1-1 泛媒體產業的挑戰與動能)(圖4.1.2-1 泛媒體產業增長曲線)“云智一體”技術與應用解析系列白皮書 智能視頻篇3233為充分發揮云智
98、技術的價值,百度智能云深度到參與視頻相關產業的智能化升級中,基于云智一體的智能視頻云 3.0 平臺,為泛互聯網、泛媒體和泛產業等領域,提供產業類智能視頻應用解決方案,覆蓋互動娛樂、內容生產、智能分析、遠程實時通訊、生產管理和安全管理等場景。在全面視頻化的時代,政策驅動傳統媒體向融合、智慧、移動、高清化轉型,傳統媒體正在向自主可控、互動、智能型媒體發展。百度智能視頻云 3.0 以及智能視頻全鏈條 AI 技術,為泛媒體視頻的發展注入生命力,助力產業全面升級。新挑戰競爭加劇。當前流量紅利已經見頂,用戶運營轉向存量運營,媒體行業對增量用戶的爭奪日趨白熱化。需求多元化與傳播碎片化。用戶的個性化需求增長迅
99、速,多元化趨勢顯著;同時,隨著傳播渠道的形式與數量直線增加,中心化傳播逐漸弱化,傳播碎片化加劇。新動能新內容。當前,直播、短視頻等新媒體內容成為主流,AR/VR/AMR 等新內容供給機制躍躍欲試。新方式。車載、家庭等多屏交互終端持續涌現,更有數字人等新交互技術加持。新業態。面對新的業務模式,媒體+政務/服務/商務等泛媒體組合出現了新的業務機會,內容逐漸成為一種新產品業態。比如金融媒體,基于專業的內容生產,為銀行、證券等金融機構提供垂類內容服務。4.1.1 泛媒體產業格局:應對新挑戰、把握新動能4.1 云智一體的視頻技術推動泛媒體產業升級泛媒體產業存在著用戶驅動、科技引領的三條增長曲線,不同的媒
100、體形態和媒體階段,都在這三條曲線上發展。信息化增長曲線為實現提質增效的目標,傳統廣電媒體正在做辦公、采編、傳播等環節的信息化轉型。網絡化增長曲線完成信息化升級的媒體機構,開始朝著網絡化新媒體矩陣方向發展,廣電、報業等諸多機構都在謀劃自己的新媒體矩陣,一些省市廣電傳媒希望打造出超級 APP,并嘗試通過 MCN 渠道來聚合更多內容。智能化增長曲線人工智能引領的產業轉型,產生了很多新的業務形態,既有內容+政務/服務/商務的新業務模式探索,也催生了更多內容的場景化服務。一些內容科技類企業把內容的全鏈條生產和全渠道分發作為立足點,為內容的供給方和消費方提供技術服務。4.1.2 泛媒體產業演進的三條增長曲
101、線(圖4.1.1-1 泛媒體產業的挑戰與動能)(圖4.1.2-1 泛媒體產業增長曲線)“云智一體”技術與應用解析系列白皮書 智能視頻篇3435定位及價值主張百度智能云依托云智一體的視頻云技術,致力于助力媒體機構的數智內容生產、打造極致體驗。智能媒體解決方案的定位如下:云智一體的媒體技術體系。百度智能云可為媒體機構提供包括智能媒資管理、智能生產創作和智慧經營等在內的云智一體技術方案,實現從內容生產到消費的全閉環技術體系。賦能產業三大升級。通過移動化、數字化升級,助力媒體業務獲得新的增長空間;打造高清互動的體驗,實現用戶體驗的新變革;推動媒體與服務模式升級,為媒體創新與探索更多元化、交互性更強的商
102、業機會提供技術支持。打造產業生態圈。百度智能云希望通過跟央媒、省市廣電等媒體機構以及頭部學校合作,探索產學研結合,提升媒體影響力,打造新型主流媒體、融媒體的大發展格局,實現媒體產業的可持續發展。4.1.3 智能媒體解決方案全景圖全景圖解析云智基礎設施。提供核心的視頻云能力及多種智能化場景技術,圍繞各類業務場景,打造媒體中臺體系。媒體 AI 中臺。通過智能內容匯聚與生產、智能媒資一體化,全面覆蓋媒體內容的策、采、編、審、發等全流程。媒體知識中臺?;诙嘣R圖譜,實現內容資產的知識化、資產化,將媒體自產和采購的海量內容進行標簽索引,形成結構化的內容資源庫。媒體經營中臺。所有媒體的內容生產都是為了
103、觸達受眾,實現傳播或者商業變現。百度有著豐富的多元化內容經營與分發經驗,助力媒體打造智能經營中臺體系。行業方案體系。在云智基礎設施和媒體中臺技術的加持下,構建智能媒資管理、智能內容生產及智能經營等行業級方案體系,覆蓋策采編審發等全流程,實現臺網端的全渠道觸達。同時,還可結合廣電、網絡、金融、文旅和體育等不同泛媒體領域的個性化場景,提供定制化解決方案。百度媒體生態體系。百度是一家有 20 多年經驗的信息服務類、搜索服務類企業,有著多年的媒體內容分發處理經驗,以及大量內容數據渠道和生態資源,能夠聯合內容合作伙伴,實現對整個泛媒體進行全鏈條、全渠道的智能化賦能。新媒體智能分發與運營?;诎俣戎R圖譜
104、,基于用戶數據洞察和知識圖譜化的內容資源,實現對用戶和內容的智能化理解,形成用戶畫像和內容庫,達到更加個性化、精準化的內容分發。同時,利用百度多年的內容流量生態運營經驗,結合人工智能技術,達到整個產業從內容生產到消費的全閉環,實現一體化運營。(圖4.1.3-1 智能媒體解決方案的定位及價值主張)(圖4.1.3-2 泛媒體產品和解決方案全景圖)“云智一體”技術與應用解析系列白皮書 智能視頻篇3435定位及價值主張百度智能云依托云智一體的視頻云技術,致力于助力媒體機構的數智內容生產、打造極致體驗。智能媒體解決方案的定位如下:云智一體的媒體技術體系。百度智能云可為媒體機構提供包括智能媒資管理、智能生
105、產創作和智慧經營等在內的云智一體技術方案,實現從內容生產到消費的全閉環技術體系。賦能產業三大升級。通過移動化、數字化升級,助力媒體業務獲得新的增長空間;打造高清互動的體驗,實現用戶體驗的新變革;推動媒體與服務模式升級,為媒體創新與探索更多元化、交互性更強的商業機會提供技術支持。打造產業生態圈。百度智能云希望通過跟央媒、省市廣電等媒體機構以及頭部學校合作,探索產學研結合,提升媒體影響力,打造新型主流媒體、融媒體的大發展格局,實現媒體產業的可持續發展。4.1.3 智能媒體解決方案全景圖全景圖解析云智基礎設施。提供核心的視頻云能力及多種智能化場景技術,圍繞各類業務場景,打造媒體中臺體系。媒體 AI
106、中臺。通過智能內容匯聚與生產、智能媒資一體化,全面覆蓋媒體內容的策、采、編、審、發等全流程。媒體知識中臺?;诙嘣R圖譜,實現內容資產的知識化、資產化,將媒體自產和采購的海量內容進行標簽索引,形成結構化的內容資源庫。媒體經營中臺。所有媒體的內容生產都是為了觸達受眾,實現傳播或者商業變現。百度有著豐富的多元化內容經營與分發經驗,助力媒體打造智能經營中臺體系。行業方案體系。在云智基礎設施和媒體中臺技術的加持下,構建智能媒資管理、智能內容生產及智能經營等行業級方案體系,覆蓋策采編審發等全流程,實現臺網端的全渠道觸達。同時,還可結合廣電、網絡、金融、文旅和體育等不同泛媒體領域的個性化場景,提供定制化
107、解決方案。百度媒體生態體系。百度是一家有 20 多年經驗的信息服務類、搜索服務類企業,有著多年的媒體內容分發處理經驗,以及大量內容數據渠道和生態資源,能夠聯合內容合作伙伴,實現對整個泛媒體進行全鏈條、全渠道的智能化賦能。新媒體智能分發與運營?;诎俣戎R圖譜,基于用戶數據洞察和知識圖譜化的內容資源,實現對用戶和內容的智能化理解,形成用戶畫像和內容庫,達到更加個性化、精準化的內容分發。同時,利用百度多年的內容流量生態運營經驗,結合人工智能技術,達到整個產業從內容生產到消費的全閉環,實現一體化運營。(圖4.1.3-1 智能媒體解決方案的定位及價值主張)(圖4.1.3-2 泛媒體產品和解決方案全景圖
108、)“云智一體”技術與應用解析系列白皮書 智能視頻篇3637廣電傳媒人民日報“創作大腦”。當前,廣電傳媒機構都在響應國家政策號召,打造新型主流媒體,實現融媒體轉型。百度智能云攜手人民日報推出“創作大腦”:一是通過 AI 技術提供智能寫作、AI 打標、在線快編等多樣的智能化生產工具,覆蓋人民日報的內容生產全場景,提升效率;二是對人民日報的海量信息,進行知識化和圖譜化處理,對整體存量資源進行標簽化索引,內容資源實現知識化和資產化,更好適用在媒體訂閱、新聞數據追蹤、熱門檢索和原創分析等生產分發場景中,提供最新熱門線索及覆蓋最廣的原創查重等數據服務;三是實現流量端的整合,百度的百家號、手機百度等媒體,融
109、合人民日報的人民號和超級APP,實現人民日報的公私流量整合,提升整體傳播效率?!皠撟鞔竽X”重點功能如下:直播剪輯工具:滿足了新媒體視頻生產中對新聞會議、活動直播中精彩、重要片段的“邊播邊剪”生產需求??稍谥辈h、活動錄制過程中,1 分鐘內完成短視頻內容生產,提升生產與發布效率,已經成為媒體高效制作短視頻的重要工具。新聞轉視頻工具:支持直接粘貼百家號、人民號、頭條號、企鵝號、微信號網頁鏈接等方式,自動生成視頻;支持上傳 word 文件自動生成視頻。主要應用在一些需要及時發布的場景中(有新聞通訊稿但來不及做成視頻)。只需把過往新聞稿件以 Word 方式或人民號生成的圖文信息,上傳鏈接或文檔至創作
110、大腦,就可以直接生成視頻,并發布在各種短視頻平臺,實現最快速的新聞視頻化傳播。視頻橫轉豎工具:該功能在多終端多渠道進行內容發布時,尤為重要。利用編碼和人工智能技術對視頻畫面進行處理,在確保最小壓縮比的情況下實現橫豎轉換,便于傳播和二次加工。同時對畫面主體人物進行智能識別,保證主要人物始終處于畫面中。視頻生產提效:視頻自動生成字幕文件、視頻片段轉 GIF、視頻大小自動適配壓縮等功能,能夠實現視頻素材的快速處理,一次生產、多終端發布。智能媒體資源庫:對剪輯素材文件進行多維 AI 分析,智能提取文件的標簽、畫面文字、語音及關鍵字等,提高文件的多次利用率。智能云盤:快捷剪輯出視頻關鍵片段,高效生產短視
111、頻;一鍵分享文件鏈接,更有加密、刪除分享、有效期設置,保證文件安全傳播。4.1.4 泛媒體客戶案例解析央視網“五智”人工智能編輯部。央視網有海量的視頻內容存儲,百度智能云從其早期媒資庫開始做標簽索引,對超過 200 萬小時的視頻做媒資化處理,基于媒體中臺打造了覆蓋策采編審發全流程的央視網人工智能編輯部實體與線上業務的全流程邏輯?;谶@套平臺,央視網開發了諸如“幫你找”等創新應用,方便采編人員、受眾都能快速通過央視網找到想要的視頻素材。同時,今年兩會期間,百度智能云與央視網合作推出虛擬數字人小 C,組織了“兩會 C+真探”的虛擬記者采訪項目,收到市場廣泛關注。(圖4.1.4-1 廣電傳媒案例)金
112、融行業:垂類信息和技術的智能化服務銀行、保險、證券等金融機構,需要大量專業化內容。百度智能云賦能垂類金融內容供應商,追蹤機構、行業等信息,對內容進行數據處理、標簽化和索引化,提供可定制化的金融輿情信息和可視化展現服務,結合機器自動生產技術,快速生產金融機構所需的內容。文旅行業:改善服務質量、提升用戶體驗文旅行業有很多存量視聽資源,并還在不斷生產。百度智能云聯合重點景區、博物館、愛國主義教育基地等機構,將人文與 AI 科技相結合,把景區影像資產數字化,基于 AI 知識圖譜做內容結構化連接,為消費者提供AI導游、AI引流、AI客服以及安全隱患預警等服務,改善了服務質量和游覽體驗,增加了營收能力,打
113、造了智慧文旅新基建標桿。攜手打造人民日報創作大腦“云智一體”技術與應用解析系列白皮書 智能視頻篇3637廣電傳媒人民日報“創作大腦”。當前,廣電傳媒機構都在響應國家政策號召,打造新型主流媒體,實現融媒體轉型。百度智能云攜手人民日報推出“創作大腦”:一是通過 AI 技術提供智能寫作、AI 打標、在線快編等多樣的智能化生產工具,覆蓋人民日報的內容生產全場景,提升效率;二是對人民日報的海量信息,進行知識化和圖譜化處理,對整體存量資源進行標簽化索引,內容資源實現知識化和資產化,更好適用在媒體訂閱、新聞數據追蹤、熱門檢索和原創分析等生產分發場景中,提供最新熱門線索及覆蓋最廣的原創查重等數據服務;三是實現
114、流量端的整合,百度的百家號、手機百度等媒體,融合人民日報的人民號和超級APP,實現人民日報的公私流量整合,提升整體傳播效率?!皠撟鞔竽X”重點功能如下:直播剪輯工具:滿足了新媒體視頻生產中對新聞會議、活動直播中精彩、重要片段的“邊播邊剪”生產需求??稍谥辈h、活動錄制過程中,1 分鐘內完成短視頻內容生產,提升生產與發布效率,已經成為媒體高效制作短視頻的重要工具。新聞轉視頻工具:支持直接粘貼百家號、人民號、頭條號、企鵝號、微信號網頁鏈接等方式,自動生成視頻;支持上傳 word 文件自動生成視頻。主要應用在一些需要及時發布的場景中(有新聞通訊稿但來不及做成視頻)。只需把過往新聞稿件以 Word 方
115、式或人民號生成的圖文信息,上傳鏈接或文檔至創作大腦,就可以直接生成視頻,并發布在各種短視頻平臺,實現最快速的新聞視頻化傳播。視頻橫轉豎工具:該功能在多終端多渠道進行內容發布時,尤為重要。利用編碼和人工智能技術對視頻畫面進行處理,在確保最小壓縮比的情況下實現橫豎轉換,便于傳播和二次加工。同時對畫面主體人物進行智能識別,保證主要人物始終處于畫面中。視頻生產提效:視頻自動生成字幕文件、視頻片段轉 GIF、視頻大小自動適配壓縮等功能,能夠實現視頻素材的快速處理,一次生產、多終端發布。智能媒體資源庫:對剪輯素材文件進行多維 AI 分析,智能提取文件的標簽、畫面文字、語音及關鍵字等,提高文件的多次利用率。
116、智能云盤:快捷剪輯出視頻關鍵片段,高效生產短視頻;一鍵分享文件鏈接,更有加密、刪除分享、有效期設置,保證文件安全傳播。4.1.4 泛媒體客戶案例解析央視網“五智”人工智能編輯部。央視網有海量的視頻內容存儲,百度智能云從其早期媒資庫開始做標簽索引,對超過 200 萬小時的視頻做媒資化處理,基于媒體中臺打造了覆蓋策采編審發全流程的央視網人工智能編輯部實體與線上業務的全流程邏輯?;谶@套平臺,央視網開發了諸如“幫你找”等創新應用,方便采編人員、受眾都能快速通過央視網找到想要的視頻素材。同時,今年兩會期間,百度智能云與央視網合作推出虛擬數字人小 C,組織了“兩會 C+真探”的虛擬記者采訪項目,收到市場
117、廣泛關注。(圖4.1.4-1 廣電傳媒案例)金融行業:垂類信息和技術的智能化服務銀行、保險、證券等金融機構,需要大量專業化內容。百度智能云賦能垂類金融內容供應商,追蹤機構、行業等信息,對內容進行數據處理、標簽化和索引化,提供可定制化的金融輿情信息和可視化展現服務,結合機器自動生產技術,快速生產金融機構所需的內容。文旅行業:改善服務質量、提升用戶體驗文旅行業有很多存量視聽資源,并還在不斷生產。百度智能云聯合重點景區、博物館、愛國主義教育基地等機構,將人文與 AI 科技相結合,把景區影像資產數字化,基于 AI 知識圖譜做內容結構化連接,為消費者提供AI導游、AI引流、AI客服以及安全隱患預警等服務
118、,改善了服務質量和游覽體驗,增加了營收能力,打造了智慧文旅新基建標桿。攜手打造人民日報創作大腦“云智一體”技術與應用解析系列白皮書 智能視頻篇3839內容和用戶是互聯網企業增長的核心要素。百度智能云助力優質內容生產者,深入垂類賽道,用 AI技術降低碼率、提升畫質,以低成本分發的方式,精準觸達到目標受眾群,形成裂變增長。云智一體的智能視頻云 3.0 平臺可為互聯網企業提供四大視頻解決方案,幫助企業提升內容生產效率,拉動創新內容的產量,優化視頻質量,提升用戶體驗,實現降本增效。4.2 云智一體的視頻技術推動泛互聯網產業升級智能小視頻一站式解決方案,提供全套智能視頻拍攝工具,在拍攝器上提供 100+
119、的 AR 技術拍攝編輯玩法。通過一站式工作流,直接將拍攝視頻傳輸至存儲系統,進行媒資管理、視頻處理與審核、以及發布與分發加速。同時,APP 樣本及服務端部分代碼開放給用戶,可根據自身需求定制開發,快速打造視頻應用。4.2.1 智能小視頻解決方案:快速上線視頻業務體育行業:全場景、全流程智能化百度智能云抓取足球領域各大聯賽與杯賽的賽事與球員信息,結合 AI 拆條、人臉識別等技術,為體育媒體機構提供從賽前的歷史數據分析、知識圖譜化檢索,球員信息梳理等服務,到賽中的 AI 實時拆條、實時精彩鏡頭、敏感信息報警、戰術分析洞察等服務,再到賽后的賽事集錦、數據對比等服務。(圖4.1.4-2 體育行業案例)
120、(圖4.2-1 泛互聯網的四大視頻解決方案)四大解決方案,帶來視頻體驗與效率升級“云智一體”技術與應用解析系列白皮書 智能視頻篇3839內容和用戶是互聯網企業增長的核心要素。百度智能云助力優質內容生產者,深入垂類賽道,用 AI技術降低碼率、提升畫質,以低成本分發的方式,精準觸達到目標受眾群,形成裂變增長。云智一體的智能視頻云 3.0 平臺可為互聯網企業提供四大視頻解決方案,幫助企業提升內容生產效率,拉動創新內容的產量,優化視頻質量,提升用戶體驗,實現降本增效。4.2 云智一體的視頻技術推動泛互聯網產業升級智能小視頻一站式解決方案,提供全套智能視頻拍攝工具,在拍攝器上提供 100+的 AR 技術
121、拍攝編輯玩法。通過一站式工作流,直接將拍攝視頻傳輸至存儲系統,進行媒資管理、視頻處理與審核、以及發布與分發加速。同時,APP 樣本及服務端部分代碼開放給用戶,可根據自身需求定制開發,快速打造視頻應用。4.2.1 智能小視頻解決方案:快速上線視頻業務體育行業:全場景、全流程智能化百度智能云抓取足球領域各大聯賽與杯賽的賽事與球員信息,結合 AI 拆條、人臉識別等技術,為體育媒體機構提供從賽前的歷史數據分析、知識圖譜化檢索,球員信息梳理等服務,到賽中的 AI 實時拆條、實時精彩鏡頭、敏感信息報警、戰術分析洞察等服務,再到賽后的賽事集錦、數據對比等服務。(圖4.1.4-2 體育行業案例)(圖4.2-1
122、 泛互聯網的四大視頻解決方案)四大解決方案,帶來視頻體驗與效率升級“云智一體”技術與應用解析系列白皮書 智能視頻篇4041以其中的智能視頻拍攝器為例。它為短視頻及相關垂直行業的 UGC/PGC 場景,提供移動端采編傳的視頻內容創作工具 SDK,內置美顏美體、人臉識別、肢體動作識別及場景特效等 100 多種技術能力,可對視頻做雙語字幕等多種編輯操作,為直播場景提供移動端推流工具,支持單向直播和互動連麥。全鏈路編解碼優化解決方案,基于采集端的 BD265 方案,兼容軟硬編碼能力,相比 H265 編碼,節省 50%的碼率或提升質量 2db。在服務端,結合 BD265 及智感超清 AI 能力,提升畫質
123、并降低碼率,節省傳輸帶寬和存儲成本。在播放端,提供實時視頻增強 SDK 技術,同碼率情況下,大幅提升視頻畫質,提升主觀體驗。4.2.2 全鏈路編解碼優化方案:降低成本、提升畫質(圖4.2.1-1 智能小視頻解決方案)(圖4.2.1-2 智能視頻拍攝器)(圖4.2.2-1 全鏈路編解碼方案)云直播服務媒資處理與管理媒資管理媒資編目媒資查詢人工審核媒資封禁媒資發布媒資生命周期管理媒資管理格式轉碼抽幀前后貼片疊加水印黑邊裁剪圖像增強圖像超分轉碼處理內容識別自動分類標簽提取智能封面智能分析色情暴恐涉政廣告智能審核指紋提取指紋比對人工復查重復刪除視頻去重原創庫創建視頻比對原創檢測非原創駁回大數據服務用戶
124、模型內容模型策略制定個性化推薦媒資數據處理任務數據分發播放數據運營數據內容數據業務方用戶數據百度用戶畫像數據APP端美顏濾鏡視頻編輯文件上傳互動特效編碼合流直播推流視頻拍攝器播放/暫停/拖動彈幕AR/VR播放廣告播放器SDK標題數據量FEED展現視頻封面圖數據采集數據上報數據埋點廣告展現與播放智能化,高體驗端到端解決方案,幫助用戶1天快速搭建短視頻/直播業務一站式,高效率開放性,個性化智能小視頻解決方案,幫助快速上線視頻業務智能視頻拍攝器,移動端視頻內容創作利器“云智一體”技術與應用解析系列白皮書 智能視頻篇4041以其中的智能視頻拍攝器為例。它為短視頻及相關垂直行業的 UGC/PGC 場景,
125、提供移動端采編傳的視頻內容創作工具 SDK,內置美顏美體、人臉識別、肢體動作識別及場景特效等 100 多種技術能力,可對視頻做雙語字幕等多種編輯操作,為直播場景提供移動端推流工具,支持單向直播和互動連麥。全鏈路編解碼優化解決方案,基于采集端的 BD265 方案,兼容軟硬編碼能力,相比 H265 編碼,節省 50%的碼率或提升質量 2db。在服務端,結合 BD265 及智感超清 AI 能力,提升畫質并降低碼率,節省傳輸帶寬和存儲成本。在播放端,提供實時視頻增強 SDK 技術,同碼率情況下,大幅提升視頻畫質,提升主觀體驗。4.2.2 全鏈路編解碼優化方案:降低成本、提升畫質(圖4.2.1-1 智能
126、小視頻解決方案)(圖4.2.1-2 智能視頻拍攝器)(圖4.2.2-1 全鏈路編解碼方案)云直播服務媒資處理與管理媒資管理媒資編目媒資查詢人工審核媒資封禁媒資發布媒資生命周期管理媒資管理格式轉碼抽幀前后貼片疊加水印黑邊裁剪圖像增強圖像超分轉碼處理內容識別自動分類標簽提取智能封面智能分析色情暴恐涉政廣告智能審核指紋提取指紋比對人工復查重復刪除視頻去重原創庫創建視頻比對原創檢測非原創駁回大數據服務用戶模型內容模型策略制定個性化推薦媒資數據處理任務數據分發播放數據運營數據內容數據業務方用戶數據百度用戶畫像數據APP端美顏濾鏡視頻編輯文件上傳互動特效編碼合流直播推流視頻拍攝器播放/暫停/拖動彈幕AR/
127、VR播放廣告播放器SDK標題數據量FEED展現視頻封面圖數據采集數據上報數據埋點廣告展現與播放智能化,高體驗端到端解決方案,幫助用戶1天快速搭建短視頻/直播業務一站式,高效率開放性,個性化智能小視頻解決方案,幫助快速上線視頻業務智能視頻拍攝器,移動端視頻內容創作利器“云智一體”技術與應用解析系列白皮書 智能視頻篇4243新零售的直播 SaaS 解決方案,幫助網紅主播、實體門店、家電家居、房地產、汽車、品牌廠商、微商電商等開啟新零售導購直播。通過一鍵式導購直播能力,提升用戶觸達率,實現線上營銷變現和裂變引流,獲得更多的轉化;提供分銷系統,實現訂單追蹤,保證用戶的歸屬和轉化;具有數據分析能力,幫助
128、用戶做出直播決策。4.2.3 新零售直播SaaS解決方案:助力商家裂變獲客、流量變現以私域流量運營為例。百度智能云幫助用戶構建私域流量池,通過直播方案,先找到用戶的種子客戶,轉化為老客戶或潛在客戶;再通過激勵措施,讓這些老客戶去分享帶動新用戶進來,留存新用戶并形成轉化,最終形成自生長造血系統運營。在線社交解決方案支持 IM 聊天、實時音視頻通話以及虛擬 AI 技術等三位一體的技術能力組合,可幫助用戶打造文字、語音、視頻等社交屬性內容,并可使用動畫制作功能,讓用戶去打造獨一無二的虛擬形象,以真人實時驅動,構造定制化 IP。4.2.4 在線社交解決方案以 BD265 終端解碼策略為例。支持 H26
129、5 解碼的機型覆蓋率超過 90%+,手機端普及 H265 的條件非常成熟。而 BD265 手機端解碼產品在具備與 H265 同等條件下,相比 H265 碼率節省 35%,通知支持降級解碼,確保 99.9%+的解碼成功率,保證整個終端播放的成功率,提升用戶體驗。(圖4.2.3-2 私域流量運營)(圖4.2.2-2 BD265終端解碼策略)(圖4.2.4-1 在線社交解決方案)(圖4.2.3-1 新零售直播SaaS解決方案)“云智一體”技術與應用解析系列白皮書 智能視頻篇4243新零售的直播 SaaS 解決方案,幫助網紅主播、實體門店、家電家居、房地產、汽車、品牌廠商、微商電商等開啟新零售導購直播
130、。通過一鍵式導購直播能力,提升用戶觸達率,實現線上營銷變現和裂變引流,獲得更多的轉化;提供分銷系統,實現訂單追蹤,保證用戶的歸屬和轉化;具有數據分析能力,幫助用戶做出直播決策。4.2.3 新零售直播SaaS解決方案:助力商家裂變獲客、流量變現以私域流量運營為例。百度智能云幫助用戶構建私域流量池,通過直播方案,先找到用戶的種子客戶,轉化為老客戶或潛在客戶;再通過激勵措施,讓這些老客戶去分享帶動新用戶進來,留存新用戶并形成轉化,最終形成自生長造血系統運營。在線社交解決方案支持 IM 聊天、實時音視頻通話以及虛擬 AI 技術等三位一體的技術能力組合,可幫助用戶打造文字、語音、視頻等社交屬性內容,并可
131、使用動畫制作功能,讓用戶去打造獨一無二的虛擬形象,以真人實時驅動,構造定制化 IP。4.2.4 在線社交解決方案以 BD265 終端解碼策略為例。支持 H265 解碼的機型覆蓋率超過 90%+,手機端普及 H265 的條件非常成熟。而 BD265 手機端解碼產品在具備與 H265 同等條件下,相比 H265 碼率節省 35%,通知支持降級解碼,確保 99.9%+的解碼成功率,保證整個終端播放的成功率,提升用戶體驗。(圖4.2.3-2 私域流量運營)(圖4.2.2-2 BD265終端解碼策略)(圖4.2.4-1 在線社交解決方案)(圖4.2.3-1 新零售直播SaaS解決方案)“云智一體”技術與
132、應用解析系列白皮書 智能視頻篇4445智感超清幫助“得物 APP”大幅提升視頻畫質體驗得物 App 是新一代潮流網購社區,聚集了新、潮、酷、炫的各類商品,也是各類潮流品牌發售和運營的首選陣地。用戶痛點是 PGC/UGC 上傳的短視頻畫質清晰度偏低,影響用戶播放體驗。百度智能云為低于 720P 的視頻超分至 720P?;谥歉谐褰鉀Q方案,PGC/UGC 上傳的短視頻全量上線,視頻畫質大幅提升,用戶觀感體驗獲得好評。為“好看視頻/全民小視頻”提供全鏈路處理分發服務好看視頻,是一個為用戶提供海量優質短視頻內容的專業聚合平臺。全民小視頻 App 覆蓋多種類型的小視頻,用戶可以發布小視頻分享、記錄生活
133、,支持大眼瘦臉美顏和各種貼紙等功能。兩款視頻應用都是全面基于視頻全鏈路處理分發平臺來構建的,從視頻拍攝、音視頻處理、理解分析等都是基于整個平臺來構建的,大幅提升視頻畫質,提升主觀體驗,節省用戶的傳輸帶寬和存儲成本。賦能快手為全球用戶提高優質的點播/直播體驗快手是國內最大短/直播視頻平臺之一,百度智能云為快手提供 BOS、CDN、LSS 等云服務,為快手全球數億用戶提供海量視頻隨時隨地快速訪問能力,讓用戶體驗好的直播感受,真正實現了端邊云一體的使用體驗。百度智能云 BOS 結合遍布全球的 CDN 節點,為快手提供海量的圖片和短視頻處理需求加速服務。百度智能云為快手提供一站式直播 LSS 解決方案
134、,智能優化鏈路,為受眾帶來高清、流暢、低延時的游戲直播,以及性能穩定的短視頻、點播回看。4.2.5 泛互聯網客戶案例解析百度智能視頻云基于端邊云一體的基礎架構,以“平臺+數據”為主導,滿足泛產業的業務系統對接和數據平臺化等需求。4.3 云智一體的視頻技術推動泛產業的視頻場景升級視頻作為人類最直接、最容易感知世界的一種方式,廣泛應用在日常生活和工作中,最喜聞樂見的視頻場景主要是在傳媒業、娛樂業等大眾消費領域,此類視頻應用場景實際上是將一些結果化信息、知識信息轉化為多媒體形式,便于受眾體驗,提升與受眾的互動傳播性。而對于產業類視頻來說,主要是服務于業務場景。因此,信息的轉化過程恰恰相反,是通過視頻
135、解析技術等,將視頻進行結構化處理,把其中的知識信息以結構化形式提取出來,為企業業務提供決策依據。4.3.1 產業類視頻與消費類視頻的區別信息轉化互動傳播采集傳播處理短視頻視頻客服直播營銷AR/VR虛擬主播信息轉化互動傳播視頻結構化視頻信息化智能會議業務視頻大數據視頻管理視頻構建視頻解析AI結構化信息-視頻視頻-結構化信息消費類視頻智能視頻云3.0產業類視頻(圖4.3.1-1 產業類視頻與消費類視頻的區別)“云智一體”技術與應用解析系列白皮書 智能視頻篇4445智感超清幫助“得物 APP”大幅提升視頻畫質體驗得物 App 是新一代潮流網購社區,聚集了新、潮、酷、炫的各類商品,也是各類潮流品牌發售
136、和運營的首選陣地。用戶痛點是 PGC/UGC 上傳的短視頻畫質清晰度偏低,影響用戶播放體驗。百度智能云為低于 720P 的視頻超分至 720P?;谥歉谐褰鉀Q方案,PGC/UGC 上傳的短視頻全量上線,視頻畫質大幅提升,用戶觀感體驗獲得好評。為“好看視頻/全民小視頻”提供全鏈路處理分發服務好看視頻,是一個為用戶提供海量優質短視頻內容的專業聚合平臺。全民小視頻 App 覆蓋多種類型的小視頻,用戶可以發布小視頻分享、記錄生活,支持大眼瘦臉美顏和各種貼紙等功能。兩款視頻應用都是全面基于視頻全鏈路處理分發平臺來構建的,從視頻拍攝、音視頻處理、理解分析等都是基于整個平臺來構建的,大幅提升視頻畫質,提升
137、主觀體驗,節省用戶的傳輸帶寬和存儲成本。賦能快手為全球用戶提高優質的點播/直播體驗快手是國內最大短/直播視頻平臺之一,百度智能云為快手提供 BOS、CDN、LSS 等云服務,為快手全球數億用戶提供海量視頻隨時隨地快速訪問能力,讓用戶體驗好的直播感受,真正實現了端邊云一體的使用體驗。百度智能云 BOS 結合遍布全球的 CDN 節點,為快手提供海量的圖片和短視頻處理需求加速服務。百度智能云為快手提供一站式直播 LSS 解決方案,智能優化鏈路,為受眾帶來高清、流暢、低延時的游戲直播,以及性能穩定的短視頻、點播回看。4.2.5 泛互聯網客戶案例解析百度智能視頻云基于端邊云一體的基礎架構,以“平臺+數據
138、”為主導,滿足泛產業的業務系統對接和數據平臺化等需求。4.3 云智一體的視頻技術推動泛產業的視頻場景升級視頻作為人類最直接、最容易感知世界的一種方式,廣泛應用在日常生活和工作中,最喜聞樂見的視頻場景主要是在傳媒業、娛樂業等大眾消費領域,此類視頻應用場景實際上是將一些結果化信息、知識信息轉化為多媒體形式,便于受眾體驗,提升與受眾的互動傳播性。而對于產業類視頻來說,主要是服務于業務場景。因此,信息的轉化過程恰恰相反,是通過視頻解析技術等,將視頻進行結構化處理,把其中的知識信息以結構化形式提取出來,為企業業務提供決策依據。4.3.1 產業類視頻與消費類視頻的區別信息轉化互動傳播采集傳播處理短視頻視頻
139、客服直播營銷AR/VR虛擬主播信息轉化互動傳播視頻結構化視頻信息化智能會議業務視頻大數據視頻管理視頻構建視頻解析AI結構化信息-視頻視頻-結構化信息消費類視頻智能視頻云3.0產業類視頻(圖4.3.1-1 產業類視頻與消費類視頻的區別)“云智一體”技術與應用解析系列白皮書 智能視頻篇4647針對視聯網平臺第三發展階段,百度智能云推出了視聯網感知平臺解決方案,該平臺屬于閉環性架構。接入側是完全開放模式,可兼容業內 10 余種的主流協議,市場上的主流終端都可以便捷的接入到平臺。另外,還給廠商開放一些百度自研的 SDK 能力,其可快速和平臺對接,實現統一管理。百度智能云還推出了度目等一體化智能終端,在
140、端側實現 AI 能力落地。視頻接入之后,視頻管理平臺可以提供 20 多種視頻處理能力,而在應用商城上有 200 種+AI 能力,可實現對多種視頻場景的覆蓋和解析。解析出來的結構化數據,會沉淀到 AI 平臺EasyDL,再利用這些數據產生豐富的、滿足業務場景化需求的 AI 算子。算子發布到大數據平臺,可為上層業務應用進行賦能。4.3.3 百度智能云視聯網感知平臺(圖4.3.2-1 泛產業視聯網發展趨勢)(圖4.3.3-1 視聯網感知平臺架構)視頻管理階段該階段以硬件廠商為主導,提供簡單的視頻管理應用,服務場景主要是視頻存管看等基礎問題,服務廠商主要是傳統設備商。這個階段雖然能滿足企業的視頻管理等
141、基礎需求,但缺乏智能化手段,主要還是人工來完成流程操作,因而相對來說整體管理效率較為低下。視頻智能階段隨著 AI 技術的發展,AI 廠商通過旁路方式,把 AI 應用賦能到視頻管理平臺上,通過智能化手段提升視頻理解能力,解決了視頻“能看懂”的問題。這個階段主要是 AI 能力主導,采用人臉、人體、車輛等 AI 基礎應用來實現智能化改造。視聯網平臺階段視聯網發展到上一階段,雖然很多需求通過 AI 應用得到了滿足,但這種組合化、智能旁路的思路,也帶來了應用碎片化的問題,企業或政府要想針對不斷涌現的業務應用需求做長期、可持續的規劃與投入,難度較大。因此,為了滿足業務發展過程中不斷涌現的各類應用和場景需求
142、,企業需要打造具備長期規劃和投入屬性的平臺,這便進入第三階段視頻網平臺階段。在該階段,平臺端與應用端充分融合,形成一個可與應用和業務快速對接、提供豐富數據服務的能力平臺。企業、政府都可以利用該平臺做長期規劃和價值投資,將整體業務都跑在平臺上,構建豐富的場景化應用體系。綜合來看,泛產業場景視聯網的未來發展趨勢:一是以應用服務為中心,更加貼近業務,業務需求也會水漲船高;二是以數據服務為平臺,滿足各種業務發展和決策的數據需求;三是在云側實現平臺化和數據化,在邊側依托 AI 技術實現場景化融合,在端側融合物聯網和視聯網,實現更多數據的匯聚與處理。4.3.2 視聯網發展的三大階段“云智一體”技術與應用解
143、析系列白皮書 智能視頻篇4647針對視聯網平臺第三發展階段,百度智能云推出了視聯網感知平臺解決方案,該平臺屬于閉環性架構。接入側是完全開放模式,可兼容業內 10 余種的主流協議,市場上的主流終端都可以便捷的接入到平臺。另外,還給廠商開放一些百度自研的 SDK 能力,其可快速和平臺對接,實現統一管理。百度智能云還推出了度目等一體化智能終端,在端側實現 AI 能力落地。視頻接入之后,視頻管理平臺可以提供 20 多種視頻處理能力,而在應用商城上有 200 種+AI 能力,可實現對多種視頻場景的覆蓋和解析。解析出來的結構化數據,會沉淀到 AI 平臺EasyDL,再利用這些數據產生豐富的、滿足業務場景化
144、需求的 AI 算子。算子發布到大數據平臺,可為上層業務應用進行賦能。4.3.3 百度智能云視聯網感知平臺(圖4.3.2-1 泛產業視聯網發展趨勢)(圖4.3.3-1 視聯網感知平臺架構)視頻管理階段該階段以硬件廠商為主導,提供簡單的視頻管理應用,服務場景主要是視頻存管看等基礎問題,服務廠商主要是傳統設備商。這個階段雖然能滿足企業的視頻管理等基礎需求,但缺乏智能化手段,主要還是人工來完成流程操作,因而相對來說整體管理效率較為低下。視頻智能階段隨著 AI 技術的發展,AI 廠商通過旁路方式,把 AI 應用賦能到視頻管理平臺上,通過智能化手段提升視頻理解能力,解決了視頻“能看懂”的問題。這個階段主要
145、是 AI 能力主導,采用人臉、人體、車輛等 AI 基礎應用來實現智能化改造。視聯網平臺階段視聯網發展到上一階段,雖然很多需求通過 AI 應用得到了滿足,但這種組合化、智能旁路的思路,也帶來了應用碎片化的問題,企業或政府要想針對不斷涌現的業務應用需求做長期、可持續的規劃與投入,難度較大。因此,為了滿足業務發展過程中不斷涌現的各類應用和場景需求,企業需要打造具備長期規劃和投入屬性的平臺,這便進入第三階段視頻網平臺階段。在該階段,平臺端與應用端充分融合,形成一個可與應用和業務快速對接、提供豐富數據服務的能力平臺。企業、政府都可以利用該平臺做長期規劃和價值投資,將整體業務都跑在平臺上,構建豐富的場景化
146、應用體系。綜合來看,泛產業場景視聯網的未來發展趨勢:一是以應用服務為中心,更加貼近業務,業務需求也會水漲船高;二是以數據服務為平臺,滿足各種業務發展和決策的數據需求;三是在云側實現平臺化和數據化,在邊側依托 AI 技術實現場景化融合,在端側融合物聯網和視聯網,實現更多數據的匯聚與處理。4.3.2 視聯網發展的三大階段“云智一體”技術與應用解析系列白皮書 智能視頻篇4849全目標感知服務。相比于單一算子只能提供事件解析,不能提供更豐富數據的局限性,百度智能云視聯網感知平臺可提供全目標感知服務,基于一張圖即可解析出人臉、人體、車輛以及其他關聯性信息,支持深度關系數據的挖掘。比如在疫情期間,快速追蹤
147、到可能的密接者并獲取關聯信息,支持疫情防控的復雜性決策,這便是全目標感知服務的應用之一。特點一:智能覆蓋多行業和場景的智能視覺分析能力。視聯網感知平臺依托百度自研的全棧式 AI 平臺能力,可為多種視頻場景提供智能化視覺應用。常見如針對人臉/人體/車輛,有豐富的特征值信息,并可提供庫查詢,還具備視頻修復能力,提升整體視頻的理解能力。目前,應用已覆蓋交通、能源、城市治理和農林等各類主流的業務場景。4.3.4 視聯網感知平臺架構的三大特點高質量快捷閉環的算子生產應用。在一些產業視頻場景中,很多需求和應用較為復雜,通用算法無法完全滿足這些場景化需求。而基于百度 AI 生產能力的視聯網感知平臺,可以高質
148、量的、快捷閉環的產生算子。將獲取的數據在 EasyDL 平臺上進行模型訓練,整個過程可零代碼方式快速實現。再將訓練出的算子發布到視聯網感知平臺,通過應用的開發和集成,實現在硬件上的快速部署。另外,應用發布之后,可通過模型評測機制,實現數據和算子質量的評測。(圖4.3.4-1 視聯網感知平臺覆蓋多行業和場景智能視覺分析能力)(圖4.3.4-3 高質量快捷閉環的算子生產)(圖4.3.4-2 全目標感知服務)“云智一體”技術與應用解析系列白皮書 智能視頻篇4849全目標感知服務。相比于單一算子只能提供事件解析,不能提供更豐富數據的局限性,百度智能云視聯網感知平臺可提供全目標感知服務,基于一張圖即可解
149、析出人臉、人體、車輛以及其他關聯性信息,支持深度關系數據的挖掘。比如在疫情期間,快速追蹤到可能的密接者并獲取關聯信息,支持疫情防控的復雜性決策,這便是全目標感知服務的應用之一。特點一:智能覆蓋多行業和場景的智能視覺分析能力。視聯網感知平臺依托百度自研的全棧式 AI 平臺能力,可為多種視頻場景提供智能化視覺應用。常見如針對人臉/人體/車輛,有豐富的特征值信息,并可提供庫查詢,還具備視頻修復能力,提升整體視頻的理解能力。目前,應用已覆蓋交通、能源、城市治理和農林等各類主流的業務場景。4.3.4 視聯網感知平臺架構的三大特點高質量快捷閉環的算子生產應用。在一些產業視頻場景中,很多需求和應用較為復雜,
150、通用算法無法完全滿足這些場景化需求。而基于百度 AI 生產能力的視聯網感知平臺,可以高質量的、快捷閉環的產生算子。將獲取的數據在 EasyDL 平臺上進行模型訓練,整個過程可零代碼方式快速實現。再將訓練出的算子發布到視聯網感知平臺,通過應用的開發和集成,實現在硬件上的快速部署。另外,應用發布之后,可通過模型評測機制,實現數據和算子質量的評測。(圖4.3.4-1 視聯網感知平臺覆蓋多行業和場景智能視覺分析能力)(圖4.3.4-3 高質量快捷閉環的算子生產)(圖4.3.4-2 全目標感知服務)“云智一體”技術與應用解析系列白皮書 智能視頻篇5051端邊云融合視聯網感知平臺在資源層、數據層、感知層等
151、三方面進行了全面的端邊云融合。在端側部署了算力和算子,快捷獲取數據。在邊緣側按場景實現邊緣閉環,業務響應快捷。在云側將關鍵信息和數據傳送到云端,實現數據的匯聚與解析,為業務提供更加云化和平臺化的服務,打造更多的業務場景應用。首推融合邊緣架構,實現全域最優成本全接入。視聯網的構建相對復雜,網絡和物理位置都非常分散,從而也導致網絡和存儲成本較高。百度智能云在業內首推“融合邊緣架構”的概念,實現在整個終端移動端上匯集邊緣、CDN 邊緣、云邊緣等,實現整體資源的統一管理,實現視頻內容的就近處理,快速響應,同時節省帶寬,拉低整體成本。開放平臺能力開放端云協同:開放整個端云協同 SDK 與 AI SDK,
152、設備廠商可便捷的配置終端設備,實現終端統一管理、快速注冊,實現低延遲的高質量連接和 AI 應用端云協同。在公網環境下,可達到百 ms 級延遲,SDK 兼容多平臺。開放平臺模塊:視聯網平臺模塊化開放服務,應用實現快速對接構建,并利用 PaaS 能力快速迭代,無需關注底層資源和運維能力,提升 SaaS 開發效率,解耦應用對平臺資源的配置管理。開放數據服務:通過 AI 能力構建數據關系數據引擎,提供豐富的數據服務 API 和模式,AI 開發平臺實現協同,提升 AI 應用質量和場景化落地。(圖4.3.4-4 視聯網感知平臺的端邊云融合架構)(圖4.3.4-5 融合邊緣架構)(圖4.3.4-6開放平臺能
153、力)首推融合邊緣架構,實現全域最優成本全接入“云智一體”技術與應用解析系列白皮書 智能視頻篇5051端邊云融合視聯網感知平臺在資源層、數據層、感知層等三方面進行了全面的端邊云融合。在端側部署了算力和算子,快捷獲取數據。在邊緣側按場景實現邊緣閉環,業務響應快捷。在云側將關鍵信息和數據傳送到云端,實現數據的匯聚與解析,為業務提供更加云化和平臺化的服務,打造更多的業務場景應用。首推融合邊緣架構,實現全域最優成本全接入。視聯網的構建相對復雜,網絡和物理位置都非常分散,從而也導致網絡和存儲成本較高。百度智能云在業內首推“融合邊緣架構”的概念,實現在整個終端移動端上匯集邊緣、CDN 邊緣、云邊緣等,實現整
154、體資源的統一管理,實現視頻內容的就近處理,快速響應,同時節省帶寬,拉低整體成本。開放平臺能力開放端云協同:開放整個端云協同 SDK 與 AI SDK,設備廠商可便捷的配置終端設備,實現終端統一管理、快速注冊,實現低延遲的高質量連接和 AI 應用端云協同。在公網環境下,可達到百 ms 級延遲,SDK 兼容多平臺。開放平臺模塊:視聯網平臺模塊化開放服務,應用實現快速對接構建,并利用 PaaS 能力快速迭代,無需關注底層資源和運維能力,提升 SaaS 開發效率,解耦應用對平臺資源的配置管理。開放數據服務:通過 AI 能力構建數據關系數據引擎,提供豐富的數據服務 API 和模式,AI 開發平臺實現協同
155、,提升 AI 應用質量和場景化落地。(圖4.3.4-4 視聯網感知平臺的端邊云融合架構)(圖4.3.4-5 融合邊緣架構)(圖4.3.4-6開放平臺能力)首推融合邊緣架構,實現全域最優成本全接入“云智一體”技術與應用解析系列白皮書 智能視頻篇5253點軍區的“點軍”二字,來源于三國,關羽在此練兵而得名。這里距離三峽大壩 47 公里,區域面積 530 平方公里,包括城區、鄉鎮、以及農村等三種生態的綜合性區域。20192020 年是黑天鵝事件頻發的 2 年,從疫情防控到環境保護、鄉村振興和產業升級,點軍區政府正面對著史無前例的變化性需求和挑戰:公共衛生:如何實現更高效、更智能化的疫情管控?鄉村振興
156、:面向鄉村振興的國家戰略,該如何落實?該如何讓偏遠地區的百姓有安全感、獲得感和幸福感?基礎醫療:如何讓偏遠地區基礎醫療更加普及?環境保護:如何讓環境保護變得更加智能化?面對這些挑戰,宜昌點軍區聯合百度智能云,融合視聯網平臺、算力平臺、物聯網平臺、大數據平臺的全域數字化服務,打造區域性運營平臺。用 50P 算力在視聯網平臺和物聯網平臺上構建豐富的業務場景應用,助力城市智能產業區域的社會治理和經濟發展。4.3.5 產業類客戶案例解析“50P 算力+1 個視聯網平臺+1 個物聯網平臺+N 個應用”的區域性運營平臺系統,正在被點軍區20 個政府部門使用,服務于 20 萬常住人口。平臺滿足了點軍區政府對
157、城市治理和民生服務的各類需求,避免了重復建設,極大降低了政府投入成本。取得的階段成效舉例如下:公共衛生:實現對疫情等突發性事件的及時響應,比如疫情爆發城市封閉,第一時間找到被滯留在高速路上的高危運輸車輛;通過跟蹤藥品銷售以及用藥人群的分布趨勢來預測流行病。鄉村振興:很多偏遠地區消防車無法立即到達現場,意外火災的處置是一個難題。點軍區在這些地區架設物聯網專網和傳感器預警系統,不斷加強偏遠地區意外火災防范能力,達到異常情況下秒級預警,激活鄰里救助。為了讓孤寡老人生活更安心,通過物聯網專網和智能床墊,對老人夜間的異常健康情況進行監測,為老人提供健康保障。為了讓百姓生活更便捷,通過物聯網專網實現在線繳
158、納水費、電費?;A醫療:使用人工智能眼底監測設備,深入農村地區衛生所,對慢性病患者進行早期篩查,讓村民能夠盡早治療,過上更健康的生活。環境保護:長江生態大保護實行十年禁漁禁捕,通過大數據構建非法捕撈行為的人工智能模型,同步結合人臉識別,鎖定非法捕撈群體。城市治理:通過人工智能視覺系統,跟蹤建筑材料運輸過程,從源頭打擊違章建筑。(圖4.3.5-1 點軍區平臺落地實踐)“云智一體”技術與應用解析系列白皮書 智能視頻篇5253點軍區的“點軍”二字,來源于三國,關羽在此練兵而得名。這里距離三峽大壩 47 公里,區域面積 530 平方公里,包括城區、鄉鎮、以及農村等三種生態的綜合性區域。20192020
159、 年是黑天鵝事件頻發的 2 年,從疫情防控到環境保護、鄉村振興和產業升級,點軍區政府正面對著史無前例的變化性需求和挑戰:公共衛生:如何實現更高效、更智能化的疫情管控?鄉村振興:面向鄉村振興的國家戰略,該如何落實?該如何讓偏遠地區的百姓有安全感、獲得感和幸福感?基礎醫療:如何讓偏遠地區基礎醫療更加普及?環境保護:如何讓環境保護變得更加智能化?面對這些挑戰,宜昌點軍區聯合百度智能云,融合視聯網平臺、算力平臺、物聯網平臺、大數據平臺的全域數字化服務,打造區域性運營平臺。用 50P 算力在視聯網平臺和物聯網平臺上構建豐富的業務場景應用,助力城市智能產業區域的社會治理和經濟發展。4.3.5 產業類客戶案
160、例解析“50P 算力+1 個視聯網平臺+1 個物聯網平臺+N 個應用”的區域性運營平臺系統,正在被點軍區20 個政府部門使用,服務于 20 萬常住人口。平臺滿足了點軍區政府對城市治理和民生服務的各類需求,避免了重復建設,極大降低了政府投入成本。取得的階段成效舉例如下:公共衛生:實現對疫情等突發性事件的及時響應,比如疫情爆發城市封閉,第一時間找到被滯留在高速路上的高危運輸車輛;通過跟蹤藥品銷售以及用藥人群的分布趨勢來預測流行病。鄉村振興:很多偏遠地區消防車無法立即到達現場,意外火災的處置是一個難題。點軍區在這些地區架設物聯網專網和傳感器預警系統,不斷加強偏遠地區意外火災防范能力,達到異常情況下秒
161、級預警,激活鄰里救助。為了讓孤寡老人生活更安心,通過物聯網專網和智能床墊,對老人夜間的異常健康情況進行監測,為老人提供健康保障。為了讓百姓生活更便捷,通過物聯網專網實現在線繳納水費、電費?;A醫療:使用人工智能眼底監測設備,深入農村地區衛生所,對慢性病患者進行早期篩查,讓村民能夠盡早治療,過上更健康的生活。環境保護:長江生態大保護實行十年禁漁禁捕,通過大數據構建非法捕撈行為的人工智能模型,同步結合人臉識別,鎖定非法捕撈群體。城市治理:通過人工智能視覺系統,跟蹤建筑材料運輸過程,從源頭打擊違章建筑。(圖4.3.5-1 點軍區平臺落地實踐)“云智一體”技術與應用解析系列白皮書 智能視頻篇5455更
162、多行業案例參考關于本報告本報告內容來源于百度智能云重磅打造的“云智技術論壇”系列活動第二期。5 月 13 日,第二場活動以云智一體的全場景智能視頻前沿技術為主題在北京召開。百度多位資深技術和產品專家,全面介紹了百度最前沿的視頻云和 AI 能力矩陣,并邀請合作伙伴共同呈現了面向互聯網、媒體、產業等場景的云智一體智能視頻方案與應用案例。2021 年,“云智技術論壇”系列活動還將陸續推出其他主題,全方位詮釋百度智能云“云智一體”的獨有優勢在各場景各行業的助力應用,敬請關注。云智一體的全場景智能視頻前沿技術精彩回顧媒體類視頻類直播類交通物流類教育類工業類人民日報“創作大腦”央視網“五智”人工智能編輯部愛奇藝“云+Al”視頻內容平臺好看視頻全鏈路處理分發服務觸手直播游戲視頻識別模型虎牙游戲直播平臺汽物流無人機整車盤點服務滬江互聯網學習直播服務歐了出行車聯網視頻云服務威創兒童成長平臺精研科技外觀缺陷視覺檢測新石器無人車百度智能云微信公眾號百度 AI 微信公眾號