1、115AI 交通2 中科院自動化所研究員王飛躍:交通 5.0 何以實現智能交通到交通智能?整理:智源社區任黎明王飛躍,中國科學院自動化研究所研究員、復雜系統管理與控制國家重點實驗室主任。他的主要研究領域為復雜系統、智能控制、智能機器人、無人駕駛等。他曾先后當選 IEEE、INCOSE、IFAC、ASME 和 AAAS 等國際學術組織的 Fellow,并且主持完成多項國家重大項目。曾獲國家自然科學二等獎、IEEE SMC 諾伯特 維納獎。王飛躍的演講主題是平行交通與交通 5.0:從智能交通到交通智能。在本次演講中,王飛躍對人工智能與智能交通的發展現狀和未來趨勢進行了系統分析,并重點分享平行交通和
2、交通 5.0 的基礎理論、關鍵技術及最新進展。隨著交通系統從機械化、電氣化、信息化、網絡化到智能化的不斷完善和提高,以區塊鏈為核心技術的交通 5.0 時代為智能社會奠定了基礎。為了實現交通 5.0 和交通智能,王飛躍團隊提出基于 ACP 的平行交通系統體系和研究開發了交通管控云網端協同平臺,他和團隊的研究成果已經成功應用于廣州、青島、杭州等城市的交通管控中并獲得了顯著的效果,并且在演講的最后,王飛躍對人工智能的新未來進行展望。以下為演講全文。一、來自 AlphaGo 的啟示王飛躍從 AlphaGo 將去向何方的問題引出對人工智能在交通領域重要性的探討。目前,很多人認為 AlphaGo已經無新技
3、術可以研究,而王飛躍則認為 AlphaGo 是一個具有里程碑性質的工作,AlphaGo 的出現把我們從Church-Turing Thesis 推向 AlphaGo Thesis 的新時代,這個時代具備以下三個特征:平行世界:真實 VS 虛擬,現實的虛擬,虛擬的現實。從牛頓到默頓:從牛頓的“大定律小數據”到默頓的“大數據小定律”,按照默頓自我實現運營的一個新時代;智能活動的三部曲,即從小數據生產出大數據,從大數據凝練出深度智能。如何從大數據中提煉出深度智能,AlphaGo 就是一個很好的樣例。AlphaGo 從人類的 80 萬例博弈開始,自我對抗“生產”出 7000 多萬例新的博弈,并利用強化
4、學習提煉出“深”智能的二張網,價值網和對策網,戰勝人類的圍棋大師。在此基礎上,AlphaGo 進一步升級,成為 AlphaGo Zero,人類博弈的小數據幾乎為零,除了博弈規則之外,一例不用,僅憑自我對抗產生的不到 3000 萬例博弈,就煉出一張智能更深的“小智能”網絡,將過去的二張網合二為一,回頭以 100:0 的戰績橫掃 AlphaGo。后來 AlphaGo Zero 再升級為 AlphaZero,不但圍棋可下,其它棋也可以下。這些深度智能使得 AlphaGo 之類變得“聰穎無比”,所以 AlphaGo 之類將成為未來智能決策及智能產業范式轉移的示例和基礎。二、大趨勢:三個三與五個五接著,
5、王飛躍介紹了 AI“三個三,五個五”的大趨勢。三個三中的三個 IT 分別對應三個世界和三個軸心時代,具體為:3NewLogic,NewDevelopment,NewPhilosophy圖 1:人工智能的大趨勢“三個三”:“老”IT 工業技術是開發物理世界的工業時代的主要工具,其對應人性大覺醒,以哲學突破為核心的第一軸心時代;“舊”IT 信息技術是開發心理世界的信息時代的主要工具,其對應理性大覺醒,以科學突破為核心的第二軸心時代;“新”IT 智能技術是開發人工世界的智能時代的主要工具,其對應智性大覺醒,以技術突破為核心的第三軸心時代?!拔鍌€五”:大 5G:從 Grid 1.0 到 Grid 5,
6、即交通網,能源網,信息網,物聯網及智聯網;大 5G 的建設促使社會形態發生的巨變:五個范例,交通變成社會交通,能源變成社會能源,計算變成社會計算,3D 打印機器人使制造會變成社會制造,最重要的是智能變成社會智能,最終社會變成智能社會,智慧社會。大 5G 建設完成后會形成大網,它把三個世界緊密聯系在一起。并且在智能科技時代將數據的力量,計算的力量,算法的力量,網絡的力量,區塊鏈的力量融合在一起,形成“五力合一”。其中,區塊鏈帶給平行智能的技術特點為:真(TRUE)(可信、可靠、可用、高效)+道(DAO)(分布式的去中心化、自主性的自動化、組織化的有序性),從平方道 D2A2O2-平行道邁向平行智
7、能。要實現平行智能必須要有一個五度空間才可行。五度空間(CPSS 物理空間,網絡空間,人工世界,心理世界,物理世界),并將人與社會因素放在核心的位置,人是萬物的度量,人必須是這五度空間的主人公。五類產業形態(工業 1.0,2.0,3.0,4.0)很自然轉變為工業 5.0,認為我們仍在第三工業革命之中,它包括工業4.0 和工業 5.0 二個階級,雖然工業 4.0 和工業 5.0 的核心都是 ICT+CPS,但是工業 4.0 是以工業自動化思維為基礎。它們之間最主要的差別為從工業自動化向知識自動化的轉變(圖 2)。王飛躍在 2000 年和 2004 年4的一篇題為平行系統方法和復雜系統管理與控制的
8、文章正式引出了平行系統及工業 5.0 的概念。圖 2:工業 4.0 邁向工業 5.0三、新理論:CPSS 和 ACP然而,若想實現智能化就必須從 CPS 轉變為 CPSS,并且智能化的核心為知識自動化。即 AR,VR 和人工智能之外,還要是通過平行系統實現的自動化智能。未來的機器就是一個平行機(圖 3 所示),這個平行機把物理的牛頓機和軟件定義的默頓機合二為一,把物理,社會,網絡空間打通,把云端和邊緣串起來,通過小數據生成大數據,把大數據變成小智能。因此,這個平行機可能給我們帶來一系列新的工作,如決策、法務、評估、學習工程師等。圖 4 為平行系統的理論計算框架(其中包括控制部分)。圖 3:基于
9、 CPSS 的平行機5圖 4:平行系統理論框架2011 年,復雜系統管理與控制國家重點實驗室成立,其研究核心為發展平行智能與平行科技,主要研究平行管理與控制、平行機器人,平行制造、平行醫藥、平行健康、平行社會,平行生態等等。為什么要研究平行?回顧使人工智能陷入十年寒冬的 Lighthill 報告,當時,Lingthill 認為人工智能的研究已經很久,但還在研究 ABC水平的問題。有一部分學者研究先進自動化 A,另一部分學者研究計算機仿真 CNS,C,而這兩部分跨度太大,如何可以使兩個世界聯系更加密切呢?這就來了第三波人,利用機器人建“橋”,Bridge,就是 B。但是,干了25 年,橋還是建的
10、不好,還在水下,不行,無法跨越“認知鴻溝”。王飛躍提出通過大數據填充鴻溝并提煉平行智能,再由平行系統架橋實現端到端的聯結,跨越認知的鴻溝(圖 5 所示)。圖 5:平行智能:跨越知識鴻溝為什么大數據和平行可以合在一起?首先,大數據的實質為“數據說話”,“預測未來的最好方式就是創造未來”:6 數據說話多了就變成了人工社會(A)及軟件定義的社會,變成社會的數字孿生,即描述智能;預測未來就是計算實驗(C)把小數據變成大數據,把大數據變成小智能,即預測智能;創造未來就是虛擬世界與現實世界合二為一,通過平行執行(P)實現虛實空間之間的反饋閉環,即引導智能。通過上述大數據的三點本質可以實現從以前在物理世界“
11、吃一塹”、在知識世界“長一智”,變到在知識世界“吃一塹,吃多塹”、在物理世界“長一智,長多智”,通過大數據和平行智能達到在物理世界低成本高性能高智能的目標。圖 6:大數據與基于 ACP 的平行系統四、智能交通系統的新時代:從平行交通到交通 5.0隨后,王飛躍介紹了如何將平行智能應用到交通領域。交通 50%是工程復雜性,50%是社會復雜性,所以交通領域是一個天然應用平行智能的場景。圖 7 為平行交通系統體系,PTMS(平行交通管理系統)既包括真實交通系統又含有虛擬交通系統,它使得計算機變成交通實驗室用來進行實驗評估、學習與培訓和控制管理,然后把相應的硬件合成起來變成社會交通,圖 8 是平行交通系
12、統的軟件接口。圖 7:平行交通系統體系7圖 8:平行交通系統軟件接口示意圖上述虛實互動平行交通管理體系架構與技術可以解決交通領域的以下難題:應用人工交通作為交通數據輸出器可以解決交通領域存在交通參與主體眾多,影響因素復雜等研究難題,將計算機作為交通實驗室,把小數據變成大數據,大數據變成小智能解決交通領域實驗成本高,可重復性低的難題;通過虛實空間平行執行及雙閉環控制解決交通領域決策效率低,控制質量差的問題。虛實互動平行交通管理系統的最終目標是建成可認知,可計算,決策優的智慧交通系統。為實現這個虛實互動的平行交通管理系統,王飛躍提出了基于實驗設計、自適應動態規劃的大規模路網交通預案實驗和優化方法;
13、構建了交通實驗場景生成和預案評估的計算引擎平臺實現軟件定義的交通場景;此外,他提出的基于人機混合增強智能的交通推薦技術,攻克了城市交通管控決策過程復雜、效率低、可靠性差等問題。而針對傳統交通感知系統面臨適用環境單一、安裝條件受限、設備成本高、系統化程度低、無法滿足復雜交通場景的精細刻畫和管控需求等一系列難題,王飛躍提出了交通平行視覺感知技術,這個技術可以產生一個從少量真實場景快速生成大規模虛擬場景(人工場景)的方法,這個方法提高了虛實互動交通視覺模型的精度和魯棒性,并且有效的解決了復雜交通場景數據難獲取、標注成本高等問題。在基于無線傳感網的城市交通空間綜合感知技術應用方面:王飛躍構建了融合多模
14、式交通行為特性的傳感網絡拓撲結構設計與優化方法(圖 9),并提出了多源異構交通數據分層關聯融合方法,這些方法大大提升了交通感知范圍廣域化和感知要素精細化水平。8圖 9:多模式交通行為特性傳感網絡架構針對城市交通管控平臺技術標準不統一的問題,以及我國城市交通在交通流組成、路網結構、出行習慣等方面的獨特性,王飛躍通過基于交通云端模糊神經元網絡與邊緣側模糊規則融合模型和城市道路混合交通智能協同控制關鍵技術開發了集主動控制、防溢流控制、關聯控制于一體的交通管控云網端協同平臺(圖 10),這個平臺的原則是當地簡單,遠程復雜。圖 10:云網端協同網絡化交通平臺關鍵技術這個平臺可以實現實際交通的按需控制。目
15、前,這個平臺主要應用的城市有青島,蘇州,廣州等城市。平行交通:濟南人工交通系統。這項應用主要是通過仿真進行交通壓力測試,即假如城市擁有一百萬輛車時實際交通到底怎么樣?09 年的仿真實驗結果表明只要路網中的車輛數目達到設計量約 15%就會出現交通擁堵情況,而兩年前杭州市的實測車輛數據顯示當車輛數約等于設計量的 15%會出現交通堵塞,這個數據印證了濟南人工交通系統仿真結果的真實性。9 廣州亞運會公共交通平行管理系統。這個系統可以把所有公共交通出行報告和方案在計算機實行進行評估,以優化公交的調度。這個系統特點是它采用平行控制理論,通過實際系統與人工系統的相互連接,通過對二者之間的行為進行對比和分析,
16、完成對各自未來的狀況的“借鑒”和“預估相應地調節各自的管理與控制方式;這個系統的應用效果是它可以和智能公交監控調度系統無縫接駁,實現對全市 60 多條線路 8000 多臺公交車以及 400 多臺中小巴平均每天 130000 條發班班次的實時優化與管理。青島平行交通系統。這個系統可以實現人工交通和實際交通互動,該系統的實施效果為:主干道通行時間減少 20%,主干道車輛停車次數減少 45%,關鍵路段的早高峰擁堵里程減少 30%,車輛平均行駛時間減少25%,路網通行效率提高 43.39%,顯著改善了青島的交通環境;杭州西湖做交通推薦系統(實時配屬系統)。王飛躍首次提出交通推薦系統的概念并將其應用到智
17、能交通領域,這個交通推薦系統大大減少了擁堵報警,錯誤報警的次數,并且大大降低報警事件的平均處理時間(大約為一個紅綠燈交替時間)。接著,王飛躍講述平行駕駛可以將虛擬駕駛和實際駕駛同步起來,提高交通運行效率。關于如何通過 AlphaGo理論,實現智能交通系統的未來-從平行交通邁向交通的 5.0,王飛躍把交通領域的發展劃分為一百年。目前,他認為交通也進入了第五代系統,從以前的機器能源(交通 1.0),電動(交通 2.0),信息化(交通 3.0),網絡化(交通 4.0),到即將邁進的平行交通(智能化交通,交通 5.0)。若想實現交通 5.0,區塊鏈技術必不可少,通過區塊鏈把五個交通合成交通 5.0(圖
18、 11),把城市、公共、物流、靜態、社會交通合二為一,打通部門之間的利益交割,做到即保密又公開,區塊鏈可以解決各部門之間的矛盾,做到即安全又可靠,所以區塊鏈技術為交通 5.0 的核心。并且未來社會的發展一定要是通過智能交通邁向智慧城市。圖 11:交通 5.0 的核心技術-區塊鏈五、結語及展望:AI 新未來演講最后,王飛躍對人工智能的新未來進行展望。關于人工智能可能會威脅人類的這一說法,王飛躍并不認為人工智能對人類會產生威脅。正如 Godel 定理所述,Godel 不相信機器、計算機能超過人,除非數學不是人類發明的,就算數學不是人類發明的,計算機機器也超不過人的大腦。王飛躍把算法總結分為三個層次
19、,第一個是算法智能,第二個是語言智能,第三個是想象智能。并且算法智能 語言智能 想象智能。正如愛因斯坦所言,智能的真正標識不是知識,而是想象。王飛躍相信人工智能及“新”IT 智能技術是人類的朋友,相信人工智能會使人類社會更加開放、更加公平。并且智能科技是時代的召喚和科技發展的必然結果,它不是人類的威脅,我們應以激動心、敬畏心和平常心面對人工智能的發展。此外,王飛躍希望人工智能只是過去的冬天和夏10天,還要有春光明媚的春天和碩果累累的秋天。中國在人工智能的研究方面要自己的話語權,力爭創造“人工智能的直道,在直道自然行車,別強調什么超車。就是超過什么人什么國,也與你我或中國無關!”。參考文獻:1
20、Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang,Where does alpha Go go:from Church-Turing Thesis to Alpha Go thesis and beyond”,IEEE/CAA Journal of Automatica Sinica 2016,Vo.3,No.2,pp.113-120.2 Fei-Yue Wang.Wang Xiao,Li Li et al Steps toward Parallel
21、Intelligence.IEEE/CAT JLS,2016.3(4):345-348.3 Fei-Yue Wang,“Parallel Control and Management for Intelligent Transportation Systems:Concepts,Architectures,and Applications.“in IEEE Transactions on Intelligent Transportation Systems,vol,11,no.3,pp.630-638,Sept.2010.4 Wang.Fei-Yue.Five Transportations
22、in One-A New Direction for ITS From QingdaoJ.IEEE Transactions on Intelligent Transportation Systems 2015.5 Yuan Yong,Fei-Yue Wang.Towards blockchain-based intelligent transportation systemsC/2016 IEEE 19th International Conference on Intelligent Transportation Systems(ITSC).IEEE,2016:2663-2668.6 Fe
23、i-Yue Wang,A framework for social signal processing and analysis:from social sensing networks to computational dialectical analyticJ.中國科學信息雜志,2013,43:1598-16l1,doi:101360/N112013-00094.11 滴滴出行副總裁葉杰平:AI 賦能智能出行新時代整理:智源社區任黎明在第二屆北京智源大會 AI 交通專題論壇中,滴滴出行副總裁、滴滴 AI Labs 負責人葉杰平教授做了AI 賦能智能出行新時代的主題演講。葉杰平,滴滴出行副總
24、裁、滴滴 AI Labs 負責人。密西根大學終身教授及大數據研究中心管理委員會成員,IEEE Fellow,智源學者。葉杰平主要從事機器學習,數據挖掘和大數據分析領域的研究。擔任包括 IEEE TPAMI、DMKD、IEEE TKDE、NIPS、ICML、KDD 等多個國際頂級期刊編委及國際頂級會議程序委員會主席和領域主席。曾獲得 KDD 和 ICML 最佳論文獎,以及 2010 年獲得美國國家自然科學基金會生涯獎(NSF CAREER Award)。2019 年帶領團隊獲得年度瓦格納運籌學杰出實踐獎(Daniel H.Wagner Prize)。隨著 AI 與各行各業的深度融合,它加速驅動世
25、界經濟從“互聯網+”邁向“智能+”。此外,新一代人工智能的發展對各行各業的帶動和影響作用將更為深刻,NEW AI 逐漸成為我國贏得全球科技競爭主動權的重要戰略抓手,具有“頭雁”效應。在交通出行領域,AI 正在推動交通出行的智能化變革。滴滴作為全球領先的移動出行平臺、全球智能出行技術的探索者,近年來,持續大力投入 AI 基礎研究,加速技術和經驗開放,與合作伙伴一道共同推動 AI 在交通出行領域的變革。本次報告中葉杰平將分享滴滴的 AI 技術如何賦能智能出行發展、如何加速智能出行時代的變革。以下智源社區編輯對葉杰平演講進行的要點整理。滴滴作為全球領先的一站式出行平臺,它具有極其豐富的出行數據,通過
26、對出行數據的分析優化為全球用戶提供出行服務。滴滴擁有的出行軌跡數據不僅數量大,而且非常完整(如滴滴在北京的出行軌跡數據已經覆蓋北京大部分道路超過 400 多次)。這些出行數據為滴滴通過人工智能和大數據技術改善交通、為用戶提供更便捷更舒心更安全的出行服務、為智能出行的愿景提供了強大的數據支撐?;诖?,葉教授分享自己及其團隊在智能出行領域的探索。葉杰平認為未來交通出行(智能出行時代)主要從以下三個層面發生變化:智能交通基礎設施(智能化、網聯化、協同化),交通基礎設施會越來越智能,包括智能路網、智能信號燈,車路協同。智能交通工具(電動化、智能化、高效化),交通工具由電動化、自動化。未來會取代現有的車
27、輛。共享出行(體驗化、共享化、綜合化),共享出行在未來會越來越受歡迎。上述三個巨大變化中最關鍵的變化為智能,所以 AI 是智能出行的核心技術。目前,AI 已經應用于智能出行的多個場景,如括智慧交通,智能交通工具,智能運營,智能調度,智慧供需預測,智能派單等(圖 1)。此外,在出行安全方面,地圖中的路況預測、時間預估及路徑規劃中都需要用大量的 AI 技術??头刻煨枰獯鸷A康膯栴},葉杰平開發了一套基于 NLP-知識圖譜及語音的智能客服系統。這套系統可以滿足大部分用戶的需求,極大提升了客服的效率,并且為 AI 賦能社會提供基礎。12 圖 1:智能出行一、AI 賦能交通基礎設施滴滴基于其獨有的交通
28、出行大數據,建設了一套集合分析中樞,控制中樞,感知中樞,數據中樞的交通大腦,這個交通大腦包括交通擁堵的實時展示,交通需求和出行規律的分析挖掘,交通擁堵原因探索及信號燈的控制優化等功能。此外,滴滴通過對政府數據,行業數據,眾包數據,互聯網數據的感知,開發了集大數據研判、實時預警、交通規劃、度量體系于一體的城市交通分析工具,這個工具可以實現智慧信控、AI 派警、交通誘導及車路協同等城市化的方案(圖 2)。圖 2:滴滴智慧交通解決方案接著,葉杰平介紹了智慧交通項目,該項目由滴滴與政府和城市一起合作,應用滴滴平臺的大數據和 AI 技術進行優化分析以形成智能信號燈。具體案例如:基于滴滴現有的交通運行軌跡
29、數據,結合 AI 和大數據分析算法,滴滴可以對每個十字路口各個方向的車流量進行預測,基于各個方向車流量的預測,交通管理部門就可以智能13地進行信號燈的控制。目前,該項目已成功應用于濟南等 20 多個城市,優化了超過 2500 多個信號燈,在優化后的區域,車輛平均行駛時間降低了 10-20%,該結果表明這個項目可以極大的改善城市交通的運行效率。二、AI 賦能智能車載隨著交通工具越來越智能,滴滴在智能車載方面研究開發的系統會讓未來出行更加智能、安全和舒適。2.1智能座艙系統滴滴基于語音智能(包括語音識別、語音合成、語音喚醒、聲紋識別)技術開發了一套智能座艙系統。該系統以深度學習算法為內核,以保障駕
30、駛安全為技術主線,支持駕駛員行為識別,身份驗證及多模態智能交互功能。智能座艙系統可以提供低成本高性能的智能出行解決方案。針對復雜的車載環境,融合車輛信息,及時識別駕駛隱患,為司機預警,旨在為智能出行提供更安全更高效的出行體驗。2.2高級輔助駕駛系統高級輔助駕駛系統是基于 AI 視覺智能(包括人臉識別、人體識別、文字識別、車輛識別)技術開發的一套系統,這個系統與司機行為識別功能共同構成車輛主動安全體系。這個主動安全體系主要包括前期碰撞預警,車道線偏離預警,行人碰撞預警等預警功能。并且在車輛行駛危機時會發出警告,輔助駕駛員減輕或避免碰撞危險,從而增強駕駛的安全性。通過報告中的視頻演示可知,該系統會
31、根據駕駛員的錯誤駕駛操作、不良習慣(未系安全帶、駕駛中抽煙,手持接聽電話等等不良駕駛狀態進行語音提醒,并且可以在斑馬線處識別行人并主動減速停車。2.3自動化網絡剪枝優化視覺系統由于視覺系統是基于深度卷積神經網絡,而深度神經網絡的最大的缺點是主干網絡非常龐大(如 AlexNet,VGGNet,ResNet 等都超過幾百兆)而嵌入式資源又非常有限。這個不足給視覺系統帶來巨大的挑戰,針對這個挑戰,滴滴研發了自動化網絡剪枝方法(圖 3),該方法可以在識別精度基本一致的情況下使深度神經網絡模型的大小壓縮了 50-100 倍,極大提升了系統的性能,具體細節參考1。圖 3:AutoCompress 方法14
32、2.4基于語音交互的接單系統在語音技術應用方面,以前,司機需要通過手動點擊屏幕進行訂單的處理,包括接單,取消訂單,導航等,這些手動操作不僅會導致出行體驗差,而且增加了出行途中的不安全指數及駕駛的危險系數?;诖?,滴滴研發了一套基于語音交互的接單系統,司機可以直接通過語音進行接單等進行操作,目前這個系統已經應用于日本、澳洲等國家,通過報告中的該系統在日本的應用場景視頻演示可知,當訂單成功后,司機可以通過語音實時了解乘客的位置及乘坐時間,大大提高了出行效率。未來,語音交互系統將支持包括接單,取消訂單,信息查詢,主動聯系乘客或客服,加油充電維保等全方位的語音交互服務,為乘客和司機提供全行程的智能化服
33、務。三、AI 賦能共享出行平臺3.1AI 賦能出行交易市場滴滴的共享出行平臺通過網絡把世界和乘客連接起來,為乘客提供全方位的出行服務,滿足乘客的多元化出行需求及高質量的服務體驗,同時也提高司機的收入及減少空駛以提高交通出行效率。這個共享出行平臺服務主要包括發單,派單,接駕和送駕等流程。AI 技術在這個服務流程中貫穿始終,如為乘客推薦上車點及訂單預估價,訂單供需預測與調控,訂單派單,車輛調度,出行安全保障,ETA 及路徑規劃等(圖 4)。圖 4:AI 賦能出行 3.2基于二分圖的派單算法如何通過 AI 進行派單、調度及訂單時間預估?其中,訂單分配是滴滴最核心的業務之一。目前,滴滴平臺每兩秒可以做
34、一次訂單分配,滴滴訂單分配具體步驟為(圖 5):首先,構建一個將所有司機、所有的乘客訂單聚合在一起;然后,構建一個訂單與司機兩兩相連的二分圖。這個二分圖的核心是兩兩相連后的權重,將這個權重構建一個矩陣,行表示乘客,列表示司機,矩陣中的值表示司機與乘客的訂單匹配度。這個匹配度通過計算司機與乘客的距離及訂單行駛時間來確定,如果司機跟乘客的距離越近,行使越短,匹配度的值越高,其中,匹配度的值在 0 到 1 之間。這個匹配度矩陣的二分圖可以用經典的 Kuhn-Munkres 算法求得最優解,這個最優是在確保接駕體驗的基礎上,在 2 秒內最多的滿足乘客的訂單需求。15圖 5:基于二分圖的派單算法因此,基
35、于二分圖匹配的派單算法最核心的內容包括路徑規劃和預估到達時間(ETA)。其中,路徑規劃指表示從起點到終點需要經過的路線,預估到達時間表示預估從起點到終點的需要行駛的時間。在預估到達時間的研究方面,滴滴研發一套基于深度學習的時間預估系統,這個預估系統模型的核心是把出行軌跡用序列描述,因此,預估到達時間就可以用 LSTM 進行建模,再結合 Wide 和 Deep 模型(具體細節可參考2)。通過這個深度學習系統可以使算法的精度有了顯著的提升,通過報告中的該系統的應用場景視頻演示可知,滴滴應用深度學習打造了新一代線上地圖平臺,其中 AI Labs 基于神經網絡和強化學習技術針對路徑規劃(RP)和到達時
36、間預估(ETA)問題研發了準確性高,計算速度快,占用資源少的新一代深度學習模型,這個模型可以在復雜的移動出行場景中確保車輛實時調度與訂單分配的準確性,并根據實時突發路況進行計算反饋以快速整合生成最優出行方案,同時,該平臺會根據乘客與司機的地理位置信息及路況信息、出行數據、司機信用評級進行動態匹配最佳訂單和路徑策略選擇(圖 6)。圖 6:AI 賦能地圖:ETA16基于 Kuhn-Munkres 的訂單分配算法雖然可以在兩秒內找到最優解,但如果結合 AI 技術對未來交通的預測信息,在兩秒鐘之內,該算法可以滿足更多的訂單需求及提升訂單分配的效率。3.3基于強化學習的智能派單由于每個訂單分配的決策會對
37、未來司機(車輛)的分布產生影響,所以可以用時間序列決策問題表示訂單分配,這個基于時間序列的訂單分配問題可以用馬爾科夫決策過程(MDP)求解,通過 MDP 求解后,該問題的目標將從短期收益最優轉變為長期收益最優。如圖 7 右下角所示,MDP 中每個司機是一個 agent,狀態(state)表示司機所處的位置(location)和當前時間(time)。動作(action)表示司機訂單匹配,無論司機和乘客訂單匹配與否,都會產生一個 action。獎勵(reward)表示對每個 action 的激勵(假如司機和某個訂單匹配成功,reward為該訂單的價值,沒有匹配 reward 為 0)?;趶娀瘜W習
38、和組合優化方法充分考慮了每次派單對未來的司機分布的影響及基于全天車輛供需與出行預測,它把訂單分配決策問題從兩秒最優變成長期(如一天)最優。因此,基于 MDP 的訂單分配系統 2017 年在全國 TOP20 城市上線,在確保用戶體驗的基礎上,顯著提升了司機的收入,具體細節可以參考3。圖 7:基于強化學習的智能派單3.4基于 V-Net 的智能派單基于 MDP 訂單匹配的缺點是狀態太少,只是一個時間或一個空間,導致許多非常有價值的狀態信息沒有得到充分運用,針對這個缺點,葉杰平應用深度強化學習來求解訂單分配問題?;谏疃葟娀瘜W習的派單本質上是用深度神經網絡直接學習價值函數(圖 8),通過神經網絡引入
39、更多的特征(時間,空間,實時供需,實時天氣等)能夠增強神經網絡的泛化能力及深度強化學習的有效性以提升訂單分配的精準度和效率。此外,通過遷移學習可以有效提升多個城市的訂單分配訓練學習任務來提升訂單匹配的效率。具體可以參考 4。并且,基于強化學習的網約車派單解決方案獲得 2019 年 INFORMS Daniel H.Wagner Prize,該獎項為企業應用運籌學領域最高獎之一。17圖 8:基于 V-Net 的智能派單3.5基于強化學習的司機 AI 助手在真實的出行場景里,新手司機會由于錯誤的訂單決策導致長時間沒有接到訂單。針對這個問題,葉杰平及團隊開發了基于強化學習的司機 AI 助手(圖 9)
40、,該 AI 助手主要利用時空價值來幫助司機做最優的決策,提升平臺效率及司機的收入。通過報告中的視頻演示可知該 AI 助手基于深度強化學習和最優決策理論技術,司機助手可以同時考慮基于時、空間的長期優化目標基礎上,利用深度神經網絡進行價值估計,為司機提供更準確有效的調度指引,該助手可以有效地將司機指引到訂單熱區以縮短空駛時間,在助手的幫助下,平臺司機可以高效的在城市出行服務運行,更好地滿足用戶出行需求,最大化城市供需時空分布并且提升出行效率。該司機 AI 助手已經在小范圍進行測試。實驗結果表明基于 AI 司機調度能夠顯著提升司機收入和平臺效率。圖 9:基于強化學習的 AI 司機助手3.6AI 賦能
41、駕駛安全在 AI 賦能社會(AI 賦能駕駛安全)方面。滴滴圍繞人、車、路三個核心交通要素,采集了與駕駛員相關的基本信息數據通過大數據和 AI 技術進行數據特征挖掘以消除交通隱患(如根據軌跡 MMU 來識別急加速急轉彎急變18道,行駛過程玩手機,疲勞駕駛等危險行為)。此外,滴滴通過對平臺發生的交通事故進行了深度的復盤分析包括超速,減速讓行,高速路況速度過快,疲勞分心等為最嚴重的隱患行為,及時發現這些隱患行為并警示提醒司機是保證出行安全的關鍵點。通過對海量的數據分析進行路況預估,在一些特殊的高危路口,如果車的行駛速度超過某閾值,發生車禍的概率會顯著提升,如果識別到此行為與路況,會有“前方路口事故多
42、發,請注意減速”的警示提醒(圖 10)。AI 賦能駕駛安全可以顯著降低了路口交通事故的數量。圖 10:交通事故高隱患組預警四、結語本次演講最后,葉杰平對 AI 在三個層面賦能智能出行新時代做了簡要的總結(圖 11),未來 AI 終將促使交通行業發生巨大的變革,即從智能交通基礎設施;智能交通工具到共享出行的不斷變革。目前,交通出行幾乎是一個世界性難題,因為它不僅與每個人的日常生活息息相關,還與經濟發展和社會進步密不可分。所以,葉杰平希望有更多的研究者參與智能出行的建設,用人工智能改變未來交通出行。圖 11:AI 賦能智能出行新時代19參考文獻:1 Liu N,Ma X,Xu Z,et al.Au
43、toCompress:An Automatic DNN Structured Pruning Framework for Ultra-High Compression RatesC.national conference on artificial intelligence,2020.2 Wang Z,Fu K,Ye J,et al.Learning to Estimate the Travel TimeC.knowledge discovery and data mining,2018:858-866.3 Xu Z,Li Z,Guan Q,et al.Large-Scale Order Di
44、spatch in On-Demand Ride-Hailing Platforms:A Learning and Planning ApproachC.knowledge discovery and data mining,2018:905-913.4 Tang X,Qin Z,Zhang F,et al.A Deep Value-network Based Approach for Multi-Driver Order DispatchingC.knowledge discovery and data mining,2019:1780-1790.20 百度集團副總裁李震宇:車路智行,打造面
45、向未來的交通整理:智源社區楊依帆在 2020 北京智源大會“AI 交通”專題論壇中,百度集團副總裁、智能駕駛事業群總經理李震宇發表了名為車路智行,打造面向未來的交通主題演講,他指出,智能交通的核心驅動力在于“自動駕駛+車路協同”,“車、路、行”三駕馬車齊頭并進,才能在保證安全出行的基礎上實現終極“無人駕駛自動化”的目標。百度認為“自動駕駛+車路協同”,將成為中國發展智能交通的制高點,助力實現真正的“交通強國”。百度 Apollo推出 ACE 智能交通引擎,以自動駕駛和車路協同為雙引擎,支持智能車聯、智能信控、智能公交、智能貨運、Robotaxi 等眾多應用場景,“面向未來、兼容當下,讓交通出行
46、更簡單、更美好”。圖 1:百度副總裁、智能駕駛事業群總經理李震宇正在演講21李震宇,百度集團副總裁,智能駕駛事業群總經理。歷任百度多個基礎技術部門和業務部門的負責人,帶領過產品、研發、商業合作等不同類型的團隊,有豐富的管理經驗。在首批國家新一代人工智能開放創新平臺名單中,“依托百度公司建設自動駕駛國家新一代人工智能開放創新平臺”名列榜首。下面是智源社區編輯整理的李震宇演講要點。一、智能車路協同對自動駕駛產生的價值1.1降低成本目前自動駕駛車輛成本居高不下,并且多數是實驗型車輛,而真正達到量產車型需要進一步增加成本。車路協同可以降低傳感器成本、計算單元成本、安全冗余成本,將單車成本轉移到路側,從
47、而降低更多車輛的成本。從宏觀層面判斷,車路協同的收益效率也是非常高的。圖 2:自動駕駛+車路協同,中國智能交通發展的制高點1.2保障自動駕駛安全在紅綠燈識別、盲區檢測、更遠視距、特殊場景識別以及交通態勢預測中,車路協同能夠發揮重要作用如識別一輛大卡車后面橫穿出的“鬼探頭”的小汽車;路邊??恐惠v汽車,提醒遠方車輛變道;進行路面的“井蓋”等離散障礙物的識別;十字路口更遠視距的識別等等。車輛和道路協同識別,能夠增強識別效果,使得自動駕駛更具安全性。二、智能車、路、行融合的三條必經之路下圖中的三維坐標直觀地展示了車、路、行三者綜合發展的軌跡,共分為三個階段:數字化、網聯化與自動化。22圖 3:車路智
48、行融合,是交通發展的必經之路2.1數字化數字化是智能交通的初級階段,比如司機可以通過智能識別和導引完成智能停車,交通控制系統通過人工智能技術進行交通治理等。2.2網聯化5G、IOT 萬物互聯等基礎設施、通信與物聯網產業的發展可以帶領我們實現網聯化的目標。網聯化能夠驅動智能駕駛、輔助車聯等狀態,如公交車聯網后可以看清和聽懂紅綠燈的指示信息,從而與紅綠燈進行聯動。2.3自動化自動化是智能交通的終極狀態,即達到完全無人駕駛的程度。百度在此理論基礎上推出了面向未來的 ACE 交通引擎A:Autonomous driving 自動駕駛,C:Connected Road 車路協同,E:Efficient
49、Mobility 移動出行。三、ACE 交通引擎核心驅動力:自動駕駛+車路協同ACE 交通引擎的主要構成為:一個數字底座,兩個智能引擎,N 個應用生態。數字底座將車、路、云、圖進行數字化;智能引擎分為 apollo 自動駕駛引擎與車路協同引擎;應用生態為開發人員與合作伙伴提供平臺,開發數字化、網聯化與自動化的相關應用。圖 4:百度智能交通:1(數字底座)+2(智能引擎)+N(生態應用)23ACE 交通引擎適用于多個場景:自主泊車、Robotaxi、智能信控、智能貨運、智能公交、智能車聯等。四、城市如何通過智能交通受益智能信控:智能信控的主要作用是調節道路擁堵,提高出行能力,從而降低道路建設成本
50、。智能停車:過去人們對于停車收費的體驗并不良好,現在,我們可以通過人工智能的方式得知車輛何時來到,何時離開,最后通過 APP 或者小程序的方式進行停車收費。圖 5:智能交通:釋放 GDP 增長潛能,促進產業升級智能公交:智能公交可以提高準點率、降低事故率,提高乘客體驗。智能貨運:智能貨運能夠降低長途運輸等路途中的事故率,同時降低貨車油耗。李震宇最后總結道,中國擁有穩定的制度優勢及強大的基礎設施建設能力,基于 5G、IOT 及人工智能相關技術,切實結合人們實際出行需求,解決道路交通出行難題,我們一定能夠實現真正的“交通強國”!24 北京市交通信息中心副主任杜勇:打破孤島,用大數據驅動交通融合發展
51、整理:智源社區任黎明杜勇本次的演講主題是打破孤島,用大數據驅動交通融合發展。杜勇,北京市交通信息中心副主任。長期從事智能交通關鍵技術研發和應用推廣工作,先后主持或參與完成了 863、國家科技支撐計劃等多項國家及省部級重大科研項目??蒲谐晒@省部級科學技術獎 9 項。先后獲得“全國交通運輸青年科技英才”、“北京市百千萬人才工程”、“北京市高層次創新創業領軍人才”等科研稱號。在本次演講中,杜勇回顧了過去十年北京市交通信息中心在北京交通行業大數據資源整合共享和開發利用方面所開展的工作,并基于工作實踐,總結了交通大數據的典型特征及面臨的困局。對于市民對更高品質出行服務提出的新需求,以及不斷涌現的新技術
52、、新業態,他介紹了以“深化交通大數據開放應用,推動交通運輸服務協同創新”為主線的北京智慧交通提升行動計劃,包括該行動計劃的發展愿景、業務架構和技術架構等。以下為智源社區編輯整理的杜勇演講要點。一、交通大數據的困局1.1交通大數據方面開展的工作以交通大數據的困局為出發點,杜勇介紹了過去幾年來在交通大數據方面開展的工作及對他對交通大數據的理解和體會,從 2009 年開始到現在,他在交通大數據領域的主要工作經歷了以下三個階段。從 2009 年到 2010 年是數據匯聚階段,探索建立了交通行業數據中心,實現了交通委內部各個系統數據的接入共享和交換,實現交通行業數據中心從無到有的突破;從 2010 年到
53、 2017 年是數據管理階段,開展了三個方面工作,第一是數據介入范圍不斷擴展,從交通行業內部的公交、地鐵、出租等行業,拓展到了鐵路、民航、氣象部門。第二,實現了交通委內部和北京市其他的政府部門以及交通運輸部之間常態化的數據共享交換,隨著數據量的增大及業務部門對數據的依賴,建立了規范化的管理體系保障數據中心穩定平穩運行;從 2017 年到現在是數據應用階段,而傳統的關系型數據庫已經無法滿足數據的存儲和計算的實際需求,因此,將數據中心升級為并行計算和分布式存儲的大數據中心,圍繞相關實際應用場景開展大數據應用示范工作。1.1.1交通大數據的數據來源目前,從交通行業大數據中心整合數據可知,交通大數據主
54、要有以下三個來源(圖 1):委內的數據:包括了北京市運輸行業的從業人員,營運車輛和經營業戶等基礎信息;路政行業審批執法數據和公路交通流量數據及交通執法的檢查和處罰數據;行業數據:包括了地面公交、軌道交通,出租汽車以及貨運、客運等傳統的交通行業的數據。也包括了近幾年新興的網約車、共享單車等新的交通業態數據。數據類型包括軌道站點,公交線路站點車輛等基礎信息,包括了衛星定位刷卡,掃碼,計價,售票,排班以及訂單等動態運營數據。25 外部數據,從民航部門整合了機場的到離航班等信息。從氣象部門介入了實時氣象數據。圖 1:交通大數據的數據來源1.1.2交通大數據的數據特點在數據管理層面,北京的交通行業大數據
55、管理具有以下三個特點。廣聚合,實現了接入交通行業內外相關信息系統,匯聚數據每日達到 5 億條;強管理,按照 ISO20000 管理體系,實現了中心全流程,可視化規范管理;重服務。開展大數據分析挖掘,支撐交通運行檢測規劃決策出行服務等交通重點業務工作。杜勇介紹,通過對交通大數據進行清洗、計算、分析,并且利用可視化技術對交通相關業務進行服務,目前,交通大數據逐漸支撐了四類服務。如圖 2 所示,左上角和左下角分別是軌道交通站點的客流換乘量以及地面公交的線網運行速度。通過這兩個系統,監管部門可以實時了解交通運行情況,從而對公交線路優化和規劃的政府決策提供數據支撐。右邊兩個圖是實時公交信息,每輛公交車的
56、到站時間和距離以及滿載率,地鐵的站與站之間的客流滿載率。把這些數據信息發送給高德、百度等互聯網企業,讓出行者通過相關 APP 可以查詢他們所需要的出行信息。此外,這些信息數據對互聯網企業開展精細化調度提供了堅實的數據支撐。圖 2:交通大數據的應用服務261.2交通大數據方面開展的工作杜勇認為交通大數據如果要發揮作用,必須要經歷精細化的數據管理;精準化的交通特征計算;智慧化的交通決策分析等三個主要工作。從基礎化的交通設施接入交通的動態運行情況,再應用深度學習,數據挖掘和人工智能等技術對交通大數據進行深層次處理,此過程如用 X 光給人體檢一樣,通過對交通大數據的深度挖掘能夠發現交通的運行情況,交通
57、的問題,有利于開展精細化的開展交通治理工作(圖 3)。圖 3:交通大數據的處理工作1.2.1交通大數據主要有四方面的特征:全面:交通大數據的數據量大而全,其涉及到 PB 級數據量。百億級的數據記錄及涉及的相關領域眾多;混雜:交通數據價值高低并存,包括了交通調度指令、客票信息及監控影像等動態和靜態的數據信息;關聯:交通行業大數據必須實現跨行業的關聯,數據的匯聚實現系統與行業關聯及業務協同;多樣:在數據結構上存在異質多樣的特征,包括結構化和非結構化及流動式等多個樣式的數據。1.2.2交通大數據應用方面存在的主要問題:(一)在信息孤島層面,交通數據存在行業孤島,區域孤島及開放不暢等三個方面問題:從行
58、業孤島來看,交通數據主要體現為行業數據的整合還是不全面;從區域孤島來看,交通大數據存在著不同省市交通部門之間的數據沒有完全互聯互通;從開放不暢來看,雖然有交通大數據,但是面對社會企業、社會公眾包括研究機構等開放的渠道不是很暢通,使交通數據的價值沒有得到很好的發揮。(二)在質量差層面,交通數據存在著以下四個方面問題:27 標準不統一,比如出租車的衛星定位終端設備沒有按照統一標準來生產制造;數據不完整,所采集到的數據有許多核心數據字段存在數據缺失問題;精細化程度不夠,如公交站臺位置不是很精準,全市企業對站點的編碼不統一;穩定性不夠,很容易出現數據中斷問題。因此,杜勇認為交通行業的大數據應該更加重視
59、數據層面的標準建設和質量管理工作,近年來,在交通行業大數據方面做的工作包括統一了北京市出租汽車車載終端的統一技術要求,建立了全市層面的統一的站點線路的編碼規則及利用衛星定位數據精準化矯正位置。(三)在分析弱層面:交通數據主要包括淺、虛、亂等不足(圖 4);淺是對于交通行業數據的統計分析多,對于深層次挖掘以支撐決策的工作比較少;虛是學術理論研究相對較多,對實際交通問題并且解決實際問題的研究比較少;亂是大多數人站在自己角度,利用自己掌握的數據進行分析得出相關結論,但真正站在全市的角度利用跨部門的數據進行客觀分析,得出全局性結論較少。圖 4:交通大數據分析弱困局二、交通大數據的分析與應用:通過對去年
60、北京市交通的現狀、問題及未來的發展趨勢,杜勇介紹了北京交通委制定的智慧交通三年行動提升計劃。在智慧交通新時期、市民對更高品質出行服務的新需求日益迫切、同時,新技術和新業態正在不斷涌現、北京智慧交通的建設亟需把握新機遇、整合提升智能交通設施、深化數據開放應用、推動交通運輸服務協同創新、從而使北京交通運輸步入一個新的發展階段。2.1智慧交通計劃的聚焦方向未來的交通是以預約共享系統最優為主要特征的方向。為了更好地聚焦未來交通的方向,從實現路徑上應該重28塑道路資源,運輸資源和城市空間資源的分配模式,實現交通運輸全局優化,系統協同與智能可控。在技術應用方面要充分利用大數據,人工智能,5G 通信,自動駕
61、駛帶來的技術變革機遇、從而通過技術創新來推動機制創新。2.2智慧交通計劃的工作目標接著,杜勇從該行動計劃的工作目標方面仔細講述了通過推動智能化技術與交通業務的深度融合預期實現的三類目標(圖 5):第一類目標:提升交通運輸整體運行效率;具體體現為讓百姓的公交出行更準時,乘坐地鐵更舒適,出租車更便捷,不同交通運輸方式更協調;第二類目標:實現平衡調節交通系統供需關系;具體體現為交通供需信息匹配,能夠合理引導百姓出行需求,使百姓出行可規劃、可計劃、可選擇、可預期;第三類目標:著力增強智慧交通治理能力,具體體現是是信號燈能夠實現智能調控,交通執法能夠實現線上線下一體化執法,通過技術和機制兩方面能夠充分動
62、員社會力量參與北京市的交通治理工作。圖 5:智慧交通的工作目標2.3智慧交通計劃的業務架構然后,杜勇講述了該行動計劃感知層、數據層、應用層和業務層等的業務架構(圖 6)??偠灾?,智慧交通計劃以智慧感知設施為基礎,全面整合政府、企業、社會化數據,搭建交通大數據平臺,實現交通要素的全景全量采集,打造集交通運行監測、指揮調度、決策支持、綜合信息服務為一體的交通大腦、構建運營、管控、執法、服務等智慧交通應用場景、圍繞優供”、“控需”、“強治”的交通綜合治理思路,該計劃的最終目標為公共出行提供便捷、高效、安全、綠色的服務。29圖 6:智能交通的業務架構2.4智慧交通計劃的技術架構從技術架構方面,該智慧
63、交通計劃以邊、端、云為主線的技術架構(圖 7)。根據北京市交通的特點,該計劃形成了地面公交,軌道交通,運輸服務道路管理等領域的端邊云的技術架構。在這個架構的基礎上構建北京市統一的交通運輸云和交通大腦。這個技術架構主要包括以下四個方面。圖 7:智慧交通的技術架構 建設“1+1+6”的云架構體系:統籌政府、行業、社會各自的資源優勢,打造“一個交通運輸云為中心,一個交管云為協同、六個交通行業為支撐”的云平臺架構;30 建設“一套標準、統一表達、多元融合”的大數據管理體系:整合全景全量的大數據資源,建設城市交通數據中臺和數據共享開放平臺,實現交通大數據的共享和深化應用;建設“端”、“邊”、“云”三層架
64、構的視頻資源分析管理體系:整合全市交通視頻資源,統一管理,建設云計算和邊緣計算一體化的分布式異構調度體系,通過機器學習和人工智能技術,實現車牌識別、人臉識別、行為識別的視頻大數據智能化分析挖掘;建設基于高精地圖平臺和數字孿生平臺的城市交通大腦:構建全市統一的交通高精度數字地圖庫,探索利用物理模型、傳感器數據、運行數據建設北京交通數字孿生仿真平臺,在此基礎上,建設完善北京市城市交通大腦,實現體化監測、自動識別預警、現場數據和視頻聯動、公交線網優化、智能考核評價、體化出行規劃、動態信息服務等業務。2.5智慧交通計劃的行動路線最后,杜勇把智慧交通計劃的行動路線總結為以出行者為中心,開放式建設發展(圖
65、 8)結束本次智源大會報告。該計劃行動路線的內容為將公交到站時間、公交地鐵客流擁擠度、停車位、交通事件、移動支付等動態出行數據向互聯網平臺開放、采用政企合作的模式、面向 C 端共同打造門到門的一體化出行服務(Maas)平臺。充分融合互聯網平臺在人工智能、視頻分析等領域的大數據中臺能力、賦能交通大腦、面向 G 端共同打造用數據驅動、與視頻聯動、和現場互動的新一代交通運行監測預警和指揮調度平臺。圖 8:智慧交通的行動路線31 北航教授杜博文:基于廣義時空數據挖掘的交通復雜行為認知-從研究到工業整理:智源社區任黎明在第二屆北京智源大會 AI 交通專題論壇中,北京航空航天大學杜博文教授做了基于廣義時空
66、數據挖掘的交通復雜行為認知-從研究到工業的主題演講。杜博文,北京航空航天大學教授,博士生導師,國家自然科學基金委優秀青年基金獲得者?,F就職于軟件開發環境國家重點實驗室、綜合交通大數據應用技術國家工程實驗室及北京腦科學高精尖中心。他的主要研究方向為廣義時空大數據挖掘與認知、工程大數據、人工智能與機器學習。圍繞這些研究,他主持了包括國家自然科學基金優青、重大、國家重點研發計劃等 10 余項項目/課題,共發表包括 KDD、TKDE、Networks、TITS、TC 等國際期刊/會議論文 60 余篇,授權發明專利 10 余項,榮獲國家科技發明二等獎(排名 3)及國家技術進步二等獎(排名 3)各 1 項
67、,省部級科技獎項 5 項。杜博文研究團隊的網站是 https:/。本次報告中,杜博文重點介紹了他團隊對交通領域的單源時間序列數據、二維時空數據及高維時空數據等方面的探索,包括探討了如何將相關研究成果應用于具體交通問題的改善等。以下為智源社區編輯整理的杜博文演講要點。一、研究動機1.1研究背景從改革開放至今,我國的交通運輸方式已經巨大的變化,這些巨大的變革標志著我國已經成為交通大國。近年來,隨著國家對交通領域發展目標的不斷明確及在交通領域的研究不斷深入。交通系統諸如多主體、多交通方式、多分布等多因素問題,網約車調度、公交車調度、共享單車調度等散決策問題以及意外交通事故、城市交通擁堵指數、惡劣氣象
68、等強干擾問題也逐漸凸顯出來,這些問題造成了交通供需的解析難度增加,車流、客流聚集等一系列嚴重現象。這些現象意味著龐大而復雜的交通系統正在面臨如何更加高效、精準,智能等關鍵挑戰。1.2研究新機遇隨著大數據技術與交通的深度融合,大數據正成為交通智慧化發展和社會精細化治理的重要技術支撐。數字中國建設等大數據協作方案,為我們解決交通領域的難題與挑戰指明了方向和方法,如通過物聯網技術讓獲取全時全域的城市交通數據成為可能。而這些大數據不僅是城市建設新常態的需求也是社會服務效能提升的重要基礎?;诖髷祿榻煌I域發展提供的重要機遇,杜博文主要研究時空數據(如航空高鐵公路、城市地鐵的變化數據可以映射到空間維度
69、上;而歷史狀態突然變化、居民跨越空間位置的移動行為可以映射到時間維度上;這些數據統一歸結為時空數據)。目前,現有交通領域的時空大數據存在復雜時變及多元異構的缺點,這些缺點給交通領域的研究造成以下三大嚴峻挑戰。群同行為的多擾動與隨機性會導致路網通行狀態的辨識能力弱;32 移動目的多樣性與多變性會使群體移動行為非常復雜;不同數據源的差異性與離散性會導致不同維度的特征關聯性弱。針對上述挑戰,如何對城市交通的復雜行為進行動態認知和響應成為交通領域研究的主要科學問題?;谶@個研究問題,杜博文及團隊主要對基于廣義時空數據挖掘的交通復雜行為認知-從研究到工業進行深入研究。他從以下三個階段開始本次主題演講。二
70、、第一階段:單源時間序列現有交通領域的研究者及交通應用實踐者在最開始時都是對某一個空間路網的運行狀態進行研究。比如,我們在開車過程中,常??吹叫畔⑻崾酒辽蠈δ骋粋€段面的交通流量統計的結果。并且其通常使用 ViSSUM 和TransCAD 等仿真軟件。然而,通過這些軟件進行研究工作的最大的缺點是被動感知,并且感知的范圍極其有限,它僅局限在某條道路的幾個斷面上。這就引發了因位置綁定而難以形成全局感知的問題。針對難以全局感知的難題,杜博文在研究思路中將車輛視為移動傳感器,該移動傳感器可以實現交通數據來源從固定檢測到移動采樣的巨大變革,同時也實現了交通數據由小樣本到交通大數據的轉變。這個巨大的變革從研
71、究思路上實現從對交通領域的研究從一維空間向二維空間的邁進。但是,在真實研究中直接使用移動檢測器會受到數據擾動性及誤差的隨機性影響,這些影響必然導致辨識結果的誤差偏差大?;诖藛栴},杜博文建立了將多個路段關聯成一個區域,然后將各路段時空關聯數據進行融合,再通過建維去擾、缺失補償及融合校驗的方法來提高路網運行狀態的辨識準確率。具體步驟如下:首先,針對多元檢測器檢測結果不一致或者相互沖突的問題構建了區域級的面向多元異構數據的多層級適配融合模型(圖 1)。該模型通過數據源之間的相互校驗及關聯關系來提高計算結果的準確性,實驗結果表明與單元數據相比,誤差降低了 10.3%,保證了數據的穩定性(圖 2)。圖
72、 1:面向多源異構數據的多層級適配融合模型33圖 2:多元異構數據的多層級適配融合模型實驗結果其次,針對移動檢測器位置隨機分布產生的部分信息缺失的問題,杜博文受到指紋識別的啟發提出了基于穩健特征空間映射的稀疏數據補償模型。通過對區域運行狀態綜合特征挖掘及大規模實時數據投影映射轉化的方法保證了數據的完整性。與國際先進方法相比,基于廣域空間位置的時序數據補全方法的交通信息覆蓋率增加了7%,達到了 82%。因此,基于移動位置數據的城市出行信息服務關鍵技術與應用項目獲得 2016 年國家技術發明二等獎。圖 3:穩健特征空間映射的稀疏數據補償模型研究結果34在對第一階段的研究進行總結時,杜博文發現在實際
73、交通應用中,如何根據交通路網運行狀態的實時客流量變化來動態調度公交車的運力及對路網的參數進行設計優化改進都是未知的。所以,單源時間序列的研究方法,在時空二維表征認知能力方面有限,并且非通勤群體行為復雜、關聯特征弱、出行軌跡非連續及個體出行行為不確定性等問題導致單源時間序列難以對路網運行狀態的本質進行真正解析。目前,路網運行狀態最關鍵的研究指標是 OD 量(起始地到目的地之間的群體流量)。通過研究關鍵位置檢測器狀態變化對于路網運行狀態辨識的研究可以看作是在歐拉坐標系下開展的,并且歐拉坐標系對于固定空間位置研究是有效的。然而,如果要解析路網運行狀態就要對群體移動行為進行研究,然而群體移動對于交通的
74、供需是未知的,則歐拉坐標系就不再適用解析路網運行狀態?;谶@個挑戰,杜博文應用拉格朗日坐標研究二維時空數據。圖 4:研究思路的變革 歐拉坐標系-拉格朗日坐標系三、第二階段:二維時空數據在拉格朗日坐標系中,路網運行狀態辨識檢測傳感器的關聯關系從空間位置轉化到研究移動軌跡間的關聯關系,這一轉變使交通領域的時空數據研究從被動感知轉為主動認知,而這個轉變的主要難點在于如何在移動的檢測傳感器間建立關聯關系。因此,交通數據也從單一的二維空間數據轉化為二維時空數據。3.1居民群體出行路徑解析方法3.1.1基于時空相關性特征的通勤客流聚集成因與溯源方法由于城市交通卡與手機位置數據可以全面反映城市居民出行規律,
75、近年來,許多學者利用這兩大數據通過研究通勤群體行為來輔助企業預測出行及輔助公交車調度。然而,這兩大數據存在數據稀疏且不連續的重大問題。針對此問題,杜博文提出了基于時空相關性特征的通勤客流聚集成因與溯源方法。首先,該方法通過分段式動態時間彎曲方法識別出關鍵出行路徑并且進行通勤客流分析(圖 5),然后引入多任務學習預測客流及演示路徑及常態化的出行需求(圖 6)。通過實際測試結果表明該方法誤差為 11.15%,比現有方法降低了 50%(圖 7)。35圖 5:分段式動態時間彎曲方法圖 6:多任務學習方法圖 7:實驗結果誤差率對比分析36將基于時空相關性特征的通勤客流聚集成因與溯源方法應用于北京天通苑區
76、域的通勤群體流量進行預測實驗,該實驗研究發現在與天通苑連接的百余個區域,有九個區域為公交客流的主要通勤區域,通過該方法得到的數據為公交車調度優化提供了數據支持(圖 8)。圖 8:研究方法應用實踐3.1.2非通勤群體出行關鍵路徑識別方法在出行的城市居民中有高達 40%的非通勤群體,這些非通勤群體具有非規律性出行性且群體占比小、特征弱等特點,這些特點大大增加了對于非通勤群體的出行行為機理的研究。針對這個難題,杜博文提出基于無監督加半監督的混合監督學習方法(圖 9),這個方法可以動態識別非通勤群體的出行路徑及識別旅游、購物客流的出行規律。圖 9:混合監督學習關鍵路徑識別研究方法3.1.3基于移動行為
77、規律的群體識別方法杜博文在 2016 年的 KDD 和 2019 年的 KEED 上的文章中3,通過混合監督學習方法把扒手群體移動模式行為識別作為典型異常軌跡的應用場景,利用無監督學習的異常值檢測方法,在規律性出勤群體和非規律性出勤群37體的基礎上,使用 One Class SVM 再次進行分類,進而應用由監督分類模型識別異常軌跡,通過在同一空間位置的頻繁返回模式、逗留模式、徘徊模式等刻劃出了有別于規律性非規律性出勤群體異常移動行為,這個方法可以實現公共交通系統中的扒手識別。通過社交媒體公布的信息與一卡通信息數據進行匹配,建立混合監督學習方法訓練與測試數據集。然后結合一卡通通行數據進行認證,最
78、終實驗結果表明混合監督學習方法的準確率接近 93%(圖 10)。圖 10:混合監督學習異常群體識別方法研究結果3.2基于時態集合的復雜交通行為建模由于上述的三個內容都是從某一個狀態到下一個狀態的轉移,所以可以將其歸類為簡單的時序。但在交通實際參與中,交通狀況與出行行為是耦合的關系且交通路況與出行行為的影響因素更為復雜及數量多?;诖?,杜博文將復雜交通序列數據預測建模為時態集合預測問題。這兩者的主要區別在于時態集合是一組狀態而不是一個狀態。通過時態集合的價可以對復雜的交通事件進行建模。然而時態集合數據具有結構復雜、各因素屬性各異特點,不同因素之間語義關聯,特別是同集合中的元素之間還存在時序依賴的
79、難題(圖 11)。圖 11:時態集合的問題挑戰現有時態問題的解決方法是把這些狀態都向一個低維特征空間進行映射,如 KDD2016,2019 以及 SIGIR2016年的研究工作,這些研究工作大多數依照時間序列和時態事件預測思路(利用集合嵌入模塊集合的低維特征表示)。在兩階段策略中第一階段的低維表征直接作為第二階段的輸入,此方法會導致大量的特征信息損失,致使模型的預測精度降低。38針對上述問題,杜博文拋棄了對每個因素集合學習低維表示的階段,他提出直接以集合中各元素為研究對象并且盡可能多地保留元素自身信息。該方法具體如下:首先,通過元素與元素間、集合與集合之間的關系學習發現一種語義關系學習;然后,
80、通過引入注意力機制學習同類元素間的時間依賴關系,再利用門控機制融合靜態與動態信息的表征信息作為最后輸出的結果來提升預測模型的精度(圖 12)。圖 12:動靜態信息融合的復雜交通行為建模在 2020 年 KDD 的Predicting Temporal Sets with Deep Neural Networks的文章中,通過大規模的實驗表明,該預測方法(即 DSNTSP)在多個數據集中的各項衡量指標平均都超過現有方法的 10%,這個優異的結果驗證了該思路的有效性(圖 13)。圖 13:DSNTSP 研究實驗結果39由于城市在不斷演化,使交通領域的研究范圍由城市內變成城市群,居民出行范圍不斷擴大
81、,出行距離不斷增長,出行模式增多,行為復雜度提高且交通模式同時變成綜合交通模式等巨大的研究挑戰。針對這兩個挑戰,主要有以下兩種研究來解決個體行為的非連續性群體移動規律持續變化性及運行狀態不確定性等復雜性問題。移動行為變化,群體的單移動行為變成了群體的多模式移動行為。比如公交換地鐵,公交換地鐵以及地鐵換單車的積蓄出行。同一空間維度,單種交通資源需求量變為多種交通資源需求量的協同變化。比如現在地鐵站附近到底需要多少輛共享單車,實際上是由共享單車本身以及網約車、地鐵、公交所共同決定的。如果只用共享單車的數量預測單車的需求量一定是不準的,因為會受到出租車、公交等復合影響。上述兩種主要研究表明二維時空數
82、據很難描述連續性出行模式。由此,交通領域的研究問題由二維時空數據上升到高維時空數據。四、第三階段:高維時空數據美國亞利桑那州立大學周教授認為交通行為可以形式化為空間、時間、狀態三個部分。通過對這三個部分的時空數據深度挖掘可以分析出行者的行為模式,交通狀態的演化規律。然而,真實場景中交通狀況肯定是個多維度的,比如在某一時間和空間上,既有出租車行為狀態,也有公交車的行為狀態、共享單車的行為狀態。杜博文把一個狀態的多影響因素、多維度特征都映射到對應的狀態點上,即通過高維特征建模來刻畫學習行為解析這個狀態點(圖 14)。圖 14:研究思路的轉變4.1基于 CoST-NeT 模型的交通需求量聯合預測研究
83、目前,交通需求量的預測研究方法主要針對單一交通方式,這些方法缺乏對多模態交通需求量之間相關性的分析與挖掘。然而,實際上在不同出行方式的交通需求量之間,存在較強的關聯性。因此杜博文提出基于多模態交通需求量的聯合預測方法,首先,將高維時空數據中的每個時間點上不只是單一的交通需求量,而是多種交40通需求量的綜合;再挖掘不同交通方式在時間和空間維度上的關聯關系;最后,將多模式交通需求量預測建模為高維時空數據預測問題進行交通需求量的預測。圖 13:高維時空數據深度關聯與融合預測現有的研究方法主要應用 CNN,RESTENT 等神經網絡模型來獲取某一個時刻的交通狀態。這些方法的不足是沒有對交通需求量空間分
84、布關系深入挖掘。杜博文提出了通過挖掘單種交通方式供給需求與多種交通需求量共性聯合的方法以提高多模式交通需求量預測模型的精度。首先,從微觀角度對交通需求量進行分解,從宏觀對多模交通需求量進行融合;再應用 CoST-NeT(采用多層基于卷積神經網絡的自編碼來進行單種交通需求的特征分析和異質 LSTM 模型將多種交通需求的特征進行融合);最后,應用 CoST-NET 模型學習單種交通需求的不變性和多種交通需求量之間的共性以實現多種交通方式的聯合預測(圖 14)。圖 14:基于 CoST-NET 模型的多種交通方式的聯合預測在 KDD2019 的Co-Prediction of Multiple Tr
85、ansportation Demands Based on Deep Spatio-Temporal Neural Network研究中,CoST-NET 模型預測精度達到 12.5%,并且該模型具有魯棒性高泛化性強的特點(圖 15)。此外,這篇文章也是就目前看到而言最先開展高維時空下多模態交通需求量預測的文章。在實際應用方面,基于 CoST-NET 模型驗證了北京首條自行車“高速”建設的合理性。41圖 15:CoST-NeT 預測實驗結果4.2基于動態圖卷積神經網絡的交通需求量預測研究截止 2019 年,交通需求量研究的最新預測方法主要基于深度學習的思路,基于深度學習的方法將交通網絡建模成網
86、格,并使用卷積神經網絡 CNN 來獲取空間相關性。然而,實際交通存在道路的不規則性和交通需求量在空間分布的不均勻性等特征,這些特征導致使用規則的網格進行交通需求量預測建模時存在著難以準確描述交通需求量的時空分布的問題。因此,杜博文提出了基于動態圖卷積的交通需求量預測方法(圖 16)。通過構建動態的需求轉移矩陣以準確描述歷史出行交通需求量及出行規律;在時空分布方面,將門限循環單元中矩陣乘法替換為動態圖卷積,并動態提取交通需求時空依賴關系解決了難以同時考慮交通時空依賴的難點。圖 16:動態圖卷積的交通需求量預測方法42在 2020 年發表于 TITS 的Traffic Demand Predict
87、ion Based on Dynamic Transition Convolutional Neural Network的研究文章表明了在綜合考慮時空依賴關系及外部環境因素對交通需求量的進行預測時,尤其是對出租車需求量的預測,動態圖卷積的交通需求量預測方法與現有最好方法的 DCRNN 相比,RMSE 精度提高了 50%。此外,通過對分時段的預測結果進行比較,無論是早高峰還是晚高峰,DTCNN 具有更好的預測精度(圖 17)。圖 17:DTCNN 交通需求量預測方法實驗結果此外,將該研究應用在深圳的交通數據集進行了驗證,驗證結果表明 DTCNN 方法能夠反應居民的實際出行需求,可以為公交路線優化
88、提供精準數據支持(圖 18)。圖 18:DTCNN 的實際應用案例五、結語最后,杜博文介紹到上述研究的交通時空數據都屬于廣義時空數據挖掘的框架(圖 19),如從在最開始提到的固定位置的數據研究,可以映射到最簡單的 a 這種結構化數據,地鐵線路數據可以映射到 b 這種一維空間數據,43基于網格的交通數據可以映射到二維的空間數據(c)等。該研究框架還可以發現交通系統的通用特點,比如說除了路面交通數據、大量的地下基礎設施檢測數據、橋梁檢測數據也符合這個框架。此外,廣義時空數據挖掘框架還可以擴展到類似土木工程、橋梁工程、高鐵線路等檢測領域。圖 19:廣義時空數據挖掘的框架參考文獻:1 Transit
89、Pattern Detection Using Tensor Factorization,INFORMS Journal on Computing,2019.2 Bowen Du,Chuanren Liu,Wenjun Zhou,Zhenshan Hou,Hui Xiong.Detecting Pickpocket Suspects from Large-Scale Public Records.IEEE Trans.Knowl.Data Eng.31(3):465-478(2019).3 Bowen Du,Chuanren Liu,Wenjun Zhou,Zhenshan Hou,Hui X
90、iong.Detecting Pickpocket Suspects from Large-Scale Public Transit Records.IEEE Trans.Knowl.Data Eng.31(3):465-478(2019)4 Le Yu,Leilei Sun,Bowen Du,Chuanren Liu,Hui Xiong,Weifeng Lv,Predicting Temporal Sets with Deep Neural Networks,KDD,2020.5 Ye J,Sun L,Du B,et al.Co-Prediction of Multiple Transpor
91、tation Demands Based on Deep Spatio-Temporal Neural Network.Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery Data Mining.ACM,2019:305-313.6 Bowen Du,Xiao Hu,Leilei Sun,Junming Liu,Yanan Qiao,Weifeng Lv,Traffic Demand Prediction Based on Dynamic Transition Convolutio
92、nal Neural Network,IEEE Transactions on Intelligent Transportation Systems,2020.44“AI 交通”圓桌論壇:強基建、重研發、促融合,政產學研攜手,創造立體耦合智能交通網絡整理:智源社區楊依帆在 2020 北京智源大會“AI 交通”專題論壇的圓桌討論環節,百度集團副總裁兼智能駕駛事業群總經理李震宇、北京市交通信息中心副主任杜勇以及北京航空航天大學教授杜博文參與了交流。三位專家針對主持人所提出的問題積極交換了意見,分別從政、產、學、研角度出發,提出了智能交通網絡、數據知識融合、數據隱私保護等方面的相關架構設計解決方案。
93、圖 1:2020 北京智源大會“AI 交通”專題論壇主持人:首先請三位專家暢想一下未來的智能交通。李震宇:未來智能交通主要有三點:一是無人駕駛技術的突破;二是相關政策法規的突破;三是智能網聯道路基礎設施建設。杜勇:智能交通需要完善智慧感知基礎設施,針對城市道路資源、空間資源進行優化,讓百姓的出行可規劃、可預期。我們要變革傳統交通運輸調度方式,通過技術創新來帶動機制和服務創新。杜博文:智慧交通需要城市交通大腦進行決策,外加可控制的末梢神經系統配合運作。人、車、路協同耦合需要構建一張立體網絡,基礎設施保障能讓出行更加安全可靠。45主持人:請談談交通大數據和智能交通服務之間的關系。李震宇:大數據可以
94、衍生出交通服務,交通服務也可以產生大數據。廣義的交通大數據與交通服務可以有許多重疊的部分。杜勇:大數據處在中臺,用于支撐上層的各類智能交通服務。數據應用能力成熟度越高,代表支撐能力越強;反之,數據應用能力越低,服務對數據的依賴程度就越低。杜博文:如何令數據知識驅動服務?關鍵點有四個:感知、認知,協同和預知。感知是感知當前狀態;認知用于追根溯源,通過數據挖掘手段分析感知到的狀態由何原因引起;協同是運用“群知”的手段,通過機器學習、遷移學習等方法構建協同網絡;最后,預知可以判斷演化趨勢,實現智能交通精準服務。主持人:今天幾位專家組成了一個政、產、學、研的專家團隊,請問過往工作經歷給諸位何種啟發?李
95、震宇:隨著協同融合需求的增加,我發現大家的合作共識非常一致,未來政、產、學、研能夠更加緊密地跨領域協作,共享數據信息。杜勇:政府推動交通信息服務可分為三個階段:主導、引導和督導。前期聯合科研機構與企業實現關鍵技術突破;中期鼓勵上下游企業開展合作;后期建立標準規范,加強監督工作,推進產業健康有序發展。杜博文:科研方面一定要深入行業,彌補技術短板。政府接收反饋自學術界與產業界的數據知識,不斷循環迭代,碰撞火花。主持人:數據隱私保護主要有兩種方式:一種是為數據增加噪音或擾動,讓數據進行有損傳輸,另一種是當前熱門的聯邦學習大家彼此保留數據,只開放訪問權,互相傳遞加密參數,共同建模。請問這兩種方式哪種更好?李震宇:這兩種方式我們在實踐中都用到過。在共享前做一些必要的數據脫敏,使得數據流動起來,只有數據流動起來,創造的價值才不可限量。杜勇:我們將公交線路站點等原始靜態數據全部開放,而個人出行相關的隱私數據通過信息平臺加密處理,將處理后的信息服務向企業開放。有損傳輸和聯邦學習這兩種技術方式都值得探索和引入。杜博文:聯邦學習是非常關鍵的技術,通過 DES 把數據包裝成服務形式提供給用戶,同時區塊鏈配合進行加密追溯和智能合約簽訂。通過“數據即服務”的方法將數據鏈接起來,形成可總控的虛擬通道。數據在使用過程中是透明的,用戶并不知道數據來源于何處,而區塊鏈的追溯功能可以追溯到誰使用了數據。