《01開幕式和全體大會.pdf》由會員分享,可在線閱讀,更多相關《01開幕式和全體大會.pdf(44頁珍藏版)》請在三個皮匠報告上搜索。
1、101全體大會2 科技部副部長李萌在 2020 北京智源大會開幕式上的致辭2020 年 6 月 21 日,由北京智源人工智能研究院主辦的 2020 北京智源大會在線上成功開幕。在開幕式上,科技部副部長李萌在線出席并致辭。下面是致辭全文。尊敬的殷勇副市長、各位專家,女士們、先生們、朋友們,大家上午好!去年,我參與了 2019 北京智源大會,對大會提出的打造“內行的 AI 盛會”印象深刻,今年智源大會圍繞“人工智能的下一個十年”開展廣泛研討,將會為全球人工智能的發展走向提供更多前瞻思考。首先,我謹代表科技部,對 2020 北京智源大會的召開表示熱烈的祝賀!人工智能是新一輪科技革命和產業變革的戰略性
2、技術,正在對科技進步、經濟發展和社會治理等方面產生重大而深遠的影響。中國高度重視人工智能的創新發展,2017 年 7 月,國務院印發新一代人工智能發展規劃,明確提出中國新一代人工智能發展的戰略目標:到 2030 年,人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創新中心。近年來,科技部加快推進規劃實施,圍繞人工智能重大科學問題研究、關鍵技術研發和產業化應用,進行了一系列重點部署。一是加快實施科技創新 2030-“新一代人工智能”重大項目,圍繞大數據智能、跨媒體智能、群體智能、混合增強智能、自主智能系統等五大方向持續攻關,加快突破人工智能基礎理論和關鍵核心技術瓶頸。二是推動國
3、家新一代人工智能創新發展試驗區建設,已支持北京、上海、深圳、天津、濟南、浙江德清縣等建設 11 個創新發展試驗區,到 2023 年,將布局建設 20 個左右。三是建設國家新一代人工智能開放創新平臺,依托百度、京東、小米、曠視等領軍企業建設自動駕駛、智能供應鏈、智能家居、圖像感知等 15 個開放創新平臺,推動基礎軟硬件和技術的開放共享,服務人工智能創新創業。四是高度重視人工智能治理問題,成立國家新一代人工智能治理專業委員會,發布新一代人工智能治理原則,提出和諧友好、公平公正、包容共享、尊重隱私等八條原則,并探索建立人工治理國際交流平臺,推動全球發展負責任的人工智能。五是推動人工智能與實體經濟深度
4、融合。培育發展人工智能新興產業,促進傳統產業智能化升級改造,推動產業鏈、價值鏈的高端化。特別是在應對此次全球新冠疫情中,推動人工智能技術在病區管理、流行性病學調查、藥物研發、輔助醫療診斷、社區防控、疫情監控、風險分析預警等方面的廣泛應用,為全球疫情防控工作積累了豐富的經驗與成功案例,可為世界各國利用人工智能等技術建立應對疫情機制提供借鑒和參考。北京是首個國家新一代人工智能創新發展試驗區。在試驗區建設過程中,希望北京市依托自身科技資源和產業發展優勢,持續加大投入、深化改革、完善機制、強化保障,突出把握好“三個引領”:一是原創引領,希望北京市依托智源研究院等新型研發機構,建立完善適應于人工智能基礎
5、前沿研究的科研制度,持續加大人工智能頂尖科學家培養,在人工智能原始創新方面取得更多突破性成果,引領全球人工智能創新方向,形成具有全球影響力的人工智能“北京學派”。同時要積極推進人工智能“新基建”發展,強化人工智能創新發展的基礎支撐條件。二是改革引領,希望北京市持續圍繞數據開放與保護、應用場景開放、成果轉化、知識產權保護等方面開展政3策先行先試。深入推進公共數據有序開放,加快智能醫療、智能交通、智能政務、科技冬奧等優勢領域應用場景建設,推動領先人工智能技術示范應用,并加快制訂適應人工智能發展的政策框架和法規標準體系,為人工智能科學研究、技術開發、產品創新、產業發展和社會應用營造良好環境。三是開放
6、引領,希望北京市以更加包容、開放的心態融入全球人工智能創新生態,推動智源研究院等研究機構積極參與人工智能領域國際重大科研計劃,加強與國際頂尖人工智能研究機構的國際合作,推動建設鏈接全球人工智能創新網絡的重要節點。同時要積極參與國際人工智能治理,推動新一代人工智能治理原則和人工智能北京共識落地,為未來打造“負責任的、有益的”人工智能,為開放合作和包容共享的智能時代貢獻更多的“北京智慧”。為進一步推動北京構建開放協同的人工智能生態系統,科技部正聯合相關部委共同編制關于支持北京加快建設具有全球影響力的人工智能創新中心行動計劃,從人才培育、基礎前沿研究、創新服務平臺建設等方面強化支持,助力北京打造世界
7、一流的人工智能發展高地。最后,希望智源研究院加快建設,在人工智能基礎理論與共性技術上產出具有重要國際影響的原創成果,早日建設成為匯聚全球頂尖科學家研究力量的重大戰略平臺。預祝大會圓滿召開!謝謝大家!4 北京市副市長殷勇在 2020 北京智源大會開幕式上的致辭2020 年 6 月 21 日,由北京智源人工智能研究院主辦的 2020 北京智源大會在線上成功開幕。在開幕式上,北京市副市長殷勇在線出席并致辭。下面是致辭全文。尊敬的各位嘉賓,各位新老朋友,大家好!在全球抗擊新冠肺炎疫情的特殊時刻,我們舉行第二屆北京智源大會,同世界人工智能領域的頂尖專家學者通過視頻相聚,共同探討未來十年人工智能的發展走向
8、,意義十分重大。首先,我謹代表北京市人民政府,向出席大會的專家學者和業界精英,表示誠摯的歡迎。當前,新冠肺炎疫情仍在全球蔓延,給世界各國經濟社會發展帶來嚴重沖擊,奪走了數十萬人的寶貴生命。面對疫情,我們最需要做的,就是堅持人民至上、生命至上,全面加強國際合作,特別是大力推動科技領域的國際交流合作,發揮科技防疫的支撐作用,凝聚全球戰“疫”的強大合力。人工智能作為引領新一輪科技革命和產業變革的戰略性技術,具有溢出帶動性很強的“頭雁”效應,正在對經濟發展、社會進步、國際政治經濟格局等產生重大而深遠的影響。在這次疫情防控中,人工智能的優勢得以凸顯,在中國和北京產生了很多典型應用場景。比如,我們利用人工
9、智能,在高密度人流中快速、準確地識別出體溫異常者;我們利用 AI 技術開展遠程問診,有效降低了醫護人員近距離接觸感染的風險;我們利用人工智能影像輔助診斷技術,大幅提高診斷效率,緩解了醫護人員緊張問題;我們通過人工智能有效減少病毒檢測中的重復性工作,提高了檢測效率;等等。同時我們也認識到,當前全球人工智能發展整體上仍處于起步階段,許多基礎性的科技難題尚未突破,在行業應用、生態構建等方面仍面臨一系列難題與挑戰。我們認為,克服這些難題與挑戰,需要統籌各個國家的創新資源,加強知識與信息共享、學術與市場互動,推動多元文化碰撞,促進創新要素互補與整合,從而降低創新成本,提高創新效率,加速科學發現。而在所有
10、這些工作中,起決定性作用的,還是人的交流與合作。我們應該本著對人類負責、對科學負責的精神,采取更加務實的舉措,為各類人才開展國際交流合作創造條件、提供支撐。北京作為中國的政治中心、文化中心、國際交往中心和科技創新中心,是中國人工智能資源最豐富、創新最活躍、人才密度最高的城市。北京擁有人工智能相關人才近 4 萬人,占全國總量的近 60%;北京的人工智能相關企業超過 1 千家,占全國近 30%,曠視、寒武紀、地平線、云知聲等 8 家公司入選 CB Insights 2020 年全球AI 獨角獸公司榜單,第四范式、創新奇智、禾多科技 3 家公司入選 CB Insights 2020 年全球 AI 初
11、創公司 100強榜單;同時,北京還擁有中國首個新一代人工智能創新發展試驗區,布局建設了 7 個國家新一代人工智能開放創新平臺。近年來,我們明確將人工智能作為北京科技創新和產業發展的重點領域之一,采取一系列舉措,推動人工智能加速發展。人才方面,我們持續加大投入和支持力度,制定出臺一系列針對性人才政策,不斷拓寬人才寬度和厚度,努力為各類人才在京發展提供最好的條件??蒲蟹矫?,我們聚焦原始創新和核心技術,建立自由探索與5目標導向相結合的科研體制,組建北京智源人工智能研究院等新型研發機構,支持科學家勇闖人工智能科技前沿“無人區”,開展原創性強、非共識的探索性研究,挑戰最基礎的問題和最關鍵的難題。資金方面
12、,我們設立了總額為 300 億元、放大后規??蛇_ 1500 億元的科創母基金,用于長期穩定支持包括人工智能在內的各類前沿科技的研發。應用場景方面,我們積極推動人工智能在醫療、交通、教育、城市治理、政務服務等領域廣泛應用,并且將全市的重大項目、重大工程向人工智能技術應用開放,努力構建智慧城市。下一步,我們還將進一步加大投入力度、工作力度和創新力度,最大限度消除制約人工智能發展的各類障礙,構建更加包容、開放的人工智能創新生態,為全世界人工智能人才在北京開展學術交流、科學研究、創新創業營造更加優良的環境。各位專家學者、行業精英,得力于你們的卓越工作和杰出貢獻,人工智能技術在過去十年間取得重大突破,人
13、工智能產業取得爆發式發展。面向下一個十年,如何實現從專用人工智能向通用人工智能的跨越式發展,如何加速人工智能的商業化應用,如何有效應對人工智能發展涉及的法律、倫理問題,如何讓人工智能在促進全球社會、經濟和環境可持續發展方面發揮更加積極的作用,都有待于大家去共同探索。我們舉辦北京智源大會,就是希望為國內外人工智能領域的優秀人才搭建一個開展前沿學術研討的交流平臺,進行靈感的碰撞、思想的交鋒。希望大家借助這個平臺,深入研討未來全球人工智能的發展趨勢,積極開展科學研究、技術研發、人才培養等方面的交流合作,同時也歡迎各國人工智能人才來北京創新創業,共同為全球人工智能的賦能共生、繁榮發展貢獻力量!最后,預
14、祝大會取得圓滿成功!謝謝大家!6 智源研究院院長黃鐵軍:智源進展報告各位專家、朋友們好!我是北京智源人工智能研究院的院長黃鐵軍,下面我將代表智源研究院簡要匯報我們在過去一年中的主要進展和未來一段時間的主要發展計劃。首先,讓我們簡單回顧一下智源研究院的發展愿景,它分為四個層次:1.聚焦原始創新和核心技術,建立自由探索與目標導向相結合的科研體制。2.支持科學家勇闖人工智能科技前沿“無人區”,挑戰最基礎的問題和最關鍵的難題,推動人工智能理論、方法、工具、系統和應用取得變革性、顛覆性突破。3.營造全球最佳的學術和技術創新生態,推動北京成為全球人工智能學術思想、基礎理論、頂尖人才、企業創新和發展政策的源
15、頭,率先成為國際領先的人工智能創新中心。4.推動人工智能產業發展和深度應用,改變人類社會生活,促進人類、環境和智能的可持續發展。下面,我從五個方面報告智源研究院近一年來的主要進展。一、智源學者首先是“智源學者”計劃,這是 2019 年 4 月開始執行的,目的是遴選最優秀的科學家,挑戰最基礎的問題和最關鍵的難題。在過去的一年里,我們先后設立了人工智能的數理基礎、機器學習、自然語言處理、智能信息檢索與挖掘、智能體系架構與芯片五大方向,遴選并支持了以“智源研究員”和“智源科學家”為主的學者 69人。2019 年底我們還遴選了以“自由探索”為使命的 16 位青年科學家,總數達到了 85 人,他們分別來
16、自于北京大學、清華大學、中國科學院等高校院所和在京優秀企業。圖1:以一流學者為核心,實施“智源學者計劃”。智源學者計劃擴充為五個層次,培育和支持人工智能優秀科技人才,建設世界人工智能人才高地,人數再增加100名,其中智源研究員和青年科學家20+、智源新星20+、探索者30+、博士后30+。7今年我們將智源學者計劃擴充為五個層次,繼續再增加支持 100 人,除了去年已經執行的“智源研究員”和“青年科學家”保持不變之外,新增了“智源新星”,這個層次的人才要求 33 歲以下,由智源研究院和在京的高校、院所同步引進,進行人工智能的開放性、探索性的研究。我們還設立了“智源探索者”這樣一個新層次,它面向所
17、有有意到北京發展、但尚未確定目標單位的人工智能優秀人才,不拘一格。智源探索者不僅可以在智源進行潛心研究,而且智源也會協助他們對接合適的北京高校院所和企業。在博士后層次,智源今年正式設立了博士后工作站,聯合優勢高校院所,招收優秀的博士后開展前沿研究。圖 2:智源研究院的重大方向布局圖 2 中大致描繪了智源在重大研究方向的布局,以及這些方向與我們重要任務、目標的關系??v向就是我們的重大方向,比如剛才說的已經成立的五個重大方向,以及今年已經在醞釀、爭取盡早公布的三個新方向:認知神經基礎、決策智能和機器感知。此外,我們還專門為非共識的、完全開放的探索研究設置一個“開放探索方向”。所有這些研究方向和我們
18、現在做的各方面任務有密切的關系,比如所有這些方向都可以參與“智源社區”的建設,所有這些方向都會追求“學術突破”。當然各個方向關注的重心可能會各有側重,圖中大的實心圈就表示這樣的關系,比如數理基礎的重心是學術突破,芯片系統和信息檢索挖掘的重心在成果轉化等。應用方面,我們目的面向三大應用場景:智能醫療、智能交通和智能政務,它們也在各大方向中各有側重。我們還在規劃面向未來的一些重大研究任務,比如如何制造能力更強的智能機器,如何設計更接近人類認知的認知圖譜,以及從去年開始的人工智能倫理和科學應用發展方面的一些工作等。所有這些方向都會參與這些任務的實施。二、智源社區智源社區是互聯網上的智源研究院,經過一
19、年多的建設努力,今天,我們正式發布智源社區,目的是構建高度合作的人工智能社區,營造活躍的學術和技術創新生態,通過進一步加強社區成員的協同效應,培養培養出新一代問題的發現者和解決者。8圖 3:智源社區構建人工智能學者社交網絡,營造學術和技術創新生態正在觀看智源大會的數萬名朋友,你們現在已經體驗了智源社區的部分功能活動系統和線上論壇,大家可以輸入網址 baai.org,或掃描屏幕上的二維碼,注冊成為第一批社區成員,與本次大會報告嘉賓線上交流,更多功能將在智源大會結束后對外開放,包括以展示研究成果,探討新發現,參與智源大會、學術報告會、主題沙龍、論文分享等活動;社區還將幫助學者、學生、開發者、創業者
20、找到學術交流與技術合作的伙伴,社區將緊密聯系 3000 名以上的人工智能領域頂尖學者,輻射 10 萬以上人工智能科研和技術人員。圖 4:世界首個“機器學習通用數學符號集”,部分樣例。作為智源社區的公共服務之一,今天我們將發布由多所高校和多位領域學者緊密協作的成果世界首個“機器學習通用數學符號集”。目前,機器學習是一個熱門的研究方向,但研究學者們往往來自不同領域,而論文中所用記號差別很大,便造成論文閱讀困難?!巴ㄓ脵C器學習符號集”針對常用且易混淆的符號,給出一套標準化建議并提供 LaTeX 包,輔助論文寫作過程中的常用符號選擇,以解決符號混亂導致的交流障礙問題。本次會議,智源研究院將與清華大學人
21、工智能研究院、創新工場共同發布人工智能下一個十年報告。報告9通過科技情報大數據平臺 AMiner 對人工智能領域的學術論文進行數據挖掘,并結合行業投融資等數據,回顧展望 AI 技術、人才、產業、政策、治理等方面的發展情況。報告可以通過注冊成為“智源社區”成員獲得。以下是一些主要研究發現,更詳細的分析內容大家可以閱讀報告來了解。首先是科研方面,報告對比了中美的 AI 科研實力。借助 AMiner 系統,基于 2009-2020 年 AI 領域 45 個頂級期刊和會議所收錄的論文進行數據挖掘和分析,美國發表的論文數和學者數都是我國的 2-3 倍,所以我們應該更加努力。在報告分析的 20 個人工智能
22、領域里面,人機交互、知識工程、機器人、計算機圖形等領域,中國與美國的差距尤其大。圖 5:2009-2020 年間 AI 領域,中、美兩國論文量和學者量對比。中國學者量和論文量都約是美國學者量的三分之一,但人均論文產出量略高。中國國內我們也對城市分布做了統計,北京擁有國內 AI 高校和企業的數量資源優勢,在 AI 領域的論文量和人才量最多。相對而言,深圳和香港 AI 人才在發表論文方面更努力,其人均論文產出量更多。圖 6:人工智能領域論文發表量 TOP10 國內城市。AI 投融資方面,大家可能已經注意到了,中國 AI 創業熱潮自 2013 年起興起,每年新成立的 AI 創業公司數量增速明顯,直到
23、 2015 年爆發達到近 10 年的頂峰,此后兩年 AI 創業雖有下滑趨勢但仍保持較高水平,直到2018、2019 年呈現斷崖式下跌。目前中國 AI 企業創業方向集中在機器學習、計算機視覺、自然語言處理等技術層,以及金融、教育、交通、工業等行業應用層。10圖 7:中國 AI 創業企業數量在各領域的分布情況。數據來源:IT 桔子、北京智源人工智能研究院圖 8:中國 AI 領域歷年投融資事件數量及融資總額。數據來源:IT 桔子、北京智源人工智能研究院報告也對人工智能技術的未來發展進行了分析,我們認為,機器學習與深度學習在人工智能領域應用廣泛并取得顯著成果,但受限于底層算法,使得人工智能技術發展達到
24、瓶頸,未來需要與數學、腦科學等結合實現底層理論的突破。同時,要實現具有能理解、會思考、有認知、會決策的強人工智能,離不開數據支撐和知識驅動,將知識圖譜、認知推理、邏輯表達結合的認知圖譜也將是未來的一個重要研究方向。11三、數據中心和智能醫療數據中心和智能醫療方面,智源研究院成立了數據開放研究中心,圍繞“開放數據”、“知識圖譜”、“算法平臺”三大主題,建設數據與知識開放平臺。在“開放數據”方面,我們推出行業基準系列數據集和智源大賽系列數據集,旨在推動人工智能領域的數據與知識共享。今年,自疫情初始,我們發布了最全的“新冠肺炎開放數據源”,從疫情、科研、知識、媒體和政策這五個方面收集了來自世界各地各
25、種類型的相關開放數據,已吸引來自全球各地近四萬人次訪問和下載。除此之外,我們在疫情應對方面持續加力,通過構建一個大規模、結構化的中英文雙語新冠知識圖譜,用知識支撐 AI,提供更多智能服務與應用。在“算法平臺”方面,通用智能平臺CogDL 的構建為研究人員提供了基于圖的模型開發與測試工具,在健康醫療方面給予安全可靠、高效便捷的智能預測服務。接下來,我們將繼續聯合曠世發布全球最大的物體檢測數據集,和京東聯合發布多模態人機對話數據集,和智源學者朱軍團隊聯合發布 AI 安全數據集,并舉辦相應的競賽,推進人工智能行業數據共享。圖 9:智源數據開放研究中心在“數據研究”方面,針對智能醫療領域面臨的數據孤島
26、和數據安全隱私的挑戰,我們研發了智能醫療共享計算平臺。在“數據共享”和“數據競賽”方面,我們推出行業基準系列數據集和智源大賽系列數據集,旨在推動人工智能領域的數據與知識共享。為了推進新冠肺炎藥物研發,我們發布了智源抗疫-藥物研發小分子性質預測賽。圖 10:智能醫療開放平臺12剛才講到,新冠疫情的抗疫是過去半年左右的時間里智源研究院的一個重要任務,我們新冠疫情數據計算平臺上線了“知識疫圖-全球新冠疫情智能駕駛艙”,基于知識驅動、全球疫情統計數據和預測模型,對世界各地的疫情發展及風險狀況進行量化評估和預測,提供復工、復產各方面的輔助決策支持,包括地區疫情風險評估、政府政策推薦、個人生理和心理健康自
27、測評估等。此外,我們智源聯合清華、協和、首都醫科大學共同發布的乳腺癌智能計算與預測平臺 SonoBreastX,可以自動預測病變腫瘤良/惡性及其分子亞型,輔助醫生進行乳腺癌診斷。為解決智能醫療領域的醫療數據共享問題,智源研發了聯邦學習多方安全計算平臺,接下來會基于乳腺癌數據集進行智能醫療領域聯邦實驗,突破醫療數據共享關鍵技術的研發。四、創新中心創新中心是智源為推動人工智能產業發展和深度應用設立的成果轉化創新載體,也是支撐人工智能產業發展的重要一環。創新中心通過開放智源的生態資源,支持關鍵核心技術攻關,推動 AI 原始重大創新和關鍵技術落地和深度應用。圖 11:智源創新中心人工智能研究成果轉化、
28、創新載體具體來講,分為三個層面:1.圍繞智源重大學術方向,支持智源學者或高校院所的 AI 科學家,基于自身的原始重大創新成果進行技術開發創新,實現成果落地;2.支持已初步實現落地成果的重大技術或行業共性關鍵技術進行工程化驗證和應用探索,實現跨越式發展;3.支持新興行業發展過程中對人工智能關鍵技術需求開發,加速人工智能面向實際應用的廣泛滲透和應用。創新中心將把自己的創新生態資源開放出來支持大家,提供包括研究者、開發者以及創業者共同合作的良好土壤,共同探索人工智能領域前沿技術的落地,共同推動中國人工智能產業的發展。歡迎大家加入創新中心。五、倫理與可持續發展最后一個方面是倫理和可持續發展。去年,智源
29、牽頭發布的了人工智能北京共識,得到國內外廣泛關注。我們也嚴格按照北京共識進行實踐。下面,我講兩個例子。13第一個典型的例子,是保護隱私的傳染鏈密切接觸者精準追蹤系統。智源研究院團隊從 3 月份開始就著手研發常態化防控技術,研發一種保護隱私的傳染鏈密切接觸者精準追蹤系統,稱為智源藍保,Blue Bubble。能夠精準追蹤感染人員相對位置,快速排查與感染者有近距離接觸風險的人員,大幅降低隔離人員比例,降低經濟損失。圖 12:智源藍保技術框架藍牙 ID 碰撞+近距判斷+本地邊緣存儲使用到的技術,就是手機、手環上隨手可得的的藍牙設備,通過設備 ID 之間的相互碰撞和記錄近距離接觸。當感染者被確診,他手
30、機上記錄的行動軌跡由疾控部門公開,其他人和安裝量藍牙設備的場所通過比對發現密切接觸人員,做到精準追蹤。未有近距離時空交叉者,不必隔離,不用現在這樣發現一名感染者,整個街道或整個社區全部隔離。需要特別說明的是:除了藍牙 ID 匿名化處理之外,我們記錄的藍牙兩兩發現數據,自始至終沒有離開過該場所,或者存在用戶手機上,全程不上網,不上傳商業數據庫,所以不會數據外泄??偨Y起來就四句話:場所數據不離場,個人隱私不離機,患者軌跡供比對,能自證者不隔離!最近人民日報報道了這項進展。我們的智源藍保有四大優勢:GPS、手機網絡定位,粒度太粗,無法精確到場所內部、大樓內部,而我們設計的基于藍牙發現的技術可以精確到
31、一兩米。前面提到,我們的數據全程不離場、不離機、不上網,就和大樓內的視頻監控數據一樣在本地保護起來。支持常態化防控,比如大樓內人員聚集熱度圖;或者確診病例出現時,可以恢復他在樓內的位置軌跡,這一過程還是本地化操作,匿名化。我們已經在量子芯座實現示范樓,充分利用了大樓內的已有無線網絡和邊緣存儲,1000 多平米一層樓成本不到 1000 元,兩三個小時就可以完成部署安裝調試。智源藍保系統,未來有望和視頻監控一樣,成為智慧樓宇的標配,比視頻監控成本低很多,而且不涉及人臉圖像等隱私信息。14聯合國可持續發展目標(Sustainable Development Goals,SDG)由聯合國 2015 正
32、式通過,旨在從 2015 年到2030 年間以綜合方式徹底解決社會、經濟和環境三個維度的發展問題,轉向可持續發展道路。人工智能是能夠改變社會的顛覆性技術,也是能夠推動社會進步的使能技術。應當通過新一代人工智能的發展促進全球可持續發展目標的實現,這既是寫入國家新一代人工智能發展規劃、國家新一代人工智能治理原則的目標,也是全球人工智能產、學、研界的共同目標。人工智能的科研機構、教育機構、企業有責任通過人工智能推動社會、經濟、環境的可持續發展。圖 13:建立面向可持續發展的人工智能智庫,發布面向可持續發展的人工智能公益研究計劃為此,北京智源人工智能研究院擬建立面向可持續發展的人工智能智庫,發布面向可
33、持續發展的人工智能公益研究計劃。我們將聯合全球科研機構相關學者,并邀請“對采用人工智能實現可持續發展有共同愿景”的國內、國際企業作為伙伴單位,成立面向可持續發展的人工智能公益研究計劃。智源研究院將作為管理機構執行該公益研究計劃的資助,組織全球相關專家成立科學委員會,與參與共建的企業共同擬定年度資助方向并評審、并向全球發布相關課題。組建面向可持續發展的人工智能智庫平臺,負責計劃和研究成果的全球發布和推廣。智源研究院作為組織管理機構,從中不收取任何費用。研究項目將向全球開放申請,研究成果在公益研究計劃官網向全球公開,支持在遵循開源許可協議條件下無償使用。目前接受企業申請,作為戰略合作伙伴和共同發起
34、單位資助相關研究計劃,曠視、滴滴、小米三家企業已經表示準備支持,希望更多企業能夠共同支持這項計劃,為推動人工智能技術對全球的可持續發展做出更多的貢獻。最后再次感謝大家長期以來對北京智源人工智能研究院的支持,讓我們共同努力,建設人工智能創新的活躍生態,共同推動人工智能技術的發展以及人類社會的進步。15 卡內基梅隆大學教授 Ruslan Salakhutdino:將領域知識融入深度學習模型整理:智源社區錢小鵝在第二屆智源大會“全體會議”中,Ruslan Salakhutdinov 教授分享了主題為Incorporating Domain Knowledge into Deep Learning M
35、odels(將領域知識融入深度學習模型)的報告。RuslanSalakhutdinov,是卡內基梅隆大學教授,加拿大統計機器學習研究主席,微軟學者和斯隆獎獲得者,主要研究領域為深度學習概率圖模型和大規模優化,師從 GeoffreyHinton,是剪枝、深度編碼等著名學習方法的提出者。他于 2009 年獲得多倫多大學的博士學位,隨后又在麻省理工大學開展了為期兩年的博士后研究。2016 年,入職卡內基梅隆大學,同年獲得英偉達人工智能先驅獎,并加入蘋果公司擔任 AI 研究總監。目前Ruslan 已累計發表學術論文 300 多篇,是深度學習領域年輕一代領軍科學家,主要的研究方向為:語音識別、計算機視覺
36、、推薦系統、語言理解、藥物研發及生物圖像分析。Ruslan 認為,雖然我們用 AI 算法可以解決很多問題,但還是面臨很多局限性和挑戰,主要分為這四大類:1.自然語言理解與推理2.人工智能:深層強化學習和控制3 將領域知識融入到深度學習模型中4.多模態、半監督學習、自監督學習本次講座中,Ruslan 主要為我們深入分享了他的團隊在上述第二、第三項挑戰領域中,所進行的探索和最新成果。一、將領域知識融入到深度學習模型首先,Ruslan 為我們剖析了一個非常有意思的例子,如下圖 1,如果我們試圖回答如下這個問題:據我們所知,哪些冠狀病毒可以感染人類呢?答案有三類:MERS-CoV、SARS-CoV 以
37、及 Covid-19。想要回答這個問題,我們可以從多個渠道亦或者我們自身現有的知識庫中挖掘到答案,但我們不難發現的是,這是一個關于生物防疫或病毒方向的專業問題,無論我們調用上述所說的哪種渠道回答這個問題,我們最終所調用的必然是與該問題相同或相關的領域知識,也就是 Ruslan 本次講座中的關鍵詞Domain Knowledge。圖 1:哪些冠狀病毒可以感染人類?16領域知識在回答復雜問題是非常重要的,尤其是我們現在的工業場景中所需要的交叉知識更為豐富,例如自動駕駛,在現行的自動駕駛算法方案中,依賴的領域知識是非常豐富的:我們需要從攝像機中采集圖像,利用計算機視覺的一些算法來處理圖像;同樣,我們
38、也需要從其他傳感器,例如激光雷達、GPS、IMU 等中收集數據,來構造圖像的輔助算法。顯然,構造一套完整的自動駕駛算法需要多個領域的知識支撐,同樣回答上述圖 1 中提出的問題,也需要多個領域的知識支撐,如下圖 2。因此,如何收集相關的數據、如何找到數據間的邏輯關系,如何將這種推理關系抽象成模型,甚至將其抽象成標簽依賴性非常弱的弱監督學習模型,一直是該領域的關鍵挑戰。圖 2:領域知識在深度學習推理中應用時的關鍵挑戰解決上文中提到的“關鍵挑戰”有很多不同的方法,Ruslan 為我們分享了其中一個研究方向使用知識庫和文本結合的方法建立開放域問答系統(如圖 3)。首先,我們先為大家介紹兩個比較核心的關
39、鍵詞:開放域以及知識庫。開放域。開放領域問答系統的概念雖然提出的時間并不長,但已經形成發展出了一些比較成熟的系統。它起源于 1993 年麻省理工學院人工智能實驗室開發的 START 系統。所謂開放域問答系統,即采用基于知識庫和指定的檢索方式,對用戶提出的問題進行自動的答案搜索的系統。如果用戶提出的問題在系統的知識庫中,則直接返回正確答案。反之,如果用戶提出了超出系統知識庫的問題,則系統將會分析問題的關鍵詞,并通過搜索引擎搜索關鍵詞得到相關信息,對信息進行后處理后得到較為準確的答案。知識庫(KnowledgeBases,KBS)。所謂知識庫,其實就是將互聯網上的信息經過專家人工提取和構造,以三元
40、組的形式存儲下來(Subject,Relationship,Object),是一種非常結構化的信息,比較知名的有FreeBase。在人工智能興起之前,傳統的 QA 都是通過知識庫進行檢索或者信息抽取等方式進行建模的。有了知識庫,那么給定一個問題我們自然可以進行檢索記憶并作出回答。該問題的挑戰在于,由于問題往往是以自然語言的方式提出,而知識庫是高度結構化的組織,所以如何進行檢索或者信息抽取其實是一個很困難的工作,同時,面對 KBS 這么龐大的知識庫應該如何解決內存容量問題也同樣是值得不斷優化的方向。17圖 3:使用知識庫和文本結合的方法建立開放域問答系統自人工智能興起后,在知識庫中快速搜素答案成
41、為了可能。通常,整個過程可以描述為(如圖 3):首先,我們在知識庫中確定具體的關鍵詞;其次,將這些詞進行文本挖掘;最后,結合文本信息建立知識圖譜。如果將神經網絡引入知識圖譜模型,其本質即是我們通常所說的圖神經網絡。使用圖神經網絡進行答案挖掘(換句話說即為,整合文本信息獲取知識圖譜信息)是一件非常有趣的事情,學界的研究也非?;馃?。隨著研究的深入,大家把方向轉向了更為復雜的問題Multi-Hop Question。Multi-Hop Question,多跳問題,顧名思義也就是回答問題需要多步推理過程。與 Single Face 相比,多跳問題屬于復雜問題的一類子場景。為了方便大家理解,我們不妨先為
42、大家分享一個實例。如下圖 4 所示,如果我們試圖讓回答系統回答一個較為復雜的問題:生產 Voglibose 的公司總部設在哪里?那么,其實我們可以把這個問題分為兩個問題回答;1.哪家公司生產 Voglibose?2.該公司的總部設在哪里?整合大量的文本信息后,我們了解到,Voglibose 這種藥物的生產公司為武田制藥公司,該公司是日本最大的制藥公司,該公司的總部設在日本大阪。用這種方式,我們通過連續的回答兩個簡單問題,最終回答了一個復雜問題。當然,多跳問題也能分解為三個或更多的簡單問題。Ruslan 隨即提到,對于該問題能否做到端到端、更有效、組合更具靈活性?18圖 4:多跳問題實例分析圖R
43、uslan 及其團隊成員在該領域已經做出了一些成果,他介紹到,整個多跳問題可以通過圖神經網絡解決,該神經網絡大體可以分為四個模塊:GraphConstruction 該模塊的核心目標建立圖,將與問題及答案相關的數據存儲為圖類的數據結構,主要包括:1)根據關鍵冊檢索相關段落,尋找到與關鍵詞匹配度最高的 N 個段落;2)尋找能夠鏈接到其他相關短多的 facts and entities;3)為上一步中相關的段落和實體添加邊。ContextEncoding 該模塊的核心目標是為了把所有的搜索到的段落或實體拼接成一個整體,我們稱之為 Context,結著我們將原始的問題 Question 一同拼接起來
44、,進行編碼,將編碼后的結果輸入到神經網絡中。通常,我們使用 Bag-Of-Symbol 的方法對段落或實體進行編碼,將知識庫存儲成一個 N 維的向量,并使用 Bag-Of-Ngrams 的方法對原始的問題進行編碼,存儲為 Nv 維向量。19 GraphReasoning 該模塊的核心目標是利用圖神經網絡,進行圖中信息的傳播,訓練各實體類型節點中連接邊的權重,同時學習圖神經網絡中各門的注意力和表達能力,用于做答案區域抽取。Multi-taskPrediction 該模塊的核心目標是圖推理之后,更新過的節點表示被用于不同的子任務,由于答案可能不在實體節點中,因此我們需要構造一個有效的損失函數,對整
45、體編碼的內容進行回歸,從而進行多任務的預測。在整個的流程中,我們注意到,以實體(Entity)作為節點,關系(Relationship)作為邊,記憶作為矩陣進行結構化存儲,使得問題更具有計算性。我們可以根據問題找到相關記憶,并對其進行加權求和,同時,我們考慮記憶對問題的稀疏性,使得在計算的過程中可以直接使用大量稀疏矩陣的算法模塊進行存儲和計算,有效的加快了推理速度,減少了內存的損耗。同時在端到端記憶傳播的過程中,Ruslan 引入得分機制將實體與問題的相關性分數與實體共同存儲在數據結構中,最終得到答案。Ruslan 談到,他對這個項目是非常感興趣的,因為我們通常在開放式回答系統背后嵌入的知識庫
46、是基于維基百科的,或基于某個知識庫的側面。但Ruslan 所建立的知識庫是非常與眾不同的。由于記憶矩陣的嵌入,以及這些特定的數據結構和網絡架構,使得多個問題的“軟連接”(問題之間的邏輯關系)更容易得到,同時魯棒性也更強,基于此,Ruslan 可以建立一個完全由他個人“控制”的知識庫,這個數據庫并不來源于維基百科,也不來源于單純的一些知識片段,這個知識庫可以非常大,內容涉及的更加廣闊。最后,Ruslan 為我們展示了新算法模型的精度及速度,如下圖 5。圖 5:Ruslan 與合作者的最新研究成果(精度/速度)對比圖20二、深層強化學習與控制講座的第二部分,Ruslan 為我們分享了四大挑戰(請參
47、閱文章開頭介紹)中他對第二個挑戰深層強化學習與控制的思考和研究。他指出,我們心中所構想的所謂的人工智能,其更偏向于增強學習,也就是機器真正的學習能力或所謂的“智慧”。Ruslan 首先為我們列舉了一個非常有產業價值的實例機器人導航。如下圖 6 中,如果我們討論機器人導航的真正學習能力,我們期望機器人會自動的構建地圖,在構建的地圖中尋找到人類需要的目標,并自動進行路徑規劃獲?。ɑ虻诌_)目標所在地。圖 6:導航系統中的增強學習Ruslan 指出,導航是構建智能代理的關鍵任務。導航任務可以用多種形式表示,例如,點目標任務,即到導航到特定的坐標;語義導航,即查找特定場景或對象的路徑等。但不管任務是什么
48、,在未知環境中進行導航的核心問題是探索,即如何有效地訪問盡可能多的環境。這有助于最大限度地擴大覆蓋范圍,以便在未知環境中找到目標,或者在有限的時間預算內高效地預映射環境。在 2019 年,學術界的一些研究人員已經開始探索使用端到端的強化學習方法來解決這個問題。研究人員認為,使用強化學習方法有諸多好處:1)對于模型的輸入而言,經典模型的輸入大部分為傳感器觀察到的實際幾何體,而強化學習模型可以直接從圖像中推斷幾何體,使得輸入模式的選擇更加靈活;2)強化學習可以有效地利用現實世界的結構規律;3)較經典的機器學習算法,強化學習可以提高對顯示狀態估計的精度,因此更具有魯棒性。然而,相對于從前的經典模型,
49、強化學習模型也具有不容忽視的缺陷:算法算力大,所需的存儲空間大。21圖 7:導航算法的挑戰及解決方法鑒于此,Ruslan 提出了一種改進的新算法Active Neural SLAM(ANS)。這項工作提出了一個模塊化和層次化的方法來學習三維環境中的策略,稱為“主動神經系統”。Ruslan 的方法利用了經典方法和基于學習的方法的優勢,通過使用帶學習 SLAM 模塊的分析路徑規劃器,以及全局和本地策略。強化學習的使用使得輸入模式更具有靈活性(在 SLAM 模塊中),在全局的導航決策中利用了物理世界的結構規律,在局部的導航決策中并增加了對狀態估計的魯棒性。該算法在每個模塊中使用強化學習方式,并保留了
50、它的優點,同時,在訓練過程中進行分層分解和模塊訓練,如圖 8 為該算法的整體框架圖:神經 SLAM 模塊根據傳入的 RGB 觀測值和傳感器讀數預測地圖和智能體姿態估計。全局導航策略使用此映射和姿勢輸出長期目標,并使用分析路徑規劃器將其轉換為短期目標。局部導航策略被用于訓練短期目標,使得我們避開在訓練過程中高樣本的復雜度。該算法模型可以容易的轉移到 PointGoal任務中,并在 CVPR 2019 Habitation PointGoal 導航挑戰賽中獲得非常好的成績。圖 8:Active Neural SLAM 算法整體框架圖22如圖 8,在整個算法框架中我們看到,起關鍵作用的為藍色的三個方
51、框,分別為全局策略、局部策略及神經SLAM。下面我們再具體介紹一下這三個“硬核”算法模塊:局部策略,學習局部策略的即學習制定一個遵循規劃者給出的計劃的確定性策略。該策略旨在適應映射中的小錯誤。例如:神經 SLAM 模塊有時會錯誤地預測地毯是障礙物。在這種情況下,智能代理者會計劃繞過地毯。但是,如果短期目標超出后,神經 SLAM 模塊仍然預測到地毯,那么算法根據觀察后會反饋該信息,局部策略根據該信息理解地毯不是障礙,并學會克服它。全局策略,學習一個全局策略來抽樣長期目標的另一種選擇是使用一種稱為基于邊界的探索(FBE)的經典算法(Yamauchi,1997)。邊界被定義為已探索的自由空間和未探索
52、的空間之間的邊界?;谶吔绲奶剿鞅举|上是在這個邊界上取樣點作為探索空間的目標。在研究中 Ruslan 發現,在最靠近智能代理者的前沿點上進行取樣會產生更好的結果。定性地說,Ruslan 認為,基于前沿的探索花費了大量時間探索某些物品后面的角落或小區域。相比之下,訓練有素的全局政策忽略了狹小的空間,選擇了遙遠的長期目標,從而提高了覆蓋率。神經 SLAM,ANS 與基線的區別在于 ANS 使用額外的監督來訓練姿態估計器。為了了解性能增益是否來自于這種額外的監督,Ruslan 從 ANS 中移除了位姿估計器,只使用輸入傳感器讀數作為我們的姿勢估計,結果表明,即使沒有姿態估計器,ANS 仍然優于基線。
53、同時,Ruslan 還觀察到,在沒有姿態估計器的情況下,小場景下的性能僅下降約 1%,而在大型場景中則下降約 10%。這是意料之中的,因為更大的場景需要更長的時間來探索,并且姿勢錯誤會隨著時間的推移而累積,從而導致偏移。將真實姿態作為輸入傳遞給基線而不是傳感器讀數并沒有提高它們的性能。最后,Ruslan 總結到,ANS 提出了一個模塊化的導航模型,它利用了傳統導航方法和基于學習的導航方法的優點,該模型在探索和點目標任務上都優于先前的方法,并且在域、目標和任務之間表現出很強的泛化能力。未來,該模型可以擴展到復雜的語義任務,如語義目標導航和具體的問答,使用語義神經 SLAM 模塊創建一個捕捉環境中
54、對象語義屬性的多通道地圖。該模型還可以與先前的本地化工作相結合,以便在先前創建的地圖中重新定位,以便在后續事件中高效導航。三、結語本次講座中,Ruslan 為我們分享了兩大挑戰主題:1)如何將領域知識應用于深度學習模型,從而提高開放式問答系統的搜索精度;2)如何用深度強化學習,結合傳統的導航方法,提高導航系統的精度及泛化能力。由于Ruslan 所學甚廣,因此在分享的過程中,他常常不局限于當下的問題及探索領域,旁征博引,為我們分享了許多經典的案例,使得聽眾的理解過程更加生動簡潔。23 哥倫比亞大學教授周以真:數據科學的使命與應用整理:智源社區韓鵬飛在本屆智源大會“全體大會”中,哥倫比亞大學周以真
55、教授做了主題為:“Data for Good:Ensuring the Responsible Use of Data to Benefit Society”的演講。在演講中,周以真闡述了數據科學研究的使命,并介紹了哥倫比亞大學以此為基礎的一些最新研究。周以真(JeannetteM.Wing),哥倫比亞大學計算機科學學院教授,數據科學研究所所長,曾任微軟全球資深副總裁。美國國家自然基金會計算與信息科學工程部助理部長。研究方向包括:可信人工智能、可信計算、隱私、安全、軟件規范和驗證、分布式和并發系統、編程語言、編程方法、軟件工程。發表學術論文 300+,Google Scholar 他引 270
56、00+次,其中論文Computational Thinking單篇引用 6000+?,F為美國計算機學會(ACM)和國際電氣電子工程師學會(IEEE)會士。個人主頁:http:/www.cs.cmu.edu/wing/,實驗室主頁:https:/www.datascience.columbia.edu/columbia-data-science一、數據科學的使命首先,什么是數據科學?在這里,周以真給出了一個數據生命周期示意圖(如下圖 1),其包含了數據生成、數據收集、數據處理、數據分析、數據可視化等過程。而數據生命周期中最令人感興趣,也是在人工智能、機器學習中發揮重要作用的便是數據分析過程。而數
57、據科學作為從數據中發掘價值、能夠推進新知識的研究,其中的關鍵詞就是價值。價值取決于終端用戶的解釋:對于科學家來說,價值就是發現新知識;對于天文學家來說,仰望星空的價值就是為了發現新的行星;對于企業家來說,價值就是利潤。之前所提到的人工智能、機器學習、深度學習等都是孕育價值的工具。圖 1:數據生命周期圖接下來,周以真為我們介紹了哥倫比亞大學數據科學研究所的主要情況。哥倫比亞大學數據科學研究所旨在培訓下一代數據科學家,并開發創新技術服務于社會。該研究所與 17 個院所進行合作,擁有 350 多個附屬學科,涉及多個交叉學科,致力于促進先進技術的合作,以收集和解釋數據并解決社會面臨的緊迫問題。該研究所
58、還與業界緊密合作,將有前途的想法推向市場。哥倫比亞大學數據科學研究所在數據科學領域的研究,主要由數據驅動科學計算系統中心、網絡安全中心、數據,媒體與社會中心、財務和業務分析中心、數據科學基礎中心、健康分析中心、感應,收集和移動數據中心24和智慧城市中心八個研究中心,與計算社會科學、材料發現分析、教育三個工作小組構成。哥倫比亞大學數據科學學院是一個多學科、多專業交叉合作的學院,其研究方向主要包含健康分析、金融分析、智慧城市和計算社會科學等,數據科學的研究基石是計算機科學,統計學和運籌學。哥倫比亞大學在工程學院有很強的運籌學在商學院有很強的運籌學團隊,研究方向涉及:金融、人工智能,信息安全,生物醫
59、學、天氣氣候、人機交互等眾多新興熱點領域。部分項目合作如下圖 2 所示:圖 2:哥倫比亞大學數據科學研究所交叉合作項目示意圖哥倫比亞大學數據研究所在注重科學理論研究的同時,也著重于應用研究落地,其工業應用領域涉及制藥、零售、金融等眾多領域,并與阿里巴巴,百度、微軟及 IBM 等眾多國內外公司合作。以哥倫比亞大學數據科學研究所與 IBM 的合作為例,涉及的領域如下圖 3 所示。圖 3:哥倫比亞-IBM 區塊鏈中心和數據透明度圖25二、如何使用數據來造福人類社會接下來,周以真基于建立哥倫比亞大學數據科學研究院的使命如何使用數據來造福人類社會,介紹了未來研究工作的著重點:(1)提高數據科學的研究水平
60、;(2)通過應用數據科學改變所有的領域、專業及部門;(3)確保以負責任的方式使用數據造福社會,比如考慮人工智能的安全性和魯棒性等。2.1提高數據科學的研究水平周以真介紹,數據科學研究來自一個融合了統計學、計算機科學和社會科學的全新領域因果推理。這對計算機科學、數據科學還有人工智能都有很重要的意義。我們想要解決的問題叫做多因果推理1(Multiple Causal Inference)。傳統的因果推理是單向的,一個原因帶來一個結果,而在這里我們關注的是多個因果的聯系。舉例來說,假設導演想要拍電影,在挑選演員時想先預測一下用哪個演員能帶來多少收入。我們現在有一個數據庫,包含電影名、演員還有票房等數
61、據,我們想通過統計的方式知道每個演員能轉化成多少票房。這個工作的難點在于,這里面有不少混雜因子,既影響因,又影響果。比如說,電影的類別就是一個混雜因子,因為大部分時候動作片就比藝術片票房要高;還有電影的敘事方式也對票房有影響。這些混雜因子會影響建模。所謂因果性與相關性不同,相關性指的是如果我們觀測到了一個變量 X 的分布,就能推斷出另一個變量 Y的分布的話,那么說明 X 和 Y 是有相關性的。而因果性則強調,如果我們操作了某個變量 X,而這種操作(Manipulate)引起了 Y 變量的變化的話,那么我們才能說明 X 是 Y 的 Cause,而 Y 是 X 的 Effect。這是因果學習的基本
62、出發點,我們要找的是這樣的因果關系,而不是簡單的相關關系。如圖 4 所示,展示了一個經典的因果推理過程實例。圖 4:經典因果推理周以真介紹說,傳統的方法可能會先列出所有的影響因子,計算一下可能結果,但是否已經測量了所有的混雜因子是不可證偽的,于是周以真團隊提出了這么一個想法去除混雜因子(Deconfounder)。這是一種結合了無監督機器學習和預測模型檢測的算法,推斷潛在變量將其作為未觀察到的混雜因子的替代,然后用這個替代來執行因果推斷,估計“接近真實”的因果效應。Deconfounder 有三個特點:比經典因果推斷更弱的假設;對混雜因子的替代效果是可以檢測的;無偏推斷。26回到電影選角的例子
63、,周以真團隊通過 Deconfounder 的方法測量了 007 系列電影中演員的票房影響力,發現經過去除混雜因子后,演員 Sean Connery(James Bond)的價值比沒有去除混雜因子前提高了不少,而另外兩個演員 Bernard Lee(M)和 Desmond Llewelyn(Q)的價值卻下降了。事實上,多因果推斷在現實生活中有很多應用,比如基因分析、挑選運動員還有商品定價等,有助于解決很多現實問題。如圖 5 所示:圖 5:新思想解構過程2.2通過應用數據科學改變所有的領域、專業及部門數據科學的第二個使命就是可以將其應用到各行各業,及不同的研究領域,譬如金融學、生物信息學、天文天
64、體學、信息科學等學科,以推動各行各業的轉型與發展。接下來,周以真介紹了幾個學科應用的例子。比如有研究員研究了圍繞胰腺癌細胞的微型炸彈的基因組2。他們發現他們的微生物離子抵消了治療腫瘤的化療的效果。但是他們進一步發現如果你給腫瘤注射抗生素,那么這將對微型生物圈產生反作用,從而使化療有效。比如天文學家喜歡在任何領域使用最先進的技術來解決他們的大數據問題3。他們從弱引力透鏡獲得的圖像數據。結果用卷積神經網絡來估計大爆炸模型的系數。比經典的統計方法精確得多。哥倫比亞大學數據科學研究所和微軟的一項合作研究,則是通過將機器學習算法與經濟學進行結合,研究人工智能眾包平臺 Amazon Mechanical
65、Turk 這樣的勞動力市場4,是否是一種買方壟斷(即只有一個買方而有多個賣方,此時買方具有壟斷性,可以付出較低的價格),是否是一個公平的勞動力市場等。還有一個示例是將強化學習應用到金融工程中去。在當今社會中,有愈來愈多的人在使用機器人投資顧問,利用強化學習可以花費較短的時間來學習到用戶的風險偏好,而且現在與機器人的交流也變得越來越人性化。經濟學意義5上,非常關注因果推理。不僅僅是相關性,而機器學習給了很多分析大數據的方法。經濟學、大數據和機器學習算法的結合如何才能真正推動這兩個領域的發展,除此之外,周以真還介紹了歷史文化方面的研究應用。哥倫比亞大學歷史系已經開始利用機器學習模型、輿情分析等方法
66、去分析歷史文本6。例如,每一年哥大歷史系教授都會在美國政府發布的文件中搜集文本,比如搜集上世紀 70 年代外交官相互發的外交傳電,通過分析和可視化這些文件,來了解 70 年代所發生的歷史事件。如圖 6 所示。27圖 6:數據科學在歷史方面的應用2.3DataforGood:負責任地使用數據那么我們該如何以負責任的方式使用數據,并以數據為方式應對社會挑戰?微軟曾經提出的的人工智能六大原則,周以真通過重新組合,就變成了一個縮寫“FATES”,分別是公平(Fairness),負責任(Accountability),透明(Transparency),道德(Ethics),安全、保障與隱私(Safety
67、,Security,and Privacy)。在談論安全時,周以真提到了關于隱私的魯棒性。如圖 7 所示,這是一個測試深度學習系統的系統 DeepXplore7,用以尋找深度學習系統可能犯的具體錯誤。圖 7:DeepXplore 算法框圖28這個系統受到 2 種軟件工程技術的啟發,一種叫做神經元覆蓋(Neuron Coverage),另一種是差異測試(Differential Testing)。什么是神經元覆蓋?在軟件工程中,測試程序會用到代碼覆蓋,為軟件每一個路徑創建一個測試,神經元覆蓋的思路與之類似,比如創建一些輸入的事件實例去覆蓋每一個神經元,然后我們就會發現很多錯誤。該系統使用這兩種技
68、術定義一種算法,基本上比較兩種不同的 DNN,并展示如何修改輸入,從而對 DNN 缺失進行分類,即變化圖像。如圖 8 所示,如果你看到左邊的圖像,這是自動駕駛汽車上的典型圖像,汽車會按照正確的引導,向左行駛;但如果你稍微將圖像變暗,那么 DNN 將不幸地作出錯誤的分類,并告訴汽車向右行駛結果導致穿過護欄、越過懸崖以及人員傷亡。所以重點是系統能夠找出導致 DNN 做錯事的干擾輸入。通過這個系統,他們揭示了 15 種當前最佳的深度學習模型的數千個不同的不正確的極端情況。這項工作獲得了 SOSP 最佳論文獎。圖 8:DeepXplore 算法效果圖周以真介紹的另一個項目是 PixelDP8,緣起是現
69、在有很多研究都揭示出 DNN 的脆弱性,連非常簡單的涂鴉都會改變 DNN 的分類結果,而在自動駕駛時如果認錯了交通標識,可能會導致非常嚴重的后果。這項研究工作受到了差分隱私(Differential Privacy)的啟發,該理念來自于密碼學,現在被嫁接到了機器學習中,試圖使 DNN 更加強大,以應對圖像中的污染等情況。在該項研究中,DNN 被增加了一個噪聲層,可以確保將輸入中污染的影響控制在一定范圍內,讓分類器不會認錯。29圖 9:PixelDP 算法框圖對于來自現實社會的挑戰,這些研究還處于起步階段,但是周以真團隊希望可以通過數據科學來幫助人們應對這些社會挑戰。周以真介紹,目前哥倫比亞大學
70、數據科學家們正在研究解決的幾個挑戰問題是:(1)如何利用大數據及機器學習方式,來更好的幫助農民們選擇適合播種的農作物9,來減少由于氣候對農產品產生的影響?比如研究者們發現,如果印度的作物生產繼續向稻米趨同,該國的糧食供應,可能更容易受到其后的影響(如干旱,酷熱)。增加粗糧(如小麥和高粱)的產量份額,可以提高印度糧食生產抵御氣候變化的能力,特別是在粗糧產量已與稻米產量相當的地方。在重要的農業地區實現農作物結構的多樣化可幫助緩解某些氣候變化(如干旱、酷熱),因此通過研究對印度的作物種植多元化給出了一些建議,有助于抵御氣候變化的不利影響。(2)流行病方面存在的挑戰。周以真介紹,哥倫比亞大學已經建立了
71、一個聯邦數據集10,包含 10 億個病人的病例圖,有 600 萬個病人記錄,500 萬個獨特的病人記錄,它們來自 25 個不同的國家,基本上是從 80 個不同的數據庫中提取,并且都是用同樣的格式對數據進行了收集整理。周以真認為這些數據令人驚嘆,可以使我們深入了解僅靠臨床了解不到的醫療情況。圖 10:哥倫比亞大學流行病數據庫介紹30糖尿病,高血壓和抑郁癥三種疾病可視化結果如圖 11 所示。圖 11:疾病可視化結果圖周以真指出,當我們有一個很大的數據集時,我們可以進行因果推理。所以我們可以想象構建電子健康檔案11是為了使用我前面描述的這個特定數據庫的技術,其推理結果如圖 12 所示。圖 12:因果
72、推理算法框圖推理通過該推理過程,我們可以看出,通過將深度學習與醫學相結合,去除混雜因子降低了假陽性率和假陰性率。從因果關系到非因果關系的推理,幫助找到了更接近真實的治療效果評估,它還確定了更符合醫學文獻中發現的有效藥物。31參考文獻:1 Yixin Wang and David M.Blei,“The Blessings of Multiple Causes,”arXiv:1805.06826v2 stat.ML,June 19,20182 Geller L T,Barzily-Rokni M,Danino T,et al.Potential role of intratumor bacter
73、ia in mediating tumor resistance to the chemotherapeutic drug gemcitabineJ.Science,2017,357(6356):1156-11603 Arushi Gupta,Jos Manuel Zorrilla Matilla,Daniel Hsu,Zoltn Haiman,“Non-Gaussian information from weak lensing data via deep learning,”Physical Review D,in press(accepted April 30,2018),E-print
74、 available at https:/arxiv.org/abs/1802.012124 Arindrajit Dube,Jeff Jacobs,Suresh Naidu,and Siddharth Suri,“Monopsony in Online Labor Markets,”forthcoming,American Economic Review:Insights,August 2018.5 Agostino Capponi,Octavio Ruiz Lacedelli,and Matt Stern,“Robo-Advising as a Human-Machine Interact
75、ion System”,August 2018,preprint6 Allison J.B.Chaney,Hanna Wallach,Matthew Connelly,and David M.Blei,Detecting and characterizing Events,in Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing,November 2016.7 Kexin Pei,Yinzhi Cao,Junfeng Yang,and Suman Jana,“Deep Xp
76、lore:Automated Whitebox Testing of Deep Learning Systems,Proceedings of the 26th ACM Symposium on Operating Systems Principles,October 2017,Best Paper Award.8 Mathias Lecuyer,Baggelis Atlidakis,Roxana Geambasu,Daniel Hsu,and Suman Jana,“Certified Robustness to Adversarial Examples with Differential
77、Privacy,arXiv:1802.03471v2,June 26,2018,to appear IEEE Security and Privacy(Oakland)2019.9 Kyle F.Davis,Ashwini Chhtre,Narasimha D.Rao,Deepti Singh,Ruth DeFries,Environmental Research Letters,Volume:14,Article number:064013,https:/doi.org/10.1088/1748-9326/ab22db10 George Hripcsak,Patrick B.Ryan,Jon
78、 D.Duke,Nigam H.Shah,Rae Woong Park,Vojtech Huser,Marc A.Suchard,Martijn J.Schuemie,Frank J.DeFalco,Adler Perotte,Juan M.Banda,Christian G.Reich,Lisa M.Schilling,Michael E.Matheny,Daniella Meeker,Nicole Pratt,and David Madigan,“Characterizing treatment pathways at scale using the OHDSI network,”PNAS
79、 Early Edition,April 2016.11 Linying Zhang,Yixin Wang,Anna Ostropolets,Jami J.Mulgrave,David M.Blei,George Hripcsak,“The Medical Deconfounder:Assessing Treatment Effect with Electronic Health Records(EHRs),”arXiv:1904.02098v1,April 2019.32 圖靈獎得主 Judea Pearl:新因果科學與數據科學、人工智能的思考整理:智源社區龔鶴揚高亦斌在本次智源大會中,圖靈
80、獎得主 Judea Pearl 做了主題為The New Science of Cause and Effect with reflections on data science and artificial intelligence的演講。JudeaPearl(朱迪亞珀爾),加州大學洛杉磯分校(UCLA)教授,圖靈獎(TuringAward)得主。他在 20 世紀 80 年代開發并倡導了 AI 的概率方法,被稱為貝葉斯網絡之父。然而為了強人工智能的愿景,Pearl 脫離主流 AI 研究社區,提出了一套因果的數學語言和理論,引領了正在席卷各個學科的“因果革命”。他自己最引以為傲的工作是“The
81、 fundamental law of counterfactuals?!?Judea Pearl 個人 Slogan:To Build Truly Intelligent Machines,Teach Them Cause and Effect。在演講中,Judea Pearl 站在整個數據科學的視角,簡單回顧了過去的“大數據革命”,指出數據科學正在從當前以數據為中心的范式向以科學為中心的范式偏移,現在正在發生一場席卷各個研究領域的“因果革命”。Pearl 解釋了什么是因果科學以及相關新邏輯和推理引擎的思想脈絡,包括介紹了被稱之為“Double-Helix”的兩個因果推理的基本定理,并以其作
82、為出發點推演出因果圖模型框架,最后概述了該框架下因果推理的七大工具。另外,為了幫助讀者們更加透徹地理解 Pearl 的因果推理思想,我們結合 Judea Pearl 近年來的論文、訪談和報告,以及其學生 Elias Bareinbion、馬普智能所 Bernhard Scholkopf 團隊等的相關研究工作,對本報告進行了一定的補充說明。一、因果革命:改變數據科學的新革命在報告中,Pearl 首先介紹了一場正在改變數據科學的新革命“因果革命”。因果革命和以數據為中心的第一次數據科學革命,也就是大數據革命(涉及機器學習,深度學習機器應用,例如 Alpha-Go、語音識別、機器翻譯、自動駕駛等等)
83、的不同之處在于,它以科學為中心,涉及從數據到政策、可解釋性、機制的泛化,再到一些社會科學中的基礎概念信用、責備和公平性,甚至哲學中的創造性和自由意志??梢哉f,因果革命徹底改變了科學家處理因果問題的方式。圖 1:Pearl 關于數據科學本質的洞見,見文獻333因果革命中,數據科學的任務被重新分成了三類:預測,描述和反事實預測6。關于它具體如何席卷各個學科,詳情可參見:Bernhard Scholkopf 最引以為傲的論文之一Causality for Machine Learning,它概述了信息革命時代下因果和機器學習的融合的基本原理和深刻思考5,Causal Inference and Da
84、ta-Fusion in Econometrics 是 Elias Eareinboim(Pearl 學生)關于因果結合經濟學領域的最新綜述7。因果也影響了社會科學,醫療健康科學,計算機和統計學等,見資料1,8。哈佛大學教授 Gary King(2014)盛贊了這場因果革命,它指出“過去三十年關于因果理論的進展超過了人類前面積累的總和?!盤earl 繼續解釋說,成百上千過去認為不可能解決的問題,現在可以通過簡單的數學和可計算的算法解決。在介紹完“因果革命”之后,Pearl 接著介紹了本次報告的大綱:什么是因果科學,為什么它需要新的邏輯和推斷引擎 如何讓機器獲得因果推理的能力(因果推理引擎的結構
85、)因果推理的兩個基本定律 因果智慧的七個工具二、什么是因果科學?當前曲線擬合的機器學習和深度學習取得了巨大的成功,為什么需要研究因果8?Pearl 在去年接受 Lex Fridman 訪談4時提到“Everything starts with the question:What is the research question?”。而 Pearl 在這次報告中,則用了幾個統計學中的經典例子。第一個問題是:“鍛煉身體是否有利于健康?”見下圖,x 軸表示運動時間,y 軸表示膽固醇水平。圖 2:鍛煉是否有利于健康?34一方面,在圖 2(左)中,可以看大每個年齡組中都出現了向下的趨勢,表明運動可能的確
86、有降低人體膽固醇水平的效果;另一方面,在圖 2(右)中,同樣的散點圖并不依據年齡對數據進行分層,那么我們就會看到一個明顯向上的趨勢,這表明運動得越多,人體膽固醇水平就越高,這種矛盾在統計學中被成為辛普森悖論。Pearl 介紹的另外兩個例子,一個是關于“藥物”、“性別”、“死亡率”的研究問題:“藥物有效果嗎?”另外一個是關于“疫苗”、“天花”、“死亡率”的研究問題:“疫苗有效果嗎?”這幾個例子共同說明了數據可能對你講出兩個不同的故事。如果信息發生了一些變化,得到的結論就可能是不一樣的。更加準確地來說,這幾個例子本質上是要回答因果問題,僅有數據信息而沒有先驗因果關系信息的時候,就可能得出與關注研究
87、的問題相互矛盾的答案?;卮鹨蚬麊栴}需要因果信息。Pearl 在這次報告中指出,因果科學始于因果問題,因果科學研究如何回答因果問題。什么是因果問題呢?他給了幾個簡單的例子:1.給定的治療方法在預防疾病方面效果如何?2.是新的減稅政策導致銷售額上升嗎?還是我們的營銷活動?3.肥胖引起的年度醫療保健費用是多少?4.雇傭記錄可以證明雇主犯了性別歧視嗎?5.我即將辭職,我會后悔嗎?他解釋到上面這五個因果問題,因為這些問題都包含著不對稱信息,所以無法用現在標準的科學語言,也就是具備對稱性的數學公式來描述。相對于“=”表示對稱信息,他用箭頭 表示非對稱信息,見下圖:圖 3:對稱 VS 非對稱在過去的 30
88、年中,Pearl 和他的同事找到了非對稱性的表達工具。他認為因果科學是回答因果問題的邏輯和工具,也就是推理引擎。通俗來說它有三個輸入,包括我們想知道什么、我們已經知道什么和可用數據,以及作為輸出的兩類關注問題的答案:a)現在某個行動會有什么結果?b)過去換個選擇會有什么不同的結果?因果推理是人類思想中不可或缺的組成部分,應該對其進行形式化和算法化處理,以實現人類水平的機器智能3。Pearl描述了一個因果推理的三級結構,把因果信息按其能夠回答的類型進行分類。該分類形成了一個三層的層級結構,某層的問題,只有在獲取不低于該層信息時,才能夠被回答。35a)三個因果層級圖 4:三個因果層級,參見書籍2第
89、一層是關聯(Association),它涉及由數據定義的統計相關性。大多數機器學習系統運行在這一層上。第二層是干預(Intervention),不僅涉及到能看到什么,還涉及一個干預或行動將會導致什么結果。作為例子,Pearl 提了一個問題:“如果我們把價格翻倍,將會發生什么?”第三層是反事實(Counterfactual),是對以前發生的事情的反思和溯因,解決的是“如果過去作出不一樣的行為,現在的結果會有何不同?”的問題。頂層也就是反事實層是功能最強大的層次,如果我們有一個可以回答反事實問題的模型,那么我們也可以回答有關干預和觀察的問題。例如,干預問題:What will happen if
90、we double the price?可以通過反事實問題來回答:What would happen had the price been twice its current value?同樣,一旦我們回答了干預問題,就可以回答關聯問題。我們只是忽略了干預動作部分,而是讓觀測取代了。但是在相反的方向上,干預問題不能僅憑觀測信息(也就是統計相關性)回答,涉及反思和溯因的反事實問題也不能僅用從隨機對照實驗中獲得的干預信息來回答。反事實是科學思維以及法律和道德推理的基礎。舉個例子,在法庭判定被告是否應該負法律責任的時候,判定有罪的一個依據是“若非”被告的行為,損失就很可能不會發生(For examp
91、le,in civil court,a defendant is considered responsible for an injury if,butfor the defendants action,it is more likely than not the 36injury would not have occurred)?!叭舴恰钡挠嬎愫x要求將現實世界與被告未發生某行為反事實世界進行比較。用個更通俗的例子來講,已知的事實是“一個人吃了藥死了”,對應的一個反事實問題是“如果此人沒有吃藥,不死的概率是多少?”Pearl 在報告中指出,理解因果推理需要抓住一個竅門,那就是區分seeing
92、和doing的不同,一個簡單例子就是某個便利店中“觀測到某商品的價格翻倍”和“店主強制讓某商品價格翻倍”存在區別。Pearl 發明了 do 算子來數學化表示干預或行為,有了它我們能用數學公式區分 seeing 和 doing:這里我們借用文獻5中一個表格補充說明,表格的行是不同類型的問題,而列是不同類型模型:表 1:從統計模型到因果模型,再到物理模型5可以看到統計模型只有關聯層的信息,所以只能回答相關性問題,而不能回答干預問題和反事實問題?;趫D的因果貝葉斯網絡因果只有干預層的信息,所以只能回答干預和關聯層的問題,而不能回答反事實問題。最后基于結構的因果模型,它的能力最接近物理模型,三個層級的
93、問題都能夠回答。事實上,朱松純教授10在報告的最后向 Pearl 提出了因果建模的定位問題,他說他喜歡因果建模的思想“Fromdatatoscience”,從上面的表格中可以看到因果模型是從統計模型走向物理模型的過渡。b)因果推理引擎Pearl 提出了一套基于結構的關于因果的數學語言和理論,作為因果科學是回答因果問題的推理引擎,該引擎的特點是“Knowledge in,Knowledge out,Data in between”,而基本出發點是因果推理的兩大基本定律:37圖 5:因果推理的兩大基本定律他指出第一個定律是關于反事實的信息,可以推演出需要使用函數來刻畫變量之間的因果關系,而第二個定
94、律刻畫了因果圖結構,因果圖上每個每條缺失的邊都意味著在給定某些變量下的條件獨立性,可用它做模型檢驗,結構學習和因果問題的符號演算。他以這兩大基本定律為出發點,發展出了被稱為結構因果模型(SCM)的數學框架,該框架能夠回答三個層級的因果問題。在如下的例子中,模型用函數關系表示,而因果圖上的缺失的邊 CW 和 SR 都意味著給定某些變量之下的條件獨立性。圖 6:一個簡單結構因果模型現代因果建模工具的發展已對所有數據密集型科學(尤其是社會科學和流行病學)產生了變革性的影響,其中因果圖已成為它們的第二語言。在這些學科中,因果圖模型幫助科學家從觀測數據中提取因果關系,并解構了困擾研究人員數十年的悖論。3
95、8我們根據 Pearl 的論文3補充說明因果科學的推理引擎,它由三個部分組成:圖模型,結構方程以及反事實和干預邏輯。圖模型是一種語言,用于表示 Agent 對世界的了解。反事實幫助他們闡明他們想知道的事情。結構方程將兩者以扎實的語義聯系在一起。該推理引擎將假設(以圖模型的形式)、數據和 Query 作為輸入。圖 7:SCM 推理引擎如何結合數據和因果模型回答因果問題,見文獻3SCM 推理引擎存在三個輸出:估計式(Estimand)是關注的查詢(Query)的某個概率表達式,表示在已有模型假定下計算 Query 的一種方法;Estimate 是用某種統計方法和已有數據對 Estimand 概率表
96、達式的估計;一組擬合指標(Fit Indices)用于衡量數據與假設的兼容程度。第一個輸出是較難理解的,如果已有模型假定下某 Query 無法回答,也就是沒有對應的 Estimand,則稱該 Query 為“不可識別”,Pearl 的 do-calculus 就是判斷 Query 是否可識別的一個完備的演算工具。Pearl 僅用抽象的方式描述了這個推理引擎,關于該引擎如何回答因果問題,如何解決數據科學中的混雜偏差,選擇偏差和遷移學習問題的細節可以參考 Elia Bareinboim 的論文7。三、因果推理七個工具接著 Pearl 概述了通過因果科學的推理引擎完成七個任務以及每個任務中使用的工具
97、,并討論了每個工具對自動推理技術的獨特貢獻。下面是因果智慧的七大工具:Tool 1.Encoding causal assumptions in transparent and testable way.Tool 2.Predicting the effects of actions and policies.Tool 3.Computing counterfactuals and finding causes of effects(attribution,explanation,susceptibility).Tool 4.Computing direct and indirect effe
98、cts(Mediation)(discrimination,inequities,fairness)Tool 5.Integrating data from diverse sources(external validity and selection bias).Tool 6.Recovering from missing data.Tool 7.Discovering causal relations from data.39第一個工具就是使用因果圖透明的編碼了因果知識,使用 d-分離圖準則下的條件獨立性來檢驗因果結構先驗假設。Pearl 給出了 Shrier 和 Platt 于 2008
99、 年提出的運動醫學領域的簡單例子(熱身對于運動損傷的影響),在這個例子中變量之間相互如何相互影響被透明的表示了出來,變量之間因果關系的確定可以基于合理的事實,它能用 d-分離圖準則下的條件獨立性來檢驗。圖 8:一個因果圖模型實例第二個工具就是使用 Do-Calculus 定義和回答干預層的因果問題,這些問題包括計算某個行為,干預或策略產生的因果效應。繼續看熱身對于運動損傷的因果效應例子,我們需要選擇哪些變量作為控制變量呢?是不是控制變量越多越好呢?Pearl 的回答是,一定不要控制變量 Z3(也就是 Previous Injury)否則下圖的路徑會被聯通,造成混雜偏差,不能正確估計回答該因果效
100、應的問題,正確的做法是控制變量 Z1,Z2。具體 Do-Calculus 解決混雜偏差建議參考文獻7。圖 9:Do-Calculus 確定控制變量第三個工具是計算反事實,找出某個結果的原因。我們要去找到事件結果的原因,我們要進行歸因,進行解釋。反事實是科學思維以及法律和道德推理的基礎,例如,反事實問題“一個人吃了藥死了,如果此人沒有吃藥,不死的概率是多少?”的答案是法律責任判定中的重要依據。40圖 10:反事實概率回答歸因問題第四個工具是中介分析。直接(間接)因果效應是指一個變量對另一變量的既定影響在多大程度上是直接的(間接的),這是許多不同學科都關注的一類重要因果問題,它們可用 Pearl
101、的推理引擎解決。這一工具現在也被用于判斷歧視、不公正的做法、不公平現象,我們要討論人工智能和機器學習領域中的公平性問題時,我們必須考慮中介效應,Pearl 給出了一個雇主是否有性別歧視的例子,也就是回答如何用數據判斷雇主是否用性別決定錄用員工與否的問題。圖 11:中介分析回答性別歧視與否問題41第五個工具是泛化和數據融合。它的基本問題是關于如何融合分布不同的實驗性研究或觀測性研究,Pearl 及其學生 Elias Bareinboim 提出一個解決此任務的框架。Pearl 在文獻1中,解釋了因果建模工具能夠幫助解決 AI 應用中魯棒性或適應性的原因。Pearl 在報告中用一個例子簡單的講解了一
102、下基本思路,首先把數據源的數據類型(觀測/RCT)和其他特點用圖表(上)列出來,然后轉化稱對應的因果圖(下),其中圖中 S 節點標記了數據源的 S 指向變量有差異。這樣就可以用因果建模工具綜合不同數據源,回答關注總體的感興趣因果問題,其詳情見文獻7圖 12:因果推理解決多源數據集融合問題實例42第六個工具是從缺失數據恢復。由于缺少數據而導致的問題困擾著實驗科學的每個分支,所有的數據都會有一個缺失值的問題,它本質是一個因果問題。實際上建立一個缺失數據因果模型之后,可以用因果推理引擎判斷和實現從缺失數據下的所關注問題的推斷。圖 13:缺失數據問題本質是因果問題第七個工具是因果發現。因果發現就是要去
103、尋找一系列的模式或者圖結構,能夠與數據相兼容的,同時能夠進行簡潔的表示。當前從數據中得到因果結構的因果結構學習,不僅要學習因果結構,還要學習從數據中直接得出哪些變量是因果變量的因果表示學習,這已經成為了當前一個熱點研究課題,Pearl 在文獻2中提出了為 AI 提出小圖靈測試作:How can machines representcausalknowledge in a way that would enable them to access the necessary information swiftly,answer questions correctly,and do it with
104、ease,as a human can?因此因果表示學習是一個十分重要課題,向更多了解相關內容建議參考資料1,2,5,9。四、結論最后,Pearl 指出,因果革命不僅僅席卷了各個研究領域,也開始影響教育和實際應用,將數據科學從當前以數據為中心的范式往科學為中心的范式偏移。這個革命的高潮還沒有到來,但我們將會看到一個非常聲勢浩大的革命,尤其是從社會智能的角度來觀察。我們將能夠與機器智能進行緊密的交流和互動,無論用戶是誰,其可能是另外一個機器或者電力服務系統,這在社會智能領域未來的十年中就會發生。另外一個,是與倫理學相關的,即同理心,最終機器甚至會有意識和自由意志、同情心以及倫理道德。所以,我們每
105、一個人都應更多地關注因果科學。For me,consciousness is having a blueprint of your software.-Pearl,2019 Dec443精選參考資料特別注意,我們在文章中引用論文的方式并不嚴格,應該當成一個參考資料來理解。事實上,這一部分給出了筆者認為對參與這場“因果革命”至關重要,精心挑選之后的資料。希望在教會機器因果思維,構建能夠通過小圖靈測試的 Causal AI 之路上,這些資料可以幫助讀者快速理解和把握因果科學全局。下面是這些資料及其簡介:1 “Foundations and new horizons for causal infer
106、ence”研討會,2019,https:/opc.mfo.de/show_workshop?id=3271 因果推斷始于經濟和生物統計等學科,它剛剛才開始成為人工智能的一個重要工具,數學基礎依舊很零碎,該研討會聚集了來自人工智能,生物統計學,計算機科學,經濟學,流行病學,機器學習,數學和統計學的頂尖研究人員,研討會上的報告和討論將有助于在未來幾年內塑造和改變這一領域的發展。2 “The Book of Why:the new science of cause and effect,”Judea Pearl and Dana MacKenzie,(Basic Books,2018).http:/
107、bayes.cs.ucla.edu/WHY/3 J.Pearl,“The Seven Tools of Causal Inference with Reflections on Machine Learning,”Communications of ACM,62(3):54-60,March 20194 Judea Pearl:Causal Reasoning,Counterfactuals,Bayesian Networks,and the Path to AGI|AI Podcast https:/youtu.be/pEBI0vF45ic 這三個材料是 Pearl 的因果理論的最新綜述,較
108、為通俗易懂介紹了因果關系的新科學,描繪了一條教會機器因果思維的強人工智能之路。5 Causality for Machine Learning,Bernhard Schlkopf,2019 這是一篇剛剛掛 arxiv 就被 Pearl 親自 twitter 點贊的論文,是馬普智能所所長 Bernhard Scholkopf 最引以為傲的論文之一,他將被 Pearl 點贊這事情寫在其個人主頁自我介紹的第一段中。Scholkopf 及其團隊在因果結合機器學習方面做了最多的工作,此文總結和升華了提出了信息革命時代下因果結合機器學習的一般理論和深刻思考。6 A Second Chance to Get
109、 Causal Inference Right:A Classification of Data Science Tasks,Miguel A.Hernn,John Hsu&Brian Healy,2019 來自哈佛教授 Migual A.Hernan 對當前數據科學的深刻反思,澄清了數據科學任務如何分類的基本問題:prediction,description and counterfactual prediction.7 Causal Inference and Data-Fusion in Econometrics,P.Hnermund,E.Bareinboim.Dec,2019.該論文是
110、因果革命,Pearl 的因果圖模型框架如何影響某一個特定領域-計量經濟學的范例。8 Beyond Curve Fitting:Causation,Counterfactuals,and Imagination-based AI,AAAI Spring Symposium,March 25-27,2019 https:/ 這是 Judea Pearl 和其學生 Elias Eareinboim 組織的一次研討會,探索了 Causality+X:X 代表了某個學科。9 NeurIPS 2019,From System 1 Deep Learning to System 2 Deep Learning,Yoshua Bengio.Video with synchoronized slides https:/ 描繪了一個具備因果推理能力的 AI 系統。10 加州大學洛杉磯分校 UCLA 朱松純教授,淺談人工智能:現狀、任務、構架與統一|正本清源