1、人工智能:知識的創造、轉移與應用人工智能在中國、歐洲和美國的發展趨勢 人工智能:知識的創造、轉移與應用目錄人工智能:知識的創造、轉移與應用 3序 4概要 9重點 11引言 12第 1 章識別人工智能研究 18利用人工智能定義人工智能 20第 2 章 人工智能:多面領域 242.1 教學視角、研究視角、產業視角和媒體視角 262.2 人工智能研究七大集群 27第 3 章人工智能研究發展與區域性趨勢 303.1 人工智能研究的全球性趨勢 323.2 人工智能研究的區域性趨勢 383.3 區域性研究的影響與應用對比 543.4 人工智能知識轉移 56第 4 章人工智能教育 624.1 人工智能在線教
2、育概覽 644.2 中國人工智能專業畢業生案例分析 66第 5 章道德倫理在人工智能中發揮的重要作用 705.1 道德倫理與人工智能 725.2 人工智能因善而立,為善而行: 探討道德倫理與人工智能的問題 76結束語 & 未來研究 79附錄 81序言人工智能:知識的創造、轉移與應用丹奧萊愛思唯爾(美國)首席技術官 “近年來,人工智能 (AI) 已經引起決策者、高校、研究人員、企業、媒體和公眾的廣泛關注。隨著大數據時代的到來和計算能力的提升,人工智能在科研和技術領域的突破日新月異。人工智能改變社會的轉化力讓人們在滿懷期待的同時心生恐懼。在高漲的關注度和蓬勃的發展勢頭下,AI術語卻逐漸混淆。盡管“
3、人工智能”、“機器學習”和“數據科學”這幾個概念并不相同,但人們總是把它們混為一談。人們通常會自然而然地把“人工智能”理解成一個概括性術語,用以描述“讓計算機像人類一樣做出判斷”這一總體目標。深度學習等主題則跳脫出了人工智能的范疇,發展成了獨立的研究領域和技術。 對于這樣一個能改變人類生活形態的領域,我們有必要理清混淆的術語,以保證政策目標能正確地轉化為研究重點,學生教育能與就業市場需求相匹配,媒體能對比全球不同國家和地區知識的發展。這正是我們想利用該報告著手解決的具有挑戰性的難題。作為一家專注于研究領域和健康領域的信息分析公司,我們的數據資產將為解決這些重要問題提供有價值的見解。 基于大量的
4、自有數據集和公共數據集,我們的數據學家們在高性能計算技術的基礎上運用機器學習進行數據檢測,再由全球各研究機構和行業專家們進行驗證,進而以全面的、結構化的方式歸納出人工智能領域的特性。在此基礎上探討人工智能知識是如何在全球范圍內得以創造、轉移和應用的,本報告重點關注中國、歐洲與美國三大地區。我們所使用的傳統的文獻計量學研究不僅針對出版的期刊文獻,還包括會議、預印本、教材和競賽出版物。 當我看到最終的報告時,對探討人工智能研究途徑、道德倫理和責任創新的部分感觸最深。傳統的機器學習技術需要人為地設定構建模型的關4 人工智能:知識的創造、轉移與應用鍵數據,而新技術則由機器自身來決定輸出成果所需的重要數
5、據。研究重點從設計軟件程序向設計訓練集和測試集的轉變是根本性的。面對日趨復雜的人工智能算法和模型,對算法和模型可解釋性的要求越來越高,因此這一轉變的重要性不言而喻。為什么人工智能算法會得出特定的結果?機器篩選重要數據的方法和依據是什么?人工智能運算得出的結果是否存在無意識的偏誤? 人們先入為主地認為計算機是利用線性程序得出有限的結果的,所以人們總想對人工智能模型背后的“程序流”一探究竟。盡管當前人們正在做一些極富價值的工作來解密現代機器學習技術的“黑匣子”,但該報告則清晰地指出了改變公眾認知的必要性,要探討關于人工智能道德倫理和偏誤的問題,就要讓人們了解機器是如何利用這些新技術運作的,了解它們
6、計算出的概率性結果。思維方式的這一轉變將把討論的重點轉移到以下兩點:該如何訓練這些機器以解決道德倫理和偏誤的問題;審視我們構建的模型,盡力解釋發生了什么。 這正是愛思唯爾“數據小分隊”目前正在進行的工作:這個擁有多項技能的團隊開發的新算法,整合了目前正在使用的機器學習算法、研究對象領域、軟件工程、測試和倫理的知識,從而確保設計出能實現算法的預期目的,同時減少意外后果的機器“訓練課程”。 這篇報告旨在為負責任地開發、傳播與利用人工智能知識貢獻力量,造福社會。本報告的發布也代表勵德集團將更廣泛地與人工智能在線資源中心進行互通,獲取更多的深度見解,并由此拓寬與研究界和諸多領域的合作。作為愛思唯爾首席
7、技術官,我期待未來與大家有更多交流?!比斯ぶ悄埽褐R的創造、轉移與應用 5 序言以成果發布平臺為依據計算人工智能領域的出版量 “界定人工智能領域的難度之大是人所共知的,因此也很難說清該領域的出版物究竟有多少。羅素(Stuart Russell)和諾維格(Peter Norvig)1指出了開展AI研究工作所圍繞的兩條主軸。第一條主軸的兩端分別是邏輯推理和行為。第二條主軸則介于能密切反映人類思維處理過程的解釋(即認知科學)和更注重合理性與優化型的解釋之間,而后者更有應用價值。人工智能另一個顯而易見的維度則是對新技術的研究及其在各領域的應用。人工智能吸收了眾多領域的基本技能,如邏輯、概率學與統計學、
8、數學優化、攝影測量法、神經科學以及博弈論等,而人工智能的方法又廣泛應用于語音識別、計算機視覺、機器人學、網絡安全、生物信息學以及醫療衛生等眾多領域,因此要想劃清人工智能與其上下游領域的界限絕非易事。 人工智能的界限隨著時間的推移而變化。20世紀80年代末之前,以喬姆斯基的語言學、相關解析技術和一階語義學為基礎的自然語言處理技術無疑是屬于人工智能的范疇的,而基于信號處理和隱馬爾可夫模型的語音識別技術則不然。如今,這兩個領域的發展在很大程度上是由機器學習推動的,所以當屬主流人工智能的范疇。 劃定人工智能界限的基礎在我看來就是人工智能領域的社會組織,即發表該領域新成果的平臺學術期刊和各大會議。研究同
9、一子領域或同時研究兩個子領域的專家們或共聚一堂、交流觀點,或將著作集結成冊發表。人工智能領域的平臺既包括傳統意義上的代表性人工智能會議,如IJCAI2、AAAI3、ICAPS4和KR5,也包括機器學習與概率推理的會議與組織,如NIPS6、ICML7和UAI8,還包括更多獨立的應用型會議,如KDD9和SIGIR10等。 以成果發布平臺為依據計算出版量的方法能幫助我們系統且透明地描述某一領域(如人工智能領域)或某些領域的核心領域(如人工智能領域的子領域,亦或是整個計算機科學領域)所涵蓋的內容,也能系統地區分核心領域的寬度與粒度。所需信息均可在諸如Scopus的索引中找到。當然,我們也可以對分類器加
10、以訓練來達到同樣的目的。分類器多會就核心領域標簽下的基本事實進行分類,從而對出版內容進行操作。雷蒙德佩羅特博士美國斯坦福國際研究院人工智能中心高級技術顧問6 人工智能:知識的創造、轉移與應用 這篇報告亦遵循了這一方法,采用多種方式來塑造和構建人工智能領域。面對新技術層出不窮的人工智能領域,這無疑是幫助人類了解和監控其發展動態的一大壯舉。未來對不同平臺和聚類算法進行的系統化、對標化的處理將會是一項有趣的研究?!?1、羅素斯圖爾特, 諾維格皮特. 人工智能: 現代方法. 第三版. 埃塞克斯, 英國: 培生教育出版集團;2014。 2、IJCAI:國際人工智能聯合會議。 3、AAAI:人工智能促進協
11、會。 4、ICAPS:國際自動規劃和調度大會。 5、PKRR:知識表示與推理原則。 6、NIPS:神經信息處理系統進展大會。 7、ICML:國際機器學習大會。 8、UAI:人工智能不確定性協會。 9、KDD:數據庫知識發現。 10、SIGIR:資訊檢索主題小組。 人工智能:知識的創造、轉移與應用 7序言定義人工智能:人工智能本體論的新方法 學科本身并不存在。學科的出現是集體建設的結果,在這個過程中,研究人員匯聚成一個研究社群,他們的目標、方法和理念不謀而合。因此,學科的本質就是研究社群。社群進步,相關的學科就會發展。因此,在我看來,如果采用自下而上的方法,重點關注研究工作的主體,而非自上而下的
12、定義,那么成功描述學科特性的可能性會更大。 基于這一前提,我很高興為愛思唯爾團隊的這份報告做推廣。該報告描述了人工智能領域的操作特性,涉及60萬份文件和700多個領域特定的關鍵詞。這是一項傲人的成就,據我所知,這是迄今為止在人工智能成果的特征方面總結得最全面的一份報告。更重要的是,不同于研究領域的人為分類法,該報告總結的AI特征是以數據為依據,利用機器學習和文本挖掘技術進行文件分類和關鍵詞識別后得出的,而前者不可避免地會反映參與研究的專家的某些觀點。因此,在我看來,該報告準確度更高,能更客觀地反映人們在人工智能領域所作出的貢獻。 毫無疑問,除科學價值以外,該報告對于有意探索該領域的人來說也有非
13、常寶貴的實用意義。比如,我們可以利用人工智能的綜合特征來更好地把握關鍵趨勢和研究課題,這會非常有趣。在相關的研究工作主體分散在不同的研究社群時 (人工智能道德倫理研究就是這種情況) 其意義尤為明顯。 就我個人而言,這項工作令我興奮的原因在于,它為一些趣味性的新研究提供了依據。我的一大研究方向就是利用人工智能技術尋求創造性的解決方案,幫助人們掌握科研動態。在這一背景下,我的團隊開發了一套研究領域自動生成分類的新方法。研究各類方法能在多大程度上覆蓋研究領域,能在多大程度上相結合以提高準確率,這些都是非常有趣的嘗試。這僅僅是我舉的一個例子,這項工作將會開啟更多有趣的研究課題。 總而言之,這不僅僅是一
14、份杰作,更是一系列趣味研究的開始。我在此祝賀愛思唯爾團隊取得的成就,也期待AI領域的進一步發展。 恩里科莫塔英國開放大學知識技術學教授8 人工智能:知識的創造、轉移與應用概要 毫無疑問,人工智能的重要性日益增長,與人類的聯系也日益密切: 人工智能助手和人工智能推薦正逐漸滲透我們的日常生活。然而,人工智能的定義卻尚未統一。分類法將有助于我們理解這個不斷演化著的領域和它變幻不定的結構。目前,人工智能已圍繞搜索與優化、模糊系統、自然語言處理與知識表示、計算機視覺、機器學習與概率推理、規劃與決策以及神經網絡等形成集群。 雖然人工智能橫跨多個領域,并且可以從教學、研究、產業、媒體等不同的視角來加以研究,
15、但用來描述這些視角的詞匯卻鮮有重疊。產業往往強調算法,可能是為了從投入的時間和人力中獲取更高收益。人工智能的社會相關性日益凸顯,人們越來越多地使用算法使潛在的道德倫理問題浮出水面,足見人工智能應用與道德倫理問題在各大媒體的曝光度,而這又使公眾更加意識到人工智能正是大勢所趨。有趣的是,道德倫理關鍵詞在教學中被提及的頻率更高,這可能與公眾的興趣所在和政府的強制要求不無關系,荷蘭就是這樣。在人工智能領域的研究中,道德倫理類關鍵詞尚不明晰可見,這就引發了一些疑問:道德倫理分析是否會成為人工智能研究人員下一步的研究主題?關于道德倫理的討論是否是在人工智能領域之外、甚至是所有研究以外的其他領域進行的?這一
16、點需要引起注意,因為人工智能領域責任創新是確保人人安全、公平地享有人工智能發展成果的關鍵。 顯然,不同的AI研究視角之間缺乏共同語言,人們不免對人工智能各領域間理解和溝通的有效性產生懷疑。各地區、各部門間的配合日益緊密,實現了即時協作,使得研究對話從傳統的順序翻譯轉為了以媒體和社交媒體為媒介的在線平行對話。新的利益相關者,如學生、自由職業者和公民等,也能通過Kaggle這樣的競爭平臺參與到研究中來。共同語言和共識能促進人工智能生態系統內部各個角色間的聯系。 人工智能已經成為影響國家競爭力的重要因素。近年來,許多有關人工智能的國家政策和國際政策先后出臺,與人工智能研究生態系統的發展壯大相輔相成。
17、同時,人工智能領域百花齊放,傳播渠道也日漸多樣,包括出版物、預印本、會議、競賽和軟件等。 人工智能領域的研究存在明顯的地區差異。在政策的扶持下,中國的人工智能發展迅猛。有望在全球范圍引領人工智能浪潮。其在人工智能領域的人才引進同樣表明,中國的研究環境越來越有吸引力。中國的人工智能研究集中于計算機視覺,尚未形成專攻包括語音識別在內自然語言處理和知識表示的研究,這或許是因為這類研究的研究主體是企業,而它們通常不會發表諸多科學論文。中國在人工智能領域的研究和教育勢頭強勁,學術產量激增,研究成果同其他地區一樣,也得到了應用。人工智能:知識的創造、轉移與應用 9盡管科研成果增長迅速,中國在該領域的引文影
18、響力仍然較低,這表明中國的研究似乎更具區域性,而非全球性。國際合作水平低,研究人員的流動性較低,這使得中國在人工智能領域的研究語料庫相對較小,引用度卻高。和眾多其他研究領域一樣,合作是成功的關鍵。全球范圍內各大社交媒體對某領域的熱烈討論和相關國際競賽的增多便是最有力的論證。 本報告所指“歐洲”為歐盟所屬44個成員國及有資格獲得歐盟“地平線2020”計劃資助的相關國家。該地區與歐洲之外的國際合作很高并保持逐漸升高的趨勢,是在人工智能領域科研產量最大的地區。然而,近年來,歐洲似乎面臨著人工智能人才流失的問題。歐洲人工智能研究范圍之廣體現了歐洲國家的多樣性,每個國家都有自己的發展歷程與專長。歐洲地區
19、的研究重點集中在模式識別的遺傳編譯、模糊系統、語音識別和人臉識別。在歐洲,深度學習與其他子領域的研究聯系較其他地區相對松散,而人工智能機器人學已融入機器學習的集群中。 美國企業吸引了眾多AI人才,科研實力雄厚,這或許要歸功于他們跨界組建聯合實驗室的傳統。學術界同樣表現不俗,在學術產量和保留人才方面均表現突出。美國在全球人工智能領域的競爭中處于領先地位,越來越多的研究人員參與了人工智能領域的國際合作。美國的AI研究偏重特定算法,并且把語音識別和圖像識別歸類到不同集群。研究語料庫表明,美國在人工智能研究領域的多樣性雖不及歐洲,但遠勝中國。 我們發現在研究人工智能的其他主要國家和地區中,印度迅速崛起
20、,人工智能領域的出版量僅次于中、美兩國。2017年,伊朗的學術出版量位居全球第九位,與法國、加拿大持平。去年,俄羅斯的科研成果超過了新加坡與荷蘭,居土耳其之后,德國和日本分別占據第五、第六位。 本報告為研究評估人員、科研資助方、政策制定者和研究人員提供了相關見解。我們采用自下而上的方法描述人工智能研究領域,希望以后能有機會同大家合作定義語料庫。我們的分析還提出了一些在未來研究中有意思的問題: 人工智能領域的研究表現與為人工智能提供輔助的傳統領域(如計算機科學、語言學、數學 等)的研究表現之間是否存在關聯? 如何將人工智能研究轉化為現實應用、社會影響力和經濟增長? 全球范圍內人工智能領域的國際性
21、流動研究人員來自哪里,又去向何方? 當前AI領域出版物的增長態勢能否持續?不同國家和部門間又將如何開展競爭與合作? 10 人工智能:知識的創造、轉移與應用重點人工智能:知識的創造、轉移與應用 11 第2章 人工智能研究的重點是搜索與優化、模糊系統、自然語言處理與知識表示、計算機視覺、機器學習與概率推理、規劃與決策以及神經網絡。 第3&第5章 人工智能的社會相關性與日俱增,其成果已廣泛運用于醫療科學、農業和社會科學等不斷發展的小規模領域,在社交媒體和博客中也頻繁被提及。雖然存在這種社會相關性,目前的研究語料庫卻鮮少涉及道德倫理,然而近期召開的會議則表明人工智能道德倫理問題正在引起人們的關注。 引
22、言&第3章 人工智能領域在過去十年中保持了年均5.3%的增速,在過去五年中每年增長12.9,已然發展成影響國家競爭力的重要領域,國際合作日益頻繁。盡管中國在該領域發展迅猛、雄心勃勃,歐洲仍 是人工智能研究領域的最大參與者,與此同時,美國則鼓勵企業和學術界緊密合作。 引言&第3章 中國渴望在全球范圍內引領人工智能。在強有力的政策扶持下,中國的人工智能發展迅猛,特別是計算機視覺和模糊系統。其在人工智能領域的人才引進同樣表明,中國的研究環境越來越有吸引力,引文影響力也與日俱增。然而,同其他地區相比,中國的研究似乎更具區域性,而非全球性。 第3章 歐洲在人工智能領域的學術成果產量最大,最具多樣性,國際
23、合作水平不斷提高。然而,近年來,歐洲面臨人工智能人才流失的問題,在學術界這一問題尤為嚴重。 第3章 美國企業吸引了眾多人才,科研實力雄厚,這或許要歸功于他們跨界組建聯合實驗室的傳統。學術界同樣表現不俗,在學術產量和保留人才方面表現突出。 第3章 印度在人工高智研究領域異軍突起,目前已成為繼中、美之后的第三大人工智能出版國。.附錄數據來源 arXiv120是一個由私營非盈利教育機構康奈爾大學管轄運營,受康奈爾大學圖書館121、西蒙斯基金會122和成員機構資助123,為物理學、數學、計算機科學、定量生物學、定量金融、統計學、電子工程、系統科學和經濟學等領域提供論文預印服務的網站。 數字書目索引與圖
24、書館項目(DBLP)124是提供計算機科學領域主要文獻的在線檢索服務。由早期的小型實驗性網絡服務器發展到如今在計算機科學領域備受歡迎的開放式數據服務,DBLP的使命是為計算機科學領域的研究人員免費提供高質量的文獻元數據和電子版鏈接。 截止到2016年5月,DBLP為170多萬名作者發表的330多萬份出版物、32,000多卷期刊、31,000多份會議記錄以及23,000多本專著做了索引。 Kaggle125是一家招攬、培訓數據學家的眾包平臺,是全球規模最大的數據學家與機器學習者社群。Kaggle從最初舉辦機器學習競賽發展成為如今的公共數據平臺、數據科學與人工智能短期教育眾包平臺。2017年3月8
25、日,谷歌宣布收購Kaggle。 Plum Analytics126致力于衡量科學研究的影響力,旨在為使用和分析科學研究的個人與組織提供現代化的手段,衡量這些研究的影響。 ScienceDirect 127是愛思唯爾旗下的全文本期刊平臺。該平臺擁有寶貴的、無可比擬的客戶群優勢,在該平臺進行科學研究性能測定提供了全新的視角。目前該平臺約有1,400多萬名活躍用戶,2018128年全文本下載量超過了9億次。 SciVal129可快速方便地訪問230多個國家和地區、10000多所研究機構的研究成果。憑借先進的數據分析技術,SciVal能在幾秒內處理大量數據,生成可視化圖像。SciVal根據全球5,00
26、0家出版商出版的21,915份期刊、4,600萬份出版物計算得出了共170萬億項指標。 90 人工智能:知識的創造、轉移與應用 Scopus130是愛思唯爾旗下的數據庫,主要存儲同行評審文獻的摘要與引文,覆蓋了共7100萬份文件,主要來自5,000家出版商發行的23,700種活躍期刊、圖書和會議論文。 Scopus涵蓋多個語種,業務范圍覆蓋全球:Scopus數據庫中約有46%的文獻標題是非英語的(或同時使用英語與其他語言)。此外,一半以上的文獻來自北美以外的其他地區,如歐洲、拉丁美洲、非洲和亞太地區等。 本報告中,1996-2017年Scopus數據庫的靜態版本以國家、地區和FORD規定的學科
27、門類進行匯總。131 TotalPatent132全球專利數據庫將為您提供最全面的專利信息,以及搜索、比較和分析結果的工具。 120 https:/arxiv.org/. 121 https:/www.library.cornell.edu/about. 122 https:/simonsfoundation.org/. 123 https:/confluence.cornell.edu/x/ALlRF. 124 https:/dblp.uni-trier.de/. 125 https:/ 126 https:/. 127 https:/ 128 https:/ 129 https:/ 130 https:/ 131 Frascati Manual 2015. OECD Library. https:/read.oecd-ilibrary.org/ science- and-technology/frascati-manual-2015_9789264239012-en#page60. 132 https:/ 91 人工智能:知識的創造、轉移與應用