斯坦福大學:人工智能指數2021年度報告(221頁).pdf

編號:81207 PDF  DOCX 221頁 13.18MB 下載積分:VIP專享
下載報告請您先登錄!

斯坦福大學:人工智能指數2021年度報告(221頁).pdf

1、人工智能指數2021年度報告斯坦福大學以人為本人工智能研究院(斯坦福HAI)人工智能指數2021年度報告22021年人工智能指數報告簡介歡迎來到第四期人工智能指數報告! 今年,我們大大增加了報告中的數據量,擴大了合作的外部組織范圍,更加嚴格的校準了我們的數據,并加深了我們與斯坦福大學以人為本人工智能研究所(Human-Centered Artificial Intelligence,HAI)的聯系。人工智能指數報告跟蹤、整理、提煉和可視化人工智能相關數據。其使命是為政策制定者、研究人員、高管、記者和普通公眾提供公正的、經過嚴格審核的、來源于全球的數據,以形成對人工智能這一復雜領域的直觀感知。該

2、報告旨在成為世界上最可信、最權威的人工智能數據和洞察來源。COVID與人工智能 2021年的報告從多個角度展示了COVID-19對人工智能發展的影響。在“技術性能”一章中具體討論了一家人工智能初創公司是如何在COVID-19大流行期間使用基于機器學習的技術來加速COVID相關藥物發現的?!敖洕币徽轮械姆治霰砻?,人工智能的人力招聘和私人投資并沒有受到COVID-19大流行的不利影響,這二者在2020年期間都有所增長。不過,受到COVID-19的影響,2020年更多人選擇通過虛擬會議的方式參加了人工智能研究會議,這種虛擬會議形式導致了會議出席人數的大幅飆升。本期報告變化 2020年,我們對來自政

3、府、行業和學術界的140多名讀者進行了調查,了解他們認為報告最有價值的內容以及我們還應該改進的方向。讀者們建議改進的主要問題是: 技術性能。我們在2021年大大擴展了這一章節,并加入了更多自己的分析。 多樣性和倫理數據。我們在今年的報告中收集了更多的數據。不過,根據我們的調查,人工智能的多個領域中目前仍然缺乏與多樣性和倫理問題相關的有益信息。 不同國家之間的比較。讀者普遍對比較多個國家之間的人工智能指數感興趣。在今年的報告中,我們做了如下改進: 收集了更多數據,以便進行國家間的比較,特別是與經濟學和文獻計量學有關的數據; 納入了對不同國家采取的各種人工智能戰略以及這些戰略如何隨著時間的推移而演

4、變的全面總結。公開數據和工具 2021年人工智能指數報告的附錄部分提供了原始數據和互動工具。我們邀請人工智能界的各位成員以與您工作和興趣最為相關的方式使用這些數據和工具。 原始數據和圖表:報告中所有圖表的公開數據和高分辨率圖像均可在Google Drive上找到。 全球人工智能活力(GlobalAIVibrancy)工具:我們今年對Global AI Vibrancy 工具進行了改版,可以根據22個指標對多達26個國家進行比較,同時提供了更好的互動可視化服務。更新后的Global AI Vibrancy 工具能夠根據用戶偏好,對各國的相對地位進行透明的評估。此外,我們確定了相關的國家指標以表征

5、國家層面的政策優先事項。Global AI Vibrancy 工具中還顯示了包括發達經濟體和新興市場的人工智能卓越中心。 人工智能測量中的問題:2020年秋季,我們發布了人工智能政策中的測量:機遇與挑戰,該報告闡述了2019年秋季AI Index主辦的會議上討論的各種人工智能測量問題。人工智能指數2021年度報告3目錄2021年人工智能指數報告引言2九大要點4人工智能指數指導委員會和工作人員5如何引用該報告6致謝7報告要點10第1章研發 (R&D) 14第2章技術性能 41第3章經濟 80第4章人工智能教育 107第5章人工智能應用的倫理挑戰 125第6章人工智能的多樣性 135第7章人工智能

6、政策和國家戰略 151附錄177訪問公開數據人工智能指數2021年度報告4藥物設計與發現領域人工智能投資大幅增加:“藥物、癌癥、分子、藥物發現 ”在2020年獲得的私人人工智能投資金額最大,超過了138億美元。這個金額是2019年投資金額的4.5倍。行業轉變還在繼續:2019年,北美人工智能專業畢業的博士中有65%進入了產業界,這一數據比2010年的44.4%有所上升,凸顯出產業界開始在人工智能發展中發揮更大作用。生成一切:人工智能系統可以生成標準足夠高、質量足夠好的文字、音頻和圖像合成結果。對于一些受限的技術應用,人類已經很難分辨出合成和非合成結果的區別。人工智能面臨多元化挑戰:2019年,

7、美國居民人工智能博士新畢業生中有45%是白人。相比之下,僅有2.4%非洲裔美國人,3.2%是西班牙裔。中國在人工智能期刊引用量上超過美國:幾年前,中國在期刊發表的論文總數上超過了美國,現在,在期刊引用方面中國也處于了領先地位。而在AI領域會議方面,美國發表的會議論文數量近十年內依然持續(明顯)領先于中國(被引用的次數也更多)。美國人工智能博士畢業生大部分來自國外-他們畢業后還選擇留在美國:2019年,北美新畢業的人工智能博士中,國際學生的比例繼續上升,達到了64.3%,這一數據比2018年增加了4.3%。在外國畢業生中,有81.8%的人選擇留在美國工作,而8.6%的人選擇在美國以外的地方工作。

8、監控技術快速、廉價、日益普及:大規模監控所需的技術正在迅速成熟,圖像分類、人臉識別、視頻分析、語音識別等技術在2020年都取得了重大進展。人工智能倫理缺乏基準和共識:雖然一些團體在人工智能倫理領域制定了一系列定性或規范性報告,但是該領域仍普遍缺乏可用于衡量或評估關于技術發展的廣泛社會討論與技術本身發展之間關系的基準。此外,研究人員和民間社會認為人工智能倫理學比產業組織更重要。人工智能已經得到了美國國會的關注:第116屆國會是美國歷史上最關注人工智能的國會會議。在這一屆國會記錄中提及人工智能的次數是第115屆國會的三倍以上。九大要點123456789人工智能指數2021年度報告6如何引用本報告D

9、aniel Zhang, Saurabh Mishra, Erik Brynjolfsson, John Etchemendy, Deep Ganguli, Barbara Grosz, Terah Lyons, James Manyika, Juan Carlos Niebles, Michael Sellitto, Yoav Shoham, Jack Clark, and Raymond Perrault, “The AI Index 2021 Annual Report,” AI Index Steering Committee, Human-Centered Artificial In

10、telligence Institute, Stanford University, Stanford, CA, March 2021, Chinese translation by Synced.斯坦福大學人工智能指數2021年年度報告由Attribution-No Derivatives 4.0 International授權許可??赏ㄟ^下面的網址查看該許可的副本: http:/creativecommons.org/licenses/by-nd/4.0/.人工智能指數是斯坦福大學以人為本人工智能研究所(Human-Centered Artificial Intelligence Inst

11、itute, HAI)的一個獨立產品。感謝我們的支持伙伴:歡迎大家反饋針對本報告以及對明年報告的想法、建議??赏ㄟ^郵件 AI-Index-Reportstanford.edu 與我們聯系。人工智能指數是在人工智能 (AI100) 的百年研究中構想出來的。 中文版獨家合作伙伴:機器之心人工智能指數2021年度報告7致謝感謝以下組織和個人為 2021年人工智能指數報告 提供數據、 分析、 建議和專家評論。組織arXivJim Entwood, Paul Ginsparg, Joe Halpern, Eleonora PresaniAI倫理實驗室Cansu Canca, Yasemin UstaBl

12、ackinAIRediet Abebe, Hassan Kane 彭博政府Chris CornillieBurningGlassTechnologiesLayla OKane, Bledi Taska, Zhou Zhou計算機研究協會(CRA)Andrew Bernat, Susan Davidson ElsevierClive Bastin, Jrg Hellwig, Sarah Huggett, Mark Siebert IntentoGrigory Sapunov, Konstantin Saven-kov 國際機器人學聯合會Susanne Bieller, Jeff Burnstei

13、n歐盟委員會聯合研究中心Giuditta De Prato, Montserrat Lpez Cobo, Riccardo Righi領英Guy Berger, Mar Carpanelli, Di Mo, Virginia Ramsey 利貫交易網(Liquidnet)Jeffrey Banner, Steven Nichols麥肯錫全球研究院Brittany Presten微軟學術圖譜Iris Shen, Kuansan Wang 美國國家標準與技術研究院Patrick GrotherNestaJoel Klinger, Juan Mateos-Garcia, Kostas Stathou

14、lopoulosNetBaseQuidZen Ahmed, Scott Cohen, Julie KimPostEraAaron MorrisQueerinAIRaphael Gontijo LopesStateofAIReportNathan Benaich, Ian HogarthWomeninMachineLearningSarah Tan, Jane Wang人工智能指數2021年度報告8個人ActivityNetFabian Caba (Adobe Research); Ber-nard Ghanem (阿卜杜拉國王科技大學); Cees Snoek (阿姆斯特丹大學)人工智能人才流

15、失與教師離職Michael Gofman (羅切斯特大學); Zhao Jin (長江商學院)自動定理證明Geoff Sutcliffe (邁阿密大學); Christian Suttner (康寧股份有限公司)布爾可滿足性問題Lars Kotthoff (懷俄明州大學) 企業在人工智能研究會議中的代表Nuruddin Ahmed (韋仕敦大學艾維商學院); Muntasir Wahed (弗吉尼亞理工大學)會議參與者Maria Gini, Gita Sukthankar (AAMAS); Carol Hamilton (AAAI); Dan Jurafsky (ACL); Walter Sc

16、heirer, Ramin Zabih (CVPR); Jrg Hoffmann, Erez Karpas (ICAPS); Paul Oh (IROS); Pavlos Pep-pas, Michael Thielscher (KR) 人工智能會議中的倫理Pedro Avelar, Luis Lamb, Marcelo Prates (南里奧格蘭德聯邦大學) ImageNetLucas Beyer, Alexey Dosovitskiy, Neil Houlsby (Google) MLPerf/DAWNBenchCody Coleman (斯坦福大學), Peter Mattson (Go

17、ogle)分子合成Philippe Schwaller (IBM 歐洲研究院)可視化問答Dhruv Batra, Devi Parikh (喬治亞理工學院/FAIR); Ayush Shrivastava (喬治亞理工學院)你只看一眼 (YOLO)Xiang Long (百度)人工智能指數2021年度報告9建議和專家評論研究生報告及網站技術支持Alexey Bochkovskiy; 百度飛槳計算機視覺團隊; Chenggang Xu (長江商學院); Mohammed AlQuraishi (哥倫比亞大學); Evan Schnidman (EAS Innovation); Fanghzhen

18、 Lin (香港科技大學); David Kanter (MLCommons); Sam Bowman (紐約大學); Maneesh Agrawala, Jeannette Bohg, Emma Brunskill, Chelsea Finn, Aditya Grover, Tatsunori Hashimoto, Dan Jurafsky, Percy Liang, Sharon Zhou (斯坦福大學); Vamsi Sistla (加州大學伯克利分校); Simon King (愛丁堡大學); Ivan Goncharov (Weights & Biases) Ankita Baner

19、jea, Yu-chi Tsao (斯坦福大學)Michi Turner (報告平面設計和封面藝術); Nancy King (報告編輯); Michael Taylor (報告數據可視化); Kevin Litman-Navarro (Global AI Vibrancy 工具設計與開發); Travis Tyler (人工智能指數網站設計); Digital Avenues (人工智能指數網站開發)人工智能指數2021年度報告10第1章研發(R&D) 2019年至2020年,人工智能期刊論文的數量增長了34.5%。這一數據比2018年至2019年的增長比例(19.6%)要高得多。 在主要的

20、國家和地區中,發表同行評審人工智能論文數量最多的機構類型均是學術機構。但產出論文數量排名第二的機構類型在不同國家卻各不相同:在美國,各大企業附屬的研究機構所發表的論文占論文總數量的19.2%。而在中國和歐盟,產出論文數量排名第二的機構為政府,其中,中國政府機構產出論文數量占論文總數量的15.6%,而歐盟的該數據為17.2%。 2020年,中國在世界范圍內的人工智能期刊論文引用次數首次超過了美國。2004年,中國的人工智能期刊論文發表總數量曾短暫超過美國,后續在2017年又重新奪回領先優勢。然而,在過去十年中,美國的人工智能會議論文引用次數一直(且明顯)高于中國。 受到COVID-19的影響,2

21、020年主要的人工智能會議大都是以虛擬方式召開的,由此導致登記的參會的人數大幅增加。2020年,9個會議的參會人數幾乎翻了一番。 在過去的6年里,arXiv上與人工智能相關的論文數量增長了6倍多,從2015年的5478篇增長到2020年的34736篇。 2019年公開發表的人工智能論文的數量占全球同行評審科學論文總數量的3.8%,高于2011年的1.3%。第2章技術性能 生成一切:人工智能系統現在可以處理文本、音頻和圖像并生成足夠高質量的產品。對于一些限定的技術來說,人類難以判斷合成和非合成輸出之間的差異。從對社會有用和較為無用兩個角度出發,有望生成大量的人工智能下游應用程序。這也促使研究人員

22、致力于檢測生成模型的技術研究。DeepFake檢測挑戰賽的數據表明了計算機區分不同輸出的能力。 計算機視覺的產業化:過去十年,得益于機器學習技術(特別是深度學習技術)的應用,計算機視覺研究取得了巨大進展。新的數據顯示,計算機視覺正在實現產業化。在一些較大的基準庫中,算法或模型的性能已經開始趨于平穩。這表明計算機視覺社區需要致力于開發和確定難度更大的基準,以進一步測試性能。各公司正在投入越來越多的計算資源,以比以往更快的速度訓練計算機視覺系統。同時,用于已部署系統的技術,如用于分析視頻靜止幀的對象檢測框架,正在迅速成熟,這表明人工智能將會進一步在產業場景中部署。 自然語言處理(NLP)超越了它的

23、評估指標:得益于NLP的快速發展,已經出現了語言能力顯著提升的人工智能系統,并且這些系統已經開始對世界產生了有意義的經濟影響。谷歌和微軟都在其搜索引擎中部署了BERT語言模型,而微軟、OpenAI等公司也開發了其他大型語言模型。NLP的研究進展如此迅速,以至于它已經開始超過了用于測試它們的基準。例如,在SuperGLUE上獲得能和人類的性能水平相當的軟件產品報告要點人工智能指數2021年度報告11正在快速涌現。SuperGLUE是針對早期NLP進展超過GLUE評估能力而開發的NLP評估套件。 關于推理的新分析:大多數技術問題的測量標準都會在固定的基準上顯示出在當前時間點上的最佳系統的性能。而為

24、人工智能指數開發的新分析方法提供了允許不斷發展的基準的測量標準,并將一段時間內一組系統的總體性能歸因于各個單獨的系統。這些應用于兩個符號推理問題:自動定理證明和布爾公式的可滿足性。 機器學習正在改變醫療和生物學領域的游戲規則:隨著機器學習技術的引入,醫療和生物行業的格局發生了實質性的變化。DeepMind的AlphaFold應用深度學習技術,在蛋白質折疊這一長達數十年的生物學難題上取得了重大突破??茖W家利用機器學習模型學習化學分子的表示,以制定更有效的化學合成規劃。PostEra是一家人工智能初創公司,這家公司在COVID-19流行期間使用基于機器學習的技術來加速發現COVID相關的藥物。第3

25、章經濟 “藥物、癌癥、分子、藥物發現 “在2020年獲得的私人人工智能投資最大金額,超過了138億美元。這一金額是2019年投資金額的4.5倍。 巴西、印度、加拿大、新加坡和南非是2016年至2020年人工智能行業雇用人數增長最多的國家。盡管受到了COVID-19的影響,2020年我們了解到的各國的人工智能行業雇傭的員工人數仍在繼續增長。 更多人工智能領域的私人投資集中到了更少的初創公司中。2020年的私人人工智能投資金額比2019年增加了9.3%。這一數字比2018年至2019年(5.7%)增加的比例更高。不過,新融資的公司數量連續三年減少。 根據麥肯錫的一項調查,盡管解決與使用人工智能相關

26、的倫理問題的呼聲越來越高,但行業內解決這些問題的努力仍然是非常有限的。例如,人工智能中的公平性和公正性等問題仍然很少受到公司的關注。此外,與2019年相比,2020年認為個人或個體隱私的風險是與其相關的公司仍然很少。在受訪的公司中,正在試圖減輕或規避這些風險的公司比例并沒有變化。 盡管COVID-19大流行導致了經濟衰退,但麥肯錫的一項調查中有一半的受訪者表示冠狀病毒并沒有對他們在人工智能領域的投資產生影響。而實際上有27%的人表示他們的投資仍有所增加。只有不到四分之一的企業減少了它們對人工智能的投資。 從2019年到2020年,美國的人工智能職位比例有所下降,這是六年來的首次下降。從2019

27、年到2020年,美國發布的人工智能工作崗位總數也下降了8.2%,從2019年的325724個崗位減少到2020年的300999個崗位。第4章人工智能教育 2020年進行的一項人工智能指數調查顯示,過去四年,世界頂尖大學加大了對人工智能教育的投入。在過去的四個學年中,教授學生在本科和研究生階段構建或部署實用人工智能模型所需技能的課程數量分別增加了102.9%和41.7%。 計算機研究協會(CRA)的一項年度調查顯示,過去十年,北美地區更多的人工智能博士畢業生選擇在產業界工作,而選擇學術界工作的則較少。其中,選擇進入產業界工作的新AI專業博士比例增加了48%,從2010年人工智能指數2021年度報

28、告12的44.4%增至2019年的65.7%。相比之下,進入學術界的新AI專業博士比例下降了44%,從2010年的42.1%降至2019年的23.7%。 CRA的調查顯示,在過去10年中,在美國獲得CS博士學位的博士總人數中,人工智能相關博士人數所占比例從14.2%上升到2019年的23%左右。與此同時,其他以前非常流行的CS博士學位的受歡迎程度有所下降,包括網絡、軟件工程和編程語言。與2010年相比,程序編譯相關專業的博士學位人數都有所減少,而人工智能和機器人/視覺專業則大幅增加。 在經歷了兩年的增長之后,北美地區的人工智能領域由大學轉到產業界工作的教師人數從2018年的42人下降到了201

29、9年的33人(其中28人是終身教職員工,5人沒有獲得終身教職)。2004年至2019年間,卡內基梅隆大學(Carnegie Mellon University)AI領域的教師離職人數最多(16人),其次是喬治亞理工學院(14人)和華盛頓大學(12人)。 2019年,北美新AI專業博士中的國際學生比例繼續上升,達到64.3%,比2018年增長4.3%。在外國畢業生中,有81.8%的人留在美國,而8.6%的人選擇在美國以外工作。 在歐盟,絕大多數人工智能專業的學術課程都是在碩士及以上階段開設的。學士和碩士階段最常開設的課程是機器人學和自動化,而相關短期課程中最常開設的專業是機器學習(ML)。第5章

30、人工智能應用的倫理挑戰 自2015年以來,提交給人工智能會議的論文標題中包含倫理相關關鍵詞的論文數量有所增長。不過,在主要人工智能會議上標題能夠匹配倫理相關關鍵詞的論文平均數量多年來仍然較小。 2020年,與人工智能倫理道德使用相關的五大最受關注的新聞話題分別是:歐盟委員會發布的人工智能白皮書,谷歌解聘道德研究員蒂姆尼特蓋布魯(Timnit Gebru),聯合國成立的人工智能道德委員會,梵蒂岡的人工智能道德計劃,以及IBM正在取消其人臉識別相關業務。第6章人工智能的多樣性問題 十多年來,女性AI專業博士畢業生和計算機科學(CS)終身教職員工的比例一直很低。美國計算機研究協會(CRA)的一項年度

31、調查顯示,北美AI博士項目的女性畢業生人數占所有博士畢業生人數的比例還不到18%。一項人工智能指數調查結果顯示,在世界上的幾所大學中CS系終身教職員工中僅有16%是女性。 CRA的調查顯示,2019年,在美國AI博士畢業生新移民中,45%是白人,22.4%是亞裔,3.2%是西班牙裔,2.4%是非裔美國人。 在過去十年中,白人(非西班牙裔)新畢業計算機博士的比例變化不大,平均約為62.7%。而同期黑人或非裔美國人(非西班牙裔)和西班牙裔計算機博士的比例則明顯下降,平均分別下降了3.1%和3.3%。 近年來,由NeurIPS合辦的Black-in-AI研討會的參與人數顯著增加。2019年參會人數和

32、提交論文數是2017年的2.6倍,而接受論文數是2017年的2.1倍。人工智能指數2021年度報告13 在Queer in AI組織于2020年進行的一項會員調查中,近一半的受訪者表示,缺乏包容性是他們成為AI/ML領域從業者所面臨的一個障礙。超過40%的受訪者表示,他們曾在工作或學校受到過歧視或騷擾。第7章人工智能政策和國家戰略 自2017年加拿大發布全球首個國家人工智能戰略以來,截至2020年12月,已有30多個國家和地區發布了類似文件。 全球人工智能伙伴關系(Global Partnership on AI ,GPAI)和經濟合作與發展組織(Organisation for Econom

33、ic Co-operation and Development,OECD)人工智能政策觀察站和人工智能專家網絡于2020年啟動。這些國際組織的成立推動了政府間的協作,以共同支持面向所有人的人工智能發展。 在美國,第116屆國會是歷史上對人工智能關注度最高的國會會議 。本屆國會在立法、委員會報告和國會研究服務(Congressional Research Service,CRS)報告中提到人工智能的次數是第115屆國會的三倍多。目錄14第1章章節預覽人工智能指數2021年度報告第 1 章 研發(R & D)人工智能指數2021年度報告目錄15第1章章節預覽人工智能指數2021年度報告第1章:研發

34、(R&D)概述 16章節要點 171.1論文18同行評審的人工智能論文 18 概述 18 按地區 18 按地理區域 20 按機構隸屬關系 21 學術企業合作 23人工智能期刊論文 25 概述 25 按地區 26 按地理區域 27 引用 27人工智能會議論文 28 概述 28 按地區 29 按地理區域 30 引用 30人工智能專利 31 概述 31arXiv 論文 32 概述 32 按地區 32 按地理區域 33 按研究領域 34要點: 關于arXiv的深度學習論文 351.2會議36會議出席 36要點:參加人工智能研究會議的企業界企業代表 381.3人工智能開源軟件庫39GitHub 標星 3

35、9章節預覽第 1 章:訪問公開數據目錄16第1章章節預覽人工智能指數2021年度報告概述概述本報告開篇概述了人工智能(AI)的研發工作,因為研發是人工智能進步的基礎。自從這項技術在20世紀50年代首次引起計算機科學家和數學家的注意以來,人工智能已經發展成為一門具有重大商業應用價值的研究學科。人工智能論文的數量在過去20年里急劇增加。人工智能會議和預印本檔案的興起進一步推動了研究和學術的廣泛交流。包括中國、歐盟和美國在內的各個國家都在競相致力于人工智能研究。研發章節的介紹目的就是跟蹤人工智能這個日益復雜和競爭激烈的研究領域的研究進展。本章首先使用來自Elsevier/Scopus和微軟學術圖譜(

36、MAG)數據庫的數據以及來自arXiv論文預印本庫和Nesta的數據,以了解同行評審的期刊論文、會議論文和專利等人工智能出版物,以及每種出版物的引用和影響情況。文章列舉了主要人工智能國家和地理區域對人工智能研發的貢獻,并考慮了這些貢獻是如何影響該領域的。第二和第三部分則討論了在主要人工智能會議和GitHub上的研發活動。第1章:研發(R&D)目錄17第1章章節預覽人工智能指數2021年度報告章節重點 2019年至2020年,人工智能期刊論文的數量增長了34.5%。這一數據比2018年至2019年的增長比例(19.6%)要高得多。 在主要的國家和地區中,同行評審的人工智能論文主要來自于學術機構。

37、但產出論文數量排名第二的機構類型在不同國家卻各不相同:在美國,各大企業附屬的研究機構所發表的論文數量占論文總數量的19.2%。而在中國和歐盟,產出論文數量排名第二的機構為政府,其中,中國政府機構產出論文數量占論文總數量的15.6%,而歐盟的該數據為17.2%。 2020年,中國在世界范圍內的人工智能期刊論文引用次數首次超過了美國。2004年,中國的人工智能期刊論文發表總數量曾短暫超過美國,后續在2017年又重新奪回領先優勢。然而,在過去十年中,美國的人工智能會議論文引用次數一直(且明顯)高于中國。 受到COVID-19的影響,2020年主要的人工智能會議大都是以虛擬方式召開的,由此導致登記參會

38、的人數大幅增加。2020年,9個會議的參會人數幾乎翻了一番。 在過去的六年中,arXiv上與人工智能相關的出版物數量增長了6倍多,從2015年的5478篇增長到2020年的34736篇。 2019年公開發表的人工智能出版物的數量占全球同行評審科學出版物總數量的3.8%,高于2011年的1.3%。 人工智能出版物包括同行評審出版物、期刊文章、會議論文和專利。為了跟蹤這些出版物的發展趨勢以評估全球人工智能研發活動的狀況,本報告使用了以下數據集:Elsevier/Scopus同行審查出版物數據庫;所有期刊、會議論文和專利出版物的微軟學術圖譜(MAG)數據庫;以及arXiv和Nesta電子預印本數據。

39、章節要點第1章:研發(R&D)目錄18第1章章節預覽人工智能指數2021年度報告20002001200220032004200520062007200820092010201120122013201420152016201720182019020406080100120經過同行評審的AI出版物數量(以千計)2000-19年經同行評審的AI出版物數量來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告人工智能出版物包括同行評審出版物、期刊文章、會議論文和專利。為了跟蹤這些出版物的發展趨勢以評估全球人工智能研發活動的狀況,本報告使用了以下數據集:Elsevier/Scop

40、us同行審查出版物數據庫;所有期刊、會議論文和專利出版物的微軟學術圖譜(MAG)數據庫;以及arXiv和Nesta電子預印本數據。同行評審的人工智能出版物本節首先介紹Elsevier Scopus數據庫中的數據。Scopus包含7000萬個同行評審的研究成果,這些研究成果來自5000多家國際出版商。以下所示的2019年版數據來自一套全新的出版物,因此所有同行評審的人工智能出版物的數字與往年人工智能指數報告中的數字不同。由于出版物索引方法的改變,數據集的準確率從80%提高到了84%(詳見附錄)。概覽圖1.1.1a給出了同行評審人工智能出版物的數量,圖1.1.1b顯示了這些出版物在全球所有同行評審

41、出版物中1.1 出版物所占的比例。2000年至2019年間,出版物總數增長了近12倍。而這一時期同行評審出版物的比例從2000年的0.82%上升到2019年的3.8%。按地區1自2004年以來,在全世界同行評審的人工智能出版物總數中,東亞和太平洋地區所占份額最大,其次是歐洲和中亞以及北美(圖1.1.2)。2009年至2019年間,南亞和撒哈拉以南非洲的同行評審人工智能出版物數量增長最快,分別增長了8倍和7倍。1.1出版物第1章:研發(R&D)圖 1.1.1a1 本章中對各個地區的區域劃分是根據世界銀行的分析分組完成的。目錄19第1章章節預覽人工智能指數2021年度報告2000200120022

42、00320042005200620072008200920102011201220132014201520162017201820190%1%2%3%4%經過同行評審的AI出版物(占總數的百分比)3.8%2000-19年經同行評審的AI出版物(占總數的百分比%) 來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告1.1出版物圖 1.1.1b19992000200120022003200420052006200720082009201020112012201320142015201620172018201920202021202220230%10%20%30%40%經

43、過同行評審AI出版物(占世界總數的百分比)0.7% 撒哈拉以南非洲8.8% 南亞5.5% 中東及北非2.7% 拉丁美洲及加勒比海17.0% 北美25.1% 歐洲及中亞36.9% 東亞及太平洋2000-19年按地區展示的同行評審的AI出版物(占總數的百分比%)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告圖 1.1.2第1章:研發(R&D)目錄20第1章章節預覽人工智能指數2021年度報告200020012002200320042005200620072008200920102011201220132014201520162017201820190%5%10%15%20%25%經過

44、同行評審的AI出版物(占世界總數的百分比)16.4% 歐盟14.6% 美國22.4% 中國2000-19年按地理區域展示的同行評審的AI出版物(占總數的百分比%)來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告按地理區域劃分為了比較世界主要人工智能參與者的活動,本節展示了來自中國、歐盟和美國的同行評審人工智能出版物的趨勢。截至2019年,中國在2017年超過歐盟 (圖1.1.3)后,同行評審人工智能出版物中所占份額在全球一直處于領先地位。2019年,中國發表的同行評審人工智能論文數量是2014年的3.5倍,而這一時期歐盟發表的論文數量僅是2014年的2倍,美國則是

45、2014年的2.75倍。1.1出版物圖 1.1.3第1章:研發(R&D)目錄21第1章章節預覽人工智能指數2021年度報告2000200120022003200420052006200720082009201020112012201320142015201620172018201901,0002,0003,0004,000經過同行評審的AI出版物數量14 其他382 醫療4,352 政府1,675 公司2000-19年按機構隸屬關系展示的中國經同行評審的AI出版物數量來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告1.1出版物圖 1.1.4a按機構隸屬關系以下圖表

46、顯示了與中國的企業、政府、醫療和其他機構(圖1.1.4a)、歐盟(圖1.1.4b)和美國(圖1.1.4c)相關的同行評審人工智能出版物的數量。2 2019年,中國大約有95.4%的同行評審人工智能出版物是與學術界相關的,而歐盟和美國的這一比例分別為81.9%和89.6%。這些機構的附屬類別并不是互斥的,因為有些作者可能附屬于一種以上的機構。數據表明,除學術界之外,政府機構在中國和歐盟的同行評審人工智能出版物中所占比例始終最高(2019年分別為15.6%和17.2%),而在美國,除學術機構外占比最高的機構類型則是企業附屬機構(19.2%)。2 在所有三個地理區域中,與學術界相關的論文數量超過了政

47、府、企業和醫學相關的論文數量。我們在圖中沒有標示出學術界的隸屬關系,因為這樣處理會導致圖表扭曲。第1章:研發(R&D)目錄22第1章章節預覽人工智能指數2021年度報告2000200120022003200420052006200720082009201020112012201320142015201620172018201901,0002,0003,000經過同行評審的AI出版物數量120 其他718 醫療2,277 政府3,513 公司2000-19年按機構隸屬關系展示的美國經同行評審的AI出版物數量來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告1.1出版物

48、圖 1.1.4c2000200120022003200420052006200720082009201020112012201320142015201620172018201901,0002,0003,000經過同行評審的AI出版物數量187 其他508 醫療3,523 政府1,594 公司2000-19年按機構隸屬關系展示的歐盟經同行評審的AI出版物數量來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告圖 1.1.4b第1章:研發(R&D)目錄23第1章章節預覽人工智能指數2021年度報告1,0002,0006,0007,0008,0003,000 4,000 5

49、,000 同行評審的AI出版物數量美國歐盟中國英國德國日本法國加拿大韓國荷蘭瑞士印度中國香港西班牙意大利2015-19年按地理區域展示的產學界合作、合著的同行評審AI出版物數量(總和)來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告1.1出版物圖 1.1.5產學合作自20世紀80年代以來,美國學術界和產業界之間的研發合作變得越來越重要也越來越受歡迎,具體表現在產學研中心數量的激增以及企業對大學研究的貢獻增多。圖1.1.5顯示,2015年至2019年間,美國出版的產學界合作、合著的同行評審的人工智能出版物數量最多,是歐盟的兩倍多,排在第二位。其次是中國,排在第三位。

50、第1章:研發(R&D)目錄24第1章章節預覽人工智能指數2021年度報告510201,0002,00050 100 200 500經學術界同行評審的AI出版物數量(對數尺度)0123同行評審的AI出版物的現場加權引文影響力(FWCI)德國澳大利亞巴西加拿大中國歐盟法國中國香港印度印度尼西亞伊朗意大利日本馬來西亞波蘭俄羅斯新加坡韓國西班牙瑞士中國臺灣土耳其英國美國2019年同行評審AI出版物的領域加權引用影響和產學界合作同行評審AI出版物的數量來源:Elsevier/Scopus,2020年|圖表:2021年AI指數報告1.1出版物圖1.1.6中給出了產學界合作如何影響不同地理區域人工智能出版物

51、的領域加權引用影響(Field-Weighted Citation Impact,FWCI)。FWCI用于衡量出版物的引用次數與同一年、同一學科、同一格式(書籍、文章、會議論文等)其他類似出版物的平均引用次數的比較。FWCI值為1.0表示全球均值。根據全球均值,大于或小于1意味著出版物被引用的次數大于或小于預期。例如,FWCI為0.75意味著引用次數比全球平均水平少25%。圖表中y軸表示所有經同行評審的人工智能出版物的FWCI, x軸表示學術界-企業合著出版物的總數(對數比例)。為了提高FWCI指標的信噪比,圖標中僅包括了在2020年擁有超過1000份經同行評審的人工智能出版物的國家。圖 1.

52、1.6第1章:研發(R&D)目錄25第1章章節預覽人工智能指數2021年度報告200020012002200320042005200620072008200920102011201220132014201520162017201820192020020406080AI期刊出版數量(以千為單位)2000-20年AI期刊出版文獻數量來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告2000200120022003200420052006200720082009201020112012201320142015201620172018201920200%1%2%3%AI Journal出版物

53、(占所有出版物的百分比)2.2%2000-20年AI期刊出版文獻(占所有期刊出版文獻的百分比 %),2000-20來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告1.1出版物圖 1.1.7a人工智能期刊論文接下來的三個部分將根據微軟學術圖譜譜(Microsoft Academic Graph,MAG)的數據,列出人工智能期刊、會議論文和專利的出版趨勢,以及它們各自的引用情況,這些引用可以用于揭示研發的影響情況。MAG 3是一個知識圖譜,由超過2.25億份出版文獻組成(截至2019年11月底)。概述總體而言,2020年人工智能期刊出版文獻數量比2000年高5.4倍(圖1.1.7a)。

54、2020年,人工智能期刊出版文獻的數量比2019年增長了34.5%,這一增長率遠遠高于2018年至2019年的19.6%。人工智能期刊出版文獻在全球所有出版文獻中的份額在2020年躍升了0.4個百分點,高于過去五年0.03個百分點的平均水平(圖1.1.7b)。圖 1.1.7b3 詳情可參見“微軟學術服務(MAS)與應用概述”、“微軟科學研究學術服務綜述”。第1章:研發(R&D)目錄26第1章章節預覽人工智能指數2021年度報告2000200120022003200420052006200720082009201020112012201320142015201620172018201920202

55、0212022202320240%10%20%30%40%AI Journal出版物(占世界總數的百分比)0.3%, 撒哈拉以南非洲4.9%, 南亞3.1%, 中東及北非 1.3%, 拉丁美洲及加勒比海14.0%, 北美13.3%, 歐洲及中亞26.7%, 東亞及太平洋2000-20年按地區分列的AI期刊出版文獻(占全球總數的百分比 %)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告按地區圖1.1.8顯示了2000年至2020年間,按地區展示的人工智能期刊在MAG數據庫中所占的份額。在過去的21年里,東亞和太平洋、歐洲和中亞以及北美是人工智能期刊的主要發行地,而這三個地區的主導地

56、位隨著時間的推移也在發生變化。2020年,東亞和太平洋地區的份額最高(26.7%),其次是歐洲和中亞(13.3%)以及北美(14.0%)。此外,在過去十年中,南亞、中東和北非的增長最為顯著,這兩個地區的人工智能期刊出版文獻數量分別增長了6倍和4倍。1.1出版物圖 1.1.8第1章:研發(R&D)目錄27第1章章節預覽人工智能指數2021年度報告2000200120022003200420052006200720082009201020112012201320142015201620172018201920200%5%10%15%20%25%AI Journal出版物(占世界總數的百分比)12.

57、3%, 美國8.6%, 歐盟18.0%, 中國2000-20年按地理區域展示的AI期刊出版文獻(占世界總出版文獻的百分比%)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告按地理區域圖1.1.9顯示,在三大人工智能大國中,自2017年以來,中國在人工智能期刊出版文獻中所占份額居世界首位,2020年為18.0%,其次是美國(12.3%)和歐盟(8.6%)。1.1出版物圖 1.1.92000200120022003200420052006200720082009201020112012201320142015201620172018201920200%10%20%30%40%AI期刊引

58、文(占世界總數的百分比)19.8%美國11.0%歐盟20.7%中國2000-20年按地理區域展示的AI期刊引用情況(占世界總引用情況的百分比%) 來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告引用從人工智能期刊引用比例的角度看,圖1.1.10顯示,2020年中國(20.7%)首次超過美國(19.8%),而歐盟的整體份額繼續保持下滑趨勢。圖 1.1.10第1章:研發(R&D)目錄28第1章章節預覽人工智能指數2021年度報告20002001200220032004200520062007200820092010201120122013201420152016201720182019

59、20200%5%10%15%20%25%AI會議出版物(占所有出版物的百分比)20.2%2000-20年AI會議出版文獻(占所有會議出版文獻的百分比 %)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告20002001200220032004200520062007200820092010201120122013201420152016201720182019202001020304050出版數量(以千為單位)2000-20年AI會議出版文獻數量來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告1.1出版物圖 1.1.11a圖 1.1.11b人工智能會議出版文獻 概述20

60、00年至2019年間,人工智能會議出版文獻數量增長了4倍。在過去十年中,其增長已經趨于平穩,2019年的出版文獻數量僅為2010年的1.09倍。44 注意,MAG收錄的2020年會議數據尚不完整。詳見附錄。第1章:研發(R&D)目錄29第1章章節預覽人工智能指數2021年度報告19992000200120022003200420052006200720082009201020112012201320142015201620172018201920202021202220232024202520260%10%20%30%40%AI會議出版物(占世界總數的百分比)5.1%, 南亞2.2%, 中東及

61、北非1.7%, 拉丁美洲及加勒比海 0.3%, 撒哈拉以南非洲18.6%, 歐洲及中亞27.3%, 東亞及太平洋 21.7%, 北美2000-20年按區域展示的AI會議出版文獻(占全球總數的百分比 %)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告按地區由圖1.1.12可以看出,與人工智能期刊出版文獻的趨勢類似,東亞和太平洋、歐洲和中亞以及北美是人工智能會議出版文獻的主要來源地。具體而言,東亞及太平洋地區從2004年開始就一直處于領先地位,2020年其占比已經超過了27%。北美在2018年超過歐洲和中亞占據第二位,共占比20.1%。而其2020年的占比為21.7%。1.1出版物圖

62、 1.1.12第1章:研發(R&D)目錄30第1章章節預覽人工智能指數2021年度報告2000200120022003200420052006200720082009201020112012201320142015201620172018201920200%10%20%30%40%AI會議引文(占世界總數的百分比)11.8% 中國40.1% 美國10.9% 歐盟2000-20年按地理區域展示的AI會議引用情況(占世界總引用量的百分比%)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告20002001200220032004200520062007200820092010201120

63、12201320142015201620172018201920200%5%10%15%20%25%AI會議出版物(占世界總數的百分比)12.8% 歐盟15.2% 中國19.4% 美國2000-20年按地理區域展示的AI會議出版文獻(占全球總數的百分比%)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告按地理區域2019年,中國在人工智能會議出版文獻中所占比例超過了美國(圖1.1.13)。自2000年以來,中國在人工智能會議出版文獻中所占的比例大幅增長。2019年中國人工智能會議出版文獻所占比例幾乎是2000年的9倍。歐盟人工智能會議出版文獻所占比例在2011年達到頂峰后持續下降。

64、1.1出版物圖 1.1.13引用關于人工智能會議出版文獻的引用情況,由圖1.1.14顯示可知,美國在過去21年中在主要大國中都占據主導地位。2020年,美國以40.1%的總引用率位居榜首,其次是中國(11.8%)和歐盟(10.9%)。圖 1.1.14第1章:研發(R&D)目錄31第1章章節預覽人工智能指數2021年度報告200020012002200320042005200620072008200920102011201220132014201520162017201820192020020406080100AI專利出版物的數量(以千為單位)2000-20年AI專利出版物數量來源:微軟學術圖譜

65、,2020年|圖表:2021年AI指數報告1.1出版物圖 1.1.15a人工智能專利概述在過去20年中,世界上公布的人工智能專利總數一直在穩步增長,從2000年的21806項增長到2019年的101876項,增長超過了4.5倍(圖1.1.15a)。人工智能專利在世界范圍內的份額增長較小,從2000年的2%左右增長到2020年的2.9%(圖1.1.15b)。由于人工智能專利數據是不完整的,到2020年,只有8%的數據集包含一個國家或地區的隸屬關系。因此,我們對按地理區域劃分的人工智能專利出版物份額數據表示懷疑,并未將其納入主報告中。詳見附錄。200020012002200320042005200

66、6200720082009201020112012201320142015201620172018201920200%1%2%3%AI專利出版物(占所有出版物的百分比)2.9%2000-20年AAI專利出版物(占所有專利出版物的百分比 %)來源:微軟學術圖譜,2020年|圖表:2021年AI指數報告圖 1.1.15b第1章:研發(R&D)目錄32第1章章節預覽人工智能指數2021年度報告2015201620172018201920200102030關于arXiv的AI相關出版物的數量(以千為單位)2015-20年ARXIV AI相關出版文獻數量來源:arXiv,2020 |圖表:2021 AI

67、指數報告1.1出版物圖 1.1.16ARXIV出版文獻除了如上所述的發表學術論文的傳統途徑,目前在arXiv(一個電子預印本的在線存儲庫)上發表論文/文獻(通常是預同行評審)的做法得到了人工智能研究人員的廣泛認可。arXiv允許研究人員在提交給期刊和會議之前分享他們的研究成果,這大大加快了信息發現和傳播的周期。本節中提及的人工智能相關出版文獻的數量是根據arXiv中如下領域的出版文獻統計得到的:cs.AI(人工智能),cs.CL(計算和語言),cs.CV(計算機視覺),cs.NE(神經和進化計算),cs.RO(機器人技術),cs.LG(計算機科學中的機器學習),以及stat.ML(統計學中的機

68、器學習)。概述在短短的六年時間里,arXiv上與人工智能相關的出版文獻數量增長了六倍多,從2015年的5478篇增加到2020年的34736篇(圖1.1.16)。20152016201720182019202020210%10%20%30%40%與arXiv相關的AI相關出版物(占世界總數的百分比)4.0% 南亞2.5% 中東及北非 1.3% 拉丁美洲及加勒比海 0.3% 撒哈拉以南非洲36.3% 北美26.5% 東亞及太平洋 22.9% 歐洲及中亞2015-20年按地區展示的ARXIVAI相關出版文獻(占世界總數的百分比%)來源:arXiv,2020 |圖表:2021 AI指數報告按地區按地

69、區進行的分析顯示,雖然北美在arXiV人工智能相關出版文獻的全球份額中仍然領先,但其份額已從2017年的41.6%下降到2020年的36.3%(圖1.1.17)。與此同時,東亞及太平洋地區的出版文獻份額在過去五年中穩步增長,從2015年的17.3%增長到2020年的26.5%。圖 1.1.17第1章:研發(R&D)目錄33第1章章節預覽人工智能指數2021年度報告20152016201720182019202002,0004,0006,0008,00010,00012,000arXiv上與AI相關的出版物數量11,280美國6,505歐盟5,440中國2015-20年按地理區域展示的ARXIV

70、 AI相關出版文獻數量來源:arXiv,2020 |圖表:2021 AI指數報告2015201620172018201920200%10%20%30%與arXiv相關的AI相關出版物(占世界總數的百分比)32.5% 美國18.7% 歐盟15.7% 中國2015-20年按地理區域展示的ARXIV AI相關出版文獻(占世界總數的百分比%)來源:arXiv,2020 |圖表:2021 AI指數報告按地理區域在三大人工智能強國有關arXiv的人工智能相關出版文獻總數不斷增加的同時,中國正在趕超美國(圖1.1.18a和圖1.1.18b)。另一方面,歐盟的出版文獻份額基本保持不變。1.1出版物圖 1.1.

71、18a圖 1.1.18b第1章:研發(R&D)目錄34第1章章節預覽人工智能指數2021年度報告20152016201720182019202002,0004,0006,0008,00010,000arXiv上與AI相關的出版物數量11,098 cs.LG11,001 cs.CV1,818 stat.ML2,571 cs.RO743 cs.NE5,573 cs.CL1,923 cs.AI2015-20年按研究領域劃分的ARXIV AI相關出版文獻數量來源:arXiv,2020 |圖表:2021 AI指數報告按研究領域在arXiv與人工智能有關的六個領域中,機器人學(cs.RO)和計算機科學中的

72、機器學習(cs.LG)這兩個領域的出版文獻數量在2015年至2020年間增長最快,分別增長11倍和10倍(圖1.1.19)。2020年,計算語言學(cs.LG)和計算機視覺(cs.CV)在所有與人工智能相關的arXiv出版文獻數量中占比最多,分別占32.0%和31.7%。2019年至2020年,增長最快的領域是cs.CL(35.4%)和cs.RO(35.8%)。1.1出版物圖 1.1.19在arXiv與人工智能有關的六個領域中, 機器人學(cs.RO)和計算機科學中的機器學習(cs.LG)這兩個領域的出版文獻數量在2015年至2020年間增長最快, 分別增長11倍和10倍。第1章:研發(R&D

73、)目錄35第1章章節預覽人工智能指數2021年度報告arXiv中的深度學習論文隨著數據訪問量的增加和計算能力的顯著提高,深度學習領域正在以驚人的速度發展。 來自Nesta的研究人員通過分析arXiv中計算機科學 (CS) 和統計學中的機器學習(state.ML)領域的論文摘要,使用主題模型算法識別出arXiv中的深度學習論文。 圖1.1.20表明, 僅在過去的五年中, arXiv中有關深度學習的出版文獻總數就增長了近六倍。2010201120122013201420152016201720182019202001234567關于arXiv的深度學習出版物的數量(以千為單位)2010-19年AR

74、XIV深度學習出版文獻數量來源:arXiv/Nesta,2020年|圖表:2021年AI指數報告圖 1.1.201.1出版物第1章:研發(R&D)目錄36第1章章節預覽人工智能指數2021年度報告出席會議情況是工業界和學術界對科學領域感興趣程度的一個很好的指標。 在過去的20年里, 人工智能會議不僅在規模上, 而且在數量和聲望上都有所增長。 本節介紹了主要的人工智能會議的出席情況和提交論文趨勢數據。會議出席2020年,由于大多數會議都是通過虛擬形式召開的,人工智能會議的參與度顯著提高。只有第34屆國際人工智能大會(Association for the Advancement of Artif

75、icial Intelligence ,AAAI)在2020年2月線下召開。會議組織者介紹說,虛擬形式使得來自世界各地的研究人員的出席率提高,但是準確的出席人數很難衡量。由于2020年會議出席人數數據的非典型性,根據2019年的出席人數數據分析, 11個主要人工智能會議被分為兩類:3000人以上的大型人工智能會議和3000人以下的小型人工智能會議。圖1.2.1顯示,2020年,9個會議的參會者總人數幾乎翻了一番。5 特別是,智能機器人與系統國際會議(IROS)將虛擬會議設置為允許用戶在長達3個月的時間內觀看會議活動,從而造成了非常高的出席率。國際人工智能聯合會議(IJCAI)分別在2019年和

76、2021年1月舉辦,由于不是在2020年舉辦的,它沒有出現在圖表中。1.2 會議1.2會議會議組織者介紹說, 虛擬形式使得來自世界各地的研究人員的出席率提高, 但是準確的出席人數很難衡量。5 對于AAMAS會議,2020年的出席情況是根據用于記錄報告和管理在線會議的平臺所提供的用戶數確定的。對于KR會議,2020年的出席情況是基于注冊人數確定的。對于ICPAS會議,出席人數450人只是一個估計數,因為一些參會者可能使用了匿名Zoom帳戶。第1章:研發(R&D)目錄37第1章章節預覽人工智能指數2021年度報告2010201120122013201420152016201720182019202

77、001,0002,0003,0004,0005,000出席人數469KR450ICAPS3,726AAMAS5,600ICLR3,972ACL2010-20年小型AI會議出席情況來源:會議數據|圖表:2021 AI指數報告1.2會議第1章:研發(R&D)圖 1.2.22010201120122013201420152016201720182019202005,00010,00015,00020,00025,000參加人數22,011 NeurIPS25,719 IROS3,015 IJCAI3,050 ICRA4,884 AAAI10,800 ICML7,500 CVPR2010-20年大型A

78、I會議出席情況來源:會議數據|圖表:2021 AI指數報告圖 1.2.1目錄38第1章章節預覽人工智能指數2021年度報告人工智能研究會議上的企業代表來自弗吉尼亞理工大學和西部大學艾維商學院的研究人員發現,大型科技公司逐漸提高了主要人工智能會議的參與度。在他們題為“人工智能的去民主化:人工智能研究中的深度學習和計算鴻溝”的論文中,研究者們利用在人工智能會議中與企業相關的論文份額變化情況來說明企業正在越來越多的參與到人工智能研究中。他們認為,學術界計算能力的分配不均(他們稱之為“計算鴻溝”)加劇了深度學習時代的不平等。此外,大型科技公司往往擁有更多的資源用于設計人工智能產品,但它們所致力于的研究

79、領域卻不像優秀的或小型企業那樣多樣化。這就引發了人們對人工智能內部偏見和公平性的擔憂。圖1.2.3中展示出的10個主要人工智能會議中,企業代表參會情況都呈上升趨勢,這也就進一步擴大了計算鴻溝。0%10%20%30%40%0%10%20%30%40%0%10%20%30%40%30.8% KDD29.0% NeurIPS28.7% ACL28.5% EMNLP27.9% ICML25.6% ECCV23.7% ICCV21.9% CVPR19.3% AAAI17.5% IJCAI世界500強科技論文份額來源:Ahmed&Wahed,2020年|圖表:2021年AI指數報告財富全球500強技術論文

80、的百分比20002019200020192000201920002019圖 1.2.31.2會議第1章:研發(R&D)目錄39第1章章節預覽人工智能指數2021年度報告軟件庫是喲用于創建應用程序和產品的計算機代碼的集合。如TensorFlow和P有Torch等流行的特定于人工智能的軟件庫可以幫助開發人員快速有效地創建其智能解決方案。本節通過GitHub數據來分析討論各類軟件庫的受歡迎程度。GITHUB星標GitHub是一個代碼托管平臺,現階段的人工智能研究人員和開發人員經常使用GitHub上傳、評論和下載軟件。GitHub用戶可以“星標”(star)一個項目,將其保存在自己的列表中,該列表可以

81、表達自己的興趣和喜好,類似于Twitter和其他社交媒體平臺上的“喜歡”功能。當人工智能研究人員在GitHub中上傳的代碼有使用到開源庫包時,GitHub上的星標數可以用來衡量各種人工智能開源軟件庫的受歡迎程度。圖1.3.1表明TensorFlow(由Google開發,2017年公開發布)是最受歡迎的人工智能軟件庫。2020年第二受歡迎的軟件庫是Keras(也是由Google開發的,建立在Tensorflow2.0之上)。除TensorFlow之外,圖1.3.2顯示PyTorch(由Facebook創建)是另一個越來越受歡迎的庫。1.3 人工智能開源軟件庫1.3人工智能開源軟件庫第1章:研發(

82、R&D)TensorFlow (由Google開發, 2017年公開發布)是最受歡迎的人工智能軟件庫。 2020年第二受歡迎的軟件庫是Keras (也是由Google開發的, 建立在Tensorflow2.0之上) 。目錄40第1章章節預覽人工智能指數2021年度報告201420152016201720182019202001020304050累計Github星數(千)45 Sckit-learn19 MXNet51 Keras8 Caffe29 Theano46 PyTorch17 Cntk31 BVLC/caffe2014-20年按AI庫列出的GITHUB星標數量(不包括TENSORFLO

83、W)來源:GitHub,2020 |圖表:2021 AI指數報告1.3人工智能開源軟件庫第1章:研發(R&D)圖 1.3.22014201520162017201820192020050100150累計Github星數(千)45 Sckit-learn19 MXNet51 Keras8 Caffe29 Theano153 TensorFlow46 PyTorch17 Cntk31 BVLC/caffe2014-20年AI庫的GITHUB星標數量來源:GitHub,2020 |圖表:2021 AI指數報告圖 1.3.1目錄41第2章章節預覽人工智能指數2021年度報告第 2 章技術性能人工智能指

84、數2021年度報告目錄42第2章章節預覽人工智能指數2021年度報告第2章:技術性能概述 43章節重點 44計算機視覺452.1計算機視覺-圖像46圖像分類 46 ImageNet 46 ImageNet:Top-1準確度 46 ImageNet:Top-5準確度 47 ImageNet:訓練時間 48 ImageNet:訓練成本 49 要點:超過ImageNet 的難度測試 50圖像生成 51 STL-10: Frchet Inception Distance (FID)得分 51 FID 與現實生活 52Deepfake 檢測 53 Deepfake 檢測挑戰(DFDC) 53人體姿態估計

85、 54 上下文中的常見對象(COCO)數據集: 關鍵點檢測挑戰 54 上下文中的常見對象(COCO)數據集: DensePose挑戰 55語義分割 56 城市景觀(Cityscapes)數據集 56嵌入式視覺 572.2計算機視覺-視頻58 活動識別 58 ActivityNet 58 ActivityNet:瞬時動作定位任務 58 ActivityNet:最難的活動 59目標識別 60 你只看一次(YOLO) 60人臉檢測和識別 61 美國國家標準與技術研究所(NIST) 人臉識別供應商測試(FRVT) 612.3語言62英語語言理解基準 62 SuperGLUE 62 SQuAD 63商業

86、機器翻譯(MT) 64 商用MT系統數量 64GPT-3 652.4語言推理技術67視覺和語言推理 67 視覺問答(VQA)挑戰 67 視覺常識推理(VCR)任務 682.5語音69語音識別 69 語音轉錄:LibriSpeech 69 說話人識別:VoxCeleb 69 要點: 語音識別技術的競爭差距 712.6推理72 布爾可滿足性問題 72 自動定理證明(ATP) 742.7醫療和生物學76分子合成 76 正向化學合成規劃的測試集準確度 76COVID-19和藥物發現 77AlphaFold和蛋白質折疊 78專家點評79章節預覽第 2 章訪問公開數據目錄43第2章章節預覽人工智能指數20

87、21年度報告概述概述本章重點介紹人工智能各個子領域的技術進展,包括計算機視覺、語言、語音、概念學習和定理證明。本節使用多種定量測量方式的組合,如常用的基準和獎項挑戰,以及學術論文的定性分析來展示最先進的人工智能技術的發展情況。雖然技術進步使得人工智能系統的部署比以往更廣泛、更容易,但人們對人工智能的使用也越來越關注,尤其是在算法偏差等問題上。新的人工智能技術能力的出現,例如能夠合成圖像和視頻,也帶來了倫理挑戰。第2章:技術性能目錄44第2章章節預覽人工智能指數2021年度報告章節要點 生成一切:人工智能系統現在可以處理文本、音頻和圖像并生成足夠高質量的產品。對于一些限定的技術來說,人類難以判斷

88、合成和非合成輸出之間的差異。從對社會有用和較為無用兩個角度出發,有望生成大量的人工智能下游應用程序。這也促使研究人員開始致力于檢測生成模型的技術研究。具體來說,DeepFake檢測挑戰賽的數據表明了計算機區分不同輸出的能力。 計算機視覺的產業化:過去十年,得益于機器學習技術(特別是深度學習技術)的應用,計算機視覺研究取得了巨大進展。新的數據顯示,計算機視覺正在實現產業化。在一些較大的基準庫中,算法或模型的性能已經開始趨于平穩。這表明計算機視覺社區需要致力于開發和確定難度更大的基準,以進一步測試性能。各公司正在投入越來越多的計算資源,以比以往更快的速度訓練計算機視覺系統。同時,用于已部署系統的技

89、術,如用于分析視頻靜止幀的對象檢測框架,正在迅速成熟,這表明人工智能將會進一步在產業場景中部署。 自然語言處理(NLP)超越了它的評估指標:得益于NLP的快速發展,已經出現了語言能力顯著提升的人工智能系統,并且這些系統已經開始對世界產生了有意義的經濟影響。谷歌和微軟都在其搜索引擎中部署了BERT語言模型,而微軟、OpenAI等公司也開發了其他大型語言模型。NLP的研究進展如此迅速,以至于它已經開始超過了用于測試它們的基準。例如,在SuperGLUE上獲得能和人類的性能水平相當的軟件產品正在快速涌現。SuperGLUE是針對早期NLP進展超過GLUE評估能力而開發的NLP評估套件。 關于推理的新

90、分析:大多數技術問題的測量標準都會在固定的基準上顯示出在當前時間點上的最佳系統的性能。而為人工智能指數開發的新分析方法提供了允許不斷發展的基準的測量標準,并將一段時間內一組系統的總體性能歸因于各個單獨的系統。這些應用于兩個符號推理問題:自動定理證明和布爾公式的可滿足性。 機器學習正在改變醫療和生物學領域的游戲規則。隨著機器學習技術的引入,醫療和生物行業的格局發生了實質性的變化。DeepMind的AlphaFold應用深度學習技術,在蛋白質折疊這一長達數十年的生物學難題上取得了重大突破??茖W家利用機器學習模型學習化學分子的表示,以制定更有效的化學合成規劃。PostEra是一家人工智能初創公司,這

91、家公司在COVID-19流行期間使用基于機器學習的技術來加速發現COVID相關的藥物。章節要點第2章:技術性能目錄45第2章章節預覽人工智能指數2021年度報告自20世紀60年代引入以來,計算機視覺領域取得了重大的研究進展,近年來在某些特定的視覺任務上已經達到了人類的水平。常見的計算機視覺任務包括物體識別、姿態估計和語義分割。隨著計算機視覺技術的不斷成熟,相關技術已經實現了一系列應用:自動駕駛汽車、醫學圖像分析、消費應用(如谷歌照片)、安全應用(如監控、衛星圖像分析)、工業應用(如檢測制造和裝配中的缺陷零件)等。計算機視覺第2章:技術性能計算機視覺目錄46第2章章節預覽人工智能指數2021年度

92、報告圖像分類在20世紀10年代,圖像識別和分類領域開始從經典的人工智能技術轉向基于機器學習的技術,特別是基于深度學習的技術。從那時起,由于基礎技術(算法、計算硬件和大規模數據集)的不斷進步,圖像識別已經從一種昂貴的、特定領域的技術轉變為一種經濟的適用于更多領域的技術。ImageNet來自斯坦福大學和普林斯頓大學的計算機科學家于2009年創建了ImageNet。ImageNet是一個包含超過1400萬張圖像的數據集,涵蓋200個類別,提供了擴展和改進的可供研究人員訓練人工智能算法的數據。2012年,來自多倫多大學的研究人員利用深度學習技術,將ImageNet大規模視覺識別挑戰賽的結果提升到了一個

93、新的水平。從那時起,深度學習技術就占據了各大比賽的排行榜。一些目前已被廣泛應用的技術首次出現都是在ImageNet比賽的參賽作品中。2015年,微軟研究院的一個團隊表示,通過使用“殘差網絡(Residual Net)”,他們的方法在圖像分類任務1 上的表現已經超過了人類水平。這一創新隨后被陸續應用到了其它人工智能系統中。在2017年比賽結束后,研究人員仍在繼續使用ImageNet數據集測試和開發計算機視覺應用程序。ImageNet挑戰的圖像分類任務要求機器根據圖像中的主要對象為圖像分配一個類別標簽。下面的圖表探討了隨著時間的推移,性能最好的ImageNet系統的演變情況,以及算法和基礎設施的進

94、步如何讓研究人員提高訓練圖像識別系統的效率,同時減少訓練高性能系統所需的絕對時間。ImageNet:Top-1準確度Top-1準確度測試人工智能系統為圖像分配正確標簽的能力,特別是其單個最有可能的預測結果(在所有可能的標簽中)是否與目標標簽相同。近年來,研究人員開始關注如何通過使用訓練庫之外的數據(例如Instagram或其他社交媒體來源的照片)進行預訓練來進一步提高ImageNet的性能。通過對這些數據集的預訓練,使得系統能夠更有效地使用ImageNet數據,從而進一步提高性能。圖2.1.1顯示,使用預訓練數據的最新系統在Top-1準確度中每10次嘗試中會出現1次錯誤,而在2012年12月,

95、當時的系統每10次嘗試中會出現4次錯誤。谷歌大腦團隊的模型在2021年1月達到了90.2%的最高準確率。2.1 計算機視覺-圖像2.1計算機視覺-圖像第2章:技術性能1 值得注意的是,得出這個評估指標所基于的人類基線方法來自于一個斯坦福大學的研究生,這名研究生所接受的測試與人工智能系統的測試大致相同。由于基礎技術的進步, 圖像識別已經從一種昂貴的、 特定領域的技術轉變為一種經濟的、適用于更多領域的技術。目錄47第2章章節預覽人工智能指數2021年度報告75%80%85%90%95%100%準確度排名前五98.8%, 含有額外的訓練數據97.9%, 不含額外的訓練數據94.9% 人類水平Imag

96、eNet挑戰:Top-5準確度來源:論文與代碼,2020年;AI指數,2021年|圖表:2021年AI指數報告01/201301/201401/201501/201601/201701/201801/201901/202001/202190.ImageNet:Top-5準確度Top-5準確度考察的是正確的標簽是否出現在分類器的前五個預測中。圖2.1.2顯示,錯誤率已從2013年的85%左右提高到2020年的99%左右。22.1計算機視覺-圖像第2章:技術性能2 注:關于人為錯誤的數據是這樣產生的:向一個人展示500張圖像,然后要求他對1500張測試圖像進行標注,他完成的Top-5分類任務錯誤率

97、為5.1%。這是一個非常粗略的基線,但它能夠向我們展示出人類在這項任務上的表現如何。60%70%80%90%100%準確度排名第一90.2%, 含有額外的訓練數據86.5%, 不含額外的訓練數據ImageNet挑戰:Top-1準確度來源:論文與代碼,2020年;AI指數,2021年 | 圖表:2021年AI指數報告01/201301/201401/201501/201601/201701/201801/201901/202001/202180.圖 2.1.1圖 2.1.2目錄48第2章章節預覽人工智能指數2021年度報告ImageNet:訓練時間隨著時間的推移,原始測量準確度的提高,評估在Im

98、ageNet上訓練圖像分類器達到標準性能水平所需的時間變得非常有用,因為它能夠揭示出大規模人工智能訓練的基礎計算基礎設施的進步。這一點很重要,因為訓練系統的速度越快,評估系統并用新數據更新系統的速度就越快。進一步的,ImageNet系統的訓練速度越快,組織在開發和部署人工智能系統方面的生產力就越高。想象一下等待幾秒鐘系統訓練和等待幾個小時之間的區別,以及這種區別對于研究人員探索的想法的類型和數量意味著什么,以及它們可能有多大的風險。下面是MLPerf的結果,這是一個由非盈利性機器學習開放組織MLCommons組織舉辦的競賽,參賽者使用公共(殘差網絡)架構訓練ImageNet網絡,然后根據訓練系

99、統所需的實際時間對系統進行排名3 。如圖2.1.3所示,ImageNet上的訓練時間從6.2分鐘(2018年12月)下降到47秒(2020年7月)。與此同時,用于實現這些成果的硬件數量大幅增加。前沿系統一直以使用“加速器”芯片為主,從2018年的GPU開始,2019年和2020年過渡到谷歌的TPU,并獲得了同類型的最佳結果。訓練時間分配:MLPerf不僅展示了每個競賽周期的最優效果,同時還提供了每個比賽周期中每個參賽項目所使用的所有數據。這反過來也能分析得到每個時期的訓練時間分布(圖2.1.3)。(請注意,在每個MLPerf競賽中,參賽者通常會提交使用不同硬件排列組合的多條記錄。)圖2.1.4

100、顯示,在過去幾年中,訓練時間縮短了,MLPerf項目之間的差異也縮短了。與此同時,參賽者開始使用越來越多的加速器芯片來加快訓練速度。這種情況與人工智能越來越廣泛的發展趨勢是一致的,即通過更高程度的最佳實踐和基礎設施共享,可以更好地理解大規模的訓練過程。2.1計算機視覺-圖像第2章:技術性能3 下一次MLPerf更新計劃于2021年6月進行。想象一下等待幾秒鐘系統訓練和等待幾個小時訓練之間的區別, 以及這種區別對于研究人員探索的研究思路的類型和數量意味著什么, 以及它們可能有多大的風險。目錄49第2章章節預覽人工智能指數2021年度報告12/201706/201812/201806/201912

101、/20191251020501002005001,0002,000費用(美元;對數尺度)$7.43ImageNet:訓練成本(準確率達到93%)來源:DAWNBench,2020年|圖表:2021年AI指數報告ImageNet:訓練代價訓練一個現代的圖像識別系統大概需要多少錢?根據斯坦福DAWNBench團隊的測試,答案是2020年只需要幾美元。這一數字比2017年的成本下降了大約150倍(圖2.1.5)。從這個角度來看,2017年10月,一個參賽者參賽需要花費的成本是1100美元,而現在大約只需要7.43美元。這代表了算法設計的進步以及云計算資源成本的下降。2.1計算機視覺-圖像第2章:技術

102、性能圖 2.1.512/201806/201907/202001,0002,0003,0004,000加速器數量0123456訓練時長4,0961,0246406.2 Min1.3 Min47 SecIMAGENET:培訓時間的分配ImageNet:最佳系統的訓練時間和硬件來源:MLPerf,2020 |圖表:2021 AI指數報告加速器數量訓練時長2018201920201101001,00010,000訓練時長(分鐘)ImageNet:訓練時間分布來源:MLPerf,2020 |圖表:2021 AI指數報告圖 2.1.3圖 2.1.4目錄50第2章章節預覽人工智能指數2021年度報告超出I

103、mageNet之外更難的測試盡管ImageNet的性能有了很大的提高, 但目前的計算機視覺系統還不夠完善。 為了更好地研究現有系統的局限性, 近年來研究人員開始開發更具挑戰性的圖像分類基準。 但是, 由于ImageNet已經非常龐大, 需要調用大量的基礎資源才能使用, 因此簡單地擴展ImageNet中圖像的分辨率或數據集的絕對大小并沒有意義。這兩種操作都會進一步增加研究人員在ImageNet上的訓練代價。一些研究人員開始構建自定義數據集來測試圖像分類器的健壯性, 目的是設計并找到新的有效方法。 這其中的許多數據集是與ImageNet兼容的 (通常較?。?。 具體包括:ImageNetAdver

104、sarial數據集這是一個與ImageNet中的圖像相似的圖像數據集,其中包含了一些自然混淆信息(例如,一只蝴蝶落在地毯上,而地毯的紋理與蝴蝶的紋理非常相似),以及一些無法使用現有系統正確分類的圖像。研究人員稱,這些圖像“由于在場景配置的長尾中遇到的場景復雜性問題以及利用分類器盲點,會導致產生一致的分類錯誤”。因此,在ImageNet對抗模型上取得的研究進展有助于提高模型的泛化能力。ImageNet-C數據集這是一個常見ImageNet圖像的數據集,其中包含了75個視覺損壞的效果(例如,亮度、對比度的變化,像素化、霧化效果等)。利用這一特性,研究人員通過執行在這一數據集中的實驗可以得到更多關于

105、模型泛化能力的信息。ImageNetRendition數據集這是一個關于模型泛化性能的測試,具體是利用ImageNet訓練的模型完成對200個ImageNet類別的30000個示例圖的分類任務。ImageNet庫是圖像庫,因此這里的泛化能力表示系統能夠學習到有助于完成分類任務的更加細微的信息,因為他們能夠“理解”示例圖和他們訓練時所使用的拍攝圖像之間的關系。跟蹤這些數據的時間計劃是怎么樣的?由于這些基準相對較新,該計劃將持續進行若干年,社區可以針對它們對一系列系統進行測試。這些測試將產生用于生成進度跟蹤圖所必要的信息。2.1計算機視覺-圖像第2章:技術性能目錄51第2章章節預覽人工智能指數20

106、21年度報告圖像生成圖像生成任務是生成看起來與“真實”圖像無法區分的圖像。圖像生成系統有多種用途,從提高搜索能力(如果可以生成類似的圖像,則搜索特定圖像會變得更容易)到輔助其他生成用途(例如,編輯圖像、為特定目的創建內容,生成單個圖像的多個變體以幫助設計師集思廣益,等等)。近年來,基于深度學習的算法不斷改進,同時計算量不斷增加且更多大規模數據集投入使用,圖像生成的發展進程也在加快。STL-10:FrchetInceptionDistance(FID)得分Frchet Inception Distance(FID)是一種用于衡量圖像生成進度的方法,它與人工智能系統“思考”合成圖像與真實圖像之間的

107、差異有關,真實圖像的FID得分為0,而看起來非常相似的合成圖像的FID得分接近于0。圖2.1.6顯示了過去兩年中生成模型在STL-10數據庫中生成合成圖像方面的研究進展。STL-10數據庫旨在測試系統在生成圖像和收集其他圖像信息方面的有效性。2.1計算機視覺-圖像第2章:技術性能01/201804/201807/201810/201801/201904/201907/201910/201901/202004/202007/2020202530354045距離得分25.4STL-10:FRCHET起始距離(FID)得分來源:論文與代碼,2020年|圖表:2021年AI指數報告圖 2.1.6目錄5

108、2第2章章節預覽人工智能指數2021年度報告2.1計算機視覺-圖像第2章:技術性能FID與現實生活作為一種評估技術,FID有它的缺點:它通過使用模型本身數據的定量測量來評估圖像生成的質量。而其它一些方法則能夠利用人類團隊來評估這些模型的輸出。例如,人眼感知評估(HYPE)方法,這種方法向人類顯示合成圖像,人類看到合成圖像后對合成圖像進行定性評級來完成評估,從而判斷圖像質量。這種方法比經典的FID評估方法成本更高,運行速度也更慢。但是,隨著生成模型本身的不斷改進,考慮引入人類團隊的方式可能會變得越來越重要。定性示例:您可以查看合成圖像質量隨時間的變化來感受技術的進步。在圖2.1.7中,您可以看到

109、按照時間排序的人臉合成圖像的最佳范例示例。到了2018年,這項技術的效果已經足夠好了,人類已經很難對模型進行大幅改進(盡管可以訓練機器學習系統來識別假貨,但這項任務正在變得更具挑戰性)。這為該領域的最新進展提供了一個很好的示例,同時強調了需要引入新的評價方法來衡量未來研究進展的重要性。圖 2.1.7GAN在人臉合成中的發展201420152016201720182020來源: Goodfellow et al., 2014; Radford et al., 2016; Liu & Tuzel, 2016; Karras et al., 2018; Karras et al., 2019; Go

110、odfellow, 2019; Karras et al., 2020; AI Index, 2021目錄53第2章章節預覽人工智能指數2021年度報告DEEPFAKE檢測圖像合成技術的進步在給人類帶來威脅的同時,也帶來了新的機遇。例如,近年來研究人員利用合成圖像技術的突破,開發出能夠生成人臉合成圖像的人工智能系統,這些系統可以將這些人臉合成圖像疊加到照片或電影中其他人的臉上。人們把這種生成技術的應用稱為“deepfake”。生成錯誤信息和制造(主要是歧視女性的)色情制品等都屬于惡意使用deepfake的方式。為了解決這個問題,研究人員正在開發一種新的檢測技術。Deepfake檢測挑戰(DFD

111、C)Deepfake 檢測挑戰(DFDC)于2019年9月由Facebook創建,旨在衡量deepfake檢測技術的進展。DFDC要求參賽者從大約100000個剪輯過的公共數據庫中訓練和測試他們的模型。參賽者提交的材料是根據對數損失函數評分的,這是一種基于概率的分類標準。較小的對數損失意味著能夠更準確地預測deepfake視頻。根據圖2.1.8, 2019年12月至2020年3月間,隨著參賽方法或模型的不斷改進,對數損失下降了約0.5。2.1計算機視覺-圖像第2章:技術性能1/6/20201/16/20201/26/20202/5/20202/15/20202/25/20203/6/20203

112、/16/20203/26/20200.00.10.20.30.40.50.60.7日志丟失0.19deepfake檢測挑戰:log損失來源:Kaggle,2020 |圖表:2021 AI指數報告圖 2.1.8目錄54第2章章節預覽人工智能指數2021年度報告人體姿態估計人體姿態估計是從一幅圖像中估計人體各部位或關節(手腕、肘部等)位置的問題。人體姿態估計是一種經典的“全方位使用的”人工智能功能。能夠完成這項任務的系統可用于一系列工業場景的應用中,例如,為時尚行業構建增強現實場景、基于人群軀干的行為分析、監視人們的特定行為、協助分析現場體育直播和體育賽事、將一個人的動作映射到虛擬化身中,等等。上

113、下文中的公共對象(COCO)數據集:關鍵點檢測挑戰上下文中的公共對象(COCO)是一個用于目標檢測、分割和字幕顯示的大型數據庫,包含33萬幅圖像和150萬個目標實例。它的關鍵點檢測挑戰任務要求機器同時檢測到一個物體/一個人,并在圖像中標定他們的身體關鍵點,比如一個人的肘部、膝蓋和其他關節。該任務基于平均精度(Average precision,AP)來評估算法,AP是一種可用于測量目標檢測器精度的測量標準。圖2.1.9顯示,在過去四年中,該任務中算法的準確度提高了約33%,最新算法的平均準確度達到了80.8%。2.1計算機視覺-圖像第2章:技術性能07/201601/201707/201701

114、/201807/201801/201907/201901/202007/202050%60%70%80%90%平均精度80.8%COCO關鍵點挑戰:平均精度來源:COCO排行榜,2020年|圖表:2021年AI指數報告圖 2.1.9目錄55第2章章節預覽人工智能指數2021年度報告上下文中的公共對象(COCO)數據集:DensePose挑戰DensePose,即密集人體姿態估計,是一項從二維圖像中提取人體三維網格模型的任務。2018年,DensePose系統公開之后,Facebook建立了DensePose COCO。這是一個大規模數據庫,其中包含了在50000張COCO圖像上進行的圖像到曲面

115、的對應關系的標注。自此,DensePose被作為標準的基準數據庫使用。COCO-DensePose挑戰的任務包括:檢測人、分割人體,以及估計屬于人體的圖像像素和模板3D模型之間的對應關系。該任務使用測地線點相似性(GPS)測量計算平均精度,GPS測量是用于測量估計點與圖像中身體點的真實位置之間的測地線距離的對應關系匹配程度得分。該任務的準確度從2018年的56%提高到了2019年的72%(圖2.1.10)。2.1計算機視覺-圖像第2章:技術性能03/201805/201807/201809/201811/201801/201903/201905/201907/201909/201950%55%

116、60%65%70%75%平均精度72%COCO Densepose挑戰:平均精度來源:arXiv&CodaLab,2020年|圖表:2021年AI指數報告圖 2.1.10目錄56第2章章節預覽人工智能指數2021年度報告語義分割語義分割的任務是將圖像中的每一個像素分類為一個特定的標簽,如人、貓等。圖像分類任務是為整幅圖像確定一個標簽,而語義分割則是試圖分割給定圖像中的不同目標和對象,從而實現更細粒度的識別。語義分割是自動駕駛汽車(識別和隔離道路上的物體)、圖像分析、醫療應用等使用的基本輸入技術。城市景觀Cityscapes數據集Cityscapes是一個大規模數據庫,包含了一年中多個月(春季、

117、夏季和秋季)白天記錄的50個不同城市的各種城市街道場景。該數據庫包含5000張高質量、像素級標注的圖像和20000張每周標記的圖像。語義場景的理解,尤其是在城市空間中,對自動駕駛車輛的環境感知至關重要。Cityscapes可以應用于訓練深度神經網絡來了解城市環境。Cityscapes中的語義分割是一個像素級的語義標注任務。這個任務需要一個算法來預測圖像的每個像素的語義標記,從而將圖像劃分為不同的類別,如汽車、公共汽車、人、樹和道路。參賽者基于交并比(IoU)分數對參賽結果進行評估。較高的IoU分數代表著較好的分割準確度。2014年至2020年間,平均IoU分數提高了35%(圖2.1.11)。2

118、016年和2017年,通過引入殘差網絡,該項競賽的結果水平顯著提高。2.1計算機視覺-圖像第2章:技術性能01/201501/201601/201701/201801/201901/202060%65%70%75%80%85%90%聯盟平均交集(mIoU)85.1% 含有額外的訓練數據82.3% 不含額外的訓練數據Cityscapes挑戰:像素級語義標注任務來源:論文與代碼,2020年|圖表:2021年AI指數報告圖 2.1.11目錄57第2章章節預覽人工智能指數2021年度報告嵌入式視覺迄今為止的性能數據表明,計算機視覺系統近年來取得了巨大的進步。目標識別、語義分割和人體姿態估計等都達到了非

119、常好的性能水平。不過,這些視覺任務都是被動的或虛無的。也就是說,這些系統可以控制從相機中獲取的圖像或者視頻,但是并不能與周圍的環境進行物理互動?;谶@些被動任務的持續改進,研究人員現在已經開始開發更先進的人工智能系統,這些更先進的系統是交互式的或具體化的,也就是說,這些系統可以與周圍的環境進行物理交互并改變這些環境。例如,一個機器人可以目測一座新建筑并完成自主導航,或者一個機器人可以通過觀看視覺演示來自己學習組裝零件,而并不需要程序員為此手動編程。這一領域的研究進展目前是由復雜模擬環境的發展推動的,研究人員可以在虛擬空間中部署機器人,模擬他們的相機看到和捕捉到的東西,并開發用于導航、目標搜索和

120、目標物抓取等交互任務的人工智能算法。由于這一領域還處于相對較早的研究階段,目前很少有標準化的測量標準來衡量研究進展。本報告中給出一些可用模擬器的簡要要點、它們的發布年份,以及其它重要特性。 Thor(AI2,2017)專注于順序抽象推理,可將預定義的“魔術”動作用于目標對象。 Gibson(Stanford,2018)專注于通過3D掃描儀獲得的真實感環境中的視覺導航。 iGibson(Stanford,2019)專注于根據真實房屋繪制并可操作的大型真實場景中的完全交互:導航+操縱(在機器人學中稱為“移動操縱”)。 AI-Habitat(Facebook,2019)專注于視覺導航,強調更快的執行

121、速度,實現計算成本更高的方法。 ThreeDWorld(麻省理工學院和斯坦福大學,2020)通過游戲引擎關注照片級真實感環境,并增加了對柔性材料、流體和聲音的模擬。 SEAN-EP(Yale,2020)是一個具有模擬虛擬人類的人-機交互環境,可以通過web瀏覽器收集人類的遠程演示。 Robosuite(Stanford和UT-Austin,2020)是一個用于機器人學習的模塊化仿真框架和基準。2.1計算機視覺-圖像第2章:技術性能目錄58第2章章節預覽人工智能指數2021年度報告201620172018201920200%10%20%30%40%50%平均平均精度(mAP)42.8%Activ

122、ityNet時間動作定位任務來源:ActivityNet,2020 |圖表:2021 AI指數報告視頻分析是對連續圖像幀進行推斷的任務,有時也包括音頻輸入。盡管許多AI任務依賴于但圖像對推斷,但越來越多的應用需要計算機視覺來完成視頻的解析。例如,識別特定的舞蹈動作可受益于看到按時間順序鏈接的幀的變化;推斷某個人在人群中移動,或是機器隨時間進行一系列運動時也是如此?;顒幼R別活動識別的任務是從視頻片段中識別出各種各樣的活動。它有許多重要的日常應用,包括攝像機監控和機器人自主導航。目前,對視頻理解的研究仍然集中在較短時間的事件中,比如幾秒鐘長的視頻。較長時間的視頻理解正在獲得越來越多的關注。Acti

123、vityNetActivityNet于2015年推出,是一個人類活動理解的大型視頻基準。該基準測試了算法在視頻中標記和分類人類行為的能力。通過提高ActivityNet等類似任務的性能,人工智能研究人員正在開發一種系統,這種系統可以對復雜行為進行分類,這種復雜行為比單個圖像中包含的行為分類難度更大。比如根據自動駕駛汽車的視頻輸入中描述行人的行為,或者為體育賽事中的特定動作提供更好的標記。ActivityNet時間動作定位任務ActivityNet挑戰中的時間動作定位的任務要求是:檢測600個小時內包含多個活動的未剪輯視頻序列中的時間片段。針對這項任務的評價主要集中在:(1)定位:系統如何準確地

124、定位時間間隔的開始時間和結束時間;(2)識別:系統如何正確地識別活動并將其劃分為正確的類別(如投擲、攀爬、遛狗等)。圖2.2.1顯示,在過去五年中,所提交的關于時間動作定位任務的結果的最高平均精度增長了140%。2.2 計算機視覺-視頻2.2計算機視覺-視頻第2章:技術性能圖 2.2.1目錄59第2章章節預覽人工智能指數2021年度報告0%2%4%6%8%10%12%14%平均平均精度(mAP)喝咖啡跳高拋光家具戴隱形眼鏡卸下卷發器剪刀石頭布跑馬拉松鉛球抽煙投擲飛鏢2019-20年ActivityNet:最困難的活動,2019-20來源:ActivityNet,2020 |圖表:2021 AI

125、指數報告20192020ActivityNet:最困難的活動圖2.2.2顯示了2020年時間行動定位任務中最困難的活動,以及它們的平均精度與2019年結果的比較。喝咖啡(Drinking coffee)仍然是2020年被認為最困難的活動。石頭剪子布(Rock-paper-scissors)雖然仍然是排名第十的最困難的活動,但它的改進是相當巨大的,增長了129.2%,即從2019年的6.6%增加到了2020年的15.22%。2.2計算機視覺-視頻第2章:技術性能圖 2.2.2目錄60第2章章節預覽人工智能指數2021年度報告12/201604/201804/202011/202020304050

126、607080平均精度(mAP50)65.2YOLOv2(分辨率:不清楚)YOLOv3(分辨率:608)YOLOv4(分辨率:608)PP-YOLO(分辨率:608)YOLO:平均精度來源:Redmon&Farhadi(2016&2018)、Bochkovskiy等人(2020)、Long等人(2020)|圖表:2021 AI指數報告目標檢測目標檢測是在圖像中識別給定目標的任務。一般來說,在實際場景中部署的系統中,圖像分類和圖像檢測任務通常是耦合在一起的。解決衡量已部署的目標識別系統改進情況的一個有效方法是研究廣泛應用的目標監測系統的發展情況。你只看一眼(YOLO)YOLO是一個廣泛使用的開源的

127、對象檢測系統。YOLO的進展已經包含在YOLO變體的一個標準任務中,這樣方便我們了解科學研究是如何普及到開源工具中的。自2015年首次發布以來,YOLO經歷了多次迭代。隨著時間的推移,YOLO已經沿著兩個約束條件進行了優化:性能和推理延遲,如圖2.2.3所示。具體來說,這意味著通過測量YOLO,可以測量系統的先進性。這些系統可能沒有達到絕對的最佳性能,但卻是圍繞現實世界的需要而設計的,比如對視頻流的低延遲推斷。因此,YOLO系統可能并不總能達到研究論文中所定義的絕對最佳性能,但當面臨諸如推理時間之類的權衡時,它們能夠代表良好的實用性能。2.2計算機視覺-視頻第2章:技術性能圖 2.2.3目錄6

128、1第2章章節預覽人工智能指數2021年度報告2017201820192020202120220.0020.0050.010.020.050.10.20.51錯誤的不匹配率(FNMR;對數尺度)0.0035, VISABORDER 照片 FNMRFMR 0.0000010.0025, VISA 照片 FNMR FMR 0.0000010.0023, MUGSHOT 照片 FNMR FMR 0.00001 DT=12 YRS0.0022, MUGSHOT 照片 FNMR FMR 0.000010.0293, WILD 照片 FNMR FMR 0.000010.0064, BORDER 照片 FNM

129、R FMR = 0.0000012017-20年NIST FRVT 1:1數據庫驗證準確度來源:美國國家標準與技術研究所,2020年|圖表:2021年AI指數報告人臉檢測和識別人臉檢測和識別是人工智能的一個應用案例,它有著巨大的商業市場,并引起了政府和軍方的極大興趣。因此,這一領域的發展讓我們能夠了解到人工智能發展中具有重要經濟意義部分的進步和發展速度。美國國家標準與技術研究所(NIST)人臉識別供應商測試(FRVT)美國國家標準與技術研究所(NIST)的人臉識別供應商測試(FRVT)提供了對商用和原型人臉識別技術的獨立評估。FRVT衡量用于民事和政府任務(主要是執法和國土安全)的自動人臉識別

130、技術的性能,包括簽證照片、面部照片圖像和虐待兒童圖像的驗證。圖2.2.4給出了在多個不同數據庫中根據錯誤不匹配率(FNMR)測量的性能最好的1:1算法的結果。FNMR是指當試圖將圖像與個體匹配時算法失敗的速率。在過去四年中,入案照和簽證照的面部識別技術改進最為顯著,錯誤率從接近50%下降到2020年的只有百分之零點幾。42.2計算機視覺-視頻第2章:技術性能圖 2.2.44 您可以在定期更新的FRVT 1:1驗證報告上查看各種數據庫的詳細信息和示例。目錄62第2章章節預覽人工智能指數2021年度報告07/201907/201908/201910/201901/202012/202001/202

131、101/20215060708090100得分90.3 得分89.8 人類水平SuperGLUE基準來源:SuperGLUE排行榜,2020年圖表:2021 AI指數報告自然語言處理 (NLP) 是指教會機器來解釋、 分類、 操作和生成語言。 從早期使用手寫規則和統計技術到最近采用生成模型和深度學習, NLP已經成為我們生活中不可或缺的一部分, 在文本生成、 機器翻譯、 問答和其他任務中都有應用。近年來,自然語言處理技術的進步使得數十億人訪問的大規模系統發生了重大變化。例如,在2019年末,谷歌開始將其BERT算法部署到搜索引擎中,使得該公司稱其內部質量指標有了顯著改善。微軟也緊隨其后,在20

132、19年晚些時候宣布將使用BERT來改進其必應(Bing)搜索引擎。英語理解基準SuperGLUESuperGLUE于2019年5月推出,它是一個單一的測量基準,用于評估模型在已建立的數據庫上執行一系列語言理解任務的性能。SuperGLUE用更具挑戰性和多樣性的任務取代了之前的GLUE基準(2018年推出)。SuperGLUE得分是通過計算一組任務的平均得分得到的。微軟的DeBERTa模型現在以90.3分的成績高居SuperGLUE排行榜榜首,而SuperGLUE的“人類基線”平均分為89.8分。雖然這并不意味著人工智能系統在所有SuperGLUE任務上的表現都超過了人類,但這確實說明這一整套方

133、法的平均表現已經超過了人類的基線??焖俚难芯窟M展(圖2.3.1)表明,未來SuperGLUE可能需要更具挑戰性,或者是被更難的測試所取代,就像SuperGLUE取代了GLUE一樣。2.3 語言2.3語言第2章:技術性能圖 2.3.1目錄63第2章章節預覽人工智能指數2021年度報告07/201601/201707/201701/201807/201801/201907/201901/202060708090100F1分數95.4 SQuAD 1.193.0 SQuAD 2.091.2 人類 1.189.5 人類 2.0SQuAD 1.1和SQuAD 2.0:F1得分來源:CodaLab工作表,

134、2020年|圖表:2021年AI指數報告SQuAD斯坦福問答數據庫(Stanford Question Answering Dataset,簡稱SQuAD)是一個閱讀理解基準,它衡量NLP模型能夠為一篇小文章的一系列問題提供簡短答案的準確程度。SQuAD測試人員通過讓一群人閱讀維基百科關于各種主題的文章,然后回答關于這些文章的多項選擇題,構建了一個人類表現基準。通過向模型發送相同的任務,并根據F1分數或模型預測和正確答案之間的平均重疊進行評估。分數越高,表現越好。在原始SQuAD發布兩年后的2016年,隨著最初的基準測試顯示參賽者的表現越來越快(這也反映了GLUE和SuperGLUE的發展趨勢

135、),SQuAD2.0應運而生。SQuAD2.0將SQuAD1.1中的100000個問題與眾包工人編寫的50000多個無法回答的問題結合起來,形成了一份類似于可回答問題的問題集。其目的是測試系統回答問題的能力,并確定系統在何種情況下能夠知道不存在答案。如圖2.3.2所示,SQuAD 1.1的F1成績從2016年8月的67.75分提高到了2018年9月的91.22分(25個月),而SQuAD 2.0僅用了10個月的時間就超過了人類的表現(從2018年5月的66.3分提高到2019年3月的89.47分)。2020年,最先進的SQuAD 1.1和SQuAD 2.0的F1成績分別達到了95.38分和93

136、.01分。2.3語言第2章:技術性能圖 2.3.2目錄64第2章章節預覽人工智能指數2021年度報告0510152025獨立機器翻譯服務的數量獨立機器翻譯服務的數量來源:Intento,2020 |圖表:2021 AI指數報告05/201707/201711/201703/201807/201812/201806/201911/201907/20200預覽商業商用機器翻譯機器翻譯(MT)是計算語言學的一個分支領域,研究如何使用軟件將文本或語音從一種語言翻譯成另一種語言。由于機器學習技術的不斷進步,目前,機器翻譯的研究已經取得了顯著的進步。機器翻譯的最新進展使得開發人員從符號方法逐漸轉向同時使用

137、統計和深度學習的方法。商用機器翻譯系統的數量商用機器翻譯系統數量的變化趨勢說明了商用機器翻譯技術的顯著改進及其在商用市場的迅速推廣。據一家評估商用機器翻譯服務的初創公司Intento介紹,2020年,使用預訓練模型的商用獨立云機器翻譯系統數量從2017年的8個增加到了28個(圖2.3.3)。2.3語言第2章:技術性能圖 2.3.3目錄65第2章章節預覽人工智能指數2021年度報告0%10%20%30%40%50%60%精度42.6%零樣本51.0%單樣本57.4%少量樣本GPT-3:42個基準的平均性能來源:OpenAI(Brown等人),2020年|圖表:2021年AI指數報告110010參

138、數數量(十億)GPT-32020年7月,OpenAI發布了GPT-3,這是已知最大的密集語言模型。GPT-3有1750億個參數,并基于570Gb的文本完成訓練。相比之下,它的前身GPT-2的體積要小100多倍,只有15億個參數。這種規模的增加產生了令人驚訝的效果:對于只有0個或少量訓練樣本的任務來說,GPT-3仍可以在未經訓練的情況下完成任務(分別稱為零樣本和少樣本學習)。這對于GPT-2來說幾乎是不可能完成的。此外,對于某些任務(但不是所有任務,如SuperGLUE和SQuAD2),GPT-3的性能要優于其它先進模型,而這些先進模型是需要依賴于大量訓練樣本來完成這些任務的。圖2.3.4引用自

139、GPT-3論文,展示了在零樣本、單樣本和少樣本學習模式下,模型規模(從模型參數量角度評估)對任務完成的準確度(越高越好)的影響。曲線上的每個點對應一個平均性能準確度,該平均性能準確度是42個基準準確度的聚合結果。隨著模型規模的增大,所有任務區域的平均準確度也相應提高。與零樣本學習相比,少樣本學習的準確度隨著模型規模增大而提高的速度更快。這表明,給定較小的文本,大型模型的表現出奇地好。2.3語言第2章:技術性能圖 2.3.4目錄66第2章章節預覽人工智能指數2021年度報告一個單一的模型可以在有限的訓練數據范圍內達到最先進的或接近最先進的性能,這一點是非常讓人印象深刻的。到目前為止,大多數模型都

140、是為單個任務設計的,因此可以通過單個指標進行有效評估。根據GPT-3,我們預測將會出現一個新的基準,這個基準能夠用于評估零到少樣本學習的語言模型的性能。當然,這項工作并不簡單。開發人員發現了越來越多的模型新功能(例如,根據一段文本描述直接生成網頁),這些新功能很難明確定義,更不用說衡量它們的性能了。盡管如此,人工智能指數仍致力于跟蹤這些新功能的性能和效果。盡管GPT-3的性能非常好,但它仍有一些缺點,其中很多缺點已經在最初的論文中進行了分析和闡述。例如,它可能會生成包含種族主義、性別歧視或帶有其它偏見的文本。此外,GPT-3(包括其它語言模型)還可能生成不可預測的和不符合事實的文本。關于如何控

141、制和“引導”這類生成文本以使其更好地符合人類價值觀的技術研究尚處于起步階段,但我們相信它的研究前景是非常好的。此外,GPT-3的訓練成本也非常高,這意味著目前只有少數掌握豐富資源的組織或機構能夠負擔得起開發和部署此類模型的費用。最后,GPT-3的應用領域非常廣泛,從聊天機器人到計算機代碼生成再到搜索。未來用戶還可能會發現更多的應用領域,包括好的和壞的,這使得人們很難確定GPT-3可能的應用范圍并預測它們對社會的影響。然而,一些大學和產業研究實驗室(包括OpenAI)正在針對解決負面應用的問題開展研究。欲了解更多詳情,請參閱Bender和Gebru等人的研究成果,以及最近斯坦福大學人類中心人工智

142、能研究所(HAI)研討會的論文集(OpenAI的研究人員也對該論文集貢獻了大量工作):理解大型語言模型的能力、局限性和社會影響。2.3語言第2章:技術性能一個單一的模型可以在有限的訓練數據范圍內達到最先進的或接近最先進的性能,這一點是非常讓人印象深刻的。 到目前為止, 大多數模型都是為單個任務設計的, 因此可以通過單個指標進行有效評估。目錄67第2章章節預覽人工智能指數2021年度報告10/201504/201610/201604/201710/201704/201810/201804/201910/201904/202055%60%65%70%75%80%精度76.4% 精度80.8% 人類

143、基線視覺問答(VQA)挑戰:準確度來源:VQA挑戰,2020年|圖表:2021年AI指數報告視覺和語言推理視覺和語言推理主要研究解決機器對視覺和文本數據的聯合推理能力。視覺問答(VQA)挑戰2015年推出的VQA挑戰的任務是給定一個圖像和一個基于公共數據集的關于圖像的自然語言問題,要求機器給出準確的自然語言答案。圖2.4.1顯示,自2015年在國際計算機視覺會議(ICCV)上第一次發布以來,VQA挑戰的準確度增長了近40%。2020年挑戰賽的最高準確度為76.4%。這一成果已經非常接近于人類基線80.8%的準確度,與2019年排名靠前的幾個算法相比性能提高了1.1%。2.4 語言推理能力2.4

144、語言推理能力第2章:技術性能圖 2.4.1目錄68第2章章節預覽人工智能指數2021年度報告11/201801/201903/201905/201907/201909/201911/201901/202003/202005/202007/202020406080100Q- AR分數70.585 人類表現視覺常識推理(VCR)任務:Q-AR得分來源:VCR排行榜,2020年|圖表:2021年AI指數報告視覺常識推理任務視覺常識推理(VCR)任務于2018年首次推出,它的要求是機器回答一個關于給定圖像的具有挑戰性的問題,并通過推理證明該答案的正確性(而VQA只要求回答)。VCR數據庫包含了29萬對

145、選擇題、答案和基本原理,以及超過11萬張來自電影場景的圖像。VCR任務的主要評估模式是Q-AR分數。它要求機器首先在四個答案選項(Q-A)中選擇一個問題(Q)的正確答案(A),然后根據答案在四個理由選項中選擇正確的理由(R)。得分越高代表任務完成的越好。人類在這項任務中的QA-R得分為85分。性能最好的模型的Q-AR分數從2018年的44分提高到了2020年的70.5分(圖2.4.2)。與2019年最好的幾個模型相比,2020年最優模型的性能提高了60.2%。2.4語言推理能力第2章:技術性能圖 2.4.2目錄69第2章章節預覽人工智能指數2021年度報告人工智能研究的一個主要方向是通過音頻數

146、據進行分析及合成人類語音。僅今年,機器學習方法極大地提高了這一類型任務的性能。語音識別語音識別,或稱為自動語音識別(ASR),是指令機器能夠識別口語單詞并將其轉換為文本的過程。自1962年IBM推出第一項語音識別技術以來,隨著Amazon Alexa、Google Home和Apple Siri等語音驅動應用的日益普及,這項技術也在不斷發展。特別是深度神經網絡的靈活性和強大的預測能力,使得語音識別變得更加容易。語音轉錄:LibriSpeech2015年首次推出LibriSpeech數據庫。該數據庫包括了有聲讀物中1000小時的語音,已經廣泛應用于語音識別技術的開發和測試。近年來,基于神經網絡的

147、人工智能系統顯著提高了LibriSpeech的性能,將單詞錯誤率(WER;0%是最佳性能)降低到了2%左右(圖2.5.1a和圖2.5.1b)。開發者可以通過兩種方式在LibriSpeech上測試系統: Test Clean評估系統從LibriSpeech數據庫中高質量子庫轉錄語音的能力。這個測試能夠評估人工智能系統在可控的環境中的性能。 Test Other確定系統如何處理LibriSpeech數據庫中的低質量子庫。這個測試能夠評估人工智能系統在噪聲更大(也可能是更符合現實條件)的環境中的性能。最近,這兩個數據庫中的研究都取得了實質性進展。在過去兩年中出現了一個重要趨勢:前沿系統的Test C

148、lean和Test Other之間的性能差距已經開始明顯縮小,從2015年末超過7個百分點的絕對性能差距,轉變為2020年低于1個百分點的性能差距。這表明ASR系統的健壯性有了顯著的提高,同時也表明LibriSpeech的性能正在趨于飽和,換句話說,我們可能需要難度更大的測試了。說話人識別:VoxCeleb說話人識別的任務目的是測試機器學習系統如何將語音對應到特定的人。VoxCeleb數據庫于2017年首次推出,該數據庫中包含6000名不同說話人的100多萬條話語。說話人識別任務的評估指標是機器將特定語音對應到特定說話人的錯誤率。VoxCeleb中較好(較低)的分數代表了一臺機器在6000個語

149、音中分辨一個語音的能力。VoxCeleb的評估方法是等錯誤率(EER),這是身份驗證系統中常用的測量標準。EER為假陽性率(錯誤地分配標簽)和假陰性率(未能分配正確的標簽)提供了測量標準。近年來,這項任務的進展主要來自混合系統,這一類系統融合了現代深度學習方法和更加結構化的算法,主要是由語音處理社區開發完成。到2020年,該任務中的錯誤率已經非常低,計算機能夠大概率(99.4%)將語音正確對應到特定的說話人(圖2.5.2)盡管如此,這項任務中也存在一些難點:例如,處理不同口音的說話人識別問題,以及在大型數據庫中區分說話人的挑戰(在10億人中識別一個人比在一組6000人的 VoxCeleb 訓練

150、庫中確定一個人要困難的多)。2.5 語音2.5語音第2章:技術性能目錄70第2章章節預覽人工智能指數2021年度報告20172018201920200%2%4%6%8%均等錯誤率0.6%VOXCELEB:等錯誤率來源:VoxCeleb,2020年|圖表:2021年AI指數報告01/201601/201701/201801/201901/20200123456字錯率1.4LIBRISPEECH:字錯誤率,Test Clean來源:論文與代碼,2020年|圖表:2021年AI指數報告01/201601/201701/201801/201901/202002468101214字錯率2.6LIBRIS

151、PEECH:字錯誤率,Test Other來源:論文與代碼,2020年|圖表:2021年AI指數報告圖 2.5.1b圖 2.5.2圖 2.5.1a2.5語音第2章:技術性能目錄71第2章章節預覽人工智能指數2021年度報告語音識別技術中的種族差異斯坦福大學的研究人員發現,先進的ASR系統表現出了明顯的種族和性別差異,他們錯誤識別黑人說話人的頻率是白人的兩倍。在這篇題為自動語音識別中的種族差異的論文中,作者利用亞馬遜、蘋果、谷歌、IBM和微軟提供的先進的語音到文本(speech-to-text)服務,采訪了42名白人和73名黑人,轉錄了數千段白人和黑人的音頻片段。結果表明,平均而言,系統處理白人

152、說話人語音的錯誤率大概每一百個字有19個錯誤,而處理黑人說話人語音的錯誤情況是大概每一百個字有35個錯誤,幾乎是白人錯誤率的兩倍。此外,這些系統在黑人男性中的表現尤其糟糕,每一百個單詞就有40多個錯誤(圖2.5.3)。從圖2.5.4中的詳細對比可以看出,不同公司之間ASR系統的差距很?。▓D2.5.4)。這篇論文的研究結果強調了解決人工智能技術引發的偏見問題的重要性,同時強調當這項技術成熟且在實際場景中部署應用時應當著重考慮并確保其公平性。2.5語音第2章:技術性能0%10%20%30%40%平均詞錯率先進的語音到文本(speech-to-text)服務測試:2019年按服務和種族展示的文字錯誤

153、率來源:Koenecke等人,2020年|圖表:2021年AI指數報告平均詞錯率領先的語音到文本服務測試:2019年按服務和種族劃分的單詞和種族展示的文字錯誤率來源:Koenecke等人,2020年|圖表:2021年AI指數報告100%Av.黑人男性 黑人女性 白人男性 白人女性蘋果 IBM谷歌 亞馬遜 微軟黑人男性 黑人女性 白人男性 白人女性0%10%20%30%40%平均詞錯率先進的語音到文本(speech-to-text)服務測試:2019年按服務和種族展示的文字錯誤率來源:Koenecke等人,2020年|圖表:2021年AI指數報告0%5%10%15%20%25%平均詞錯率領先的語

154、音到文本服務測試:2019年按服務和種族劃分的單詞和種族展示的文字錯誤率來源:Koenecke等人,2020年|圖表:2021年AI指數報告蘋果 IBM谷歌 亞馬遜 微軟100%Av.黑人說話人白人說話人圖 2.5.3圖 2.5.4目錄72第2章章節預覽人工智能指數2021年度報告本節討論人工智能中符號 (或邏輯) 推理問題的研究進展, 即從一系列假設中得出結論的過程。 我們考慮兩個主要的推理問題, 布爾可滿足性 (SAT) 和自動定理證明 (ATP) 。 這兩個定理都有對應的現實世界中的應用 (例如, 電路設計、 調度、 軟件驗證等) , 并給這類問題的測量評估帶來了巨大的挑戰。 針對SAT

155、的分析討論了如何逐步將該領域的整體改進任務具體分配到各個系統中。 此外, 針對ATP分析展示了如何測量一個不斷變化的測試庫的性能。以下所有分析均為本報告首次發布。 Lars Kotthoff編寫了文本并為SAT部分進行了分析。 Geoff Sutcliffe、 Christian Suttner和Raymond Perrault為ATP部分編寫了文本并進行了分析。 在撰寫本文時, 這項工作尚未發表。 因此, 附錄中包含了一份更嚴格的學術版本 (包括參考文獻、 更精確的細節和詳細的上下文內容) 。布爾可滿足性問題由Lars Kotthoff分析并撰寫SAT問題考慮針對一組由邏輯連接詞連接的布爾變

156、量的賦值問題,即:是否有賦值能夠使得它所表示的邏輯公式為真。真實場景中的一些問題,如電路設計、自動定理證明和調度等,都可以用SAT問題來表示和解決。我們對在過去五年(2016-2020年)的SAT競賽中排名靠前、中位數和排名靠后的SAT解算器的性能進行了分析。這項競賽已經進行了近20年,目的是評估和比較先進方法的性能。15個解算器都在全部400個SAT實例中運行并評估解算所有實例所需的時間(以CPU秒為單位)。5 這400個SAT實例是2020年比賽主賽道中的全部實例。全部解算器都在同一硬件上運行,這樣,跨年度的性能比較就不會因硬件效率的改進而混淆。雖然2016年至2018年最佳解決方案的性能

157、并沒有明顯的改進,但2019年和2020年的情況卻有了很大改善 (圖2.6.1)。這些改進不僅包括最好的解算器,也包括了它們的競爭對手。2019年排名中位數的解算器的表現優于往年排名靠前的解算器,而2020年排名中位數的解算器的表現甚至與2019年排名靠前的解算器不相上下。SAT的性能改進(主要是難以計算的人工智能問題)主要源自于兩個領域中的算法改進:新技術和現有技術更有效的實現。通常,性能改進主要是由于新技術的引入。然而,更有效的實現(隨著時間的推移,硬件性能會不斷提高)也可以提高性能。因此,很難評估性能的改進主要來自于新技術還是更有效的實現。為了解決這個問題,我們計算了時間夏普利值(tem

158、poral Shapley value),該值用于衡量在一段時間內各個單獨的系統對整體性能改進的貢獻情況(更多細節見附錄)。圖2.6.2顯示了不同競賽年份中每個解算器的時間夏普利值貢獻。其中值得注意的是,2016年解算器的貢獻是最高的。這是因為在我們的評估中,沒有可以與之進行比較的以前的先進技術,因此這一年中解算器的貢獻沒有折損。2.6 推理2.6推理第2章:技術性能5 致謝:美國懷俄明州立大學高級計算機中心提供了用于收集計算數據的資源。奧斯汀斯蒂芬(Austin Stephen)進行了計算實驗。目錄73第2章章節預覽人工智能指數2021年度報告201620172018201920207.00

159、e+058.00e+051.00e+061.20e+061.50e+061.75e+062.00e+06總時間smallsatglu_vcYalSAT 03rYalSATPauSatMapleLCMDistChronoBTMapleLCMDiscChronoBT-DL-v3MapleCOMSPS_DRUPMaple_mixMaple_LCM_DistKissat-sc2020-satglue_altexpMC_VSIDS_LRB_Switch_2500CCAnrSimCandy2016-20年每個解算器解算全部400個實例的總時間及年份(越低越好)來源:Kotthoff,2020年|圖表:20

160、21年AI指數報告201620172018201920201.00e+021.00e+031.00e+041.00e+051.00e+06時間性Shapley值glu_vcexpMC_VSIDS_LRB_Switch_2500YalSAT 03rYalSATsmallsatPauSatMapleLCMDistChronoBTMapleLCMDiscChronoBT-DL-v3MapleCOMSPS_DRUPMaple_mixMaple_LCM_DistKissat-sc2020-satglue_altCCAnrSimCandy2016-20年單個解算器對性能改進的時間夏普利價值貢獻(越高越好)

161、來源:Kotthoff,2020年|圖表:2021年AI指數報告圖 2.6.1圖 2.6.22.6推理第2章:技術性能目錄74第2章章節預覽人工智能指數2021年度報告根據時間夏普利值,在2020年,最佳解算器的貢獻顯著高于中位數和排名靠后的解算器。2020年的競賽冠軍Kissat,除第一年以外,全部擁有最高的時間夏普利值。與以前的解算器相比,它所包含的變化幾乎完全是更有效的數據結構和算法。因此,Kissat能夠充分反映出良好的工程條件對算法性能的影響。相比之下,2019年具有最大時間夏普利值(但不是競賽獲勝者)的解算器是smallsat。smallsat專注于改進的啟發式算法,而不是更有效的

162、實現。Candy也是如此,它是2017年具有最大時間夏普利值的解算器,它的主要創新點是分析SAT實例的結構,并在此基礎上應用啟發式算法。有趣的是,這兩個解算器在各自年份的競賽中都沒有排名第一,而兩個解算器的版本都比Maple解算器的版本好。盡管如此,Maple解算器對新技術的貢獻較小。這表明,增量改進雖然不一定令人興奮,但能在實踐中獲得良好的表現仍然是非常重要的?;谖覀儗υ擃I域的有限分析,新技術和更有效的實現對SAT問題求解的改進具有同等重要的貢獻。已跟蹤分析的解算器的增量改進與尚未進行長期跟蹤記錄的解算器的實質性改進一樣,他們都有可能產生更好的性能。自動定理證明(ATP)由Christia

163、n Suttner、Geoff Sutcliffe和Raymond Perrault分析并撰寫自動定理證明(ATP)主要關注系統的開發和使用,這些系統可以自動進行合理的推理,或者根據事實得出確定的結論。ATP系統是許多計算任務的核心,例如軟件驗證。TPTP問題庫用于評估從1997年到2020年ATP算法的性能,并測量系統在一段時間內解決問題的比例(更多詳細信息見附錄)。我們的分析擴展到整個TPTP(超過23000個問題),除了四個最重要的子集(每個在500到5500個問題之間)之外,都包括等式運算符的使用。這四個最重要的子集包括:子句范式(CNF)、一階形式(FOF)、帶算術的單態類型一階形式

164、(TF0)和單態類型高階形式(TH0)。圖2.6.3中解決問題的比例持續攀升,表明了該領域不斷取得研究進展。2008年至2013年的主要進展在FOF、TF0和TH0子集。FOF已經應用于眾多領域中(如數學、真實世界知識、軟件驗證),在Vampire、E和iProver系統中都有了顯著的改進。對于TF0(主要用于解決數學和計算機科學中的問題)和TH0(適用于哲學、邏輯學等)來說,隨著系統開發出了一些能夠解決“懸而未決”的問題的技術,也有了快速的初步研究進展。2014至2015年,由于Vampire系統能夠處理TF0問題,TF0又獲得了巨大的進展。值得注意的是,自2015年以來,進展仍在持續但有所

165、放緩,在過去幾年中沒有再出現快速進展或突破性的進展。2.6推理第2章:技術性能目錄75第2章章節預覽人工智能指數2021年度報告雖然這項分析顯示了ATP的進步,但顯然ATP還有更大的發展空間。解決ATP問題的兩個關鍵是:公理選擇(給定一大組公理,僅需要其中一些來證明猜想,那么我們該如何選擇公理的適當子集)和搜索選擇(在ATP系統搜索解決方案的每個階段,應如何選擇邏輯公式(e))。后一個問題自20世紀60年代提出以來一直是ATP領域中的研究重點。隨著大量知識被編碼為ATP,前一個問題正在變得越來越重要。在過去的十年中,研究人員越來越多地嘗試使用機器學習方法來解決這兩個關鍵挑戰(例如,MaLARe

166、a和Enigma ATP系統)。CADE-ATP系統競賽(CASC)的最新結果表明,機器學習的出現是ATP潛在的游戲規則改變者。2.6推理第2章:技術性能19971998199920002001200220032004200520062007200820092010201120122013201420152016201720182019202020212022202320240%20%40%60%80%已解決問題的百分比64.0% Th0 Thm Equ Nar71.4% Tf0 Thm Equ Ari61.1% Fof Thm Rfo Seq57.8% Cnf Uns Rfo Seq Nhn

167、49.2% All1997-2020年解決問題的百分比來源:Suttner,Sutcliffe & Perrault,2020年|圖表:2021年AI指數報告圖 2.6.3目錄76第2章章節預覽人工智能指數2021年度報告2.7 醫療和生物學0%25%50%75%100%精度第一76.5% Best Human76.5% Best Human76.5% Best Human76.5% Best Human76.5% Best HumanGNN-based | Graph EditsGNN-based | Graph EditsSeq2seq with attn |SMILESTransform

168、er | SMILESTransformer | SMILES化學合成規劃基準:測試準確度TOP-1來源:Schwaller,2020年|圖表:2021年AI指數報告12/201706/201811/201811/2020人類預測基準08/2019標準500k基準與 “人工智能狀態報告 (State of AI Report) ” 合作分子合成由Nathan Benaich和Philippe Schwaller撰寫在過去的25年里,制藥工業已經從基于自然資源(如植物)進行藥物開發轉向用化學合成的分子進行大規模藥物篩選??茖W家們通過使用機器學習模型,能夠確定哪些潛在藥物值得進一步在實驗室進行評估

169、,以及進行藥物分析的最有效方法是什么。各種機器學習模型可以學習化學分子的表達形式進而用于化學合成規劃。實現化學合成規劃的方法是使用文本符號表示化學反應,并將任務轉換為機器翻譯問題。自2018年以來,最新方法利用的是在單步反應大規模數據庫上訓練得到的Transformer架構。2020年下半年,研究人員開始考慮將模型的正向預測和反向合成建模為一系列的圖形編輯,自其中從零開始構建預測的分子。值得注意的是,這些方法提供了一種途徑可以快速掃描生物信息學中候選藥物樣分子的列表,并輸出合成分數和合成規劃。這使得藥物化學家能夠優先考慮已經經過經驗性驗證的候選藥物,從而最終幫助制藥行業更好的挖掘新的藥物,造福

170、患者。用于正向化學合成規劃的測試集正確性圖2.7.1給出了一些模型的Top-1準確度,這些模型是基于一個包含了美國專利中100萬個反應的免費數據庫為基準訓練得到的。6 Top-1準確度是指模型預測的可能性最高的產品與真實情況中報告的產品一致。數據表明,在過去的三年中,化學合成規劃的研究水平穩步提升。2020年的準確度比2017年提升了15.6%。最新的分子transformer在2020年11月份報告出來的成績已經達到了92%的Top-1準確度。2.7醫療和生物學第2章:技術性能圖 2.7.16 致謝:IBM歐洲研究中心和瑞士伯爾尼大學的Philippe Schwaller為收集和分析數據提供

171、了指導和資源。目錄77第2章章節預覽人工智能指數2021年度報告2.7醫療和生物學第2章:技術性能03/202004/202005/202006/202007/202008/202009/202010/202011/202012/202005,00010,00015,000提交的Moonshot總數15,545POSTERA:MOONSHOT提交的材料總數來源:PostEra,2020 |圖表:2021 AI指數報告COVID-19與藥物發現為了抵御COVID-19大流行,人工智能驅動的藥物發現代碼已經開源。COVID Moonshot是一個眾包協議,由500多名國際科學家共同參與,以加速開發

172、COVID-19抗病毒藥物。根據該協議,參與的科學家們無償公開他們的分子設計。人工智能初創公司PostEra使用機器學習和計算工具基于科學家們提交的材料評估制造化合物的難易程度,并生成合成路線。在第一周之后,Moonshot收到了2000多份材料,PostEra在不到48小時的時間內設計了合成路線。而如果相同的任務完全由人類化學家執行,一般需要花三到四周的時間才能完成。圖2.7.2顯示了一段時間以來科學家們提交材料的累計數量。Moonshot在短短四個月內就收到了來自全球365位科學家的超過10000份投稿。到2020年8月底,眾包完成了它的任務,目前重點已經轉移到優化鉛化合物和建立動物試驗中

173、。截至2021年2月,Moonshot計劃在3月底前提名一名臨床候選人。圖 2.7.2目錄78第2章章節預覽人工智能指數2021年度報告2.7醫療和生物學第2章:技術性能CASP7 (2006)CASP8 (2008)CASP9 (2010)CASP10 (2012)CASP11 (2014)CASP12 (2016)CASP13 (2018)CASP14 (2020)020406080100全球距離測試(GDT_TS)ALPHAFOLDALPHAFOLD 2CASP: 2006-20年最佳團隊在自由建模預測的中位數準確度來源:DeepMind,2020 |圖表:2021 AI指數報告ALPH

174、AFOLD與蛋白質折疊蛋白質折疊問題是結構生物學的一項重大挑戰,它的任務是考慮如何從蛋白質的一維表達(氨基酸序列7 )中確定蛋白質(生命的基本成分)的三維結構。這個問題的解決方案具有廣闊的應用前景,從能夠幫助更好地理解生命的細胞基礎,到促進藥物發現、治療疾病,再到能夠為工業任務設計新的蛋白質等等。近年來,基于機器學習的方法對蛋白質折疊問題產生了重要影響。最值得一提的是,DeepMind的AlphaFold于2018年在蛋白質結構關鍵評估(Critical Assessment of Protein Structure,CASP)競賽上首次亮相。該競賽每兩年舉辦一次,旨在促進和評估蛋白質折疊問題

175、的研究進展。在CASP中,參賽團隊會獲得一條氨基酸序列,他們負責預測相應的蛋白質三維結構。預測蛋白質三維結構需要采用非常麻煩且昂貴的實驗方法(如核磁共振波譜、X射線晶體學、低溫電子顯微鏡,等等),且其它參賽者也并不知道這些蛋白質的三維結構。CASP的表現通常使用全球距離測試(Global Distance Test,GDT)分數來衡量,這個數字介于0和100之間,主要用來衡量兩種蛋白質結構之間的相似性。GDT得分越高越好。圖2.7.3引用自DeepMind博客文章,該圖顯示了過去14年中最佳團隊在CASP中對一些較難預測的蛋白質類型(蛋白質的“自由建?!鳖悇e)進行預測的GDT中位數得分。過去,

176、獲勝算法通?;谖锢砟P?。然而,在最近兩次比賽中,Deepmind的AlphaFold和AlphaFold 2算法通過部分引入深度學習技術獲得了勝利。圖 2.7.37 目前大多數蛋白質折疊算法利用的是多序列比對的方法而不僅僅是單個序列,一個蛋白質序列的多個拷貝在進化過程中代表同一個蛋白質。目錄79第2章章節預覽人工智能指數2021年度報告專家要點今年, 人工智能指數邀請了人工智能專家分享他們對2020年最重要的人工智能技術突破的看法。 以下是他們的回答摘要, 以及部分個人意見要點。2020年最令人印象深刻的人工智能進步是什么? 提到最多的兩個系統分別是分子分析模型AlphaFold(DeepM

177、ind),和文本生成模型GPT-3(OpenAI)。2021年人工智能的發展趨勢是什么? 專家預測通過使用預訓練的模型人工智能將會取得更多的進展。例如,GPT-3是一個大型的NLP模型,可以對其進行微調從而在特定的、具體的任務中獲得優異的性能。類似地,2020年,利用超大圖像數據庫中預訓練的模型,計算機視覺領域的研究也取得了各種進步。在2021年, 你最期待看到人工智能技術進展、 部署和發展的哪方面? “我注意到了Transformers架構的流行,它最開始是用于機器翻譯,目前已經成為神經網絡代表架構。更廣泛地說,雖然NLP在深度學習的應用方面落后于視覺技術,但現在看來NLP的進步也在推動視覺

178、技術?!盤ercy Liang,斯坦福大學 “語言生成方面令人難以置信的最新進展對自然語言處理和機器學習領域產生了深遠影響,使以前非常困難的研究挑戰和數據庫突然變得毫無用處。同時這也鼓勵了研究人員針對這些復雜新模型的非常有趣也很有吸引力的能力(和重要缺陷)開展新的研究工作?!盋arissa Schoenick,艾倫人工智能研究所專家要點第2章:技術性能目錄80第3章章節預覽人工智能指數2021年度報告第 3 章經濟人工智能指數2021年度報告目錄81第3章章節預覽人工智能指數2021年度報告第3章:經濟概覽 82章節要點 833.1工作84人工智能招聘 84人工智能勞動力需求 86 全球人工智

179、能勞動力需求 86 美國人工智能勞動力需求:按技能分類 87 美國人工智能勞動力需求:按行業分類 88 美國人工智能勞動力需求:按州分類 90AI技能普及 91 全球比較 91 全球比較:按行業分類 923.2投資93企業投資 93初創公司活動 94 全球趨勢 94 區域比較 95 重點領域分析 973.3公司活動98行業應用 98 人工智能的全球應用 98 各行業和職能部門的人工智能應用 99 應用的人工智能的能力類型 99 考慮和減輕應用AI 的風險 101 COVID-19的影響 103工業機器人部署 104 全球趨勢 104 區域比較 105收益報告 106章節預覽第 3 章訪問公開數

180、據目錄82第3章章節預覽人工智能指數2021年度報告概述概述人工智能(AI)的興起不可避免地引發這樣一個問題:人工智能技術將在多大程度上影響企業、勞動力和經濟??紤]到人工智能的最新進展和眾多突破,這一領域為企業提供了巨大的好處和機會,從自動化提高生產率到使用算法為消費者定制產品,以及大規模分析數據等等。然而,人工智能帶來的效率和生產率的提高也帶來了巨大的挑戰:企業必須爭相尋找并留住技能型人才,以滿足其生產需求,同時還要注意采取一定措施來降低使用人工智能的風險。此外,COVID-19大流行引發了全球經濟的混亂,并令全球經濟處于持續的不確定性中。私營公司如何依賴并適度利用人工智能技術來幫助他們的企

181、業渡過這一困難時期呢?本章從就業、投資和企業活動的角度來討論人工智能與全球經濟之間日益交織的關系。首先利用LinkedIn的招聘率和技能普及率數據,以及Burning Glass Technologies的人工智能招聘信息,分析了全球對人工智能人才的需求。然后利用標普資本智商庫(CapIQ)、Crunchbase和Quid的統計數據,研究私人人工智能投資的趨勢。第三部分,即最后一部分,分別根據麥肯錫的人工智能全球調查、國際機器人聯合會(IFR)和普拉特(Prattle)分析了各公司應用人工智能能力的趨勢、各國機器人安裝部署的趨勢,以及在公司收益中提到人工智能因素的情況。第3章:經濟目錄83第3

182、章章節預覽人工智能指數2021年度報告章節要點第3章:經濟章節要點 “藥物、癌癥、分子、藥物發現 “在2020年獲得的私人AI投資金額最大,超過了138億美元。這一金額是2019年投資金額的4.5倍。 巴西、印度、加拿大、新加坡和南非是2016年至2020年AI行業雇用人數增長最多的國家。盡管受到了COVID-19的影響,2020年我們了解到的各國的AI行業招聘的員工人數仍在繼續增長。 更多人工智能領域的私人投資集中到了更少的初創公司中。2020年的私人人工智能投資金額比2019年增加了9.3%。這一數字比2018年至2019年(5.7%)增加的比例更高。不過,新融資的公司數量連續三年減少。

183、根據麥肯錫的一項調查,盡管解決與使用人工智能相關的倫理問題的呼聲越來越高,但行業內解決這些問題的努力仍然是非常有限的。例如,人工智能中的公平性和公正性等問題仍然很少受到公司的關注。此外,與2019年相比,2020年認為個人或個體隱私的風險是與其相關的公司仍然很少。在受訪的公司中,正在試圖減輕或規避這些風險的公司比例并沒有變化。 盡管COVID-19大流行導致了經濟衰退,但麥肯錫的一項調查中有一半的受訪者表示冠狀病毒并沒有對他們在人工智能領域的投資產生影響。而實際上有27%的人表示他們的投資仍有所增加。只有不到四分之一的企業減少了它們對人工智能的投資。 從2019年到2020年,美國的人工智能職

184、位比例有所下降,這是六年來的首次下降。從2019年到2020年,美國發布的人工智能工作崗位總數也下降了8.2%,從2019年的325724個崗位減少到2020年的300999個崗位。目錄84第3章章節預覽人工智能指數2021年度報告0123AI招聘指數巴西印度加拿大新加坡南非德國澳大利亞美國阿根廷英國土耳其意大利法國中國2020年各國AI招聘指數來源:LinkedIn,2020年|圖表:2021年AI指數報告吸引和留住熟練的人工智能人才是一項挑戰。 本節利用LinkedIn和Burning Glass的數據, 探討人工智能招聘、 勞動力需求和技能普及的最新趨勢。第3章:經濟AI招聘人工智能在不

185、同國家的就業增長有多快?本節首先介紹LinkedIn的數據,這些數據給出了不同國家人工智能相關行業的招聘率。人工智能招聘率的計算方法是,將人工智能技能寫入個人資料或從事人工智能相關職業的LinkedIn會員人數以及在新工作開始的同一個月增加新雇主的人數,除以該國LinkedIn會員總數。然后,將該比率與2016年的平均月份相關聯。例如,2020年12月的指數為1.05,則表明招聘率比2016年的平均月份高出5%??紤]到會員更新個人資料時可能出現的滯后情況,LinkedIn進行按月比較。一年的指數是該年內所有月份的平均指數。這一數據表明,2020年,所有抽樣國家的就業率都在上升。巴西、印度、加拿

186、大、新加坡和南非是2016年至2020年人工智能招聘增長率最高的國家(圖3.1.1)。在所分析的14個國家中,2020年人工智能的平均招聘率是2016年的2.2倍。對于排名第一的國家巴西來說,就業指數增長了3.5倍以上。此外,盡管出現了COVID-19大流行,但2020年14個抽樣國家的人工智能招聘人數仍在繼續增長(圖3.1.2)。有關跨國比較的更多內容,請參閱AI Index Global AI Vibrancy工具。3.1 工作3.1工作圖 3.1.11 納入比較的都是從符合條件的國家中選出的樣本,即LinkedIn的勞動力覆蓋率至少為40%,每個月至少招聘10名人工智能員工。由于中國和印

187、度在全球經濟中的重要性與日俱增,他們也被納入了這個樣本,但實際上LinkedIn在這些國家的勞動力覆蓋率并沒有達到40%。對這些國家的分析可能不像對其他國家的分析那樣全面,應當作出相應的解釋。目錄85第3章章節預覽人工智能指數2021年度報告第3章:經濟3.1工作01230123012301233.4 巴西 2.8 印度 2.7 加拿大 2.5 新加坡2.3 南非 2.2 德國 2.1 澳大利亞 2.1 美國2.0 阿根廷 1.8 英國1.8 土耳其 1.7 意大利1.6 法國 1.3 中國AI招聘指數2016-20年各國AI招聘指數來源:LinkedIn,2020年|圖表:2021年AI指數

188、報告20162020201620202016202020162020圖 3.1.2目錄86第3章章節預覽人工智能指數2021年度報告第3章:經濟3.1工作2013201420152016201720182019202020210.0%0.5%1.0%1.5%2.0%2.5%AI職位發布(占所有職位發布的百分比)0.8% 美國 0.8% 英國2.4% 新加坡0.2% 新西蘭0.7% 加拿大0.5% 澳大利亞2013-20年各國AI職位招聘(占所有職位招聘的百分比)來源:Burning Glass,2020年|圖表:2021年AI指數報告圖 3.1.3人工智能勞動力需求本節根據Burning Gl

189、ass的數據分析人工智能勞動力需求,這家分析公司從45000多個在線招聘網站收集招聘信息。為了全面、實時地了解勞動力市場的需求,Burning Glass收集職位公告,刪除重復的信息,并從職位公告文本中提取信息。請注意,Burning Glass在2020年更新了數據覆蓋范圍,增加了工作地點。因此,本報告中的數字不能與2019年報告中的數據直接比較。全球人工智能勞動力需求過去七年來,美國、英國、加拿大、澳大利亞、新西蘭和新加坡六個國家對人工智能勞動力的需求大幅增長(圖3.1.3)。平均而言,2020年人工智能職位占所有職位的比例是2013年的五倍多。在這六個國家中,新加坡的增長最多。2020年

190、,新加坡在所有工作崗位上的人工智能職位招聘比例是2013年的13.5倍。在這六個國家中,美國是唯一一個在2019年至2020年間人工智能招聘職位比例下降的國家,這也是其六年來首次下降。出現這種下降情況的原因可能是冠狀病毒大流行或該國相對成熟的人工智能勞動力市場。在美國發布的人工智能職位總數也下降了8.2%,從2019年的325724個減少到2020年的300999個。目錄87第3章章節預覽人工智能指數2021年度報告第3章:經濟3.1工作20132014201520162017201820192020202120220.0%0.1%0.2%0.3%0.4%0.5%AI職位發布(占所有職位發布的

191、百分比)0.1% 機器人技術0.1% 視覺圖像識別0.1% 神經網絡0.1% 自然信息處理0.5% 機器學習0.1% 自動駕駛0.3% 人工智能2013-20年美國AI職位(占所有職位的百分比)(按技能分類)來源:Burning Glass,2020年|圖表:2021年AI指數報告圖 3.1.4美國人工智能勞動力需求:按技能分類仔細觀察2013年至2020年間美國人工智能勞動力需求,圖3.1.4根據技能分類對這一時期的需求進行了逐年細分。每個技能類別都由一系列與人工智能相關的技能組成。例如,神經網絡技能類別包括深度學習和卷積神經網絡等技能。本章附錄提供了每個技能類別下的AI技能的完整列表。20

192、13年至2020年間,在美國的在線人工智能職位招聘中,與機器學習和人工智能相關的人工智能職位數量增長最快。其中,機器學習相關占總職位數的比例從0.1%增至0.5%,人工智能相關從0.03%增至0.3%。如前所述,2020年在所有技能類別的總體職位中,人工智能工作的份額有所下降。2013年至2020年間,在美國的在線人工智能職位招聘中,與機器學習和人工智能相關的人工智能職位數量增長最快。其中,機器學習相關占總職位數的比例從0.1%增至0.5%,人工智能相關從0.03%增至0.3%。目錄88第3章章節預覽人工智能指數2021年度報告第3章:經濟美國勞動力需求:按行業劃分為了深入了解美國勞動力市場人

193、工智能職位需求在不同行業之間的差異,本節將研究2020年美國各行業人工智能職位數量占所有職位總數的比例(圖3.1.5),以及過去10年的變化趨勢(圖3.1.6)。2020年,美國所有人工智能職位中,以下述重點行業的職位數所占比例最高,包括:信息(2.8%),專業、科學和技術服務(2.5%),農業、林業、漁業和狩獵(2.1%)。雖然前兩個行業一直主導著人工智能就業的需求,但從2019年到2020年,農業、林業、漁業和狩獵這個行業類別中人工智能就業份額的增幅最大,幾乎達到了1個百分點。3.1工作0.0%0.5%2.5%1.0% 1.5% 2.0%AI職位發布(占所有職位發布的百分比)信息專業,科學

194、,技術服務農業,林業,漁業,狩獵業制造金融和保險公共管理采礦,采石,公司/企業的油氣提取公司或企業管理教育服務批發貿易公用事業房地產和租賃其他服務零售貿易運輸和倉儲衛生保健和社會救助建筑藝術娛樂住宿和食品服務2020年美國各行業AI招聘職位(占所有招聘職位的百分比)來源:Burning Glass,2020年|圖表:2021年AI指數報告圖 3.1.52020年,美國所有人工智能職位中,以下述重點行業的職位數所占比例最高,包括:信息(2.8%),專業、科學和技術服務(2.5%),農業、林業、漁業和狩獵(2.1%)。目錄89第3章章節預覽人工智能指數2021年度報告AI職位發布(占所有職位發布的

195、百分比)0.0%1.0%2.0%3.0%0.0%1.0%2.0%3.0%0.0%1.0%2.0%3.0%0.0%1.0%2.0%3.0%0.0%1.0%2.0%3.0%2.8%信息2.5%專業,科學,技術服務2.1%農業,林業,漁業,狩獵業1.8%制造1.4%金融和保險0.9%公共管理0.8%采礦,采石,油氣提取0.8%公司或企業管理0.8%教育服務0.7%批發貿易0.6%公用事業0.5%其他服務0.5%房地產和租賃0.4%零售貿易0.2%藝術娛樂0.2%建筑0.2%運輸和倉儲0.2%衛生保健和社會救助0.1%住宿和食品服務2013-20年美國各行業AI招聘職位(占所有招聘職位的百分比)來源:

196、Burning Glass,2020年|圖表:2021年AI指數報告20132020201320202013202020132020圖 3.1.6第3章:經濟3.1工作目錄90第3章章節預覽人工智能指數2021年度報告1002005001,00010,00020,00050,000 100,0002,000 5,000Number of AI Job Postings (Log Scale)0.0%0.5%1.0%1.5%2.0%AI職位發布(占所有職位發布的百分比)阿拉巴馬州阿拉斯加州亞利桑那州阿肯色州加利福尼亞州康乃狄克州特拉華州哥倫比亞特區佛羅里達州夏威夷愛達荷州伊利諾伊州印第安納州路易

197、斯安那州緬因州馬里蘭州馬薩諸塞州密歇根州密蘇里州蒙大拿州新澤西州新墨西哥州紐約州北卡羅來納州俄亥俄州俄勒岡州南達科他州賓夕法尼亞州佛蒙特維吉尼亞州華盛頓州威斯康星州懷俄明州2020年美國各州和地區的AI職位公告(總數和占所有職位公告總數的百分比)來源:Burning Glass,2020年|圖表:2021年AI指數報告德克薩斯州美國勞動力需求:按州劃分隨著AI人才競爭的加劇,在美國,哪些公司正在尋找具有機器學習、數據科學和其他AI相關技能的員工?圖3.1.7分析了2020年美國各州的勞動力需求,其中,y軸表示所有工作崗位上人工智能工作崗位的份額,x軸表示對數刻度上人工智能工作崗位的總數。由圖表

198、顯示可知,哥倫比亞特區的人工智能就業崗位比例最高(1.88%),2019年超過了華盛頓州。加州仍然是人工智能就業崗位數量最多的州(63433)。除華盛頓特區外,華盛頓、弗吉尼亞、馬薩諸塞、加利福尼亞、紐約和馬里蘭州共有6個州的人工智能招聘職位分別占所有招聘職位的1%以上,而去年只有5個州達到這一水平。加州的人工智能工作崗位數量也超過了德克薩斯州(22539)、紐約州(18580)和弗吉尼亞州(17718)三個州的總和。第3章:經濟3.1工作圖 3.1.7目錄91第3章章節預覽人工智能指數2021年度報告第3章:經濟3.1工作0132相關AI技能滲透率印度美國中國德國加拿大韓國新加坡英國法國澳大

199、利亞巴西意大利南非2015-20年各國相對AI技能普及率,2015-20圖片來源:LinkedIn,2020年|圖表:2021年AI指數報告圖 3.1.8AI技能普及人工智能技能在不同職業中的普及程度如何?人工智能技能普及指標顯示每個職業前50名技能中人工智能技能的平均份額。這些數據是根據LinkedIn會員個人資料中列出的技能、職位以及職位所在地等信息計算得到的。全球比較在進行跨國比較時,人工智能技能的相對普及率是用一個國家各職業人工智能技能的普及率之和除以人工智能技能在全球同一職業中的平均普及率得到的。例如,相對普及率為2意味著該國人工智能技能的平均普及率是全球同類職業平均普及率的2倍。在

200、圖3.1.8所示的樣本國家中,2015年至2020年的匯總數據顯示,印度(全球平均水平的2.83倍)的相對人工智能技能普及率最高,其次是美國(全球平均水平的1.99倍)、中國(全球平均水平的1.40倍)、德國(全球平均水平的1.27倍)和加拿大(全球平均水平的1.13倍)。22 納入比較的都是從符合條件的國家中選出的樣本,即LinkedIn的勞動力覆蓋率至少為40%,每個月至少招聘10名人工智能員工。由于中國和印度在全球經濟中的重要性與日俱增,他們也被納入了這個樣本,但實際上LinkedIn在這些國家的勞動力覆蓋率并沒有達到40%。對這些國家的分析可能不像對其他國家的分析那樣全面,應當作出相應

201、的解釋。目錄92第3章章節預覽人工智能指數2021年度報告第3章:經濟全球比較:按行業為了對各行業和樣本國家的人工智能技能普及率進行更加細致深入的分解,圖3.1.9展示出了過去五年全球人工智能技能普及率最高的五大行業的匯總數據:教育、金融、硬件和網絡、制造業、軟件和IT。3 在所有五個行業中,印度的人工智能技能相對普及率最高,而美國和中國在部分榜單中也排名前列。其他相對技能普及率超過1的值得強調的專業領域,包括德國的硬件、網絡以及制造業,和以色列的制造業和教育業。3.1工作相對AI技能普及率2015-20年各行業的相對AI技能普及率來源:LinkedIn,2020年|圖表:2021年AI指數報

202、告教育0123印度美國韓國以色列瑞士德國中國金融0123硬件與網絡0123制造0123軟件與IT服務0123印度美國加拿大德國英國南非荷蘭印度美國德國中國以色列法國新加坡印度美國中國韓國德國加拿大以色列印度美國德國以色列英國西班牙中國圖 3.1.93 納入比較的都是從符合條件的國家中選出的樣本,即LinkedIn的勞動力覆蓋率至少為40%,每個月至少招聘10名人工智能員工。由于中國和印度在全球經濟中的重要性與日俱增,他們也被納入了這個樣本,但實際上LinkedIn在這些國家的勞動力覆蓋率并沒有達到40%。對這些國家的分析可能不像對其他國家的分析那樣全面,應當作出相應的解釋。目錄93第3章章節預

203、覽人工智能指數2021年度報告本節基于CapIQ和Crunchbase的數據, 通過NetBase Quid探討私營公司的投資活動。 具體著眼于企業人工智能投資的最新趨勢,如私人投資、 公開發行、 并購 (M&A) 以及與人工智能相關的少數股權。 然后, 本節將重點討論人工智能的私人投資, 即有多少私人資金進入了人工智能初創企業, 哪些行業正在吸引大量投資, 以及這些投資行為都發生在哪些國家。第3章:經濟企業投資相對于2019年, 2020年全球人工智能投資總額 (包括私人投資、 公開募股、 并購和少數股權) 增長了40%,總額為679億美元(圖3.2.1)。由于COVID-19大流行,許多小

204、企業遭受了巨大的損失。因此,在2020年,行業整合和并購的增加推動了企業對人工智能的總投資。2020年,并購占總投資的絕大部分,相較于2019年增長了121.7%。此外,2020年還發生了幾起與人工智能相關的非常引人注目的收購事件,包括英偉達收購Mellanox Technologies和凱捷收購Altran Technologies。3.2 投資3.2投資201520162017201820192020010,00020,00030,00040,00050,00060,00070,000總投資(百萬美元)44,07567,85448,85117,69943,81112,75123,00238

205、,65942,23836,57619,84913,09718,9324,4934,3284,1407,9528,5412015-20年按投資活動劃分的全球企業對AI的投資來源:CapIQ、Crunchbase和NetBase Quid,2020年|圖表:2021年AI指數報告私人投資公開發售合并/收購少數股權圖 3.2.1目錄94第3章章節預覽人工智能指數2021年度報告第3章:經濟啟動活動下面一節分析了過去10年中私人投資超過40萬美元的人工智能初創公司的發展趨勢。雖然近年來私人投資人工智能行業的數量急劇上升,但增長速度已經放緩。全球趨勢越來越多針對人工智能的私人投資正流入越來越少的初創企業

206、。盡管COVID-19大流行,2020年人工智能私人投資額較2019年仍然增長了9.3%,高于2019年的5.7%(圖3.2.2)。不過,獲得資助的公司數量連續第三年下降(圖3.2.3)。2020年,私人投資額創歷史新高,超過了400億美元。但與2017年至2018年的最大增幅59.0%相比,2020年相比2019年僅增長了9.3%。此外,受資助的人工智能初創企業數量從2017年的峰值持續大幅下降。3.2投資201520162017201820192020010,00020,00030,00040,000總投資(百萬美元)2015-20年私人AI投資情況來源:CapIQ、Crunchbase和

207、NetBase Quid,2020年|圖表:2021年AI指數報告圖 3.2.220152016201720182019202001,0002,0003,0004,000公司數量2015-20年全球新投資AI企業數量來源:CapIQ、Crunchbase和NetBase Quid,2020年|圖表:2021年AI指數報告圖 3.2.3目錄95第3章章節預覽人工智能指數2021年度報告05,00010,00015,00020,00025,000美國中國 英國 以色列 加拿大 德國 法國 印度 日本 新加坡 澳大利亞2020年各國對AI的私人投資情況來源:CapIQ、Crunchbase和NetB

208、ase Quid,2020年|圖表:2021年AI指數報告總投資(百萬美元)第3章:經濟區域比較如圖3.2.4所示,美國仍然是私人投資的主要流向地,2020年的私人投資金額超過了236億美元。其次是中國(99億美元)和英國(19億美元)。仔細研究美國、中國和歐盟這三個主導人工智能競賽的競爭者,可以進一步驗證美國在人工智能私人投資方面的主導地位。雖然中國在2018年的人工智能私人投資額異常高,但其在2020年的投資水平還不到美國的一半(圖3.2.5)。不過,值得注意的是,中國在人工智能領域擁有強大的公共投資。中國的中央和地方政府都投入了大量資金以支持人工智能研發。43.2投資圖 3.2.44 詳

209、見國防分析研究院中國政府人工智能研發支出簡評(2020年)。目錄96第3章章節預覽人工智能指數2021年度報告20152016201720182019202005,00010,00015,00020,00025,000總投資(百萬美元)9,933中國23,597美國6,662世界其他地區2,044歐盟2015-20年按地理區域劃分的AI私人投資來源:CAPIQ、Crunchbase和NetBase Quid,2020年|圖表:2021年AI指數報告第3章:經濟3.2投資圖 3.2.5目錄97第3章章節預覽人工智能指數2021年度報告015,0005,000 10,000 總投資(百萬美元)藥物

210、,癌癥,分子,藥物發現自動駕駛汽車,艦隊,自動駕駛,道路學生,課程,Edtech,英語開源,計算,Hadoop,Devops語音識別,計算機交互,對話,機器翻譯洗錢,反欺詐,欺詐檢測,欺詐預防時尚,購物體驗,美容,視覺搜索游戲,風扇,游戲,足球半導體,芯片,數據中心,處理器銀行,卡,信用卡,禮物2019年vs 2020年按重點領域劃分的全球AI私人投資來源:CapIQ、Crunchbase和NetBase Quid,2020年|圖表:2021年AI指數報告20192020第3章:經濟重點領域分析圖3.2.6顯示了2020年私人投資額最大的前10個重點領域的排名,以及2019年各自的投資額?!八?/p>

211、物、癌癥、分子、藥物發現”領域高居榜首,人工智能私人投資超過138億美元,是2019年的4.5倍。其次是“自動車輛、車隊、自動駕駛、道路”(45億美元)和“學生、課程、教育科技、英語”(41億美元)。除藥物、癌癥、分子、藥物發現外,2019年至2020年,“游戲、粉絲、游戲、足球”和“學生、課程、教育科技、英語”的人工智能私人投資額都有顯著增長。前者主要是受到美國和韓國游戲和體育初創企業數輪融資的推動,后者則是受到中國在線教育平臺投資的推動。3.2投資圖 3.2.6目錄98第3章章節預覽人工智能指數2021年度報告本節回顧了企業如何依托人工智能的進步, 利用人工智能和自動化發揮優勢, 最大化創

212、造價值。 近年來, 開始部署人工智能技術的公司數量激增, 但2020年的經濟動蕩和COVID-19的影響減緩了這一部署率。 我們利用麥肯錫全球人工智能調查引入人工智能的能力、 國際機器人聯合會 (IFR) 全球機器人安裝部署的趨勢以及Prattle在財務報告會議上提到人工智能的情況相關的數據來分析人工智能活動的部署情況。第3章:經濟行業應用本節分享了麥肯錫公司對2395名受訪者的調查結果:代表不同地區、不同行業、不同規模、不同專業和不同任期的公司的個人。麥肯錫公司的“2020年人工智能狀況”報告包含了這項調查的全部結果,包括不同公司如何跨職能應應用人工智能、從人工智能中創造最大價值的公司之間共

213、享的核心最佳實踐,以及COVID-19大流行對這些公司人工智能投資計劃的影響。人工智能的全球應用2020年的調查結果表明,與2019年相比,人工智能應用率沒有增加。超過50%的受訪者表示,他們的組織至少在一項業務職能中應用了人工智能(圖3.3.1)。2019年,58%的受訪者表示,他們的公司至少在一項功能上應用了人工智能,不過2019年關于公司人工智能應用情況的調查方式與2020年不同。2020年,亞太發達國家的公司領銜應用人工智能技術,印度和北美緊隨其后。2019年各地區的人工智能應用率基本持平,但今年為拉丁美洲和其他發展中國家的公司工作的受訪者報告在至少一項業務職能中應用了人工智能的數量要

214、小很多。3.3 公司活動3.3公司活動0%10%20%40%50%60%30%受訪者百分比發達的亞太地區 印度北美歐洲發展中市場(包括中國,中東和北非)拉美所有地區2020年全球各組織對AI的采用全球組織采用AI情況來源:麥肯錫公司,2020年|圖表:2021年AI指數報告圖 3.3.1目錄99第3章章節預覽人工智能指數2021年度報告第3章:經濟行業和職能部門應用人工智能2020年,報告應用人工智能的情況最多的是代表高科技和電信企業的受訪者,這與2019年的結果是相似的。其次是金融服務和汽車及裝配業(圖3.3.2)。與2019年(和2018年)類似的另外一個情況是,2020年的調查表明,公司

215、最有可能應用人工智能的功能/任務因行業而異(圖3.3.3)。例如,汽車和裝配行業的受訪者表示,在與制造相關的任務中應用人工智能的比例高于其他行業。金融服務行業的受訪者表示,在與風險相關的功能方面應用人工智能的比例更高。高科技和電信行業的受訪者表示,在產品和服務開發功能方面應用人工智能的比例更高??缧袠I來看,2020年的公司最有可能將人工智能用于服務運營(如現場服務、客戶服務、后臺)、產品和服務開發以及營銷和銷售等工作中。這一點與2019年的調查結果類似。3.3公司活動0%10%20%30% 40%50%60%70%受訪者百分比高科技/電信汽車與組裝金融服務商業,法律和專業服務醫療保健/醫藥消費

216、品/零售2020年各行業AI采用情況來源:麥肯錫公司,2020年|圖表:2021年AI指數報告圖 3.3.2應用的人工智能的能力類型根據行業不同,所應用的人工智能能力類型也不同 (圖3.3.4)??缧袠I來看,2020年,公司最有可能將機器學習技術、機器人過程自動化和計算機視覺確定為至少一項業務功能所需要應用的能力。各個行業都傾向于應用最能服務于其核心功能的人工智能產品。例如,制造業和分銷業(如汽車和裝配業、消費品和零售業)最常應用的人工智能為物理機器人和自動駕駛車輛。而自然語言處理能力,如文本理解、語音理解和文本生成等,則最常被日常工作需要處理大量文檔的客戶或運營數據的行業所應用,包括商業、法

217、律、專業服務、金融服務、醫療保健以及高科技和電信。目錄100第3章章節預覽人工智能指數2021年度報告產業人力資源所有行業汽車與裝配商業,法律和專業服務消費品/零售金融服務醫療保健/制藥高科技/電信12%6%2%10%9%18%9%9%2%7%2%10%8%7%39%11%34%10%20%16%21%14%4%32%3%13%2%10%37%15%15%14%21%21%21%26%16%21%20%16%10%15%11%12%5%19%9%29%12%14%3%5%1%13%13%8%2020年各行業和職能部門采用AI的情況來源:麥肯錫公司,2020年|圖表:2021年AI指數報告受訪者

218、百分比制造業市場營銷與銷售產品和/或服務開發 風險服務運營戰略與企業融資供應鏈管理圖 3.3.3第3章:經濟3.3公司活動34%18%37%14%13%33%22%14%10%8%23%11%31%13%37%19%32%12%25%27%23%33%15%26%9%18%19%13%25%11%19%6%15%14%12%18%12%18%6%14%12%11%30%14%19%6%19%19%16%32%10%24%9%17%16%15%34%15%18%10%13%33%18%9%1%6%13%7%20%7%2020年嵌入標準業務流程的AI能力來源:麥肯錫公司,2020年|圖表:2021

219、年AI指數報告受訪者百分比產業自動駕駛汽車所有行業汽車與裝配商業,法律和專業服務消費品/零售金融服務醫療保健/制藥高科技/電信計算機視覺對話界面深度學習NL一代NL語言理解NL文字理解其他機器學習技術物理機器人機器人過程自動化圖 3.3.4目錄101第3章章節預覽人工智能指數2021年度報告第3章:經濟3.3公司活動考慮和減輕應用人工智能的風險只有少數公司承認應用人工智能存在風險,而在采訪中報告會采取措施減輕這些風險的公司就更少了(圖3.3.5和圖3.3.6)。與2019年相比,被調查者引用的每種風險相關的比例基本保持不變。也就是說,大多數變化在統計上并不明顯。網絡安全仍然是大多數受訪者都表示

220、其組織明確與人工智能相關的唯一風險。一些不常被提及的風險,如國家安全和政治穩定,在2020年更會被企業視為應用人工智能的風險。盡管越來越多的人呼吁關注與人工智能使用相關的倫理問題,但業界為解決這些問題所作出的努力仍然非常有限。例如,人工智能使用中的公平性和公正性等問題仍然很少受到公司的關注。此外,與2019年相比,2020年更少的公司將個人或私人隱私視為應用人工智能的風險,而報告其公司正在采取措施以減輕這一特定風險的受訪者比例沒有任何變化。與2019年相比,被調查者引用的每種風險相關的比例基本保持不變。也就是說,大多數變化在統計上并不明顯。網絡安全仍然是大多數受訪者都表示其組織明確與人工智能相

221、關的唯一的風險。目錄102第3章章節預覽人工智能指數2021年度報告0%10%20%40%50%60%30%受訪者百分比網絡安全合規性可解釋性個人/個人隱私組織聲譽勞動力/勞動力轉移公平與公正人身安全國家安全政治穩定2020年組織認為與采用AI相關的風險來源:麥肯錫公司,2020年|圖表:2021年AI指數報告201920200%10%20%40%50%30%受訪者百分比網絡安全合規性可解釋性個人/個人隱私組織聲譽勞動力/勞動力轉移公平與公正人身安全國家安全政治穩定2020年組織采取措施應對的采用AI的風險來源:麥肯錫公司,2020年|圖表:2021年AI指數報告20192020圖 3.3.5

222、圖 3.3.6第3章:經濟3.3公司活動目錄103第3章章節預覽人工智能指數2021年度報告0%10%20%30%40%50%60%70%80%90%100%所有行業汽車與裝配商業,法律和專業服務消費品/零售金融服務醫療保健/制藥高科技/電信23%11%22%23%27%22%23%52%44%50%50%48%36%50%24%44%28%26%25%42%27%COVID-19大流行期間AI投資的變化來源:麥肯錫公司,2020年|圖表:2021年AI指數報告下降無影響上升圖 3.3.7第3章:經濟3.3公司活動COVID-19的影響盡管流感大流行造成了經濟衰退,但半數受訪者表示流感大流行對

223、他們在人工智能方面的投資沒有影響,而有27%的受訪者表示他們實際增加了投資。不到四分之一的企業減少了對人工智能的投資 (圖3.3.7) 。5 按行業劃分,醫療保健和制藥以及汽車和裝配行業的受訪者最有可能報告其公司增加了對人工智能的投資。5 由于四舍五入,數字加起來可能達不到100%。盡管流感大流行造成了經濟衰退,但半數受訪者表示流感大流行對他們在人工智能方面的投資沒有影響,而有27%的受訪者表示他們實際增加了投資。目錄104第3章章節預覽人工智能指數2021年度報告第3章:經濟工業機器人部署目前,人工智能正廣泛應用于智能手機和個人車輛等消費類設備(如自動駕駛技術)。但在實際機器人上部署的人工智

224、能還非常少。6 隨著研究人員開發將人工智能方法與現代機器人相結合的軟件,這種情況可能會改變。目前,可以通過計算工業機器人的全球銷量進行評估,即全球范圍內購買的可用于人工智能的基礎設施數量。雖然COVID-19引發的經濟危機短期內將導致機器人銷量下降,但國際機器人聯合會(IFR)預計,這場大流行將在中期為機器人行業帶來全球范圍內的增長機會。全球趨勢在經歷了連續六年的增長后,全球新部署的工業機器人數量下降了12%,從2018年的422271臺降至2019年的373240臺(圖3.3.8)。造成這種下降的主要原因是美國和中國之間的貿易緊張關系以及汽車和電氣/電子兩大主要客戶行業所面臨的困難。其中,汽

225、車工業占主導地位(占總部署量的28%),其次是電氣/電子(24%)、金屬和機械(12%)、塑料和化工產品(5%)、食品和飲料(3%)。7 需要注意的是,這些指標是對部署基礎設施的衡量,而這些基礎設施較易應用人工智能技術。這些指標并不表明是否每個新機器人都使用了大量人工智能。3.3公司活動201220132014201520162017201820190100200300400單位數(千)2012-19年全球工業機器人安裝來源:國際機器人聯合會,2020年|圖表:2021年AI指數報告圖 3.3.86 關于工業界應用人工智能和機器人的更多見解,請閱讀國家經濟研究局的工作文件“推進美國企業應用和使

226、用技術:年度商業調查的證據(2020)”。該文件是基于美國人口普查局2018年度商業調查完成的。7 請注意,對于部署的大約20%的機器人,沒有關于客戶行業的信息。目錄105第3章章節預覽人工智能指數2021年度報告第3章:經濟區域比較亞洲、歐洲和北美三個最大的工業機器人市場都見證了機器人部署數量連續六年增長期的結束(圖3.3.9)。2019年北美的降幅最大,達到了16%,而歐洲為 5%,亞洲為13%。圖3.3.10顯示了五大工業機器人市場的安裝部署數量。占全球機器人安裝部署量73%的五個國家的安裝部署量都出現了大致相同的下降趨勢,但德國除外。德國在2018年至2019年間的部署量略有上升。盡管

227、中國的工業機器人數量呈下降趨勢,但值得注意的是,中國2019年的工業機器人數量超過了其他四國的總和。3.3公司活動0100300200單位數(千) 亞洲歐洲北美洲其他南美和中美洲非洲2017-19年按地區劃分的新部署工業機器人來源:國際機器人聯合會,2020年|圖表:2021年AI指數報告201720182019亞洲、歐洲和北美三個最大的工業機器人市場都見證了機器人部署數量連續六年增長期的結束(圖3.3.9)。2019年北美的降幅最大,達到了16%,而歐洲為5%,亞洲為13%。圖 3.3.9目錄106第3章章節預覽人工智能指數2021年度報告050150200100單位數(千)中國日本美國南韓

228、德國世界其他地區2017-19年安裝五大市場的新工業機器人裝置來源:國際機器人聯合會,2020年|圖表:2021年AI指數報告201720182019第3章:經濟3.3公司活動2011201220132014201520162017201820192020202101,0002,0003,0004,0005,000AI提及數 1,356 機器學習 310 云 652 大數據 4,734 人工智能2011-20年企業收益報告中AI的提及數量來源:Prattle&Liquidnet,2020年|圖表:2021年AI指數報告收益報告如圖3.3.11所示,自2013年以來,在企業收益報告中人工智能的提

229、及數量大幅增加。2020年,人工智能在收益報告中的提及次數是大數據、云計算和機器學習的總和的兩倍,不過這一數字比2019年下降了8.5%。對大數據的提及在2017年達到頂峰,此后下降了57%。圖 3.3.10圖 3.3.11目錄107第4章章節預覽人工智能指數2021年度報告第 4 章人工智能教育人工智能指數2021年度報告目錄108第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育概述 109章節要點 1104.1高等教育機構的人工智能教育狀況111本科人工智能課程 111 教授人工智能技能的本科課程 111 人工智能和機器學習入門課程 111研究生人工智能課程 113 專注于人

230、工智能技能的研究生課程 113專注于人工智能的教職人員 1134.2北美地區人工智能和計算機科學學位畢業生114 北美地區計算機科學本科畢業生 114美國新增計算機科學博士 114 按專業劃分的新計算機科學博士 115 具備人工智能/機器學習和機器人學 /視覺專長的新計算機科學博士 117北美地區人工智能專業新博士畢業生 就業情況 118 產業界與學術界 118新人工智能專業博士留學生 1194.3歐盟及其它地區的人工智能教育120歐盟的人工智能課程 120 人工智能相關課程中講授的內容 121國際比較 122要點: 人工智能人才流失和教師離職123章節預覽第4章訪問公開數據目錄109第4章章

231、節預覽人工智能指數2021年度報告概述概述隨著人工智能逐漸成為經濟活動中重要的驅動力,人們對人工智能的興趣與日俱增。人們希望了解人工智能并獲得從事該領域工作所必須的技能。與此同時,產業界對人工智能人才的需求不斷上升,吸引著越來越多的教授離開學術界進入私營企業。本章主要關注通過各種教育平臺和機構培養人工智能人才的技能和培訓趨勢。接下來,我們將給出一份高校人工智能教育現狀的人工智能指數調查數據分析,以及基于年度計算研究協會(CRA)Taulbee調查的計算機科學本科及博士研究生人工智能相關專業探討。最后一部分將利用歐盟委員會聯合研究中心(JRC)的統計數據,探討歐洲人工智能教育的趨勢。第4章:人工

232、智能教育目錄110第4章章節預覽人工智能指數2021年度報告章節要點 2020年進行的一項人工智能指數調查顯示,過去四年,世界頂尖大學加大了對人工智能教育的投入。在過去的四個學年中,教授學生在本科和研究生階段構建或部署實用人工智能模型所需技能的課程數量分別增加了102.9%和41.7%。 計算機研究協會(CRA)的一項年度調查顯示,過去十年,北美地區更多的AI專業博士畢業生選擇在產業界工作,而選擇學術界工作的則較少。其中,選擇進入產業界工作的新AI專業博士比例增加了48%,從2010年的44.4%增至2019年的65.7%。相比之下,進入學術界的新AI專業博士比例下降了44%,從2010年的4

233、2.1%降至2019年的23.7%。 CRA的調查顯示,在過去10年中,在美國獲得CS博士學位的博士總人數中,人工智能相關博士人數所占比例從14.2%上升到2019年的23%左右。與此同時,其他以前非常流行的CS博士學位的受歡迎程度有所下降,包括網絡、軟件工程和編程語言。與2010年相比,程序編譯相關專業的博士學位人數都有所減少,而人工智能和機器人/視覺專業則大幅增加。 在經歷了兩年的增長之后,北美地區從大學轉到產業界工作的人工智能領域教師人數從2018年的42人下降到了2019年的33人(其中28人是終身教職員工,5人沒有獲得終身教職)。2004年至2019年間,卡內基梅隆大學(Carneg

234、ie Mellon University)的AI領域的教師離職人數最多(16人),其次是喬治亞理工學院(14人)和華盛頓大學(12人)。 2019年,北美新AI專業博士中的留學生比例繼續上升,達到64.3%,比2018年增長4.3%。在外國畢業生中,有81.8%的人留在美國,而8.6%的人選擇在美國以外工作。 在歐盟,絕大多數人工智能專業的學術課程都是在碩士及以上階段開設的。學士和碩士階段最常開設的課程是機器人學和自動化,而相關短期課程中最常開設的是機器學習(ML)。章節要點第4章:人工智能教育目錄111第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育2020年,人工智能指數開展

235、了一項調查,內容是面向全球一流大學和新興經濟體的計算機科學系或計算與信息學院了解關于人工智能教育四個方面的問題,具體包括:本科課程、研究生課程、人工智能倫理課程、教師的專業知識和多樣性。這項調查由來自9個國家的18所大學參與完成。1 人工智能指數調查的結果表明,大學增開了人工智能課程,同時增加了主要研究人工智能的教職員工的數量。其中,這些人工智能課程教授學生如何建立和部署實用的人工智能模型。本科人工智能課程通過評估教授學生建立或部署實用人工智能模型所需技能的課程趨勢、入門級人工智能和機器學習課程,以及招生統計數據,我們對本科階段的課程設置進行了調查。教授人工智能技能的本科課程調查結果表明,在過

236、去的四個學年中,計算機科學系在實用人工智能課程上投入了大量資金。2 在18所大學中,教授4.1 高等教育機構的人工智能教育狀況4.1高等教育機構的人工智能教育狀況2016-172017-182018-192019-20050100150200課程數量2016-20每年學生學習或構建實用AI模型所需的技能的本科課程數量來源:2020年AI指數報告圖表:2021年AI指數報告圖 4.1.1學生建立或部署實用人工智能模型所需技能的課程數量增加了102.9%,從2016-17學年的102門增加到了2019-20學年的207門(圖14.1.1)。人工智能和機器學習入門課程數據顯示,在過去四個學年中,注冊

237、或嘗試注冊人工智能入門課程和機器學習入門課程的學生人數增加了近60%(圖4.1.2) 3。1 2020年11月至2021年1月,我們通過互聯網分三次向73所大學分發了調查。其中有18所大學完成,回復率為24.7%。這18所大學分別是比利時:盧汶凱索利克大學;加拿大:麥吉爾大學;中國:上海交通大學、清華大學;德國:慕尼黑路德維希馬西米蘭大學、慕尼黑工業大學;俄羅斯:莫斯科理工學院經濟高等學院;瑞士:洛桑??茽柪砉W院;英國:劍橋大學;美國:加州理工學院、卡內基梅隆大學(機器學習系)、哥倫比亞大學、哈佛大學、斯坦福大學、威斯康星-麥迪遜大學、德克薩斯大學奧斯汀分校,耶魯大學。2 有關提供給調查對象

238、的實用人工智能模型的關鍵詞列表,請參見此處。課程定義為每周至少需要2.5學時(包括講座、實驗室、助教學時等)的一組課程,總共至少10周。具有相同標題和編號的多個課程視為一個課程。3 對于課程注冊有上限的大學,該數據包括了嘗試注冊入門級人工智能和機器學習課程的學生人數。目錄112第4章章節預覽人工智能指數2021年度報告2016-172017-182018-192019-200%50%100%150%百分比變化(2016-17 = 1)165.1%, 歐盟21.0%, 美國2016-20每年地區被AI入門和ML課程入門錄取或嘗試入學的學生人數百分比變化來源:2020年AI指數報告圖表:2021年

239、AI指數報告2019-20學年,入門級人工智能和機器學習課程的招生人數略有下降,這主要是由于美國大學課程數量的減少所造成的。在過去的四個學年中,歐盟的入門級課程注冊人數增加了165%,而美國的此類注冊人數在上一個學年出現了明顯的下降 (圖4.1.3) 。 在接受調查的8所美國大學中,有6所表示人工智能和數學基礎入門課程的報名人數在去年有所減少。一些大學認為,人數下降的主要原因是新冠疫情期間有部分學生休假。另一些大學則提到,造成人數下降的原因是入門級人工智能課程設置的結構性變化。例如,去年開設了數據科學入門課程,這可能會使得學生放棄傳統的人工智能和機器學習入門課程而去選擇了數據科學入門課程。第4

240、章:人工智能教育4.1高等教育機構的人工智能教育狀況2016-172017-182018-192019-2002,0004,0006,0008,00010,000學生數量2016-20學年被AI引入和ML課程引入或嘗試注冊的學生人數來源:2020年AI指數報告圖表:2021年AI指數報告圖 4.1.2圖 4.1.3目錄113第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育研究生人工智能課程 本調查還關注了研究生或更高學位級別的課程設置,特別是教授學生建立或部署實用人工智能模型所需技能的研究生課程。4專注于人工智能技能的研究生課程在過去四個學年中,教授學生建立或部署實用人工智能模型

241、所需技能的研究生課程增加了41.7%,從2016-17學年的151門課程增加到了2019-20學年的214門課程(圖4.1.4)。專注于人工智能的教師如圖4.1.5所示,在過去四個學年中,參與此次調查的大學中主要研究人工智能的終身教職教師人數顯著增長,與人工智能課程和學位課程需求的增長相一致。主要研究人工智能的教師人數增長了59.1%,從2016-17學年的105人增長到了2019-20學年的167人。 4.1高等教育機構的人工智能教育狀況4 如需獲得提供給調查對象的實用人工智能模型的關鍵詞列表,請參閱此處。課程定義為每周至少需要2.5學時(包括講座、實驗室、助教學時等)的一組課程,總共至少1

242、0周。具有相同標題和編號的多個課程視為一個課程。2016-172017-182018-192019-20050100150200課程數量2016-20每年學生學習或構建實用AI模型所需的技能的研究生課程數量來源:2020年AI指數報告圖表:2021年AI指數報告2016-172017-182018-192019-20050100150教職人數2016-20年主要專注于AI研究的終身教職學院數量來源:2020年AI指數報告圖表:2021年AI指數報告圖 4.1.4圖 4.1.5目錄114第4章章節預覽人工智能指數2021年度報告本節介紹計算研究協會(CRA)年度Taulbee調查的結果。CRA的

243、年度調查記錄了美國和加拿大能夠授予計算機科學(CS)、計算機工程(CE)或信息學(I)博士學位的學術單位的學生入學率、畢業率、畢業生就業和教師工資的變化趨勢。這些學術單位包括了計算機科學系和計算機工程系,在某些情況下也可以是信息或計算學院或學校。第4章:人工智能教育北美地區計算機科學本科畢業生北美地區大多數的人工智能課程都是本科階段計算機科學課程的一部分。在過去十年中,北美地區具有博士學位授予資質機構的計算機科學本科畢業生人數穩步增長(圖4.2.1)。2019年,超過28000名本科生完成了計算機科學學位,比2010年的數字高出約三倍。美國新增計算機科學博士本節分析了美國計算機科學博士畢業生的

244、趨勢,重點是與人工智能相關的專業。5 CRA調查共包括20個專業,其中兩個與人工智能領域直接相關,包括“人工智能/機器學習”和“機器人學/視覺”。4.2 北美地區人工智能和計算機科學學位畢業生4.2北美地區人工智能和計算機科學學位畢業生201020112012201320142015201620172018201905,00010,00015,00020,00025,00030,000CS本科新畢業生人數2010-19年北美博士學位機構新的CS本科生數量來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告圖 4.2.15 本節中的新計算機科學博士包括了來自美國計算機科學學術單

245、位(系、學院或大學內學校)的博士畢業生。目錄115第4章章節預覽人工智能指數2021年度報告按專業劃分的新計算機科學博士在2019年畢業的所有計算機科學博士中,人工智能/機器學習(22.8%)、理論與算法(8.0%)和機器人學/視覺(7.3%)專業的畢業生數量高居榜首(圖4.2.2)。人工智能/機器學習專業是過去十年中最受歡迎的專業。2019年人工智能/機器學習專業畢業生人數大于后面五個專業人數的總和。此外,機器人/視覺專業的畢業生人數排名從2018年的第八名躍升至2019年的第三名。在過去十年中,與其他18個專業相比,人工智能/機器學習和機器人學/視覺是計算機科學專業博士畢業生人數中增長最為

246、顯著的(圖4.2.3)。2020年,人工智能/機器學習專業計算機科學博士畢業生在所有新計算機科學博士中的比例比2010年高出8.6個百分點,其次是機器人學/視覺專業博士學位,為2.4個百分點。相比之下,計算機科學博士學位在網絡(-4.8個百分點)、軟件工程(-3.6個百分點)和編程語言/編譯器(-3.0個百分點)等專業的人數的比例在2020年出現負增長。0%5%10%15%20%新的CS博士的百分比人工智能/機器學習理論與算法機器人/視覺數據庫/信息檢索安全/信息保證圖形/可視化網路其他軟件工程人機交互操作系統 信息學:生物醫學/其他科學硬件/建筑高性能計算編程語言/編譯器社會計算/社會信息學

247、/ CSCW計算教育科學/數值計算信息系統 情報學2019年按特殊性分列的美國新CS博士生數(占總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告圖 4.2.2第4章:人工智能教育4.2北美地區人工智能和計算機科學學位畢業生目錄116第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育4.2北美地區人工智能和計算機科學學位畢業生2010-19年美國新CS PHDS的百分點變化來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告-6%-4%-2%0%2%4%6%8%10%新CS博士的百分比變化人工智能/機器學習機器人/視覺人機交互安全

248、/信息保證計算教育數據庫/信息檢索高性能計算理論和算法信息科學社會計算/社會信息學/CSCW信息系統操作系統圖形/可視化其他硬件/建筑信息學: 生物醫學/其他科學科學/數字計算編程語言/編譯器軟件工程網絡圖 4.2.3目錄117第4章章節預覽人工智能指數2021年度報告具備人工智能/機器學習和機器人學/視覺專長的新計算機科學博士圖4.2.4a和圖4.2.4b詳細展示了近年來美國主要研究人工智能/機器學習或機器人/視覺的AI專業博士人數。2010年至2019年間,人工智能/機器學習專業畢業生的數量增長了77%,而這些新博士在所有計算機科學博士畢業生中的比例則增長了61%。人工智能/機器學習和機器

249、人學/視覺博士畢業生的數量在2019年達到歷史最高水平。第4章:人工智能教育4.2北美地區人工智能和計算機科學學位畢業生0100200300畢業生人數2010-19年美國具有AI/機器學習和機器人技術/視覺專業的新CS博士生數來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告 人工智能/機器學習新博士學位的數量機器人/視覺新博士數量2010 2011 2012 2013 2014 2015 2016 2017 2018 20192.2010 2011 2012 2013 2014 2015 2016 2017 2018 20190%10%20%30%新的CS博士(占總數的百

250、分比)22.8%7.3%2010-19年美國具有AI/機器學習和機器人技術/視覺專業的新CS博士生數(占總數的百分比 )來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告人工智能/機器學習專業(占所有CS博士學位的百分比)機器人/視覺專業(占新CS博士的百分比)圖 4.2.4a圖 4.2.4b目錄118第4章章節預覽人工智能指數2021年度報告北美地區新AI專業博士畢業生就業情況新畢業的AI專業博士選擇在哪里工作?本節介紹北美地區學術界和產業界新畢業的AI專業博士的就業趨勢。6第4章:人工智能教育4.2北美地區人工智能和計算機科學學位畢業生050100150新博士生人數20

251、10-19年向北美學術界或業界使用AI的新博士生人數來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告2010 2011 2012 2013 2014 2015 2016 2017 2018 20190%20%40%60%新AI博士(占總數的百分比)23.7%65.7%2010-19年向北美學術界或業界使用AI的新博士生人數(占總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告學術界的新AI博士(占新AI博士總數的百分比)業界的新AI博士(占新AI博士總數的百分比)學術界的新AI博士數量工業界的新AI博士數量2010 2011 2012 2

252、013 2014 2015 2016 2017 2018 2019100N.圖 4.2.5a圖 4.2.5b產業界與學術界在過去十年中,北美地區新畢業的AI專業AI專業博士選擇進入產業界工作的人數持續增長,其比例從2010年的44.4%增加到2019年的65.7%(圖4.2.5a和圖4.2.5b)。相比之下,進入學術界的新畢業的AI專業AI專業博士比例下降了44%,從2010年的42.1%降至2019年的23.7%。如圖4.2.5b所示,這些變化在很大程度上反映了這樣一個事實,即進入學術界的博士畢業生人數在過去十年中基本保持不變,而大幅增加的新畢業博士主要都進入了產業界。6 本節中涉及到的新畢

253、業的AI專業AI專業博士包括來自美國和加拿大計算機科學、計算機工程和信息學的學術單位(系、學院或大學內的學校)的主要研究人工智能的博士畢業生。目錄119第4章章節預覽人工智能指數2021年度報告201020112012201320142015201620172018201920%30%40%50%60%70%新國際博士生數量(占新AI博士生總數的百分比)64.3%2010-19年北美AI新國際博士生數量(占新AI博士生總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告圖 4.2.6新AI專業博士留學生2019年,北美新畢業的AI專業博士中的留學生比例繼續上升,

254、達到了64.3%,比2018年上升了4.3個百分點(圖4.2.6)。相比之下,2019年,在已知專業領域的博士中,計算機工程有63.4%的博士、計算機科學有59.6%的博士以及信息學中29.5%的博士是留學生。此外,2019年美國的AI專業博士留學生畢業生中,有81.8%的人選擇留在美國就業,而8.6%選擇到美國以外的國家或地區工作(圖4.2.7)。相比之下,在全部已知專業領域的留學生畢業生中,有77.9%選擇留在美國,而10.4%選擇到其它地方就業。第4章:人工智能教育4.2北美地區人工智能和計算機科學學位畢業生2019年按工作地點劃分的美國AI國際新博士生(占總數的百分比)來源:2020年

255、CRA Taulbee問卷圖表:2021年AI指數報告8.6%美國以外81.8%美國9.6%未知圖 4.2.7目錄120第4章章節預覽人工智能指數2021年度報告本節介紹歐盟委員會聯合研究中心的研究,該中心評估了27個歐盟成員國以及其他6個國家(英國、挪威、瑞士、加拿大、美國和澳大利亞)的高級數字技能學術成果。這是該中心第二次開展類似的研究 7 。2020年版本涉及四個技術領域:人工智能(AI)、高性能計算(HPC)、網絡安全(CS)和數據科學(DS),具體是利用文本挖掘和機器學習技術提取與特定領域研究項目相關的內容。欲了解更多詳細信息,可參見“2019-20年高級數字技能學術課程。國際比較”

256、報告和“歐盟高等教育院校高級數字檔案供需預測”。第4章:人工智能教育歐盟的人工智能課程 這項研究揭示了27個歐盟國家的1032個人工智能項目的項目范圍和項目水平(圖4.3.1)。歐盟絕大多數專門的人工智能學術課程都開設在碩士及以上水平的課程中,從而幫助學生提升工作能力。德國在提供最專業的人工智能項目方面領先于其他成員國,其次是荷蘭、法國和瑞典。法國在提供碩士水平人工智能項目的數量方面名列榜首。4.3 歐盟及其他地區的人工智能教育4.3歐盟及其他地區的人工智能教育0102030專門AI項目的數量2019-20年度歐盟27國的專業AI計劃數量來源:歐洲委員會聯合研究中心,2020圖表:2021年A

257、I指數報告德國 荷蘭法國瑞典丹麥芬蘭愛爾蘭意大利波蘭西班牙比利時匈牙利愛沙尼亞立陶宛奧地利葡萄牙捷克羅馬尼亞拉脫維亞塞浦路斯斯洛伐克希臘斯洛文尼亞馬耳他克羅地亞盧森堡保加利亞碩士學士短期課程圖 4.3.17 請注意,2020年報告對2019年的版本進行了方法的改進,因此,不能對兩個版本進行嚴格的比較。具體的改進包括刪除某些關鍵詞和添加其他關鍵詞來識別程序。盡管如此,在2020年版的所有檢測到的程序中,超過90%是由2019年研究中出現的關鍵詞觸發的。目錄121第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育4.3歐盟及其他地區的人工智能教育短期課程學士碩士0%20%40%0%20

258、%40%0%20%40%機器人與自動化機器學習AI應用AI倫理計算機視覺自然語言處理聯網和自動駕駛汽車知識表示與推理; 規劃; 搜索; 優化AI的多代理系統哲學AIAI(通用)音頻處理2019-20歐盟27國按內容領域劃分的專門AI項目(占總數的百分比)來源:歐洲委員會聯合研究中心,2020圖表:2021年AI指數報告占專門AI項目總數的百分比圖 4.3.2人工智能相關課程中講授的內容在歐盟三個層次的專業人工智能課程中,哪些類型的人工智能技術最受歡迎?數據表明,迄今為止,機器人技術和自動化是專業學士和碩士課程中最常開設的課程,而機器學習在專業短期課程中占主導地位(圖4.3.2)。隨著短期課程越

259、來越受到已經工作的專業人士的青睞,機器學習已成為人工智能專業發展和實施的關鍵能力之一。人工智能倫理和人工智能應用也非常重要,這兩個領域在三個課程級別的教育中都占有相當大的份額。人工智能倫理,包括安保(security )、安全(safety)、問責(accountability)和可解釋性(explainability)的相關課程,平均占課程總數的14%,而人工智能應用的課程,如大數據、物聯網和虛擬現實課程,所占份額也類似。目錄122第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育4.3歐盟及其他地區的人工智能教育0100200300課程數量美國英國歐盟27國 澳大利亞加拿大挪威

260、瑞士2019-20年按地理區域和級別劃分的AI專業計劃數來源:歐洲委員會聯合研究中心,2020圖表:2021年AI指數報告學士碩士短期課程圖 4.3.3國際比較歐盟委員會聯合研究中心的報告將27個歐盟成員國的人工智能教育與歐洲其他國家進行了比較,包括挪威、瑞士和英國,以及加拿大、美國和澳大利亞。圖4.3.3顯示了2019-20學年所有國家1680個專業人工智能課程的總數。美國提供了比任何其它地區都要更多的人工智能專業課程。就人工智能專業碩士課程數量而言,歐盟27國緊隨其后。美國提供了比任何其它地區都要更多的人工智能專業課程。 就人工智能專業碩士課程數量而言, 歐盟27國緊隨其后。目錄123第4

261、章章節預覽人工智能指數2021年度報告要點:人工智能人才流失和教師離職羅切斯特大學的研究人員邁克爾戈夫曼和長江商學院的趙瑾于2019年發表了一篇題為人工智能,教育和創業的論文,探討了大學生領域特定知識與創業和吸引資金能力之間的關系。8 對于學生人工智能知識差異的來源,合著者使用了2004年至2018年間人工智能教授離開大學進入產業界的數據,他們稱之為“前所未有的人才外流”。他們使用從LinkedIn手工收集的數據,還使用了從Scopus學術出版物和會議數據庫收集的作者從屬關系對LinkedIn搜索的結果進行了補充。這篇論文指出,人工智能教師的離職對那些畢業于這些教授曾經工作過的大學的學生創辦的

262、人工智能初創公司有著負面影響。在教師離職后的幾年里,對未來的人工智能創業者會產生寒蟬效應。與本科生和碩士生相比,博士生受到的影響最大。當取代離開的人工智能教授的是排名較低的學校的教師或未獲得終身教職的教授時,這種負面影響會加劇。第4章:人工智能教育要點2004200520062007200820092010201120122013201420152016201720182019010203040教職人員數量北美人工智能教職人員離職數量統計來源:Gofman and Jin, 2020 | 圖表:2021年AI指數報告終身教職離職總數非終身教職圖 4.4.18 更多細節請見人工智能人才流失指數(

263、AI Brain Drain Index)目錄124第4章章節預覽人工智能指數2021年度報告第4章:人工智能教育要點要點:人工智能人才流失和教師離職(續)根據戈夫曼和趙瑾提供的2019年的最新數據,圖4.4.1顯示,經過兩年的增長,北美地區大學人工智能教師離職進入產業界的總人數從2018年的42人下降至2019年的33人(其中28人是終身教職員工,5人未獲得終身教職)。2004年至2019年間,卡內基梅隆大學的人工智能教師離職人數在2019年最多(16人),其次是喬治亞理工學院(14人)和華盛頓大學(12人),如圖4.4.2所示。人工智能教育02461214168 10 系科人數卡內基梅隆大

264、學喬治亞理工學院華盛頓大學加州大學伯克利分校多倫多大學斯坦福大學南加州大學德克薩斯大學奧斯汀分校密歇根大學伊利諾伊大學厄巴納香檳分校加利福尼亞大學圣地亞哥分校普渡大學哈佛大學2004-18年按大學分的北美(含大學聯盟)的AI系科數量來源:Gofman and Jin, 2020圖表:2021年AI指數報告圖 4.4.2目錄125第5章章節預覽人工智能指數2021年度報告第 5 章人工智能應用的倫理挑戰人工智能指數2021年度報告目錄126第5章章節預覽人工智能指數2021年度報告第5章:人工智能應用的倫理挑戰概述 127章節要點 1285.1人工智能原則和框架1295.2全球新聞媒體1315.

265、3人工智能會議的倫理1325.4高等教育機構的倫理教育134章節預覽第5章訪問公開數據目錄127第5章章節預覽人工智能指數2021年度報告第5章:人工智能應用的倫理挑戰概述概述隨著以人工智能為動力的創新在我們的生活中變得越來越普遍,人工智能應用的倫理挑戰也越來越明顯,并受到審查。如前幾章所述,使用各種人工智能技術可能會導致意外且有害的后果,例如隱私侵犯,基于性別、種族/族裔、性取向或性別認同的歧視,以及決策不透明等問題。在部署之前應對現有的倫理挑戰,建立問責制的、公平的人工智能創新-從來沒有任何一個時期像現在這樣重要。本章討論了隨著人工智能應用的興起而出現的倫理問題。首先,本章內容著重討論了最

266、近激增的描述人工智能原則和框架的文件,以及媒體如何報道人工智能相關的倫理問題。然后,回顧了在人工智能會議上提出的與倫理學相關的研究內容,介紹了世界各地大學的計算機科學(CS)系正在提供什么樣的倫理學課程。人工智能指數團隊發現,關于這一主題的數據非常少。盡管不少團體在人工智能倫理領域輸出了一系列的定性或規范性成果,但該領域仍然缺乏可用于衡量或評估更廣泛的關于技術發展的社會討論與技術本身發展之間關系的基準。技術性能一章涉及的一部分內容是美國國家標準與技術研究所(National Institute of Standards and Technology,NIST)對人臉識別性能的研究,重點是偏見。

267、弄清楚如何創造更多的定量數據對研究界來說是一個挑戰,但它是一個非常有用的重點。決策者敏銳地意識到了與人工智能相關的倫理問題。不過,人類更容易管理自己能夠衡量的東西,因此找到將定性論點轉化為定量數據的方法是這一過程中必不可少的一步。目錄128第5章章節預覽人工智能指數2021年度報告第5章:人工智能應用的倫理挑戰章節要點 自2015年以來,提交給人工智能會議的論文標題中包含倫理相關關鍵詞的論文數量有所增長。不過,在主要人工智能會議上標題能夠匹配倫理相關關鍵詞的論文平均數量多年來仍然較小。 2020年,與人工智能倫理道德使用相關的五大最受關注的新聞話題分別是:歐盟委員會發布的人工智能白皮書,谷歌解

268、雇倫理研究員蒂姆尼特蓋布魯(Timnit Gebru),聯合國成立的人工智能倫理委員會,梵蒂岡的人工智能倫理計劃,以及IBM正在終止其人臉識別相關業務。章節要點目錄129第5章章節預覽人工智能指數2021年度報告自2015年以來,政府、私營企業、政府間組織和研究/專業組織一直在致力于編制規范性文件。這些規范性文件描述了管理人工智能應用的倫理挑戰的方法。這些文件,包括原則、指導方針等,提供了解決問題的框架和評估各種組織內部開發、部署和管理人工智能的戰略。這些人工智能原則和框架討論了一些共同的主題,包括隱私、問責、透明度和可解釋性。人工智能原則的發布標志著組織正在關注并建立人工智能治理的愿景。不過

269、,所謂倫理原則的泛濫也遭到了倫理研究人員和人權實踐者的批評,他們反對不準確地使用與倫理有關的術語。批評人士還指出,這些原則缺乏體制框架,在大多數情況下不具備約束力。此外,由于存在模糊性和抽象性問題,這些原則無法為實施人工智能相關的倫理準則提供指導。波士頓人工智能倫理實驗室的研究人員創建了一個工具箱,用以跟蹤不斷出現的人工智能原則。2015年至2020年間,共發布了117份與人工智能原則相關的文件。數據顯示,研究和專業組織是最早推出人工智能原則文件的組織之一,而私營企業是迄今為止所有組織類型中發布人工智能原則出版物數量最多的組織(圖5.1.1)。根據圖5.1.2,截至2020年,歐洲和中亞的出版

270、物數量最多(52),其次是北美(41),東亞和太平洋地區(14)。在推出倫理原則方面,2018年,包括IBM、谷歌和Facebook在內的科技公司以及英國、歐盟和澳大利亞政府機構的表現最為突出。5.1 人工智能原則和框架第5章:人工智能應用的倫理挑戰5.1人工智能原則和框架截至2020年,歐洲和中亞的出版物數量最多 (52) ,其次是北美(41),東亞和太平洋地區(14)。在推出倫理道德相關的具體原則方面,2018年,包括IBM、谷歌和Facebook在內的科技公司以及英國、歐盟和澳大利亞政府機構的表現最為突出。目錄130第5章章節預覽人工智能指數2021年度報告201520162017201

271、820192020010203040新的AI倫理原則數量4528231722201613129655772015-20年按地區劃分的新AI倫理原則數量來源:AI倫理實驗室,2020圖表:2021年AI指數報告東亞和太平洋歐洲及中亞全球拉丁美洲和加勒比海中東和北非北美南亞Figure 5.1.2第5章:人工智能應用的倫理挑戰5.1人工智能原則和框架201520162017201820192020010203040新的AI倫理原則數量452823172219131511114496853222015-20年按組織類型劃分的新AI倫理原則數量來源:AI倫理實驗室,2020圖表:2021年AI指數報告

272、研究/專業組織私人公司政府間組織/機構政府機構圖 5.1.1目錄131第5章章節預覽人工智能指數2021年度報告0%5%15%20%10%有關AI道德的新聞報道總數的百分比指導,框架研究,教育面部識別算法偏置機器人,自動駕駛汽車AI可解釋性資料私隱企業努力2020年按主題劃分的AI倫理新聞覆蓋率(占總數的百分比)來源:CapIQ、Crunchbase和NetBase Quid,2020年|圖表:2021年AI指數報告圖 5.2.1新聞媒體是如何報道人工智能技術的倫理使用問題的呢?本節分析了NetBase Quid的數據。通過在LexisNexis的歸檔新聞數據庫中進行搜索,找到與人工智能倫理1

273、 相關的文章,涉及2020年6萬個英語新聞來源和50多萬個博客。最終,NetBase Quid搜索發現了3047篇與人工智能技術相關的文章,其中包括諸如“人權”、“人類價值觀”、“責任”、“人類控制”、“公平”、“歧視”或“非歧視”、“透明度”、“可解釋性”、“安全保障”、“問責制”和“隱私”等術語。根據語言的相似性,NetBase Quid將最終的文章劃分為七大主題。圖5.2.1顯示,在2020年,與人工智能倫理原則和框架相關的文章在最受關注的新聞主題中排名第一 (21%) ,其次是研究和教育(20%)、人臉識別(20%)。2020年,與人工智能的倫理使用相關的五個最受關注的新聞主題是:1.

274、 歐盟委員會發布人工智能白皮書(5.9%)2. 谷歌解雇倫理研究員蒂姆尼特格布魯(3.5%)3. 由聯合國組成的人工智能倫理委員會(2.7%)4. 梵蒂岡的人工智能倫理計劃(2.6%)5. IBM終止其人臉識別相關業務(2.5%)5.2 全球新聞媒體第5章:人工智能應用的倫理挑戰5.2全球新聞媒體1 此方法論正在尋求包含由哈佛研究(Harvard research study)所確認的與AI倫理相關關鍵字的文章。目錄132第5章章節預覽人工智能指數2021年度報告研究人員正在撰寫更多直接關注和討論人工智能倫理的論文,從2015年到2020年,這方面的論文提交量翻了一倍多。為了評估倫理在人工智能

275、研究中的作用,位于巴西阿雷格里港的南里奧格蘭德聯邦大學(UFRGS)的研究人員在人工智能、機器學習和機器人技術會議的論文標題中搜索倫理相關術語。如圖5.3.1所示,自2015年以來,提交給人工智能會議的論文中包含倫理相關關鍵詞的論文標題數量顯著增加。進一步,圖5.3.2給出了六個主要人工智能會議中所有出版論文中關鍵詞匹配的平均數。盡管在上一張圖表中已經提到了很多與人工智能倫理相關的內容,但我們可以看到在主要的人工智能會議上,標題中能夠與倫理相關關鍵詞匹配的論文平均數量多年來仍然非常低。不過,人工智能會議正在發生變化。從2020年開始,倫理議題被更緊密地納入到了會議議程中。例如,神經信息處理系統

276、(NeurIPS)會議,這是世界上最大的人工智能研究會議之一,在2020年首次要求研究人員在提交他們工作的同時提交一份“廣泛影響性”聲明,這標志著倫理問題與技術工作正在更深入的結合。此外,最近專門關注問責制的人工智能的會議和研討會也在激增,這其中就包括了人工智能促進協會(Association for the Advanced of Artificial Intelligence)舉辦的新的人工智能、倫理和社會會議以及公平、問責制會議,以及由計算機協會主辦的關于公平、問責和透明度的會議。5.3 人工智能會議的倫理第5章:人工智能應用的倫理挑戰5.3人工智能會議的倫理自2015年以來,提交給人工

277、智能會議的論文中包含倫理相關關鍵詞的論文標題數量顯著增加。接下來的分析會給出六個主要人工智能會議中所有出版論文中關鍵詞匹配的平均數。目錄133第5章章節預覽人工智能指數2021年度報告200020012002200320042005200620072008200920102011201220132014201520162017201820190.000.020.040.06關鍵字匹配的平均次數2000-19年SELECT大型AI會議上提及倫理關鍵字的論文標題的平均數量來源:2018年Prates et al.圖表:2021年AI指數報告AAAIICMLICRAIJCAIIROSNIPS/Neu

278、rIPS圖 5.3.2第5章:人工智能應用的倫理挑戰5.3人工智能會議的倫理20002001200220032004200520062007200820092010201120122013201420152016201720182019020406080論文數量702000-19年AI會議上提及倫理道德的論文標題的數量來源:2018年Prates et al.圖表:2021年AI指數報告圖 5.3.1目錄134第5章章節預覽人工智能指數2021年度報告024681012關于AI倫理的主題演講或小組討論大學范圍內關于廣泛道德規范的本科一般要求課程CS或其他部門的AI倫理獨立課程CS或其他部門的C

279、S道德獨立課程嵌入CS課程中的道德模塊與AI道德相關的學生團體/組織2019-20全球頂尖大學CS部門年度AI倫理學提供項目來源:2020年AI指數圖表:2021年AI指數報告圖 5.4.1第四章中我們介紹了對世界幾所頂尖大學計算機科學系或學校的調查結果,目的是評估高等教育機構的人工智能教育狀況。2 在調查過程中,還有一部分內容是了解計算機科學系或大學是否提供了接觸人工智能和計算機科學倫理方面問題的機會。在完成調查的16所大學中,有13所報告已經開設了相關課程。圖5.4.1顯示,18個系中有11個曾經主辦過關于人工智能倫理的主題活動或小組討論,其中7個系在其大學的計算機科學系或其它系開設了人工

280、智能倫理課程。一些大學還開設了計算機科學領域的倫理課程,包括單獨開設的計算機科學倫理學課程,以及嵌入到計算機科學課程中的倫理學模塊。35.4 高等教育機構的倫理教育第5章:人工智能應用的倫理挑戰5.4高等教育機構的倫理教育2 2020年11月至2021年1月,我們通過網絡分三次向73所大學分發了調查。其中有18所大學完成,回復率為24.7%。這18所大學分別是比利時:盧汶凱索利克大學;加拿大:麥吉爾大學;中國:上海交通大學、清華大學;德國:慕尼黑路德維希馬西米蘭大學、慕尼黑工業大學;俄羅斯:莫斯科理工學院經濟高等學院;瑞士:洛桑??茽柪砉W院;英國:劍橋大學;美國:加州理工學院、卡內基梅隆大學

281、(機器學習系)、哥倫比亞大學、哈佛大學、斯坦福大學、威斯康星-麥迪遜大學、德克薩斯大學奧斯汀分校,耶魯大學。3 調查沒有明確給出“嵌入到計算機科學課程中的倫理學模塊”的選項。該內容是填寫在“其它”選項中的。我們將在明年的調查中加入這部分內容。18個系中有11個曾經主辦過關于人工智能倫理的主題活動或小組討論,其中7個系在其大學的計算機科學系或其他系開設了人工智能倫理課程。目錄135第6章章節預覽人工智能指數2021年度報告第 6 章人工智能的多樣性人工智能指數2021年度報告目錄136第6章章節預覽人工智能指數2021年度報告第6章:人工智能的多樣性概述 137章節要點 1386.1人工智能中的

282、性別多樣性139人工智能學術屆的女性 139人工智能勞動力中的女性 140參加機器學習研討會的女性 141 研討會參加者 141 人員情況詳細統計 1426.2人工智能中的種族和民族多樣性144 美國的新人工智能博士 (按種族劃分) 144美國的新計算機博士 (按種族劃分) 145 計算機科學終身教職教師(按民族/種族劃分) 146人工智能領域的黑人 (Black in AI) 1466.3人工智能中的性別認同和性取向147人工智能中的LGBT群體 (Queer in AI) 147 人員情況詳細統計 147 LGBT群體從業者的經歷 149章節預覽第6章訪問公開數據目錄137第6章章節預覽人

283、工智能指數2021年度報告第6章:人工智能的多樣性概述概述人工智能系統可能會對社會產生巨大影響,但構建人工智能系統的人并不代表是這些系統要服務的人。目前,人工智能從業者以男性為主,包括學術界和工業界都是如此。盡管多年來一直強調這一點帶來的不利因素和風險,但從業者的多樣性仍然存在很大問題。種族和民族、性別認同和性取向缺乏多樣性,不僅有可能造成權力分配不均,更重要的是有可能進一步擴大人工智能系統現有的不平等問題,縮小這些系統所能夠提供的服務面向的個人和組織的范圍,進而造成不公平的結果。本章重點介紹人工智能勞動力和學術界的多樣性統計。本章內容利用了與各種組織的合作,包括機器學習中的女性(Women

284、in Machine Learning, WiML)、人工智能中的黑人(Black in AI, BAI)以及人工智能中的LGBT群體(Queer in AI),這些組織都旨在提高該領域中某些問題的多樣性。不過,本章中的數據并不全面和確鑿。在編寫本章的過程中,由于公開的人口資料非常少,人工智能指數團隊遇到了很大的挑戰。由于缺少數據,我們很難深入的分析缺乏人工智能勞動力多樣性對社會和技術發展的影響程度。人工智能中的多樣性問題是眾所周知的,而從學術界和工業界獲得更多的數據對于衡量問題規模和解決問題至關重要。關于多樣性的很多問題并沒有納入本章內容中,例如殘疾人工智能專業人士。此外,也沒有通過交叉視角

285、來考慮和分析多樣性。其它方面的內容將會在本報告后續的工作中加以討論。此外,這些多樣性統計數據只能說明部分情況。在人工智能領域工作的少數群體和邊緣化群體每天面臨的挑戰,以及組織內部導致缺乏多樣性的結構性問題,還需要更廣泛的數據收集和分析。1 感謝Women in Machine Learning,Black in AI以及Queer in AI為提高人工智能的多樣性所作出的工作、分享其數據以及對我們的配合。目錄138第6章章節預覽人工智能指數2021年度報告章節要點 十多年來,女性AI專業博士畢業生和計算機科學(CS)終身教職員工的比例一直很低。美國計算機研究協會(CRA)的一項年度調查顯示,北

286、美AI博士項目的女性畢業生人數占所有博士畢業生人數的比例還不到18%。一項人工智能指數調查結果顯示,在世界上的幾所大學中CS系終身教職員工中僅有16%是女性。 CRA的調查顯示,2019年,在美國AI博士畢業生新移民中,45%是白人,22.4%是亞裔,3.2%是西班牙裔,2.4%是非裔美國人。 在過去十年中,白人(非西班牙裔)新畢業計算機博士的比例變化不大,平均約為62.7%。而同期黑人或非裔美國人(非西班牙裔)和西班牙裔計算機博士的比例則明顯下降,平均分別下降了3.1%和3.3%。 近年來,由NeurIPS合辦的Black-in-AI研討會的參與人數顯著增加。2019年參會人數和提交論文數是

287、2017年的2.6倍,而接受論文數是2017年的2.1倍。 在Queer in AI組織于2020年進行的一項會員調查中,近一半的受訪者表示,缺乏包容性是他們成為AI/ML領域從業者所面臨的一個障礙。超過40%的受訪者表示,他們曾在工作或學校受到過歧視或騷擾。章節要點第6章:人工智能的多樣性目錄139第6章章節預覽人工智能指數2021年度報告201020112012201320142015201620172018201910%15%20%25%30%女性新博士生數量(占新AI和CS博士生總數的百分比)22.1% AI20.3% CS2010-19年北美AI和CS女性新博士生數量(占新AI和CS

288、博士生總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告110 (16.1%)女性2019-20年度按性別分列的世界頂尖大學CS系的終身教職來源:2020年AI指數圖表:2021年AI指數報告575 (83.9%)男性110 (16.1%)女性圖 6.1.1圖 6.1.2學術屆的女性我們在第四章中介紹了兩項人工智能指數調查。其中一項調查評估了全球頂尖大學計算機系的人工智能教育狀況。另外一項則是計算機研究協會(Computer Research Association,CRA)每年對北美地區信息學、計算機科學和計算機工程領域博士的招生、畢業和就業情況進行的Tau

289、lbee調查。兩項調查的數據都顯示,女性人工智能和計算機科學博士畢業生以及計算機科學終身教職教師的比例仍然很低。在過去十年中,人工智能博士和計算機科學博士的女性畢業生的人數平均占所有博士畢業生的18.3%(圖6.1.1)。在完成全球計算機科學項目人工智能指數調查的17所大學中,女性教師僅占所有主要研究領域為人工智能的終身教職教師的16.1%。6.1 人工智能中的性別多樣性6.1人工智能中的性別多樣性第6章:人工智能的多樣性目錄140第6章章節預覽人工智能指數2021年度報告6.1人工智能中的性別多樣性第6章:人工智能的多樣性0132AI相關技能普及率印度美國韓國新加坡中國加拿大法國德國澳大利亞

290、英國南非意大利2015-20年按性別劃分的AI相關技能普及率來源:LinkedIn,2020年|圖表:2021年AI指數報告女性男性圖 6.1.3人工智能勞動力中的女性第三章介紹了“全球相對人工智能技能普及率”,這一指標反映了不同職業人工智能技能的普及率,或者某些職業的人使用人工智能技能的密度。圖6.1.3顯示了一組選定國家中按國家劃分的男女勞動力池中人工智能技能的普及率。2 數據表明,在圖中所示的大多數國家中,女性人工智能技能普及率低于男性。在我們調查的12個國家中,印度、韓國、新加坡和澳大利亞在男女人工智能技能普及率方面最為公平。2 包括的國家是從符合標準的國家中選出的樣本,該標準為Lin

291、kedIn的勞動力覆蓋率至少為40%,每個月至少雇傭10名人工智能員工。由于中國和印度在全球經濟中的重要性與日俱增,他們也被納入了這個樣本,但實際上LinkedIn在這些國家的覆蓋率并沒有達到40%的勞動力。對這些國家的分析可能不像其他國家那樣全面,應該相應地加以解釋。數據表明,在圖中所示的大多數國家中,女性人工智能技能普及率低于男性。目錄141第6章章節預覽人工智能指數2021年度報告6.1人工智能中的性別多樣性第6章:人工智能的多樣性20062007200820092010201120122013201420152016201720182019202002004006008001,000參

292、與者人數9252006-20年在NEURIPS舉行的WIML WORKSHOP上的參與者人數來源:2020年Women in Machine Learning圖表:2021年AI指數報告圖 6.1.4參加機器學習研討會的女性機器學習中的女性(Women in Machine Learning, WiML),這是一個由漢娜瓦拉赫、詹恩沃特曼和麗莎韋納于2006年創立的組織,該組織負責舉辦活動和項目以對WiML提供支持。本節介紹該組織在NeurIPS舉辦的年度技術研討會的統計數據。2020年,WiML還首次在2020年機器學習國際會議(ICML)上舉辦了一整天的“協作研討會”(un-worksho

293、p),吸引了812名參會者。研討會參加者自2006年首次舉辦以來,參加NeurIPS的WiML研討會的人數一直在穩步增加。據該組織稱,由于COVID-19大流行,2020年的WiML研討會采用虛擬線上的方式召開,此外這一屆研討會還利用了Gather.Town平臺。這兩個因素使得今年的參會人數很難與往年的情況直接比較。圖6.1.4顯示,2020年的參會人員約為925名,這一數字是根據訪問虛擬平臺的人數估計得到的。在過去的十年中,WiML研討會的項目規模在不斷擴大,如包括為更多資深參與者提供一對一反饋和專業建議的指導圓桌會議,并在此基礎上包含了主題演講、海報展示等內容。于此類似的機會或是導致自20

294、14年起,WiML研討會參會者不斷增加的原因。在2016年至2019年間,WiML研討會的平均出席率約為NeurIPS整體出席率的10%。目錄142第6章章節預覽人工智能指數2021年度報告人員情況詳細統計下面給出的地理位置、專業職位和性別分類數據都是NeurIPS 2020 WiML研討會的參與者提供的。會議匯總這些信息事先征得了她們的同意,并要求她們通過會議的虛擬平臺進行填寫,整個填寫過程大約需要10分鐘。在參會者中,89.5%是女性和/或非雙性戀,10.4%是男性(圖6.1.5),大部分都來自北美地區(圖6.1.6)。此外,如圖6.1.7所示,包括博士、碩士和本科生在內的學生占參會者的一

295、半以上(54.6%)。在工業界的參會者中,研究科學家/工程師和數據科學家/工程師是人數最多的專業職位。6.1人工智能中的性別多樣性第6章:人工智能的多樣性89.5%女性或和非二元性別10.4%男性2006-20年在NEURIPS舉行的WIML WORKSHOP上的按性別劃分的參與者人數比例(占總人數百分比)來源:2020年Women in Machine Learning圖表:2021年AI指數報告89.5%女性或和非二元性別10.4%男性圖 6.1.5在參會者中,89.5%是女性和/或非雙性戀,10.4%是男性,大部分都來自北美地區。此外,包括博士、碩士和本科生在內的學生占參會者的一半以上(

296、54.6%)。目錄143第6章章節預覽人工智能指數2021年度報告0%5%10%15%25%30%35%20%參加人數百分比博士生研究科學家/工程師理學碩士學生數據科學家/工程師本科生博士后研究員軟件工程師教授(終身制任職前)教授(終身制任職后)程序/產品經理2020年前十名專業職位中NEURIPS上WIML研討會的參與者(占總數的百分比)來源:2020年Women in Machine Learning圖表:2021年AI指數報告圖 6.1.76.1人工智能中的性別多樣性第6章:人工智能的多樣性0%10%20%40%50%60%30%參加人數百分比北美歐洲亞洲非洲中南美和加勒比海澳大利亞和大

297、洋洲中東2020年RESIDENCE RESIDENT的WIML WORKSHOP參加NEURIPS的參與者(占總數的百分比)來源:2020年Women in Machine Learning圖表:2021年AI指數報告圖 6.1.6目錄144第6章章節預覽人工智能指數2021年度報告2 22 2. .4 4% 亞亞裔裔4 45 5. .6 6% 白白色色(非非西西班班牙牙裔裔)2 24 4. .8 8% 未未知知2 2. .4 4% 黑黑人人或或非非裔裔美美國國人人(非非西西班班牙牙裔裔)3 3. .2 2%西西班班牙牙裔裔1 1. .6 6% 多多種種族族(非非西西班班牙牙裔裔)2019年

298、按種族/民族劃分的新美國居民AI博士生數量(占總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告4 45 5. .6 6% 白白色色(非非西西班班牙牙裔裔)2 2. .4 4% 黑黑人人或或非非裔裔美美國國人人(非非西西班班牙牙裔裔)1 1. .6 6% 多多種種族族(非非西西班班牙牙裔裔)2019年按種族/民族劃分的新美國居民AI博士生數量(占總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告美國的新人工智能博士(按種族劃分)根據CRA Taulbee調查,在2019年美國居民新人工智能博士中,白人(非西班牙裔)所占比例最大

299、(45.6%),其次是亞裔(22.4%)。相比之下,非洲裔美國人(非西班牙裔)占2.4%,西班牙裔占3.2%(圖6.2.1)。6.2 人工智能中的種族和民族多樣性6.2人工智能中的種族和民族多樣性第6章:人工智能的多樣性圖 6.2.1目錄145第6章章節預覽人工智能指數2021年度報告20102011201220132014201520162017201820192020202120220%10%20%30%40%50%60%70%新的計算機博士,美國居民(占總數的百分比)8.5% 未知3.2% 西班牙裔,任何種族2.5% 黑人或非裔美國人(非西班牙裔)1.7% 多種族(非西班牙裔)24.4%

300、 亞裔0.6% 夏威夷人/太平洋島民0.3% 美國印第安人或阿拉斯加原住民58.9% 白色(非西班牙裔)2010-19年按種族/民族劃分的美國居民新計算機博士學位(占總數的百分比)來源:2020年CRA Taulbee問卷圖表:2021年AI指數報告美國的新計算機博士 (按種族劃分) 圖6.2.2展示了2010年至2019年間,美國計算機科學(CS)、計算機工程(CE)和信息學(I)專業授予美國居民的所有博士學位。CRA的調查顯示,白人(非西班牙裔)新博士的比例在過去10年中變化不大,平均占62.7%。同期新增黑人或非裔美國人(非西班牙裔)和西班牙裔計算機博士的比例明顯較低,平均分別為3.1%

301、和3.3%。由于未知案例的數量,我們無法比較2019年新增人工智能博士和計算機科學博士的數量(新增人工智能博士為24.8%,計算機科學博士為8.5%)。6.2人工智能中的種族和民族多樣性第6章:人工智能的多樣性CRA的調查顯示,白人(非西班牙裔)新博士的比例在過去10年中變化不大,平均占62.7%。圖 6.2.2目錄146第6章章節預覽人工智能指數2021年度報告0100200400500300參會人數參與者人數提交的論文數量接受的論文數量2017-19年與NEURIPS聯合舉辦的AI WORKSHOP BLACK中的參與者人數,提交的論文數量和接受的論文數量來源:2020年Black in

302、AI圖表:2021年AI指數報告201720182019圖6.2.3給出了人工智能指數教育調查的數據 3 。有15所大學完成了關于其教師種族構成問題的調查問卷。根據他們反饋的數字,約67.0%的終身教職教師是白人,其次是亞裔(14.3%)、其它種族(8.3%)和混血/其它種族、族裔或出身(6.3%)。終身教職教師中,黑人或非洲人,以及西班牙裔、拉丁裔或西班牙人教師的比例最小,分別占0.6%和0.8%。人工智能中的黑人人工智能中的黑人(Black in AI, BAI)由Timnit Gebru和Rediet Abebe于2017年創立,這是一個多機構和跨洲的倡議,旨在提升黑人在人工智能領域中的

303、地位。截至2020年,BAI擁有約3000名社區成員和盟友,在大型人工智能會議上舉辦了10多個研討會,并幫助全球參與大型人工智能會議的黑人人數增加了40倍。圖6.2.4顯示了與NeurIPS共同舉辦的年度Black in AI研討會的參會者數量、提交的論文和接受的論文情況。4 2019年參會人數是2017年的2.6倍,其中錄用論文數是2017年的2.1倍。6.2人工智能中的種族和民族多樣性第6章:人工智能的多樣性計算機科學終身教職教師(按民族/種族劃分)67.0%白白人人14.3%亞亞裔裔8.3%其其他他族族裔裔6.3%混混合合/ /其其他他種種族族,種種族族或或血血統統2.7%中中東東或或北

304、北非非0.8%西西班班牙牙裔裔,拉拉丁丁裔裔或或西西班班牙牙血血統統0.6%黑黑人人或或非非洲洲人人2019-20年按種族/民族劃分的世界頂尖大學CS系終身任職教師職位(占總數的百分比)來源:2020年AI指數圖表:2021年AI指數報告67.0%白白人人14.3%亞亞裔裔8.3%其其他他族族裔裔6.3%混混合合/ /其其他他種種族族,種種族族或或血血統統2.7%中中東東或或北北非非0.8%西西班班牙牙裔裔,拉拉丁丁裔裔或或西西班班牙牙血血統統0.6%黑黑人人或或非非洲洲人人圖 6.2.3圖 6.2.43 2020年11月至2021年1月,我們通過網絡分三次向73所大學分發了調查。其中有18所

305、大學完成,回復率為24.7%。這18所大學分別是比利時:盧汶凱索利克大學;加拿大:麥吉爾大學;中國:上海交通大學、清華大學;德國:慕尼黑路德維希馬西米蘭大學、慕尼黑工業大學;俄羅斯:莫斯科理工學院經濟高等學院;瑞士:洛桑??茽柪砉W院;英國:劍橋大學;美國:加州理工學院、卡內基梅隆大學(機器學習系)、哥倫比亞大學、哈佛大學、斯坦福大學、威斯康星-麥迪遜大學、德克薩斯大學奧斯汀分校,耶魯大學。4 2020年的數據受到了流感大流行的影響,因此沒有包括在內。更多有關信息,請參閱“Black in AI Impact”報告。目錄147第6章章節預覽人工智能指數2021年度報告人工智能中的LGBT群體本

306、節介紹Queer in AI (QAI)5 組織成員的調查數據,該組織旨在使人工智能/機器學習社區成為一個歡迎、支持和重視LGBT群體科學家的社區。QAI由William Agnew、Raphael Gontijo Lopes和Eva Breznik于2018年成立,通過會議、海報會議、原則和其他舉措,建立了一個由LGBT群體和盟友人工智能/機器學習科學家組成的可見社區。人員情況詳細統計根據2020年的調查,在大約100份回復中,約31.5%的受訪者認為自己是同性戀(gay),其次是雙性戀(bisexual)、非異性戀(queer)和女同性戀(lesbian)(圖6.3.1)。約37.0%和2

307、6.1%的受訪者分別認為自己是順性男和順性女,其次是性別酷兒、流性人、非二元性別和其他(圖6.3.2)。變性女性和男性分別占總受訪者的5.0%和2.5%。此外,過去三年的調查顯示,學生是QAI成員中的大多數,平均占所有受訪者的41.7%(圖6.3.3),其次是學術界或行業的初級專業人員。6.3 人工智能中的性別認同和性取向0%5%10%20%25%30%15%受訪者百分比同性戀雙性戀同性戀女同性戀異性戀無性變性人其他2020年QAI會員調查:您的性取向是什么來源:2020年Queer in AI圖表:2021年AI指數報告圖 6.3.16.3人工智能中的性別認同和性取向第6章:人工智能的多樣性

308、5 Queer in AI 在其于NeurIPS年度會議的研討會上展示了該項調查結果。目錄148第6章章節預覽人工智能指數2021年度報告0%5%10%15%25%30%35%20%受訪者百分比順勢男性順勢女性性別酷兒性別流動非二元性別和其他跨女2020年QAI會員調查:您的性別認同是什么來源:2020年Queer in AI圖表:2021年AI指數報告0%5%10%15%20%25%30%35%40%45%受訪者百分比學生初級學術初級產業其他2018-20年QAI會員調查:您將如何描述自己的職位來源:2020年Queer in AI圖表:2021年AI指數報告201820192020圖 6.

309、3.2圖 6.3.36.3人工智能中的性別認同和性取向第6章:人工智能的多樣性目錄149第6章章節預覽人工智能指數2021年度報告LGBT群體從業者的經歷QAI還調查了其成員作為酷兒人工智能/機器學習從業者的經歷。如圖6.3.4所示,81.4%的人認為缺乏行為榜樣是他們職業生涯的主要困難,70.9%的人認為缺乏社區組織是造成這種現象的原因。幾乎一半的受訪者還認為,這一領域缺乏包容性給他們造成了困難。此外,超過40%的QAI成員曾在工作或學校因為是同性戀者而被歧視或騷擾(圖6.3.5)。約9.7%的人曾五次以上遭受歧視或騷擾。0%10%20%30%50%60%70%80%40%受訪者百分比缺乏榜

310、樣 缺乏社區感缺乏包容性缺乏工作/學校支持現在的經濟困難騷擾/歧視2020年QAI會員調查:您成為AI / ML酷兒實習者所遇到的障礙來源:2020年Queer in AI圖表:2021年AI指數報告圖 6.3.46.3人工智能中的性別認同和性取向第6章:人工智能的多樣性81.4%的人認為缺乏行為榜樣是他們職業生涯的主要困難,70.9%的人認為缺乏社區組織是造成這種現象的原因。目錄150第6章章節預覽人工智能指數2021年度報告0%5%10%15%20%35%40%45%50%55%25% 30%受訪者百分比0次1次2次5次以上其他2020年QAI成員調查:您是否曾在工作或學校中經歷過歧視/騷

311、擾來源:2020年Queer in AI圖表:2021年AI指數報告圖 6.3.56.3人工智能中的性別認同和性取向第6章:人工智能的多樣性超過40%的QAI成員曾在工作或學校因為是同性戀者而被歧視或騷擾(圖6.3.5)。約9.7%的人曾五次以上遭受歧視或騷擾。目錄151第7章章節預覽人工智能指數2021年度報告第 7 章人工智能政策和國家戰略人工智能指數2021年度報告目錄152第7章章節預覽人工智能指數2021年度報告第7章:人工智能政策和國家戰略概述 153章節要點 1547.1國家和地區人工智能戰略155已發布的戰略156 2017 156 2018 157 2019 159 2020

312、 161發展中戰略(截至2020年12月) 162 公共咨詢戰略 162已宣布戰略 163要點:國家人工智能戰略與人權 1647.2人工智能的國際合作165政府間舉措 165 工作組 165 首腦會議 166雙邊協定 1667.3美國對人工智能的公共投資167非國防人工智能研發支出的聯邦預算 167美國國防部預算申請 168美國政府AI相關合同支出 169 總合同支出 169 按部門和機構分列的合同支出 1697.4人工智能和政策制定171人工智能的立法記錄 171 美國國會記錄 172 國會/議會程序中提及人工智能和 機器學習 172中央銀行 174美國人工智能政策文件 176章節預覽第7章

313、訪問公開數據目錄153第7章章節預覽人工智能指數2021年度報告第7章:人工智能政策和國家戰略概述概述人工智能將在未來幾十年內塑造全球競爭力,并且有望給早期引入人工智能者帶來顯著的經濟和戰略優勢。到目前為止,各國政府、區域和政府間組織都競相制定針對人工智能的政策,以最大限度地發揮這項技術的潛力和優勢,同時有效應對其引發的社會和倫理影響。本章介紹人工智能政策制定的情況,跟蹤了解地方、國家和國際各層面為幫助促進和管理人工智能技術所做的努力。首先,概述國家和區域人工智能戰略,回顧政府間活動。然后,深入研究美國人工智能的公共投資情況,以及立法機構、中央銀行和非政府組織是如何應對建立人工智能技術政策框架

314、的日益增長的需求的。目錄154第7章章節預覽人工智能指數2021年度報告第7章:人工智能政策和國家戰略章節要點章節要點 自2017年加拿大發布全球首個國家人工智能戰略以來,截至2020年12月,已有30多個國家和地區發布了類似文件。 全球人工智能伙伴關系(Global Partnership on AI ,GPAI)和經濟合作與發展組織(Organisation for Economic Co-operation and Development,OECD)人工智能政策觀察站和人工智能專家網絡于2020年啟動。這些國際組織的成立推動了政府間的協作,以共同支持面向所有人的人工智能發展。 在美國,第

315、116屆國會是歷史上對人工智能關注度最高的國會會議。本屆國會在立法、委員會報告和國會研究服務(Congressional Research Service,CRS)報告中提到人工智能的次數是第115屆國會的三倍多。目錄155第7章章節預覽人工智能指數2021年度報告為了指導和促進人工智能的發展,世界各國和地區正在加緊制定戰略和舉措,目的是協調政府和政府間的努力。自2017年加拿大發布全球首個國家人工智能戰略以來,截至2020年12月,已有30多個國家和地區發布了類似文件。7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略7.1國家和地區人工智能戰略本節概述了世界范圍內部分國家和地區的人

316、工智能戰略,包括G20國家、愛沙尼亞和新加坡的戰略細節,以及許多其他國家的戰略文件鏈接。資料來源包括國家或地區政府網站、經合組織人工智能政策觀察站(OECD.AI)以及新聞報道?!叭斯ぶ悄軕鹇裕ˋI Strategy)”被定義為一個政策文件,其目標是向人們傳遞支持人工智能發展的理念,同時最大限度地提高人工智能對社會的效益。一些更廣泛的創新或數字戰略文件并沒有包含在本節內容中,如巴西的電子數字戰略和日本的綜合創新戰略,這些文件的內容重點并不是人工智能。已發布人工智能戰略的國家:32個制定人工智能戰略的國家:22個目錄156第7章章節預覽人工智能指數2021年度報告已發布的戰略2017加拿大 人工

317、智能戰略:泛加拿大人工智能戰略 負責組織:加拿大高級研究所(CIFAR) 要點:加拿大人工智能戰略強調發展加拿大未來的人工智能勞動力,支持主要的人工智能創新中心和科學研究,并將該國定位為人工智能在經濟、倫理、政策和法律方面的思想領袖。 資金(2020年12月兌換率):1.25億加元(9700萬美元) 2020年11月,CIFAR發布了其最新年度報告,題為“AICAN”,該報告跟蹤了加拿大人工智能國家戰略的實施進展,其中重點闡述了加拿大人工智能生態系統的實質性增長,與醫療保健和人工智能對社會的影響相關的研究和活動,以及人工智能戰略相關的其他成果。中國 人工智能戰略:新一代人工智能發展規劃 責任機

318、構:中華人民共和國國務院 要點:中國的人工智能戰略是世界上最全面的人工智能戰略之一。它涵蓋了通過教育和技能獲取進行研發和人才培養、倫理規范和對國家安全的影響等領域。該戰略設定了具體的目標,包括:到2020年,使人工智能行業能夠與競爭對手保持一致;到2025年,成為無人駕駛飛行器(UAV)、語音和圖像識別等領域的全球領導者;到2030年,成為人工智能創新的主要中心。 資金:N/A 最新進展:中國于2019年2月建立了新一代人工智能創新開發區,并于2019年5月由學術機構和騰訊、百度等私營企業組成的多方利益相關者聯盟發布了 “人工智能北京共識”。日本 人工智能戰略:人工智能技術戰略 負責組織:人工

319、智能技術戰略委員會 要點:該戰略規劃了人工智能開發的三個獨立階段。第一階段的重點是數據和人工智能在相關服務業中的利用,第二階段的重點是人工智能的公共使用和服務業的擴張,第三階段的重點是創建一個綜合生態系統,從而將各個領域融合在一起。 資金:N/A 最新進展:2019年,日本的綜合創新戰略促進委員會推出了另一項人工智能戰略,其目的是進一步推進人工智能,解決日本目前面臨的問題,利用日本的優勢開拓未來機遇。其它芬蘭: 芬蘭的人工智能時代阿聯酋:阿聯酋人工智能戰略7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略目錄157第7章章節預覽人工智能指數2021年度報告已發布的戰略2018歐盟 人工

320、智能戰略:人工智能協調計劃 負責組織:歐盟委員會 要點:本戰略文件概述了歐盟成員國、挪威和瑞士為增加投資和建立人工智能人才渠道而商定的承諾和行動。它強調公私伙伴關系的價值,創造歐洲的數據空間和發展倫理原則。 資助(2020年12月兌換率):人工智能研究每年至少10億歐元(11億美元),戰略及其他方面至少49億歐元(54億美元) 最新更新:2018年6月發布倫理準則初稿,隨后于2019年4月更新。法國 人工智能戰略:人工智能造福人類:法國人工智能戰略 負責組織:高等教育、研究和創新部;經濟和財政部;企業總局;公共衛生部;武裝部隊部;國家數字科學研究所;數字技術與信息通信系統部際主任 要點:該戰略

321、的主要主題包括:為大數據制定積極的數據政策;面向四個戰略部門,即衛生保健、環境、運輸和國防;推動法國在研發方面的工作;規劃人工智能對勞動力的影響;確保領域內的包容性和多樣性。 資金(2020年12月率):截至2022年共15億歐元(18億美元) 最新進展:法國國家數字科學研究所(Inria)承諾在協調國家人工智能戰略方面發揮核心作用,并將每年報告進展情況。德國 人工智能戰略:德國制造的人工智能 負責組織:聯邦教育和研究部;聯邦經濟事務和能源部;聯邦勞動和社會事務部 要點:該戰略的重點是鞏固德國作為研究強國的地位,增強其產業的價值。此外,還強調公共利益,努力改善人民生活和環境。 資金(2020年

322、12月兌換率):2019年預算為5億歐元(6.08億美元),2025年前計劃執行30億歐元(36億美元) 最新更新:2019年11月,德國政府發布了一份關于德國人工智能戰略的中期進展報告。7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略目錄158第7章章節預覽人工智能指數2021年度報告2018 (續)印度 人工智能戰略:國家人工智能戰略 負責組織:轉型中印度國家研究院(NITI Aayog, The National Institution for Transforming India Aayog) 要點:印度戰略重點關注經濟增長和利用人工智能提高社會包容性的方法,同時促進研究以解

323、決與人工智能相關的倫理、偏見和隱私等重要問題。該戰略強調農業、衛生和教育等部門,這些部門依賴于公共投資和政府主動行動。 資金(2020年12月兌換率):70億盧比(9.49億美元) 最新更新:2019年,電子和信息技術部發布了提案,擬設立一個國家人工智能項目,撥款共計4億盧比(5400萬美元)。印度政府在2019年底成立了一個專門的委員會,推動有組織的人工智能政策,并建立政府機構的確切職能,以推進印度的人工智能任務。墨西哥 人工智能戰略:墨西哥人工智能綱領(2019年議程簡本) 責任組織:IA2030Mx,Economia 要點:作為拉丁美洲的第一個人工智能戰略,墨西哥戰略的重點是建立一個強有

324、力的治理框架,以規劃人工智能在各個行業的需求,確定政府的最佳做法,重點是發展墨西哥的人工智能領導能力。 資金:N/A 最新進展:根據美洲開發銀行最近的fAIr LAC報告,墨西哥正在制定具體的人工智能政策以推進進一步的行動。英國 人工智能戰略:產業戰略:人工智能行業協議 負責組織:人工智能辦公室(OAI) 要點:英國的人工智能戰略強調企業、學術界和政府之間的強有力的伙伴關系,并確定了成功產業戰略的五個基礎:成為世界上最具創新性的經濟體,創造就業機會和更好的收入潛力,基礎設施升級,有利的商業條件以及在全國建立繁榮的社區。 資金(2020年12月兌換率):9.5億英鎊(13億美元) 最新進展:20

325、17到2019年間,英國的人工智能特別委員會發布了一份關于該國人工智能進展的年度報告。2020年11月,英國政府宣布將在四年內大幅增加165億英鎊(218億美元)的國防開支,重點是有望徹底改變戰爭的人工智能技術。其它瑞典: 人工智能的國家方針中國臺灣:臺灣人工智能行動計劃7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略目錄159第7章章節預覽人工智能指數2021年度報告已發布的戰略2019愛沙尼亞 人工智能戰略:2019-2021年國家人工智能戰略 負責組織:經濟事務和通信部(MKM) 要點:該戰略強調了公共和私營機構為增加人工智能研究和開發投資而采取的必要行動,同時也改善了愛沙尼亞

326、人工智能的法律環境。此外,它還敲定了一個指導委員會的框架,該委員會將監督該戰略的實施和監測。 資金(2020年12月兌換率):截至2021年,1000萬歐元(1200萬美元) 最新情況:愛沙尼亞政府于2019年5月發布了人工智能工作組的最新情況。俄羅斯人工智能戰略:國家人工智能發展戰略負責組織:數字發展、通信和大眾媒體部;俄羅斯聯邦政府要點:俄羅斯人工智能戰略高度重視國家利益,為2017年至2030年“信息社會”的發展制定了指導方針。其中包括國家技術舉措、聯邦執行機構的部門項目以及俄羅斯聯邦數字經濟等項目,旨在推動跨部門實施的人工智能框架。資金:N/A最新進展:2020年12月,俄羅斯總統普京

327、參加了人工智能之旅會議,提出了人工智能政策的四個想法:建立人工智能使用的實驗性法律框架,制定引入人工智能算法的實際措施,為神經網絡開發者提供有競爭力的大數據獲取渠道,以及促進國內人工智能產業的私人投資。新加坡 人工智能戰略:國家人工智能戰略 負責組織:智能國家和數字政府辦公室(SNDGO) 要點:由新加坡智慧國家(Smart Nation Singapore)發起,這是一個致力于轉變新加坡經濟并開創新的數字時代的政府機構。該戰略確定了以下五個領域的國家人工智能項目:交通和物流、智慧城市和房地產、醫療保健、教育以及安全保障。 資金(2020年12月兌換率):雖然2019年戰略沒有提到資金,但20

328、17年,新加坡政府啟動了國家計劃AI Singapore,承諾在五年內投資1.5億新元(1.13億美元)。 最新進展:2020年11月,SNDGO發布了關于新加坡政府數據保護工作的首次年度更新。它描述了迄今為止為加強公共部門數據安全和保護公民私人數據而采取的措施。7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略目錄160第7章章節預覽人工智能指數2021年度報告2019 (續)美國 人工智能戰略:美國人工智能舉措 責任組織:白宮 要點:美國人工智能舉措優先考慮聯邦政府對人工智能研發的投資需求,減少獲得聯邦資源的障礙,確保人工智能技術安全開發、測試和部署的技術標準。白宮還強調發展一支具

329、備人工智能能力的員工隊伍,并表示致力于與外國合作伙伴合作,同時提升美國在人工智能領域的領導地位。然而,這項計劃仍缺乏關于計劃時間表的細節、是否有更多的研究將致力于人工智能開發以及其他執行起來會面臨的實際細節問題的考慮。 資金:N/A 最新進展:美國政府于2020年2月發布了第一年年度報告,隨后于11月發布了第一份針對聯邦機構的指導備忘錄,內容涉及監管私營機構的人工智能應用,具體包括鼓勵人工智能創新和發展以及增加公眾對人工智能技術的信任和信心的原則。2021財年的國防授權法案(The National Defense Authorization Act,NDAA)要求制定一項國家人工智能計劃,以

330、協調聯邦政府的人工智能研究和政策。韓國 人工智能戰略:國家人工智能戰略 負責組織:科學、信息通信技術部和未來規劃部(MSIP) 要點:韓國人工智能戰略要求制定計劃以促進企業使用人工智能,精簡規章制度,為人工智能和其他新興產業的開發和使用創造更有利的環境。韓國政府還計劃利用其在全球內存芯片供應方面的優勢,在2030年前制造下一代智能芯片。 資金(2020年12月兌換率):2.2萬億韓元(20億美元) 最新進展:N/A其它哥倫比亞:數字轉型和人工智能國家政策捷克共和國:捷克共和國國家人工智能戰略立陶宛:立陶宛人工智能戰略:未來展望盧森堡:人工智能:盧森堡的戰略愿景馬耳他:馬耳他:終極AI啟動臺荷蘭

331、:人工智能戰略行動計劃葡萄牙:AI葡萄牙2030卡塔爾:卡塔爾國家人工智能7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略目錄161第7章章節預覽人工智能指數2021年度報告已發布的戰略2020印度尼西亞 人工智能戰略:國家人工智能發展戰略(Stranas KA) 負責組織:研究與技術部(Menristek)、國家研究與創新局(BRIN)、技術評估與應用局(BPPT) 戰略要點:印尼的人工智能戰略旨在指導該國在2020年至2045年期間開發人工智能。它的重點是教育和研究、衛生服務、糧食安全、交通、智慧城市和公共部門改革。 資金:N/A 最新進展:無沙特阿拉伯 人工智能戰略:國家數據和

332、人工智能戰略(NSDAI) 負責組織:沙特數據和人工智能局(SDIA) 要點:作為國家經濟多樣化努力的一部分,NSDAI致力于在五個關鍵領域加快人工智能的發展:醫療、交通、教育、政府和能源。到2030年,沙特阿拉伯計劃培訓20000名數據和人工智能專家,吸引200億美元的國內外投資,并創造一個吸引至少300家人工智能和數據初創企業的環境。 資金:N/A 最新進展:在沙特政府發布該戰略峰會期間,沙特國家人工智能中心(NCAI)與中國華為和阿里云簽署了合作協議,將共同設計與人工智能相關的阿拉伯語系統。其它匈牙利:匈牙利人工智能戰略挪威:人工智能國家戰略塞爾維亞:塞爾維亞共和國2020-2025年人

333、工智能發展戰略西班牙:國家人工智能戰略7.1國家和地區人工智能戰略第7章:人工智能政策和國家戰略目錄162第7章章節預覽人工智能指數2021年度報告發展中戰略(截至2020年12月) 公共咨詢戰略巴西 人工智能戰略草案:巴西人工智能戰略 負責組織:科學、技術和創新部(MCTI) 要點:巴西國家人工智能戰略宣布于2019年啟動,目前仍處于公眾咨詢階段。經合組織稱,該戰略旨在覆蓋與人工智能有關的主題,包括人工智能對經濟、倫理、發展、教育和就業的影響,并協調解決這些問題的具體公共政策。 資金:N/A 最新進展:2020年10月,與IBM、圣保羅大學和圣保羅研究基金會合作啟動了該國最大的人工智能研究設施。意大利 人工智能戰略草案:意大利人工智能戰略方案 負責組織:經濟發展部(MISE) 要點:本方案提供了人工智能可持續發展的擬議戰略,旨在提高意大利人工智能的競爭力。它專注于提高基于人工智能的技能和

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(斯坦福大學:人工智能指數2021年度報告(221頁).pdf)為本站 (滄海一笑) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站