《2017年人工智能中的連接主義.pdf》由會員分享,可在線閱讀,更多相關《2017年人工智能中的連接主義.pdf(64頁珍藏版)》請在三個皮匠報告上搜索。
1、人工智能中的連接主義 人工智能中的連接主義 清華大學智能技術與系統國家重點實驗室 清華信息科學與技術國家實驗室(籌)清華大學計算機科學與技術系 2017.12.08 北京 2017 ArchSummit全球架構師峰會 2017 ArchSummit全球架構師峰會 提綱 OUTLINES 1 1、AI AI的本質的本質 2 2、連接主義的深度神經網絡取得突破性進展連接主義的深度神經網絡取得突破性進展 3 3、深度強化學習深度強化學習:連接主義與行為主義的結合連接主義與行為主義的結合 4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AI AI的未來的未來 提綱 OUTLINES 1 1
2、、AI AI的本質的本質 2 2、連接主義的深度神經網絡取得突破性進展連接主義的深度神經網絡取得突破性進展 3 3、深度強化學習深度強化學習:連接主義與行為主義的結合連接主義與行為主義的結合 4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AI AI的未來的未來 連接主義 連接主義 1、AI的本質 的本質 行為主義 行為主義 1、AI的本質 的本質 符號主義 符號主義 1、AI的本質 的本質 提綱 OUTLINES 1 1、AI AI的本質的本質 2 2、連接主義的深度神經網絡取得突破性進展連接主義的深度神經網絡取得突破性進展 3 3、深度強化學習深度強化學習:連接主義與行為主義的
3、結合連接主義與行為主義的結合 4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AI AI的未來的未來 弱人工智能弱人工智能:深度卷積神經網絡深度卷積神經網絡+深度強化學習 深度強化學習 2、連接主義的深度神經網絡取得突破性進展 連接主義的深度神經網絡取得突破性進展 Google Google WaymoWaymo 將激光雷達的成本削減了將激光雷達的成本削減了90%90%以上以上,20172017年年1010月已在月已在美國鳳凰城美國鳳凰城Chandler Chandler 鎮鎮100100平方英里范圍內平方英里范圍內,對對500500輛克萊斯勒插電式輛克萊斯勒插電式混合動力混合動力
4、L4L4自動駕駛汽車進行社會公測自動駕駛汽車進行社會公測,這是這是WaymoWaymo自動駕駛商業化自動駕駛商業化落地的前奏落地的前奏,首次實現了無駕駛員的公測無人駕駛出租車首次實現了無駕駛員的公測無人駕駛出租車。人工智能自動駕駛人工智能自動駕駛 無安全駕駛員了無安全駕駛員了!特斯拉特斯拉Autopilot 2.0Autopilot 2.0:目前特斯拉的量產車上均已安裝目前特斯拉的量產車上均已安裝Autopilot 1.0Autopilot 1.0或或2.02.0硬件系統硬件系統,其其自動駕駛功能自動駕駛功能,可通過可通過OTAOTA(空中下載(空中下載)進行從進行從L2L2到到L4+L4+的
5、軟件的軟件升級升級;20172017年年底之前以完全自動駕駛模式從洛杉磯開往紐約年年底之前以完全自動駕駛模式從洛杉磯開往紐約 人工智能自動駕駛人工智能自動駕駛 大范圍無人駕駛出租車試運行大范圍無人駕駛出租車試運行:UberUber 2016 2016年年9 9月月1414日日在美國匹茲堡市在美國匹茲堡市推出城區大范圍無人駕駛推出城區大范圍無人駕駛 出租車免費載客服務并試運行出租車免費載客服務并試運行;先期已測試近先期已測試近2 2年年 人工智能自動駕駛人工智能自動駕駛 20212021年年無人駕駛汽車的產業元年無人駕駛汽車的產業元年:Google Google WaymoWaymo、沃爾沃沃爾
6、沃、福特福特、寶馬寶馬、百度百度、英特爾等全球近英特爾等全球近2020家企業均已宣稱家企業均已宣稱,4 4年后的年后的20212021年前后將會是無人駕駛汽車的年前后將會是無人駕駛汽車的產業元年產業元年,部分部分SAE L4SAE L4將實現量產將實現量產。人工智能自動駕駛人工智能自動駕駛 ILSVRC?人工智能視覺物體識別人工智能視覺物體識別 Very Deep Learning 極深度學習極深度學習/1202/1202層層 15M Images 22k Categories?ImageNet ILSVRC 1,000?Deep CNN?AlexNet(Krizhevski et al.,2
7、012)15.3%top-5 error OverFeat(Sermanet et al.,2013)13.8%VGG Net(Simonyan et al.,2014)7.3%GoogLeNet(Szegedy et al.,2014)6.6%Human(Russakovsky et al.,2014)5.1%Feb 6,2015,Microsoft 4.94%Feb 11,2015,Google 4.82%Dec 11,2015,Google 3.58%Dec 10,2015,Microsoft 3.57%Feb 23,2016,Google 3.08%Sep 26,2016,Trimps
8、-Soushen 2.99%April 2017,Qihoo 360 2.77%?LFW?人工智能人臉識別人工智能人臉識別 20172017年年 1.1.閱面科技閱面科技 ReadSenseReadSense 99.82%99.82%;2.2.平安平安PingAnPingAn AI AI Lab 99.80%Lab 99.80%;3.3.騰訊騰訊YouTuYouTu Lab 99.80%Lab 99.80%刷臉支付刷臉支付/刷臉閘機刷臉閘機 1?6?“?”?3:2?人工智能人臉識別人工智能人臉識別 谷歌谷歌Clips AIClips AI相機相機 2017?10?5?Google Clips?
9、/?人工智能相機人工智能相機 阿里無人超市“淘咖啡阿里無人超市“淘咖啡”人工智能無人零售店人工智能無人零售店?DCNN?R-CNN(CVPR-2014)Fast R-CNN(ICCV-2015)Faster R-CNN (NIPS-2015)YOLO(CVPR-2016)SSD(ECCV-2016)R-FCN(NIPS-2016)人工智能物體檢測人工智能物體檢測?FCN?/?人工智能語義分割人工智能語義分割?人工智能風格抽取人工智能風格抽取 12?DeepMind?LipNet?GRID?95.2%?BBC?46.8%?12.4%?71%?80%?人工智能唇讀人工智能唇讀 Y.M.Assael
10、,et al.:LipNet:Eend-to-End Sentence-Level Lipreading,arXiv:1611.01599v2 16 Dec 2016.Apple:Siri Amazon:Alexa Microsoft:Cortana Google:Google Now Viv Labs:Viv 百度百度:度秘 度秘 AIAI虛擬助手 虛擬助手 Microsoft:小冰小冰/Tay Facebook:Messenger IBM&GIT:Jill Watson助教各助教各種種Android聊天機器人聊天機器人 AIAI聊天機器人 聊天機器人 目前的社交新媒體和互動平臺中目前的社交
11、新媒體和互動平臺中,AIAI虛擬虛擬助手和助手和AIAI聊天機器人聊天機器人,正在崛起正在崛起,推動人推動人機自然交互商業落地機自然交互商業落地 人工智能語音助理人工智能語音助理&聊天 聊天 亞馬遜亞馬遜EchoEcho 谷歌谷歌HomeHome 蘋果蘋果HomepodHomepod 百度百度DuerOSDuerOS 亞馬遜于亞馬遜于20142014年推年推出的智能音箱出的智能音箱EchoEcho,基于語音助手基于語音助手AlexaAlexa實現音樂播放實現音樂播放、新新聞搜索聞搜索、網購下單網購下單、UberUber叫車叫車、外賣預外賣預定等服務定等服務,成為行成為行業標桿 業標桿 人工智能
12、音箱人工智能音箱?9?19?DeepMind?WaveNet?人工智能語音合成人工智能語音合成 A.Oord,et al.,WaveNet:A Generative Model for Raw Audio,arXiv:1609.03499v2,19 Sep 2016.10?17?5.9%?WER?/?/?人工智能速記人工智能速記&語音輸入 語音輸入 W.Xiong,et al.,Achieving Human Parity in Conversational Speech Recognition,arXiv:1610.05256v1,17 Oct 2016.9?27?Google?GNMT?-
13、?87%?-?58%?-?60%?人工智能翻譯 人工智能翻譯 Y.Wu,et al.,Googles Neural Machine Translation System:Bridging the Gap between Human and Machine Translation,arXiv:1609.08144v2,8 Oct 2016.2017?10?5?Google?無線耳塞無線耳塞Pixel Buds?Google Pixel Buds?Google Pixel 2?40?“AI+?+?”人工智能翻譯 人工智能翻譯 5?8?Facebook?FAIR?Google?GNMT?9?人工智能
14、翻譯 人工智能翻譯 J.Gehring,M.Auli,D.Grangier,D.Yarats,and Y.N.Dauphin,Convolutional Sequence to Sequence Learning,arXiv:1705.03122v2 cs.CL 12 May 2017.Goodfellow(2014)?GAN?2016?人工智能對抗訓練人工智能對抗訓練 Ian Goodfellow,NIPS 2016 Tutorial:Generative Adversarial Networks,arXiv:1701.00160v3,9 Jan 2017 (57 pages).GAN?人工
15、智能制造人工智能制造 人工智能已成為自動駕駛汽車商業落地的關鍵人工智能已成為自動駕駛汽車商業落地的關鍵;視覺物體識別視覺物體識別、人臉識別人臉識別,唇語識別等在許多唇語識別等在許多國際公開評測中國際公開評測中,達到或超過人類的水平達到或超過人類的水平;速記等語音識別已可媲美人類速記等語音識別已可媲美人類;包括神經機器翻譯在內的自然語言處理包括神經機器翻譯在內的自然語言處理,性能性能也得到大幅度提升也得到大幅度提升,并已開始產品商業落地并已開始產品商業落地 提綱 OUTLINES 1 1、AI AI的本質的本質 2 2、連接主義的深度神經網絡取得突破性進展連接主義的深度神經網絡取得突破性進展 3
16、 3、深度強化學習深度強化學習:連接主義與行為主義的結合連接主義與行為主義的結合 4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AI AI的未來的未來 3 3、深度強化學習深度強化學習:連接主義與行為主義的結合 連接主義與行為主義的結合 學習算法學習算法:監督學習監督學習/Supervised Learning 強化強化學習學習/Reinforcement Learning 無監督學習無監督學習/Unsupervised Learning 強化學習也稱強化學習也稱再勵學習再勵學習,是一種模擬人類和動物是一種模擬人類和動物行為學習的延遲回報學習(基于獎勵或懲罰)行為學習的延遲回報學
17、習(基于獎勵或懲罰);學學習效率介于監督學習與無監督學習之間習效率介于監督學習與無監督學習之間。3 3、深度強化學習深度強化學習:連接主義與行為主義的結合 連接主義與行為主義的結合 強化學習的基本原理強化學習的基本原理 3 3、深度強化學習深度強化學習:連接主義與行為主義的結合 連接主義與行為主義的結合 Deep CNN+強化學習強化學習:應用于神經動態規劃應用于神經動態規劃(Neuro-dynamic programming)決策問題決策問題中中,取得了以取得了以AlphaGo為為代表的里程碑式的勝利代表的里程碑式的勝利 深深度強化學習與度強化學習與MDP 強化學習強化學習:20172017
18、年全球十大突破性年全球十大突破性技術之首技術之首!-MIT技術評論技術評論 3 3、深度強化學習深度強化學習:連接主義與行為主義的結合 連接主義與行為主義的結合 5:0?2015.10 3:0?2017.5 4:1?2016.3“?”?AlphaGo?60:0?2017.1 5?9?4?深度強化學習深度強化學習?3?9-15?AlphaGo Lee?4:1?深度強化學習深度強化學習 AlphaGoAlphaGo Lee Lee 12?29?-2017?1?4?Master?AlphaGo?30?60?0?1?AlphaGoAlphaGo Master Master 1919 1919 用于獲得
19、圍棋最優策略用于獲得圍棋最優策略 搜索空間搜索空間:寬度寬度250,250,深度深度150150 主要涉及如下三個關鍵技術主要涉及如下三個關鍵技術:-策略網絡策略網絡:輸出每步落子獲勝的條件概率分布輸出每步落子獲勝的條件概率分布(局部)(局部),消減搜索的寬度消減搜索的寬度 -價值網絡價值網絡:輸出對任意棋局獲勝的全局“棋輸出對任意棋局獲勝的全局“棋感感”評分評分,消減搜索的深度消減搜索的深度 -蒙特卡洛樹搜索蒙特卡洛樹搜索:輸出下一步最優落子 輸出下一步最優落子 AlphaGo?深度強化學習深度強化學習:探索認知智能的曙光探索認知智能的曙光 網絡結構網絡結構:-深度策略網絡深度策略網絡:13
20、-layer DCNN 13-layer DCNN/SL Policy SL Policy Network,RL Policy Network Network,RL Policy Network -深度價值網絡深度價值網絡:13-layer DCNN 13-layer DCNN -蒙特卡洛樹搜索蒙特卡洛樹搜索:傳統方法 暴力法暴力法:搜索空搜索空間巨大間巨大;對棋局和落子的對棋局和落子的獲勝評估困難獲勝評估困難 深度強化學習深度強化學習:探索認知智能的曙光探索認知智能的曙光 如何進行學習如何進行學習?深度監督學習深度監督學習+深度強化學習深度強化學習+大數據大數據+TPU+TPU 深度監督學習
21、:深度監督學習:人類職業圍棋高手棋譜(監督策略網絡人類職業圍棋高手棋譜(監督策略網絡,價值網絡價值網絡)/人類專家棋譜人類專家棋譜,最高最高57%57%預測成功率預測成功率 深度強化學習:深度強化學習:機器自弈(機器自弈(self-playself-play)(強化策略網絡強化策略網絡,價價值網絡值網絡)大數據:大數據:3,0003,000萬棋局(萬棋局(positionspositions)(KGSKGS圍棋服務器圍棋服務器6-96-9段段)利用其中的利用其中的100100萬進行測試萬進行測試 深度強化學習深度強化學習:探索認知智能的曙光探索認知智能的曙光 Nature 550,pp.354
22、359(19 October 2017)DOI:doi:10.1038/nature24270.AlphaGoAlphaGo Zero Zero 無師自通的圍棋無師自通的圍棋AI AI 深耕深度強化學習深耕深度強化學習 0 0天:天:AlphaGo Zero沒有利用圍棋的歷史棋譜沒有利用圍棋的歷史棋譜,僅輸入了基僅輸入了基 本的規則 本的規則 3 3天:天:AlphaGo Zero超過了超過了AlphaGo Lee 2121天天:AlphaGo Zero達到了達到了AlphaGo Master 4040天天:AlphaGo Zero超過了所有的超過了所有的AlphaGo版本版本,完全依賴完全依
23、賴 自弈自弈,沒有人的干預沒有人的干預,也未使用任何歷史棋譜數據 也未使用任何歷史棋譜數據 ResNet80 深耕深度強化學習深耕深度強化學習 arXiv:1712.01815v1 cs.AI 5 Dec 2017 AlphaZeroAlphaZero 無師自通的通用棋類無師自通的通用棋類AI AI StockfishStockfish:2016 2016 年年 Top Chess Engine Top Chess Engine Championship(TCEC)Championship(TCEC)世界冠軍程序世界冠軍程序 ElmoElmo:20172017年年Computer Comput
24、er ShogiShogi Association(CSA)Association(CSA)世界冠軍程序 世界冠軍程序 1111萬次訓練萬次訓練,不到不到2 2小時小時,擊敗擊敗Elmo Elmo 3030萬次訓練萬次訓練,4 4小時小時,擊敗擊敗Stockfish Stockfish 16.516.5萬次訓練萬次訓練,8 8小時小時,擊敗擊敗AlphaGoAlphaGo Lee Lee 深耕深度強化學習深耕深度強化學習 0 0天:天:AlphaZero沒有沒有利用任何歷史棋譜利用任何歷史棋譜,僅僅輸入了基本的棋類規則 輸入了基本的棋類規則 3 3天:天:AlphaZero打敗打敗了超人類水平
25、的國際象了超人類水平的國際象棋程序(棋程序(Stockfish)、日本將棋程序(日本將棋程序(Elmo)和圍棋和圍棋AI程序(程序(AlphaGo Zero)5,000 5,000 個個TPU1 TPU1:推演自弈的棋類推演自弈的棋類 64 64 個個 TPU2TPU2:訓練神經網絡 訓練神經網絡 深耕深度強化學習深耕深度強化學習?深耕深度強化學習深耕深度強化學習 2017?1?DeepStack?M.Moravcik,et al.,DeepStack:Expert-Level Artificial Intelligence in No-Limit Poker,arXiv:1701.01724
26、v2 cs.AI 10 Jan 2017.人工智能撲克 人工智能撲克 開辟深度強化學習新戰場開辟深度強化學習新戰場 AlphaGo?DQN 人工智能游戲玩家 人工智能游戲玩家?Nature,Feb.26,2015?Mnih,et al.,“Human-level control through deep reinforcement learning”,Nature,vol.518,pp.529-533,26 Feb.2015.深度深度Q-Q-網絡網絡/DQN 49種種Atari像素游戲像素游戲中中,29種達到乃至種達到乃至超過人類職業選手超過人類職業選手的水平 的水平 開辟深度強化學習新戰場開
27、辟深度強化學習新戰場 AlphaGo?DeepMind?“?2”人工智能游戲玩家 人工智能游戲玩家 開辟深度強化學習新戰場開辟深度強化學習新戰場 AlphaGo?人工智能自動駕駛 人工智能自動駕駛 開辟深度強化學習新戰場開辟深度強化學習新戰場 AlphaGoAlphaGo投顧投顧 AlphaGo?人工智能金融 人工智能金融 開辟深度強化學習新戰場開辟深度強化學習新戰場 AlphaGo?人工智能醫療 人工智能醫療 開辟深度強化學習新戰場開辟深度強化學習新戰場?開辟深度強化學習新戰場開辟深度強化學習新戰場 提綱 OUTLINES 1 1、AI AI的本質的本質 2 2、連接主義的深度神經網絡取得突
28、破性進展連接主義的深度神經網絡取得突破性進展 3 3、深度強化學習深度強化學習:連接主義與行為主義的結合連接主義與行為主義的結合 4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AI AI的未來的未來 以以大數據驅動的大數據驅動的Deep CNN為代表的感知智為代表的感知智能的成功能的成功(“舉三反一“舉三反一”),使機器在垂直細使機器在垂直細分領域初步獲得了媲美人類水平(分領域初步獲得了媲美人類水平(human level)的“模式的“模式”識別能力識別能力,這必將成為這必將成為認知智能發展的基石認知智能發展的基石。在新的起點上在新的起點上,進行“舉一反三進行“舉一反三”的認知智
29、能前沿研究的認知智能前沿研究 4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AIAI的未來 的未來 認知智能認知智能,即對人類深思熟慮行為即對人類深思熟慮行為 的模擬的模擬,包括記憶包括記憶、常識常識、知識學習知識學習、推理推理、規劃規劃、決策決策、意圖意圖、動機與思考動機與思考等高級智能行為等高級智能行為 現狀現狀:追求追求看清看清、聽清聽清,有識別無理解有識別無理解 未來未來:要要看懂看懂、聽懂聽懂、讀懂讀懂!邁向認知智能和通用人工智能邁向認知智能和通用人工智能?pre-training?Hinton?(2015)?Knowledge distilling?CNN?CNN?K
30、nowledge Transfer?Hinton,G.,Vinyals,O.,Dean,J.:Distilling the knowledge in a neural network.arXiv:1503.02531(2015).獲得舉一反三能力獲得舉一反三能力 從特征學習到規則學習從特征學習到規則學習 具有認知推理的半監督具有認知推理的半監督/無監督學習 無監督學習 深度無監督學習是深度無監督學習是AIAI的“黑科技的“黑科技”-動物與人類習得的大部分知識都來自于無監督動物與人類習得的大部分知識都來自于無監督學習(先有無監督學習(先有無監督,監督是語義水平的)監督是語義水平的);-通過預測性
31、的無監督學習來構建并通過預測性的無監督學習來構建并 推斷世界推斷世界,獲得“印象”獲得“印象”;-進一步降低對大數據的依賴 進一步降低對大數據的依賴“特征提取特征提取+推理推理”的小樣本學習的小樣本學習 獲得舉一反三能力獲得舉一反三能力 從特征學習到規則學習從特征學習到規則學習 具有認知推理的半監督具有認知推理的半監督/無監督學習 無監督學習 將深度學習獲得的將深度學習獲得的特征或概念抽象特征或概念抽象,想象或與知想象或與知識圖譜結合識圖譜結合,同時整合同時整合記憶記憶、注意力注意力、常識常識、推理推理、規劃與意圖等規劃與意圖等,以獲得以獲得多任務學習能力多任務學習能力。例如例如,LSTM L
32、STM(HochreiterHochreiter,19971997););記憶神經網絡記憶神經網絡MNMN(Weston Weston etet al al.,20142014);堆疊增強遞歸神經網絡(堆疊增強遞歸神經網絡(JoulinJoulin et alet al.,2014)2014);NTMNTM(DeepMindDeepMind,2014)2014);堆疊的堆疊的What-WhereWhat-Where自動編碼器(自動編碼器(Zhao Zhao et alet al.,.,2016 2016),獲得多任務學習能力獲得多任務學習能力 從特征學習到規則學習從特征學習到規則學習 邁向通用
33、人工智能 邁向通用人工智能 概念抽象概念抽象:以嵌入結構的方式表達世界以嵌入結構的方式表達世界 認知向量認知向量:概念向量概念向量通過時空遞歸通過時空遞歸學習學習,獲得知獲得知識或認知的表達識或認知的表達 推理推理/規劃規劃:對上述遞歸過程的應用對上述遞歸過程的應用 例如例如,對自動問答系統等對自動問答系統等,就可將之視為想法就可將之視為想法/認知向量之間進行檢索認知向量之間進行檢索比較比較(深度檢索模型(深度檢索模型);而對推理而對推理、規劃規劃、機器翻譯機器翻譯、語言與語境語言與語境理解理解、對話系統對話系統,就可考慮為想法就可考慮為想法/認知向量的生成認知向量的生成、組合與變換組合與變換
34、 (深度生成模型深度生成模型)。獲得多任務學習能力獲得多任務學習能力 從特征學習到規則學習從特征學習到規則學習 邁向通用人工智能 邁向通用人工智能?4 4、與符號主義的重新融合代表了與符號主義的重新融合代表了AIAI的未來 的未來 作為一種感知智能模型作為一種感知智能模型,連接主義的連接主義的深度卷積神經網深度卷積神經網絡絡迄今最好地模擬了生物視覺通路迄今最好地模擬了生物視覺通路,在完備大數據與超強在完備大數據與超強計算硬件的強力支撐下計算硬件的強力支撐下,通過多層特征的自動提取等通過多層特征的自動提取等,已在已在計算機視覺計算機視覺、語音識別語音識別、自然語言處理自然語言處理、自動駕駛自動駕駛、大數據大數據處理等諸多方面處理等諸多方面,接近接近、達到甚至超過人類水平達到甚至超過人類水平。以以AlphaZero為代表的為代表的深度強化學習深度強化學習,將連接主義與行將連接主義與行為主義結合為主義結合,已具有超人類水平的博弈類決策能力已具有超人類水平的博弈類決策能力,為決策為決策類認知智能的探索帶來了新的曙光類認知智能的探索帶來了新的曙光。與與符號主義結合符號主義結合的面向小數據具有“舉一反三的面向小數據具有“舉一反三”推理能推理能力的力的認知智能與通用人工智能認知智能與通用人工智能,仍有待探索與突破仍有待探索與突破。謝謝謝謝!