《鄭志彤-下一代人工智能:邏輯理解?物理理解?(GOTC上海會場)(38頁).pdf》由會員分享,可在線閱讀,更多相關《鄭志彤-下一代人工智能:邏輯理解?物理理解?(GOTC上海會場)(38頁).pdf(38頁珍藏版)》請在三個皮匠報告上搜索。
1、1下一代人工智能:下一代人工智能:邏輯理解?物理理解?邏輯理解?物理理解?姓名:鄭志彤(Liam Zheng)2目錄目錄1.1.當前人工智能的瓶頸當前人工智能的瓶頸2.2.關于下一代人工智能的各家觀點關于下一代人工智能的各家觀點3.3.人類智能的分析以及對應人工智能領域的發展人類智能的分析以及對應人工智能領域的發展4.4.下一代人工智能的核心是邏輯理解和物理理解下一代人工智能的核心是邏輯理解和物理理解31.1.當前人工智能的瓶頸當前人工智能的瓶頸1.1 魯棒性差1.2 BP缺失1.3 需標定訓練數據量過大1.4 多任務學習欠缺1.5 持續學習欠缺1.6 解釋性欠缺1.7 小結41.1 魯棒性差
2、圖像識別攻擊51.1 魯棒性差語音識別攻擊61.1 魯棒性差NLP攻擊-GPT271.1 魯棒性差遷移性差81.2 BP缺失 單次訓練成本高單次訓練成本高標準前傳與反傳的計算流程,其中紫色點表示計算結果需要保存在標準前傳與反傳的計算流程,其中紫色點表示計算結果需要保存在內存內存中。中。91.2 BP缺失層間分工不明晰101.3 需標定訓練數據量過大 監督訓練過于主導語音識別訓練需要11940小時訓練,如果一個人每天讀兩個小時的其中的文本,需要16年才能讀完一遍。AlphaGo zero自我對弈490萬盤圍棋,才能達到頂尖水平,如果一個人花30年的時間,每天必須下450盤??磮D說話的訓練,如果一
3、個人一天看100張圖片文本對,需要274年才能看完一遍。沒有充分利用海量未標定數據人類學習常常是反復觀察一部分未標定數據,自動抽取關鍵特征并聚類,只需要極少量的標定和糾錯,迭代幾次,就訓練完畢。111.4 多任務學習欠缺 CV本身的multitask learning沒做好;NLP本身的multitask learning也沒做好;robot control的multitask learning更沒做好。CV+NLP+robot control的multitask learning 基本沒做。人類的小孩從出生就開始做multitask learning。121.5 持續學習欠缺 持續學習(co
4、ntinual learning)對于人類很普通,絕大大部分情況下,隨著數據的增加,模型會越學越好。目前的深度模型不能很好的做持續學習,即增量學習,很可能和BP有直接的關系,也可能和突觸抽象相關。131.6 解釋性欠缺 相對于傳統的決策樹、causal inference、符號系統,目前的BP深度學習模型基本無法解釋,無法定位推理故障。人類的模型常常是理論和實驗循環迭代,可以快速定位理論的錯誤。141.7 小結 訓練成本高:遷移能力差,一個場景一個模型;標定數據量大。不能快速定位模型錯誤位置:BP、可解釋性差。不抗攻擊:微小擾動導致結果大幅偏離。海量無標定數據利用不足。海量任務間的聯系利用不足
5、。參數固定,不能自動持續學習,不能自動持續優化。152.2.關于下一代人工智能的各家觀點關于下一代人工智能的各家觀點2.1 Geoffrey E.Hinton2.2 Yann LeCun2.3 Yoshua Bengio2.4 朱松純2.5 國內名家觀點2.6 小結162.1 Geoffrey E.Hinton 針對卷積網絡丟失位置信息的缺點提出膠囊網絡。下一代人工智能要徹底解決整體和部分、三維視角equivariant、不同維度差異顯式抽取。下一代人工智能要替換BP。172.2 Yann LeCun 下一代人工智能主要依靠自監督學習,實現路徑是對比學習。182.3 Yoshua Bengio
6、 當前人工智能是System1:快速、直覺、無意識、非語言、習慣性。下一代人工智能是System2:慢、邏輯、序列、有意識、語言、算法、規劃、推理。下一代人工智能重要路徑是注意力機制(ATTENTION)、稀疏因子圖(SPARSE FACTOR GRAPH)、元學習(META-LEARNING,從IID到OOD,提升泛化能力)。192.4 朱松純 當前人工智能是鸚鵡范式,鸚鵡經訓練可以與人類對話,但是不理解你在說什么;下一代人工智能是烏鴉范式,烏鴉找到核桃之后,會把核桃扔在路上,讓車去壓,壓碎了再吃。但是因為路上車太多,烏鴉吃不到核桃,于是烏鴉把核桃扔到斑馬線上,因為這里有紅綠燈,紅燈亮時車都
7、停住了,它就可以去吃;下一代人工智能重要路徑是Spatial And-Or Graph。202.5 國內名家觀點 黃民烈:當前的對話系統面臨三個問題,第一個是語義性的問題,第二個是一致性的問題,第三個是交互性的問題。下一代對話系統是有知識、有個性和有情感的對話系統。實現路徑是知識圖譜、情感計算和風格轉換。張岳:當前的開放領域對話系統面臨四個問題,一是跨領域可拓展性差,二是社會常識推理差,三是在閱讀理解上邏輯推理基本沒有,四是在文本蘊涵上邏輯推理很差。下一代對話系統要有邏輯可拓展有常識。212.6 小結 從invariant到equivariant,從convNet到capsuleNet?;趯?/p>
8、比學習的自監督學習。通向system2的技術路線:注意力機制+稀疏因子圖+元學習。Spatial And-Or Graph:對圖片做物理理解。下一代對話系統要有情感、知識、個性。下一代對話系統要有邏輯。223.3.人類智能的分析以及對應人工智能領域的發展人類智能的分析以及對應人工智能領域的發展3.1 人類智能的8個領域3.2 當前人工智能對應人類智能的領域發展狀況3.3 小結233.1 人類智能的8個領域人類智能的多樣性人類智能的多樣性 有的人善于運動但數理能力很差 有的人善于畫畫但不會數數 有的人擅長數理思維但運動不協調 有的人是音樂家但不會數數243.1 人類智能的8個領域確定人類智能的八
9、個標準確定人類智能的八個標準 腦損傷后喪失對應的智能 在進化史上有明顯的階段 存在核心操作集合 可以符號化表達 有明顯的發展過程 存在這方面的專才、天才和其它杰出人才 能夠通過實驗心理學驗證 能夠獲得心理測量報告支持253.1 人類智能的8個領域 音樂節律(音樂節律(musical-rhythmicmusical-rhythmic)智商)智商這種智商與對聲音、節奏、音調和音樂的敏感度有關。高音樂智商的人通常有很好的音高,甚至有絕對音高,能夠唱歌、演奏樂器和作曲。他們對節奏、音調、節拍、音調、旋律或音色都很敏感。他們適于做重復性的周期性強的工作,比如駕駛員、操作員等。視覺空間(視覺空間(visu
10、al-spatialvisual-spatial)智商)智商 這一智商涉及空間判斷和用頭腦的眼睛進行可視化的能力??臻g能力是通常IQ測試中的三個因素之一,包括三維結構重建、方向感知、場景記憶等。263.1 人類智能的8個領域 口頭和書面的語言(口頭和書面的語言(verbal-linguistic verbal-linguistic)智商)智商語言智商高的人表現出一種語言和文字的能力。他們通常擅長閱讀、寫作、講故事、記單詞和日期。語言能力是最重要的IQ測試能力之一。有不同層次的語言:自然語言、程序語言、數學語言;自然語言是思維的載體,但常常有歧義性等弊端;程序語言是人與計算機等工具的接口協議,沒
11、有歧義性,有的偏人一些,有的偏機器一些;數學語言是理想的公理體系符號系統,抽象但邏輯無誤。數理邏輯(數理邏輯(logical-mathematicallogical-mathematical)智商)智商這一領域與邏輯、抽象、推理、數字和批判性思維有關。這也與有能力理解某種因果系統的基本原理有關。邏輯推理與IQ測試中的流動性智商密切相關。該智商高的人一般對數字敏感、邏輯深度深,有的善于數理推理,有的善于數理直覺。273.1 人類智能的8個領域 肢體運動(肢體運動(bodily-kinestheticbodily-kinesthetic)智商)智商肢體運動智商的核心要素是控制自己的身體動作和熟練地
12、處理物體的能力,還包括時間感、對身體動作目標的清晰感覺以及訓練反應的能力。肢體運動智力高的人一般應擅長體育、舞蹈和做手工等活動??谡Z發音也是該智商的一種體現。人際(人際(interpersonalinterpersonal)智商)智商理論上,具有高度人際智商的人對他人的情緒、感情、氣質、動機和合作能力敏感,能夠有效地溝通,容易與他人產生共鳴,他們可能是領導者或追隨者。他們善于控制自我情緒,經常喜歡討論和辯論。群體也有該智商,反映群體的緊密型,以及決定最大組織人群數,比如智人在產生拜物教后群體規模大大增加,在和尼安德特人的長期斗爭中勝出。283.1 人類智能的8個領域 自?。ㄗ允。╥ntrape
13、rsonalintrapersonal)智商)智商這一領域與內省和自我反思能力有關,是指對自己有一個深刻的理解:個人的長處或短處是什么,什么使自己獨特,能夠預測自己的反應或情緒等??梢愿鶕嶋H情況更改自己的判斷,對自己過去犯的錯誤能夠認知并改進。自然(自然(naturalisticnaturalistic)智商)智商自然學家、獵人、農民等擅長該能力,是指對動物、植物、巖石和山脈等的區分能力,并且能把它們放到生態系統的高度來處置,達到持續培育、持續獲取的動態平衡的 可持續發展。能從生態系統博弈的終極態考慮問題,從而做出最適應終極態的決策。293.2 當前人工智能對應人類智能的領域發展狀況語言語言
14、智商智商transformertransformerMultimodal Multimodal PretrainPretrain 肢體運動肢體運動智商智商Meta-Meta-reinforcementreinforcement人際人際智商智商multi-agent multi-agent learning?learning?自然自然智商智商Long life Long life learning for learning for the the ecosystem?ecosystem?視覺空間視覺空間智商智商ResnetResnet,RPN,RPN,UnetUnet、Swim-Swim-Tra
15、nsTrans數理邏輯數理邏輯智商智商transformer?transformer?自省自省智商智商s safe afe exploration?exploration?音樂節律音樂節律智商智商transformer?transformer?304.4.下一代人工智能的核心是邏輯理解和物理理解下一代人工智能的核心是邏輯理解和物理理解4.1 當前人工智能瓶頸的本質4.2 邏輯理解和物理理解是否充分提升當前的人工智能4.3 邏輯理解和物理理解的可能線索4.4 小結314.1 當前人工智能瓶頸的本質 機器學習訓練集和測試集是基于IID(獨立同分布)的假設,實際上線后預估的數據常常是OOD(與訓練集
16、分布不同)。IID和OOD都是指表征上的分布,好的表征會有好的OOD效果。雖然深度學習泛化能力比傳統機器學習要好些,但是同樣面臨OOD問題。當樣本空間很大時,訓練集永遠只是整體的微小部分,和總體的分布會有很大差異。在微小訓練集上做簡單的監督學習只會學會訓練樣本的局部模式,因為只靠局部模式表征就可以取得訓練集和測試集的IID效果了,而局部模式表征和局部模式遠遠不能滿足上線后的OOD情況??傊?,OOD是造成當前人工智能魯棒性差的本質原因。324.2 邏輯理解和物理理解是否充分提升當前的人工智能 當數據表征滿足一個因果圖,因果關系、不變性和OOD泛化是等價的。數據表征要反映數據本來的因果關系,也就是
17、反映數據本來的邏輯關系,也就是反映數據本來的物理關系。表征越真實反映數據產生的物理和邏輯過程,表征的OOD泛化就越好。物理關系是層次化的,比如像cv的圖片場景,對應物理含義的層次化表征有助于OOD泛化。表征的多空間注意力機制符合物理局部關聯密切的原理,不僅僅是空域,還有頻域、感知頻域等。有序多目標自監督訓練過程符合局部構建整體的漸進過程??傊?,符合邏輯和物理本來規律的數據表征和訓練過程充分必要的解決OOD泛化問題。334.3 邏輯理解和物理理解的可能線索 表征:表征:微小局部感知-conv注意力機制-transformer-不僅僅是空域?部件整體模型-capsule、Spatial And-O
18、r Graph直連-resnetfeedback-?訓練:訓練:有序分層多目標自監督學習元學習持續學習344.3 邏輯理解和物理理解的可能線索 cvcv表征:表征:微小局部感知-MBconv注意力機制-swim-transformer+conv-MAP部件整體模型-capsule直連-resnetfeedback-?cvcv訓練:訓練:有序分層多目標自監督學習 coav元學習持續學習354.3 邏輯理解和物理理解的可能線索 NLINLI表征:表征:微小局部感知-conv注意力機制-transformer-不僅僅是空域?RoBERTa 邏輯語法模型-?sentence【logic】直連-resn
19、etfeedback-?NLINLI訓練:訓練:有序分層多目標自監督學習 RoBERTa 動態MASK元學習持續學習364.3 邏輯理解和物理理解的可能線索 推薦系統表征:推薦系統表征:微小局部感知-conv(MA)+embedding注意力機制-transformer-時序數據表征部件整體模型-capsule、Spatial And-Or Graph直連-resnetfeedback-?推薦系統推薦系統訓練:訓練:有序分層多目標自監督學習元學習持續學習374.4 小結 人工智能是漫長的、久遠的,遠遠沒有到認知階段,下一代人工智能迫切要解決感知的魯棒性,關鍵在于表征和訓練的邏輯理解和物理理解,而不是超大模型超大數據。373738Thanks