《人工智能行業研究框架:奔赴人工智能的星辰大海-230816(69頁).pdf》由會員分享,可在線閱讀,更多相關《人工智能行業研究框架:奔赴人工智能的星辰大海-230816(69頁).pdf(69頁珍藏版)》請在三個皮匠報告上搜索。
1、奔赴人工智能的星辰大海人工智能研究框架2023年08月16日行業專題研究姓名:李沐華(分析師)郵箱:電話:010-83939797證書編號:S08805190800092誠信 責任 親和 專業 創新人工智能研究框架培訓請參閱附注免責聲明目錄/CONTENTS人工智能旨在利用計算機模擬和執行各領域的智能任務01人工智能發展史:人工智能發展已歷經三次浪潮02算力是人工智能的基礎設施,算法是人工智能的靈魂03人工智能技術的應用前景廣闊04風險提示053誠信 責任 親和 專業 創新人工智能研究框架培訓請參閱附注免責聲明01人工智能旨在利用計算機模擬和執行各領域的智能任務誠信 責任 親和 專業 創新4人
2、工智能研究框架培訓請參閱附注免責聲明從日常生活中可以隨處瞥見人工智能的影子01人工智能在生活中的常見應用:人臉識別考勤系統+APP智能推送人臉識別打卡人臉識別打卡是一種快速、高效的考勤方式,相比傳統的打卡方式,具有以下優勢:1.準確率高:人臉識別技術可以在不同光線、角度、表情等情況下,準確地識別員工的面部信息,避免了手工打卡時出現的誤差和作弊行為。2.安全性強:人臉識別技術通過人臉特征識別,確保只有正式員工才能進行考勤,防止了非法人員的進入和作弊行為。3.便捷性高:人臉識別打卡無需員工攜帶打卡卡片或密碼,只需要站在識別設備前進行識別即可,方便快捷。APP智能推送智能推送是一種機器學習方法,可以
3、識別和預測各種用戶的興趣或偏好,從而有針對性地、及時地向用戶主動推送所需信息,以滿足不同用戶的個性化需求。誠信 責任 親和 專業 創新5人工智能研究框架培訓請參閱附注免責聲明人工智能旨在利用計算機能夠模擬和執行各領域的智能任務01人工智能(Artificial Intelligence,簡稱AI)是一門研究如何使計算機能夠模擬和執行人類智能任務的科學和技術領域。通俗來說就是,先讓計算機進行學習,然后讓計算機預測未知。傳統計算機程序人工智能 根據人類經驗制定規則,讓計算機學習并預測未知 優勢:計算能力和存儲容量遠超人類腦力水平,可以處理海量數據 弊端:現實生活中很多經由人類經驗解決的問題難以制定
4、規則,也就無法轉換成機器語言讓其學習 通過輸入大量資料數據,讓計算機學習算法,總結出模型,之后再輸入相似樣本時,就可以識別結果 優勢:模仿人類經驗學習的過程,無需人為制定規則數據來源:國泰君安證券研究現如今計算機的計算能力已非常強大,信息管理也越來越數據化,積累的資料越來越多,使我們有足夠多的數據可以喂給計算機進行學習。正是這兩個因素的成熟,才使得當下是人工智能爆發的時代。機器學習算法圖1:機器學習等算法和自我迭代是AI區別于傳統計算機能力的主要因素數據來源:國泰君安證券研究自我迭代誠信 責任 親和 專業 創新6人工智能研究框架培訓請參閱附注免責聲明人工智能涵蓋四大主要的功能維度01 人工智能
5、的功能維度從“計算感知認知創造”層層遞進 計算智能指對數據的基礎邏輯計算和統計分析;感知智能指基于視覺、聽覺的信號,對目標進行模式識別與分類;認知智能指實現對信息的認知、理解、推理和決策,并實現人、物、企業等智慧實體的認知與協同;智能創造指利用人工智能技術進行文學、藝術等方面的創造性創作以及工業領域的智能制造。它的出現不僅改變了傳統的創作方式、思維方式和工業模式,也為拓寬人類的能力邊界增添了新的可能性。計算智能感知智能認知智能智能創造圖2:人工智能經歷了四個能力維度的進階數據來源:國泰君安證券研究誠信 責任 親和 專業 創新7人工智能研究框架培訓請參閱附注免責聲明計算智能是人工智能的基礎性功能
6、,賦能產業領域較廣01 人工智能在計算智能領域的實際應用能帶來巨大產業價值 計算智能,通常指基于清晰規則的數值運算,比如數值加減、微積分、矩陣分解等。計算智能得益于計算機存儲與硬件的快速發展,已給互聯網、金融和工業等多個領域帶來產業價值。計算智能也面臨顯著困境。以金融場景為例,計算智能受限于指定的數據邏輯規則,雖計算智能可以高性能地計算股票的統計特征,但無法運用專家知識,也難以進行深度、動態和啟發式的推理,對投資、博弈等業務貢獻的價值有限。計算智能所需的高性能硬件和網絡支持等,也給企業帶來了巨大的成本壓力。圖3:AI在計算智能領域的應用可以賦能各大產業數據來源:國泰君安證券研究誠信 責任 親和
7、 專業 創新8人工智能研究框架培訓請參閱附注免責聲明感知智能開始讓AI具備了模擬人類的感知能力01 人工智能在感知智能領域的實際應用開始涉及到與人類的交互 感知智能,其核心在于模擬人的視覺、聽覺和觸覺等感知能力。感知智能目前用于完成人可以簡單完成的重復度較高的工作,比如人臉識別、語音識別等。感知智能的核心業務目標是提高效率且降低成本。智能交通通過感知交通狀況和行車習慣,智能交通系統可以提高交通效率和安全性智能家居通過感知用戶的行為和需求,智能家居可以自動調整室溫、照明等設備,提高生活的舒適度智能醫療AI感知設計可以幫助醫療設備更好地理解患者的病情,從而提高醫療效率和安全性圖4:AI的感知智能能
8、夠針對人類交互相關的產業領域產生巨大變革數據來源:百度,國泰君安證券研究誠信 責任 親和 專業 創新9人工智能研究框架培訓請參閱附注免責聲明認知智能在前兩者基礎上,提升了對各類信息的處理能力01 人工智能在認知智能領域的實際應用進一步拓寬 認知智能需要具有對采集的信息進行處理、存儲和轉化的能力,在這一階段需要運用計算智能、感知智能的數據清洗、圖像識別能力。認知智能需要擁有對業務需求的理解及對分散數據、知識的治理能力。認知智能需要能夠針對業務場景進行策略構建和決策,提升人與機器、人與人、人與業務的協同、共享和博弈等能力。通過語音或文字的方式與用戶交互并提供幫助智能客服根據用戶的需求,從海量數據中
9、精準獲取相關信息智能搜索將一種自然語言翻譯成另一種自然語言智能翻譯對腫瘤、病變等醫學圖像進行分析和判斷智能影像利用視覺技術和傳感器管理車輛行駛智能駕駛圖5:認知智能的主要應用場景如下所示數據來源:國泰君安證券研究 誠信 責任 親和 專業 創新10人工智能研究框架培訓請參閱附注免責聲明智能創造開始讓AI具備了自主“生成式”(AIGC)的能力01 人工智能的智能創造本質上是一種“生成式”能力 人工智能創造是指利用計算機程序和算法等技術,讓計算機自動地生成具有一定藝術性、創造性的作品,包括音樂、詩歌、繪畫、小說等;AI創作的基礎是數據分析和模型訓練。首先需要收集和整理有關主題、情感、語言等信息的數據
10、,通過機器學習、深度學習等算法進行訓練,使得機器能夠自動完成創作任務。這種方式不僅提高了創作效率,而且還能夠創造出更加精準、深刻、個性化的作品。人工智能可以模仿人類的創作過程,產生類似于人類創作的作品。這在文學、音樂、電影等領域都有廣泛的應用。數據來源:國泰君安證券研究圖6:AI“生成式”下的創作場景部分如下所示誠信 責任 親和 專業 創新11人工智能研究框架培訓請參閱附注免責聲明AIGC取長補短,有望成為主流內容生產模式01 AIGC所屬內容生產生態的發展經歷了專家生產內容(PGC)、用戶生成內容(UGC)、AI輔助生產內容、AI生產內容(AIGC)四個階段,目前處于一、二階段為主,第三階段
11、為輔的境況 AIGC克服PGC與UGC存在的質量、產量無法兼具的缺點,其有望成為未來主流的內容生產模式資料來源:foresightnews.pro,中國信通院,國泰君安證券研究PGCUGCAIGC輔助 由專業團隊生產,內容質量高 內容生產門檻高,壟斷嚴重 生產周期長,難以滿足大規模生產需求電視,電影,游戲等 創作工具下放,用戶可自行生產內容,創作門檻、成本降低 內容生產參與者眾多,創作生態繁榮,個性化程度高 創作者參差不齊,內容質量不高短視頻,社交媒體文章,播客等 AI技術學習的專業知識輔助內容生產環節,提高內容質量 AI技術實現自動化內容生產,減少創作耗時,提高內容生產規模天花板 人在關鍵環
12、節依然需要輸入指令,沒有做到完全自主性AI輔助文字創作,圖片創作等AIGC 實現完全自主性AI自主文字創作,圖片創作等圖7:AIGC生態內容生產模式理論上會經歷四個發展階段誠信 責任 親和 專業 創新12人工智能研究框架培訓請參閱附注免責聲明AIGC興起背后是大模型的重大進步,大模型是深度學習的重要成果01大模型生成式人工智能(AIGC)模型模型的本質是對現實世界中數據和規律的一種抽象和描述。模型的目的是為了從數據中找出一些規律和模式,并用這些規律和模式來預測未來的結果。大模型是指具有非常大的參數數量的深度學習模型,通常具有數億到數萬億參數。這些模型通常需要在大規模數據集上進行訓練,并且需要使
13、用大量的計算資源進行優化和調整。生成式人工智能指基于人工智能通過已有數據尋找規律,并自動生成內容的生產方式。在大模型技術推動下,AIGC有了飛速發展,我們熟知的ChatGPT就是基于大模型的AIGC。大模型本質上也是一種深度學習領域的算法,基于一個龐大復雜的神經網絡,需要通過存儲更多的參數來增加模型的深度和寬度,從而提高模型的表現能力,參數從百億起步,對大量數據進行訓練并產生高質量的預測結果。數據來源:國泰君安證券研究圖8:大模型推動AIGC的發展誠信 責任 親和 專業 創新13人工智能研究框架培訓請參閱附注免責聲明01人工智能三要素算法,算力,數據人工智能算法算法(Algorithms):是
14、指人工智能的實現方式,包括機器學習、深度學習、自然語言處理等。算法是人工智能的靈魂,能夠決定AI能力的效率和準確性。算力算力(Hardware):指的是計算機硬件資源,包括處理器、內存、存儲等。算力是人工智能的基礎設施,能夠支持算法的運行和處理數據。數據數據(Data)是指訓練算法和實現算法所需的信息。數據可以是事實、圖像、聲音、文本等,能夠支持算法的訓練和優化。數據是人工智能的發展前提,是推動人工智能發展的“原料”。實現AI 大模型能力的基礎是AI“三要素”:算力、算法、數據 誠信 責任 親和 專業 創新14人工智能研究框架培訓請參閱附注免責聲明算法是人工智能的靈魂所在01強化學習強化學習深
15、度學習深度學習傳統機器傳統機器學習學習.人工智能(本質上就是能幫人工智能(本質上就是能幫助人類解決問題的方法)助人類解決問題的方法)機器學習(實現機器學習(實現AI功能的主功能的主流算法之一)流算法之一)人工智能算法本質上是幫助人類解決相應問題的方式方法,它可以體現為數學方程、程序、工程架構等等眾所周知,計算機最擅長處理的是數字,所以我們可以將現實問題抽象為數學問題,再讓計算機幫我們解決。那么,其中的關鍵就是找到能夠準確翻譯該問題的數據公式,一般是某個函數關系f(x)。這個函數就叫做“算法/模型”。既然我們知道算法本質就是函數,那么影響算法準確程度的因素是什么?答案就是函數的參數。而機器學習的
16、本質就是它是一種可以通過反復帶入數據從而自主調整參數的人工智能算法之一。機器學習不是某種具體的算法,而是很多算法的統稱。機器學習下的算法紛繁復雜,從學習方法上來分,機器學習又可以分為傳統機器學習(監督學習、無監督學習、半監督學習)、深度學習和強化學習等等。圖9:人工智能的算法是其解決問題的核心思路和手段數據來源:國泰君安證券研究誠信 責任 親和 專業 創新15人工智能研究框架培訓請參閱附注免責聲明強化學習和深度學習漸成主流01深度學習強化學習深度強化學習 強化學習是一種通過與環境的交互學習最優行為策略的算法。通俗地說,強化學習類似于嬰兒學習和發現世界,如果有獎勵(正強化),嬰兒可能會執行一個行
17、動,如果有懲罰(負強化),嬰兒就不太可能執行這個行動。強化學習在游戲、機器人控制和自動駕駛等領域有廣泛應用,比如熟知的AlphaGo。深度學習就是基于多層神經網絡模型來學習數據表示和特征提??;所謂神經網絡,就是讓計算模仿大腦神經元來感知信息的一種方法。深度學習可以應用于各種領域,例如計算機視覺、自然語言處理和語音識別等。深度強化學習將深度學習的感知能力和強化學習的決策能力相結合,可以直接根據輸入的圖像進行控制,是一種更接近人類思維方式的人工智能算法。主流的深度強化學習算法DQN就是在現成的強化學習算法上,通過添加深度神經網絡來實現一套新的深度強化學習算法。強化學習和深度學習都是目前機器學習算法
18、的主流分支,而深度強化學習則是博采眾長的融合產物。數據來源:國泰君安證券研究圖10:強化學習與深度學習的解釋如下所示誠信 責任 親和 專業 創新16人工智能研究框架培訓請參閱附注免責聲明算力是人工智能的基礎設施01算力在人工智能領域扮演著至關重要的角色。算力在人工智能領域的作用是提供強大的計算資源,支持人工智能算法的訓練、推理和預測,處理大規模的數據集,優化和調參模型,從而推動人工智能技術的發展和應用。訓練深度學習模型 訓練深度神經網絡需要大量的計算資源來處理大規模的數據集和復雜的模型結構。高算力可以加快訓練速度,從而提高模型的準確性和性能。推理和預測 在部署人工智能系統時,需要進行推理和預測
19、。這需要對訓練好的模型進行實際應用,并在實時或近實時的情況下對新數據進行處理和響應。高算力可以加快推理速度,使得人工智能系統能夠快速做出準確的決策和預測。大規模數據處理 人工智能應用通常需要處理大規模的數據集,包括圖像、文本、語音等。算力可以加速數據的處理和分析,提取有用的特征和模式,從而支持更高級別的人工智能任務,如圖像識別、自然語言處理和語音識別等。模型優化和調參 在人工智能領域,模型的優化和調參是提高性能和準確度的關鍵步驟。算力可以支持對模型的超參數進行優化搜索,以找到最佳的配置。此外,算力還可以用于模型架構搜索和自動化的機器學習流程,以提高模型的效果和效率。數據來源:國泰君安證券研究圖
20、11:算力在人工智能全生命周期中,都扮演著重要的支撐性角色誠信 責任 親和 專業 創新17人工智能研究框架培訓請參閱附注免責聲明數據是人工智能發展的土壤01 數據是指訓練算法和實現算法所需的信息,它是訓練模型推動AI算法的土壤。數據是人工智能成長的能源。人工智能的自我調整與學習的過程,本質上是對大量數據進行分析并找出規律,如無人車需要大量的試車數據不斷地測試算法,并在業務場景上形成自我改進的反饋系統??梢娙绻麤]有數據的場景不可能實現人工智能,數據就是人工智能的引爆點。數據是人工智能結果準確的可靠性保證。對于人工智能結果的可靠性,數據要素的豐富性和準確性是關鍵,只有數據要素充分、準確,才能提高人
21、工智能結果的準確性。數據是人工智能應用的創新基礎。在數據要素基礎上,人工智能應用可以進行跨學科的整合,輔助解決大量的實際問題,如金融預測、物流運輸、醫療診斷等,從而推動了各個領域的創新發展。人工智能創新的基礎數據數據來源:國泰君安證券研究圖12:數據相當于人工智能領域的“石油資源”誠信 責任 親和 專業 創新18人工智能研究框架培訓請參閱附注免責聲明01資料來源:國泰君安證券研究 NLP、CV等是AI技術的重要子領域。這些細分領域的技術專長,又會進一步賦能產業應用計算機視覺(CV)讓計算機和系統能夠從圖像、視頻和其他視覺輸入中獲取有意義的信息,并根據該信息采取行動或提供建議自然語言處理(NLP
22、)在機器語言和人類語言之間溝通的橋梁,以實現人機交流的目的智能推薦(RES)深度智能挖掘用戶和物品的關聯關系,將對應場景的推薦結果推送給用戶,提升用戶體驗和運營效率自動駕駛自動駕駛有四大核心支柱。感知、定位、規劃、控制。隨著神經網絡的發展,深度學習在這四大領域中發揮了重要作用隨著各類算法的演繹和迭代,人工智能的子領域明朗化情感分析機器翻譯信息抽取電子商務搜索引擎位置服務圖像分類目標檢測目標分割實例分割感知定位規劃控制新聞推薦誠信 責任 親和 專業 創新19人工智能研究框架培訓請參閱附注免責聲明AI 子領域計算機視覺01計算機視覺(Computer vision,縮寫作CV)是人工智能(AI)的
23、一個重要應用領域,是指讓計算機和系統能夠從圖像、視頻和其他視覺輸入中獲取有意義的信息,并根據該信息采取行動或提供建議。目前主要有以下幾大基礎任務:數據來源:國泰君安證券研究01020304圖像分類圖像分類任務主要的目的是判斷一張圖片的主要類別。圖像分類可以是說計算機視覺中最基礎的任務之一。目標檢測目標檢測任務是給定一張圖像或是一個視頻幀,讓計算機定位出這個目標的的位置并且知道目標物是什么,即輸出目標的Bounding Box(邊框)以及標簽。目標分割目標分割是檢測到圖像中的所有目標,解決“每一個像素屬于哪個目標物或場景”的問題,屬于像素級的,需要給出屬于每一類的所有像素點,而不是矩形框。實例分
24、割實例分割其實就是目標檢測和目標分割的結合。相對目標檢測的邊界框,實例分割可精確到物體的邊緣。相對目標分割,實例分割需要標注出圖上同一物體的不同個體。數據來源:國泰君安證券研究圖13:CV的應用場景如下所示誠信 責任 親和 專業 創新20人工智能研究框架培訓請參閱附注免責聲明01自然語言處理(英語:Natural Language Processing,縮寫作NLP)是人工智能和語言學領域的分支學科,是指讓計算機和系統能夠從文本和語音信號輸入中獲取有意義的信息,理解人類語言,并作出決策。目前主要有以下幾大基礎任務:AI 子領域自然語言處理情感分析情感分析信息抽取信息抽取機器翻譯,是指通過特定的
25、計算機程序將一種書寫形式或聲音形式的自然語言,翻譯成另一種書寫形式或聲音形式的自然語言。目前,計算機主要能夠實現語音翻譯、圖像翻譯、VR翻譯等。情感分析,即指通過計算技術對文本的主客觀性、觀點、情緒、極性的挖掘和分析,對文本的情感傾向做出分類判斷。情感分析在評論機制的App中應用較為廣泛。在互聯網輿情分析中,尤其是在選舉預測、股票預測等領域,情感分析起著舉足輕重的作用。信息抽取,指從文本中抽取出特定的事實信息。被抽取出來的信息通常以結構化的形式直接存入數據庫,可以供用戶查詢及進一步分析使用,為之后構建知識庫、智能問答等提供數據支撐。機器翻譯機器翻譯數據來源:國泰君安證券研究圖14:NLP的應用
26、場景如下所示21誠信 責任 親和 專業 創新人工智能研究框架培訓請參閱附注免責聲明02人工智能發展已歷經三次浪潮誠信 責任 親和 專業 創新22人工智能研究框架培訓請參閱附注免責聲明“AI生成內容”(AIGC)是AI發展到一定階段的必然產物02數據來源:國泰君安證券研究圖15:全球人工智能產業關鍵事件時間軸如下圖所示從人工智能關鍵歷史事件可以看出,以大模型為基礎支撐的“AI生成內容”(AIGC)功能是AI相關理論和技術發展到一定階段的必然產物誠信 責任 親和 專業 創新23人工智能研究框架培訓請參閱附注免責聲明AIGC 是從早期的“決策型”AI發展演化而來02 AIGC(生成式AI)起源于“決
27、策型”AI,決策型AI 發展過程中的技術積累為生成式AI的產生奠定基礎 決策型AI其學習的知識局限于數據本身;生成式AI在總結歸納數據知識的基礎上可生成數據中不存在的樣本 最新生成式AI技術如GAN,Diffusion等,催生多款AIGC產品如:OpenAI系列、DALLE2(Diffusion),StarryA.I.(基于GAN)等資料來源:OpenAI官網,StarryA.I.官網,國泰君安證券研究決策型AI利用機器學習技術學習數據分布,進行如分類,預測等任務。發展過程中誕生了卷積神經網絡,殘差深度網絡,Transformer網絡結構等 推薦系統:挖掘用戶與物品的關聯關系 人臉識別:根據輸
28、入人臉信息進行身份判別 文字識別:根據文字圖片輸出文本 生成式AI(AIGC)在學習歸納數據分布的基礎上,學習數據產生的模式,并創造數據中不存在的新樣本。在分析式AI技術基礎上誕生大型Transformer網絡,Diffusion等新模型 文字創作:通過提示文本生成完整文案 圖像生成:根據關鍵信息生成風格多樣圖片,如博客配圖,海報圖片等 代碼生成:根據上下文生成完整代碼 數據學習數據學習+新數據生成圖16:AIGC是在決策型AI的基礎上,學習數據產生模式,實現新樣本內容的創造誠信 責任 親和 專業 創新24人工智能研究框架培訓請參閱附注免責聲明OpenAI 的ChatGPT也是“AI 生成內容
29、”(AIGC)浪潮的一部分02資料來源:中國信息通信研究院,國泰君安證券研究AIGC發展特點人工智能總體階段早期萌芽階段(20世紀50年代-90年代中期)沉淀積累階段(20世紀90年代-21世紀10年代中期)快速發展階段(21世紀10年代中期-至今)受限于技術水平,AIGC僅限于小范圍實驗AIGC從實驗性向實用性轉變,受限于算法瓶頸,無法直接進行內容生成深度學習算法不斷迭代,人工智能生成內容百花齊放AIGC典型事件1950年,艾倫圖靈提出著名的“圖靈測試”,給出判斷機器是否具有“智能”的方法1966年,世界第一款可人機對話機器人“Eliza”問世80年代中期,IBM創造語音控制打字機“Tang
30、ora”2012年,微軟展示語全自動同聲傳譯系統,可將英文語音自動翻譯成中文語音2007年,世界上第一部完全由人工智能創作的小說1 The Road問世2014年,Lan J.Goodfellow提出生成式對抗網絡GAN2018年,英偉達發布StyleGAN模型用于自動生成高質量圖片2019年,DeepMind發布DVD-GAN模型用于生成連續性視頻2022年,OpenAI發布ChatGPT模型用于生成自然能語言文本圖17:隨著算法的不斷迭代,人工智能主動生成內容(AIGC)技術不斷發展誠信 責任 親和 專業 創新25人工智能研究框架培訓請參閱附注免責聲明以ChatGPT為例,其也是基于NLP
31、模型逐步進化而來02GPT模型是一種自然語言處理(NLP)模型,使用多層變換器(Transformer)來預測下一個單詞的概率分布,通過訓練在大型文本語料庫上學習到的語言模式來生成自然語言文本從 GPT-1 到 GPT-3 智能化程度不斷提升,ChatGPT 的到來也是GPT-4 正式推出之前的序章資料來源:CSDN,國泰君安證券研究GPT-1(1.17億參數)GPT-1 有一定的泛化能力,能夠用于和監督任務無關的 NLP 任務中2018201920202022.01GPT-2(15億參數)除了理解能力外,GPT-2 在生成方面表現出了強大的天賦:閱讀摘要、聊天、續寫、編故事,甚至可以生成假新
32、聞、釣魚郵件或在線進行角色扮演GPT-3(1750億參數)GPT-3 作為一個自監督模型,可以完成自然語言處理的絕大部分任務:將網頁描述轉換為相應代碼、模仿人類敘事、創作定制詩歌、生成游戲劇本,甚至模仿已故的哲學家預測生命的真諦InstructGPTInstructGPT是一個經過微調的新版 GPT-3,可以將有害的、不真實的和有偏差的輸出最小化ChatGPTChatGPT 是 InstructGPT 的衍生產品,它將人類的反饋納入訓練過程,更好地使模型輸出與用戶意圖保持一致2022.12圖18:ChatGPT由GPT-1到InstructGPT模型的不斷成熟而逐步形成誠信 責任 親和 專業
33、創新26人工智能研究框架培訓請參閱附注免責聲明2022年總結來看,人工智能的歷史沿革本質上是技術的進化演繹02資料來源:真格基金,國泰君安證券研究近期興起的以ChatGPT為代表的大模型,是來自于機器學習、神經網絡以及Transformer模型的多種技術的積累GPT-1GPT-2GPT-3Instruc-tGPTChatGPTT5BARTM2m-100BigBirdBERTRoBERTaXLMALBERTELECTRATransfo-rmerCNNRNN神經網絡Machine Learning基于規則的少量數據處理1950年開始1980年開始1990年開始;2006年獲得突破2017年2018
34、年2019年2020年基于模板和規則的前深度學習階段根據一定范圍的數據進行參數分類開始模仿人腦進行大量數據的標記和訓練對人腦學習過程進行重點關注進行海量數據學習訓練,人類的反饋信息成為模型學習的內容圖19:ChatGPT經過多類技術積累,最終形成針對人類反饋信息學習的大規模預訓練語言模型GANGPT-42023年27誠信 責任 親和 專業 創新人工智能研究框架培訓請參閱附注免責聲明03算力是人工智能的基礎設施,算法是人工智能的靈魂誠信 責任 親和 專業 創新28人工智能研究框架培訓請參閱附注免責聲明算力是AI產業發展的根基03算力是承載人工智能應用發展的基礎,是人工智能最核心的要素 數據的快速
35、增長對算力發展提出更高要求。隨著信息化、數字化的持續推進,全球新產生的數據量正在快速增長,根據IDC數據顯示,2021年全球新增數據總量達到84.5 ZB,預計到2026年全球新增數據總量將達到221.2 ZB,2021年至2026年間的年復合增速達到21.22%新應用場景的出現對數據實時性要求更高,從而使得邊緣計算能力變得愈發重要,人工智能應用也越來越依賴邊緣算力支撐。算法模型的復雜化和巨量化需要更強算力的支撐。近些年,算法模型的參數量和復雜程度都在呈現指數級增長態勢,尤其是自然語言處理等新興認知智能領域對算力的要求遠超圖像識別和語音識別等傳統AI領域數據算法 算力、算法和數據是人工智能產業
36、發展的三個核心要素,在三大要素中,算力才是最核心的要素 數據的生產不再是問題,如何處理、分析和使用數據才是問題。算法經歷了數十年的發展,在深度學習和加速計算出現之后,得到了迅速的發展和優化 算力是承載和推動人工智能走向實際應用的決定性力量算力圖20:算力是AI產業發展的根基數據來源:國泰君安證券研究誠信 責任 親和 專業 創新29人工智能研究框架培訓請參閱附注免責聲明算力提升有極強的經濟效益03算力的經濟效益使其成為各國政策支持的重點根據清華大學全球產業院與浪潮信息聯合發布的2021-2022全球計算力指數評估報告,通過對全球15個重點國家的計算力指數與數字經濟及GDP的回歸分析,得到15個重
37、點國家的計算力指數平均每提高1點,國家的數字經濟和GDP將分別增長3.5和1.8進一步研究發現,當一個國家計算力指數分別達到40分及60分以上時,計算力指數每提升1點,其對GDP增長的推動力將分別增加到1.5倍及3倍。智能算力提升具備重大經濟效益,對算力基礎設施發展的支持性政策成為各國政策的重點。數據來源:2021-2022全球計算力指數評估報告,國泰君安證券研究圖21:算力提升具有極強的經濟效益誠信 責任 親和 專業 創新30人工智能研究框架培訓請參閱附注免責聲明AI 數據中心需求激增,AI 服務器快速放量03AI 數據中心是專門用于支持人工智能計算和數據處理任務的設施或物理空間AI 數據中
38、心通常擁有大量高性能的服務器、GPU 加速器和專門的存儲系統,以提供強大的計算能力并加速深度學習AI 數據中心配備了高速的網絡設備和優化的軟件框架,以支持高效的數據傳輸和算法訓練通過這些專門的配置和優化,AI 數據中心能夠為各種規模和復雜度的 AI 工作負載提供可靠穩定的計算環境,并滿足大規模數據存儲、備份和分析的需求AI 數據中心在推動人工智能技術的發展和應用方面起到關鍵作用,為各行各業的 AI 應用和服務提供了強大的支持軟件支持網絡寬帶儲存需求計算能力用于大規模并行計算,處理復雜機器學習和深度學習算法的高性能計算設備(如GPU和特定的AI芯片)用于快速數據傳輸和通信的高網絡帶寬、低延遲網絡
39、,以滿足對數據傳輸速度的敏感需求用于存儲大規模數據集的大容量、高速存儲針對機器學習和深度學習任務的軟件支持,包括專門的AI框架、庫和工具,以及優化的軟件棧和分布式計算平臺,以提高計算效率和性能數據來源:國泰君安證券研究圖22:AI數據中心比普通數據中心需要更好的計算能力、存儲需求、網絡帶寬和軟件支持誠信 責任 親和 專業 創新31人工智能研究框架培訓請參閱附注免責聲明AI 數據中心需求激增,AI 服務器快速放量03大模型的出現和技術創新對AI數據中心的發展起到推動作用大模型的出現帶來了算力的增量需求根據 OpenAI 發布的有關 GPT-3模型的文檔,它包含 1750 億個參數,需要進行數千萬
40、次的計算操作來完成一次推理任務ChatGPT 的總算力消耗約為 3640PF-days,需要78 個投資規模 30 億、單體算力 500P 的數據中心才能支撐運行,這樣的規模和復雜性需要高性能的計算設備和大規模的并行計算能力,帶動了 AI 數據中心需求的增長新的處理器架構、高速網絡、存儲技術以及更高效的冷卻和能源管理系統的出現,提升了數據中心的性能和效率,為 AI 數據中心的發展提供了技術支持圖23:大模型時代使算力需求翻倍提升數據來源:IJCNN誠信 責任 親和 專業 創新32人工智能研究框架培訓請參閱附注免責聲明AI 服務器中,GPU 價值量最大03AI 服務器是AI 數據中心重要的組成部
41、分AI 服務器是專門為人工智能應用而設計和配置的服務器,具備強大的計算能力和高效的數據處理能力,是執行 AI 任務和處理大規模數據的關鍵組件,為數據中心提供計算資源和算力,用于執行復雜的 AI 算法和模型。AI 服務器有兩種主要架構:混合架構和基于云平臺的架構??梢詫祿鎯υ诒镜?,利用本地的計算資源進行AI模型的訓練和推理保證數據的安全性和隱私性可能受限于本地的存儲和計算能力混合架構基于云平臺的架構使用遠程存儲技術和混合云存儲(一種聯合本地存儲和云存儲的技術)進行數據存儲,利用云端的計算資源進行AI模型的訓練和推理提供彈性的存儲和計算能力可能存在數據的安全性和隱私性問題描述優點缺點圖24:A
42、I服務器主要使用混合架構和云平臺架構數據來源:國泰君安證券研究誠信 責任 親和 專業 創新33人工智能研究框架培訓請參閱附注免責聲明AI 服務器中,GPU 價值量最大03AI 服務器中的主要元器件包括CPU、GPU 板組、內存、存儲、網絡接口卡、機箱、主板、散熱系統和電源主板是AI服務器的核心電路板,連接各個部件并提供電源和數據傳輸的接口,承載著CPU、內存插槽、擴展插槽和其他重要組件電源提供服務器所需的電能,確保各個組件正常運行機箱是AI服務器的外部框架,提供支撐和保護內部組件的結構背板提供連接各個部件的接口,而布線則用于傳輸電力和數據信號散熱系統用于控制服務器的溫度并保持其在安全范圍內運行
43、。散熱片吸收和分散熱量,而風扇則提供氣流來冷卻服務器內部。內存(RAM)用于臨時存儲數據和程序代碼,提供快速的數據訪問和處理能力。AI服務器通常配備大容量的內存,以支持大規模的數據集和模型CPU負責執行計算任務和處理數據,是服務器的主要計算引擎,可以進行復雜的算法和模型運算加速卡(如GPU、TPU)提供高性能的并行計算能力,用于加速機器學習和深度學習任務,可以加快模型訓練和推理的速度圖25:AI服務器拆箱圖如下所示數據來源:英偉達官網,國泰君安證券研究誠信 責任 親和 專業 創新34人工智能研究框架培訓請參閱附注免責聲明AI 服務器中,GPU 價值量最大03數據來源:國泰君安證券研究圖26:整
44、個 AI 硬件產業鏈中的各個環節緊密合作,共同構建了支持 AI 應用和服務的完整生態系統 GPU 是AI 服務器中價值量最高的部件,承擔了大部分的計算任務和深度學習模型的訓練與推理AI服務器服務器GPU電源網絡設備存儲CPU冷卻系統在整個AI服務器的投入比例中,GPU通常占據較大的比例,大約在整體投入的30%至60%之間。GPU提供了強大的并行計算能力和高效的深度學習加速,是實現高性能AI計算的關鍵。CPU作為服務器的核心計算單元發揮著重要作用,而存儲、網絡設備、冷卻系統和電源等則在支持和維護服務器功能上起到關鍵作用。其他部件在整體投入中比例相對較小,但它們同樣是確保服務器正常運行和數據中心高
45、效運作的必要組成部分誠信 責任 親和 專業 創新35人工智能研究框架培訓請參閱附注免責聲明AIGC拉動AI算力需求,AI芯片將成為未來科技石油03基于APU架構的MI300預計于年底開始應用于超級計算機 隨著AI 進入“大模型”時代,訓練數據不斷增長、算法復雜度不斷提高,國內人工智能廠商對算力的需求陡升。AI芯片作為大模型及AI應用落地的算力基礎,重要性日益凸顯。廣義的AI芯片指專門用于處理人工智能應用中大量計算任務的模塊,即面向人工智能領域的芯片均被稱為AI芯片。狹義的AI芯片即針對人工智能算法做了特殊加速設計的芯片。狹義的AI芯片與傳統芯片(如CPU)相比,性能優勢主要體現在專用性的側重上
46、。數據來源:國泰君安證券研究圖27:AI芯片產業鏈較為復雜IP授權授權設計設計晶圓代工晶圓代工AI芯片芯片云端云端/邊緣端邊緣端終端終端訓練訓練推理推理智能汽車智能汽車智能手機智能手機AIoT機器人機器人誠信 責任 親和 專業 創新36人工智能研究框架培訓請參閱附注免責聲明AIGC拉動AI算力需求,AI芯片將成為未來科技石油03AI 芯片主要分為三種類型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)三類芯片代表分別有英偉達(NVIDIA)的GPU、賽靈思的FPGA和Google的TPU。GPU的計算能力最強,但是成本高、功耗高;FPGA可編程,最靈活,但是計算能力不強;ASIC體
47、積小、功耗低,適合量產,但是研發時間長,且不可編輯,前期投入成本高,帶來一定的技術風險。數據來源:國泰君安證券研究表1:AI芯片分為GPU、FPGA、ASIC三種類型GPUFPGAASIC定制化程度定制化程度通用型半定制化定制化靈活性靈活性好好不好成本成本高較高低編程語言編程語言/架構架構CUDA,OpenCL等Verilog/VHDL等硬件描述語言,OpenCL、HLS/功耗功耗大較大小主要優點主要優點峰值計算能力強,產品成熟平均性能較高,功耗較低,靈活性強平均性能很強,功耗很低,體積小主要缺點主要缺點效率不高,不可編輯,功耗高量產單價高,峰值計算能力較低,編程語言難度大前期投入成本高,不可
48、編輯,研發時間長,技術風險大主要應用場景主要應用場景云端訓練,云端推理云端推理,終端推理云端訓練,云端推理,終端推理誠信 責任 親和 專業 創新37人工智能研究框架培訓請參閱附注免責聲明AIGC拉動AI算力需求,AI芯片將成為未來科技石油03針對不同技術路徑,國內廠商均已有所布局 GPU:國內GPU廠商已有部分產品落地,國產GPU迎來黃金發展期數據來源:國泰君安證券研究圖28:國內GPU企業迎來較快發展景嘉微自主研發了一系列GPU芯片,包括JM54系列、JM72系列、JM92系列三代GPU產品公司于 2014 年成功研發出國內首顆國產高性能、低功耗 GPU 芯片JM5400,打破了國外產品長期
49、壟斷我國 GPU 市場的局面,并不斷研發更為先進的JM7200 和JM9系列2022 年5 月,公司 M9 系列第二款圖形處理芯片成功研發,可以滿足地理信息系統、媒體處理、CAD 輔助設計、游戲、虛擬化等高性能顯示需求和人工智能計算需求,可廣泛應用于各種設備海光 DCU 系列產品以基于通用的GPGPU架構,采用7nm工藝,兼容“類CUDA”環境以及國際主流商業計算軟件和人工智能軟件,軟硬件生態豐富海光DCU系列產品深算一號已經實現商業化應用,于2021年實現規?;鲐?,未來將廣泛應用于大數據處理、人工智能、商業計算等領域其產品性能達到了國際上同類型主流高端處理器的水平,具有較強的并行計算能力和
50、較高的能效比,在國內處于領先地位數據來源:國泰君安證券研究誠信 責任 親和 專業 創新38人工智能研究框架培訓請參閱附注免責聲明AIGC拉動AI算力需求,AI芯片將成為未來科技石油03針對不同技術路徑,國內廠商均已有所布局數據來源:國泰君安證券研究表2:ASIC:國內ASIC廠商實力雄厚,積極追趕國外芯片巨頭此前被全球最大FPGA廠商賽靈思收購的深鑒科技也基于FPGA來設計深度學習的加速器架構圖29:CPU+FPGA:國內巨頭紛紛布局CPU+FPGA的混合異構加速AI計算全球科技巨頭紛紛布局云端FPGA生態,國內包括騰訊云、阿里云均在2017年推出了基于FPGA的服務,百度大腦也使用了FPGA
51、芯片數據來源:國泰君安證券研究誠信 責任 親和 專業 創新39人工智能研究框架培訓請參閱附注免責聲明AIGC拉動AI算力需求,AI芯片將成為未來科技石油03實現專用算法“硬件優化”,ASIC路線在AI領域的長期成長性值得期待數據來源:頭豹研究院,國泰君安證券研究FPGA方案及ASIC方案成本曲線存在差異ASIC無法重新編程前期投入成本較高ASIC具備性能更強、體積更小、功耗更低、成本更低、可靠性更髙等優點,將更具備一定競爭優勢圖30:ASIC路線在AI領域的長期成長性值得期待誠信 責任 親和 專業 創新40人工智能研究框架培訓請參閱附注免責聲明要解決人類指定的各類任務,先要讓計算機模擬人類的學
52、習機制03人類跟計算機的能力維度各有優勢,讓計算機學習和模擬人類的解決問題的方法是各類算法的起點 人類會非常容易的辨別出垃圾郵件與貓狗,但是讓計算機做卻非常困難,因為這與發明計算機的最初任務有本質區別。比如對1億數據進行混合四則運算或大小排序,這些任務讓人類執行會非常低效,但計算機卻可以快速完成。而人工智能要處理的任務與計算機最初的任務恰好相反。這就促使了讓人們思考人類到底是怎么進行學習的。人類的學習機制:嬰兒根本不知道貓狗到現在我們可以一眼分辨出貓狗,是一個經驗學習過程:首先需要一定的樣本資料,從小可能在電視中、現實中或圖書中或家長教育中獲得大量信息,然后大腦將接受的信息進行學習、歸納、整理
53、、總結,最后形成我們的知識與經驗。對于計算機,它的優勢是計算能力非常強,可以處理海量數據。我們需要給它提供成千上萬的資料數據(貓狗照片)讓它進行學習,然后計算機再面對新樣本時才能以較高的準確率進行分辨。數據來源:AI有溫度微信公眾號,國泰君安證券研究圖32:讓計算機模仿人類來解決問題具備理論上的可行性圖31:理解人類的學習機制,有助于讓人工智能來有效復刻這種能力機制數據來源:AI有溫度微信公眾號誠信 責任 親和 專業 創新41人工智能研究框架培訓請參閱附注免責聲明例如預測一封郵件是否是垃圾郵件、預測照片中的人是男性還是女性還是偏中性?這種結果只有兩個值或者多個值的問題,我們可以把每個值都當做一
54、類,預測對象到底屬于哪一類。對于結果只有兩個值的問題,一般稱為二分類問題,結果有多個值的問題稱為多分類問題?;贏I習得的能力,AI 就能處理兩大類任務03AI 所能處理的這些任務背后的根本任務只有兩類,就是分類與回歸 人類大腦每日處理的其實也是分類與回歸問題。比如我們會思考晚上吃燒烤還是火鍋,會選擇出門穿哪件衣服,這些都可看做是分類問題;在稱重上秤前我們會先估計自己多重,約會時會預計對方幾點到達,這些都可看做是回歸問題。數據來源:國泰君安證券研究分類人工智能要處理的任務多種多樣。比如人臉識別、垃圾郵件檢測、電源票房預測、降雨量預測等等。但是這些任務背后的根本任務只有兩類,就是分類與回歸?;貧w
55、例如要通過一個人的飲食預測一個人的體重,體重的值可以有無限多個,有的人60kg,有的人61kg,而且在60和61之間也有無限多個數。這種預測結果是某一個確定數,而具體是哪個數有無限多種可能,預測的這個變量(體重)因為有無限多種可能,在數軸上是連續的,所以稱這種變量為連續變量。圖33:分類和回歸是人工智能所處理任務的主要類別分類任務:模型輸出是:對象的所屬類別;數據類型是:離散數據回歸任務:模型輸出的結果是:一個值;數據類型是:連續型數據 誠信 責任 親和 專業 創新42人工智能研究框架培訓請參閱附注免責聲明分類任務:模型輸出是對象的所屬類別,數據類型是離散數據03分類任務:有二分類和多分類 二
56、分類任務包括前面提到的垃圾郵件檢測與貓狗圖像識別的例子。多分類任務場景包括下棋與自動駕駛等場景。在棋盤上可以落子的個數是有限的,所以每一步阿爾法Go要做的就是根據當前已落子信息,預測出落子在每個可落子位置的勝率,然后選取勝率最高的位置進行落子即可;自動駕駛車輛上裝有多個攝像頭和傳感器來時刻監視車輛四周的環境信息,可根據這些環境的圖像信息讓它選擇在每種情況下方向盤轉動多少角度、油門或剎車踩多深來實現車輛的自動行駛。圖34:棋牌類是多分類任務的場景案例之一數據來源:百度圖35:自動駕駛也是一種多分類任務數據來源:廣汽可給方向盤設置900個選擇方案(普通車的方向盤一般是900度,也就是兩圈半),給油
57、門剎車分別設置10個檔位。那么整個自動行駛的過程,其實就是在每個時刻根據環境信息來對這三個關鍵部件進行操作選擇,所以可以將它看作為分類任務。誠信 責任 親和 專業 創新43人工智能研究框架培訓請參閱附注免責聲明回歸任務:模型輸出的結果是一個值,數據類型是連續型03以網約車出行預測以及股價預測來說明回歸任務?;貧w任務和分類任務并非嚴格區分。案例一:可根據上下車地點、時間、天氣情況、人流密度以及歷史記錄等因素,預測此刻某區域的網約車訂單數,并以此為依據進行車輛調度,保證供需平衡。案例二:股價預測也可看做為一個回歸問題。因為可根據歷史走勢、利弊政策、公司財報等因素對股價進行預測。其實分類問題在某種程
58、度上可以看做為一個回歸問題:比如可以定義若一支股票漲幅會大于5%,就把它歸為買入類;在-5%至5%之間,就將它歸為持有類;跌幅大于5%的話就將它歸為賣出類。圖36:網約車出行流量預測是一種回歸任務數據來源:百度地圖圖37:股價預測也是典型的回歸任務數據來源:微軟根據相應程序可以預測股價趨勢,可看做回歸問題誠信 責任 親和 專業 創新44人工智能研究框架培訓請參閱附注免責聲明最終計算機解決這些任務的方案,我們稱之為算法03從人工智能大的子領域來看,常用的算法類型有專家系統、傳統機器學習與深度學習。專家系統通俗來說就是制定規則;傳統的機器學習主要運用可解釋的數學公式進行推導預測;而目前大火的深度學
59、習則是模擬人腦神經元進行學習與預測,通常不具有可解釋性,但卻能很好的解決問題(之后會詳細解釋)。利用以往知識與經驗制定規則專家系統通過訓練集,不斷識別特征,不斷建模,最后形成有效的模型,這個過程就叫“機器學習”!無論使用什么算法,使用什么樣的數據,最根本的思路都逃不出上面的3步。傳統機器學習模擬人腦神經元進行學習與預測,通常不具有可解釋性深度學習圖38:AI核心算法主要分為三大類數據來源:國泰君安證券研究誠信 責任 親和 專業 創新45人工智能研究框架培訓請參閱附注免責聲明專家系統算法:基于以往知識與經驗來制定規則03早期AI 根據設定的規則,讓電腦去執行預測。這種早期算法也叫做“專家系統”。
60、專家系統是模擬人類專家解決某一類具體問題的人工智能系統,如疾病診療、機械設計等。那么,如何讓計算機模擬人類專家?思路很簡單:想辦法將專家掌握的知識抽取出來,利用這些知識,計算機就可以像專家一樣工作了。例如,AI在互聯網中的早期應用有識別垃圾郵件。郵箱每天會收到眾多郵件,而把垃圾郵件剔除就可以大大節約人們在垃圾郵件中浪費的時間。傳統的方法是制定規則,比如一篇文章中大量出現“免費”“特價”“發財”“代理”“穩贏”等等關鍵詞,我們就把它定義為垃圾郵件,根據設定的規則,然后讓電腦去執行預測。實現專家系統要解決兩個問題:一是如何表示知識,二是如何利用知識解決問題 首先是知識表示的問題,即如何將專家的知識
61、梳理出來,并表示成計算機能讀懂的結構。知識表示有很多種方法,最簡單的是寫成“如果.就.”這樣的判斷句,稱為“產生式規則”。第二個問題涉及到推理方法,即如何利用既有知識解決問題。以診療系統為例,如果病人的表現是打噴嚏和發燒,人類的醫生會基于打噴嚏和發燒這些表現,判斷病人可能是感冒了,而治療感冒的常用藥物是阿司匹林,因此醫生會告訴病人:吃幾片阿斯匹林。這個過程就是人類的推理過程。計算機醫生會模仿這個過程,首先會將病人發燒和打噴嚏作為前提在知識庫中查找。圖39:用IF 語句來舉例理解專家系統基于該知識推論病人是否感冒。得出結論后,通過“感冒”,在知識庫中繼續查找,發現下面的知識IF 發燒 AND 打
62、噴嚏 Then 感冒知識表示數據來源:國泰君安證券研究IF 感冒 THEN 開阿司匹林解決問題基于該知識,計算機就知道要給病人開阿司匹林誠信 責任 親和 專業 創新46人工智能研究框架培訓請參閱附注免責聲明單一的專家系統算法會遇到諸多瓶頸03但在實踐過程中,有些任務本身的規則很難定義。一個典型的例子就是圖像識別。在圖像識別領域中,一個最基礎的問題就是分辨這個圖像是什么。舉例來說,告訴你一張圖像不是貓就是狗,現在給你一張圖片,讓你分辨一張圖片到底是貓還是狗。人類可以輕松地分辨出左側是貓右側是狗,但是讓你具體說出你是究竟根據什么來分辨出貓與狗的,突然發現這個問題很難回答。例如,貓跟狗都有五官與體毛
63、,并有基本相同的姿勢等等,計算機量化描述這些規則的話,難度和復雜度極大。數據來源:AI有溫度微信公眾號圖41:因為圖像的細節特征太多,編寫規則來進行判斷的難度極大圖40:識別圖像的工作極大提升了傳統算法的難度數據來源:AI有溫度微信公眾號誠信 責任 親和 專業 創新47人工智能研究框架培訓請參閱附注免責聲明傳統的機器學習主要運用可解釋的數學公式進行推導運算03案例任務:收集鳶尾花 花萼的長度與寬度,來判斷它具體屬于哪一品種(由于可視化與易推導的需求,此處將數據維度降到2維或3維來說明傳統機器學習的原理。而現實中的數據通常是具有多種特征的,比如鳶尾花的數據集原本有4個特征,其實我們應該在一個4維
64、空間對數據進行切分)。機器學習背后的數學保證了低維空間的算法推導到高維空間也同樣適用。圖42:傳統的機器學習主要運用可解釋的數學公式進行推導預測數據來源:AI有溫度微信公眾號,,國泰君安證券研究首先將花萼的長度與寬度繪制在一張二維圖中,紅色代表一類,藍色代表一類根據兩組數據計算出一條f(x)=k1x1+k2x2+b(可理解為y=kx+b)的直線將兩類數據分離:如果再來一組數據落入直線上方,就歸屬于紅色類;若落入直線下方,則屬于藍色類誠信 責任 親和 專業 創新48人工智能研究框架培訓請參閱附注免責聲明傳統的機器學習對圖像識別有天然優勢03傳統機器學習同樣可以運用到圖像領域 可以看到在鳶尾花分類
65、任務中的特征都有明確的含義,每個數字代表什么意思。而其實在機器學習中,特征可以是很抽象的,在圖像識別領域中,通常將每一個像素點看做一個特征。在數字識別任務中,將圖像放大,每一個像素由一個方塊表示,方塊顏色的深淺不同就對應著不同的值,所以可以用28*28=784個特征來代表這張圖像,然后將數字按順序排開喂給機器機進行學習,并歸納整理每個位置的值與最終結果的關系。在算法領域中特征可能是不具有含義的,而是抽象的,甚至這個特征與最終結果毫無關系。圖44:傳統機器學習的工作流程如下所示數據來源:華為云官網圖43:利用機器學習來處理像素點可以實現圖像識別數據來源:雷鋒網誠信 責任 親和 專業 創新49人工
66、智能研究框架培訓請參閱附注免責聲明根據機器學習訓練方式,又分監督學習、無監督學習和強化學習03 監督學習需要有明確的目標,很清楚自己想要什么結果。比如:按照“既定規則”來分類、預測某個具體的值 監督并不是指人站在機器旁邊看機器做的對不對,而是具有四個步驟的流程。圖45:監督學習可以處理回歸 和 分類 兩種任務,下面以芝麻信用評分(回歸任務)來說明監督學習選擇一個合適的數學模型01 01 合適的模型先把部分已知“問題和答案”(訓練集)給機器去學習02 02 提供訓練數據機器總結出了自己的“方法論”0303 訓練出方法論人類把”新的問題”(測試集)給機器,讓他去解答04 04 在新數據上使用方法論
67、步驟1 1:構建問題,選擇模型首先找出個人信用的影響因素,從邏輯上講一個人的體重跟他的信用應該沒有關系,而財富總額貌似跟信用有關,所以根據判斷,找出了下面5個影響因素:付款記錄、賬戶總金額、信用記錄跨度(自開戶以來的信用記錄、特定類型賬戶開戶以來的信用記錄)、新賬戶(近期開戶數目、特定類型賬戶的開戶比例)、信用類別(各種賬戶的數目)步驟2 2:收集已知數據為了找出公式 f,需要先收集大量的已知數據,這些數據必須包含一個人的5種數據和他的信用狀態(把信用狀態轉化為分數)。把數據分成幾個部分,一部分用來訓練,一部分用來測試和驗證。步驟3 3:訓練出理想模型有了這些數據,通過機器學習,就能”猜測”出
68、這5種數據和信用分數的關系。這個關系就是公式 f。然后再用驗證數據和測試數據來驗證一下這個公式是否OK。步驟4 4:對新用戶進行預測當我們想知道一個新用戶的信用狀況時,只需要收集到他的這5種數據,套進公式 f 計算一遍就知道結果了!數據來源:easyai官網,國泰君安證券研究 誠信 責任 親和 專業 創新50人工智能研究框架培訓請參閱附注免責聲明主流的監督學習算法種類較多03圖:樸素貝葉斯決策樹SVM邏輯回歸線性回歸回歸樹K鄰近 Adaboosting神經網絡貝葉斯分類法是基于貝葉斯定定理的統計學分類方法。它通過預測一個給定的元組屬于一個特定類的概率,來進行分類。樸素貝葉斯分類法假定一個屬性值
69、在給定類的影響獨立于其他屬性的類條件獨立性。分類任務回歸任務回歸+分類決策樹是一種簡單但廣泛使用的分類器,它通過訓練數據構建決策樹,對未知的數據進行分類。支持向量機把分類問題轉化為尋找分類平面的問題,并通過最大化分類邊界點距離分類平面的距離來實現分類。邏輯回歸是用于處理因變量為分類變量的回歸問題,常見的是二分類或二項分布問題,也可以處理多分類問題,它實際上是屬于一種分類方法。線性回歸是處理回歸任務最常用的算法之一。該算法的形式十分簡單,它期望使用一個超平面擬合數據集(只有兩個變量的時候就是一條直線)?;貧w樹(決策樹的一種)通過將數據集重復分割為不同的分支而實現分層學習,分割的標準是最大化每一次
70、分離的信息增益。這種分支結構讓回歸樹很自然地學習到非線性關系。通過搜索K個最相似的實例(鄰居)的整個訓練集并總結那些K個實例的輸出變量,對新數據點進行預測。Adaboost目的就是從訓練數據中學習一系列的弱分類器或基本分類器,然后將這些弱分類器組合成一個強分類器。它從信息處理角度對人腦神經元網絡進行抽象,建立某種簡單模型,按不同的連接方式組成不同的網絡。圖46:主流的監督學習算法包括樸素貝葉斯、決策樹、SVM等多種算法,目前也在逐步豐富中數據來源:國泰君安證券研究誠信 責任 親和 專業 創新51人工智能研究框架培訓請參閱附注免責聲明無監督學習跟監督學習相比,主要有三個特點03 無監督學習是一種
71、機器學習的訓練方式,它本質上是一個統計手段,在沒有標簽的數據里可以發現潛在的一些結構的一種訓練方式。下面通過跟監督學習的對比來理解無監督學習:監督學習是一種目的明確的訓練方式,你知道得到的是什么;而無監督學習則是沒有明確目的的訓練方式,你無法提前知道結果是什么。監督學習需要給數據打標簽;而無監督學習不需要給數據打標簽。監督學習由于目標明確,所以可以衡量效果;而無監督學習幾乎無法量化效果如何。圖47:舉例說明無監督學習案例1:發現異常案例2:用戶細分案例3:推薦系統背景:有很多違法行為都需要”洗錢”,這些洗錢行為跟普通用戶的行為是不一樣的,到底哪里不一樣?如果通過人為去分析是一件成本很高很復雜的
72、事情,我們可以通過這些行為的特征對用戶進行分類,就更容易找到那些行為異常的用戶,然后再深入分析他們的行為到底哪里不一樣,是否屬于違法洗錢的范疇。通過無監督學習,可以快速把行為進行分類,雖然不知道這些分類意味著什么,但是通過這種分類,可以快速排出正常的用戶,更有針對性的對異常行為進行深入分析。數據來源:easyai官網,國泰君安證券研究用戶細分對于廣告平臺很有意義,不僅把用戶按照性別、年齡、地理位置等維度進行用戶細分,還可以通過用戶行為對用戶進行分類。比如大家在淘寶、天貓、京東上逛的時候,總會根據你的瀏覽行為推薦一些相關的商品,有些商品就是無監督學習通過聚類來推薦出來的。系統會發現一些購買行為相
73、似的用戶,推薦這類用戶最”喜歡”的商品。誠信 責任 親和 專業 創新52人工智能研究框架培訓請參閱附注免責聲明強化學習不需要大量的“數據喂養”,通過自我嘗試學會技能03 跟監督、無監督學習類似,強化學習并不是某一種特定的算法,而是一類算法的統稱。強化學習算法的思路非常簡單,以游戲為例,如果在游戲中采取某種策略可以取得較高的得分,那么就進一步強化這種策略,以期繼續取得較好的結果。這種策略與日常生活中的各種績效獎勵非常類似。強化學習和監督學習、無監督學習最大的不同就是不需要大量的“數據喂養”。而是通過自己不停的嘗試來學會某些技能。圖48:強化學習的主流算法包括免模型學習(Model-Free)和有
74、模型學習(Model-Based)數據來源:easyai官網,國泰君安證券研究有模型學習(Model-Based)對環境有提前的認知,可以提前考慮規劃,但是缺點是如果模型跟真實世界不一致,那么在實際使用場景下會表現的不好。免模型學習(Model-Free)放棄了模型學習,在效率上不如后者,但是這種方式更加容易實現,也容易在真實場景下調整到很好的狀態。所以免模型學習方法更受歡迎所以免模型學習方法更受歡迎,得到更加廣泛的開發和測試。誠信 責任 親和 專業 創新53人工智能研究框架培訓請參閱附注免責聲明深度學習的靈感來自大腦的結構和功能03 深度學習的概念源于人工神經網絡的研究,但是并不完全等于傳統
75、神經網絡,可以看做神經網絡的升級版本 根據李開復在人工智能內容,以識別圖片中的漢字為例來解釋深度學習:假設深度學習要處理的信息是“水流”,而處理數據的深度學習網絡是一個由管道和閥門組成的巨大水管網絡。網絡的入口是若干管道開口,網絡的出口也是若干管道開口。這個水管網絡有許多層,每一層由許多個可以控制水流流向與流量的調節閥。根據不同任務的需要,水管網絡的層數、每層的調節閥數量可以有不同的變化組合。對復雜任務來說,調節閥的總數可以成千上萬甚至更多。水管網絡中,每一層的每個調節閥都通過水管與下一層的所有調節閥連接起來,組成一個從前到后,逐層完全連通的水流系統。那么,計算機該如何使用這個龐大的水管網絡來
76、學習識字呢?比如,當計算機看到一張寫有“田”字的圖片,就簡單將組成這張圖片的所有數字(在計算機里,圖片的每個顏色點都是用“0”和“1”組成的數字來表示的)全都變成信息的水流,從入口灌進水管網絡。我們預先在水管網絡的每個出口都插一塊字牌,對應于每一個我們想讓計算機認識的漢字。這時,因為輸入的是“田”這個漢字,等水流流過整個水管網絡,計算機就會跑到管道出口位置去看一看,是不是標記由“田”字的管道出口流出來的水流最多。如果是這樣,就說明這個管道網絡符合要求。如果不是這樣,就調節水管網絡里的每一個流量調節閥,讓“田”字出口“流出”的水最多。與訓練時做的事情類似,未知的圖片會被計算機轉變成數據的水流,灌
77、入訓練好的水管網絡。這時,計算機只要觀察一下,哪個出水口流出來的水流最多,這張圖片寫的就是哪個字。圖49:深度學習就像自來水管系統,不斷調節各個閥門,讓對應出口的流量符合要求數據來源:easyai官網、人工智能,國泰君安證券研究深度學習大致就是這么一個用人類的數學知識與計算機算法構建起來的整體架構,再結合盡可能多的訓練數據以及計算機的大規模運算能力去調節內部參數,盡可能逼近問題目標的半理論、半經驗的建模方式。誠信 責任 親和 專業 創新54人工智能研究框架培訓請參閱附注免責聲明機器學習VS 深度學習03 機器學習與深度學習有著明顯的異同點 在數據準備和預處理方面,兩者是很相似的。他們都可能對數
78、據進行一些操作:數據清洗、數據標簽、歸一化、去噪、降維。核心區別:傳統機器學習的特征提取主要依賴人工,針對特定簡單任務的時候人工提取特征會簡單有效,但是并不能通用;深度學習的特征提取并不依靠人工,而是機器自動提取的。這也是為什么都說深度學習的可解釋性很差,因為有時候深度學習雖然能有好的表現,但是我們并不知道他的原理是什么。圖50:深度學習與機器學習在不同階段有不同的異同點數據來源:國泰君安證券研究數據預處理特征提取選擇分類器數據預處理設計模型訓練傳統機器學習深度學習傳統機器學習與深度學習的相似處傳統機器學習和深度學習的核心區別圖51:深度學習的優缺點如下所示優點1:學習能力強從結果來看,深度學
79、習的表現非常好,他的學習能力非常強。優點2:覆蓋范圍廣,適應性好深度學習的神經網絡層數很多,寬度很廣,理論上可以映射到任意函數,所以能解決很復雜的問題。優點3:數據驅動,上限高深度學習高度依賴數據,數據量越大,他的表現就越好。在圖像識別、面部識別、NLP 等部分任務甚至已經超過了人類的表現。同時還可以通過調參進一步提高他的上限。優點4:可移植性好由于深度學習的優異表現,有很多框架可以使用,例如 TensorFlow、Pytorch缺點1:計算量大,便攜性差深度學習需要大量的數據很大量的算力,所以成本很高。缺點2:硬件需求高深度學習對算力要求很高,普通的CPU 已經無法滿足深度學習的要求。主流的
80、算力都是使用GPU 和 TPU。缺點3:模型設計復雜深度學習的模型設計非常復雜,需要投入大量的人力物力和時間來開發新的算法和模型。大部分人只能使用現成的模型。缺點4:沒有”人性”,容易存在偏見由于深度學習依賴數據,并且可解釋性不高。在訓練數據不平衡的情況下會出現倫理風險。數據來源:easyai官網,國泰君安證券研究誠信 責任 親和 專業 創新55人工智能研究框架培訓請參閱附注免責聲明深度學習包括四種典型的算法03 4種典型的深度學習算法:卷積神經網絡、循環神經網絡、生成對抗網絡、深度強化學習圖52:深度學習的幾種主要算法如下數據來源:easyai官網,國泰君安證券研究循環神經網絡 RNNRNN
81、 是一種能有效的處理序列數據的算法。比如:文章內容、語音音頻、股票價格走勢深度強化學習 DL深度強化學習就是用深度學習來對強化學習中的State、Policy進行表示。區別的話,深度強化學習是深度學習的一個子類卷積神經網絡 CNN 能夠將大數據量的圖片有效的降維成小數據量(并不影響結果)能夠保留圖片的特征,類似人類的視覺原理生成對抗網絡 GANGAN 是最近2年很熱門的一種無監督算法,他能生成出非常逼真的照片,圖像甚至視頻。我們手機里的照片處理軟件中就會使用到它。誠信 責任 親和 專業 創新56人工智能研究框架培訓請參閱附注免責聲明Transformer 模型是一種基于自注意力機制的深度學習模
82、型,主要用于自然語言處理和計算機視覺領域。它可以用于機器翻譯、文本摘要、視覺問答等序列到序列的生成式任務,利用編碼器和解碼器的結構對輸入和輸出序列進行建模。它可以用于文本分類、情感分析等單序列的理解任務,利用編碼器對輸入序列進行特征提取。它可以用于視覺語言預訓練、圖像超分辨率、視頻修復等跨模態的任務,利用自注意力機制融合不同模態的信息。它可以用于預訓練語言模型,如 BERT、GPT 等,利用大規模無標注數據學習通用的語言表示,再遷移到下游任務上進行微調。Transformer技術框架是深度學習發展到一定階段的產物03優點缺點 能夠利用分布式 GPU 進行并行訓練,提升模型訓練效率。它能夠通過自
83、注意力機制捕捉輸入或輸出序列中任意兩個位置之間的關系,而不受距離的影響。它能夠產生更具可解釋性的模型,我們可以從模型中檢查注意力分布,看到各個注意頭(attention head)可以學會執行不同的任務。計算復雜度很高,需要大量的算力和內存,尤其是對于大型數據集和長序列。它的局部信息的獲取能力不如 RNN 和CNN 強,可能會忽略一些細節和上下文。它的位置信息編碼存在問題,因為位置編碼與詞向量相加可能會破壞詞向量的語義信息,而且位置編碼并不能很好地表征相對位置關系。它的頂層梯度消失問題,因為層歸一化模塊會阻斷梯度流,導致頂層參數難以更新。數據來源:國泰君安證券研究圖53:Transformer
84、的優缺點如下誠信 責任 親和 專業 創新57人工智能研究框架培訓請參閱附注免責聲明Transformer標志著“基礎模型”時代的開始03Transformer作為基礎性模型,為其他模型(GPT、GPT-3、BERT等)的演化提供基本手段轉移學習(Transfer Learning)使基礎模型成為可能,預訓練又是轉移學習的主要方式 轉移學習的思想是將從一項任務中學習到的“知識”(例如,圖像中的對象識別)應用于另一項任務(例如,視頻中的活動識別)。技術層面上,基礎模型通過轉移學習(Transfer Learning)(Thrun 1998)和規模(scale)得以實現。在Transformer模型
85、中,預訓練又是轉移學習的主要方法:“預訓練”是將大量低成本收集的訓練數據放在一起,經過某種預訓方法去學習其中的共性,然后將共性“移植”到特定任務模型中,再使用相關特定領域的少量標注數據進行“微調”來適應感興趣的下游任務。大規?;?scale)使基礎模型更強大,因而GPT模型得以形成 大規模需要的三個要素:(i)計算機硬件的改進例如,GPU吞吐量和內存在過去四年中增加了10倍;(ii)Transformer模型架構的開發,該架構利用硬件的并行性來訓練比以前更具表現力的模型;(iii)更多訓練數據的可用性?;赥ransformer的序列建模方法現在已應用于文本、圖像、語音、表格數據、蛋白質序列、
86、有機分子和強化學習等,這些案例的形成使得使用一套統一工具來開發各種模態的基礎模型這種理念得以成熟,象征著基礎模型時代的到來。例如,GPT-3(Brown et al.2020)在上下文學習中,只需向下游任務提供提示(任務的自然語言描述),語言模型就可以適應下游任務,這是產生的一種新興屬性。資料來源:Attention Is All You Need 論文,CSDN,國泰君安證券研究58誠信 責任 親和 專業 創新人工智能研究框架培訓請參閱附注免責聲明04人工智能技術的應用前景廣闊誠信 責任 親和 專業 創新59人工智能研究框架培訓請參閱附注免責聲明隨著大模型技術引爆AIGC浪潮,AI 應用方向
87、愈發拓展04資料來源:國泰君安證券研究 AIGC產業:可以利用人工智能技術自動產生內容,常見如代碼生成,文本問答等代碼生成文本問答圖像生成視頻生成其他AIGCChatGPT 可與人類進行流暢的文本問答Copilot 可自動編寫代碼DALLE2 由文字描述生成圖像,如:An astronaut riding a hourse as a pencil drawingSynthesia可將輸入文本合成不同述說風格的視頻圖54:AIGC應用功能簡單如下圖所示誠信 責任 親和 專業 創新60人工智能研究框架培訓請參閱附注免責聲明大模型加持下,人工智能也正在加速進入千行百業04 通用大模型的發展正在賦能各
88、行各業,行業專屬大模型也在不斷涌現。資料來源:哈爾濱工業大學社會計算與信息檢索研究中心 ChatGPT這種通用大模型已經引爆垂直領域的千行百業,各行業龍頭企業甚至初創企業都摩拳擦掌。金融、教育、醫療、法律、自動駕駛、智能物流、安防等多個領域的行業公司都已相繼加入行業大模型的研發中。星環科技研發出金融行業專屬大模型無涯,它是一款面向金融量化領域、超大規模參數量的生成式大語言模型。無涯能夠對股票、債券、基金、商品等各類市場事件進行全面的復盤、傳播和推演,從時間和空間、深度和廣度等多個方面擴展投資研究的視角,實現了全新的智能量化投研新范式。哈工大提出了一種基于醫學知識增強的大型語言模型指令微調方法,
89、打造出中文醫學大模型“本草”?!北静荨霸谥形尼t療問診場景中展現出一定的性能提升,模型能夠根據用戶的問題,提供較準確、可靠的診斷建議和治療方案,滿足非專業人士對醫學知識的需求。此外,模型具備一定的自適應能力,能夠在不同的中文問診場景中進行有效的應答,提升用戶體驗。此外,學而思研發的教育大模型“MathGPT”,理想汽車研發的自動駕駛大模型“MindGPT”。冪律聯合智譜AI聯合發布了基于中文千億大模型的法律垂直大模型“PowerLawGLM”。這些都表明,垂直大模型的蓬勃發展。圖55:金融垂直大模型無涯架構如下所示圖56:醫療垂直大模型本草如下數據來源:星環科技,國泰君安證券研究誠信 責任 親和
90、 專業 創新61人工智能研究框架培訓請參閱附注免責聲明AI+產業領域:促進數實共生,助力產業升級04AI與教育、金融、醫療、制造、傳媒、計算機等多個領域結合,助力產業升級圖57:”AI+“在各個領域應用前景廣闊資料來源:國泰君安證券研究AI可以成為虛擬世界與物理實體之間的橋梁?!皵底謭鼍啊笨梢詫Ⅰ{駛路線、環境場景重構為3D,用于訓練機器人和自動駕駛;AI+制造=“數字生產”+“工藝突破”AI+制造AI+教育AI+教育=“老師”。幫助教學內容生產降本增效,實現因材施教、有針對性的自適應性教學等,使得因材施教和自適應學習變得更加便捷和容易AI可以通過快照構建3D建模,應用于房屋設計、服裝設計等方面
91、;AI將虛擬形象提升至更高的現實水平。同時,在音樂領域,AI將文字賦予生命力,譜寫旋律AI+傳媒AI+金融一方面,金融機構可以通過AI實現金融資訊、金融產品介紹內容的自動化生產,提升金融機構內容生產的效率;另一方面,可以通過AI塑造虛擬理財顧問,讓金融服務更有溫度ChatGPT可以根據精確或模糊的自然語言,了解用戶的意圖,并生成本文,寫備忘錄和詩歌,改寫研究論文,解決數學問題,甚至編寫軟件。AI可以建立強大的搜索機制,在海量內容中完成精細化的搜索AI+計算機AI+醫療微軟旗下Nuance推出由GPT-4驅動的AI醫用軟件DragonAmbienteXperience(DAX)Express,可
92、幾秒鐘內自動生成臨床筆記草稿。它代表了醫療保健領域的下一個突破,也是大規模自動化臨床文檔之旅中的一個重要里程碑數據來源:雪球,國泰君安證券研究AI+誠信 責任 親和 專業 創新62人工智能研究框架培訓請參閱附注免責聲明AI+傳媒:拓寬創作素材,提升作品質量04ChatGPT可以根據大眾的興趣身定制影視內容,從而更有可能吸引大眾的注意力,獲得更好的收視率、票房和口碑ChatGPT可以為劇本創作提供新思路,創作者可根據ChatGPT的生成內容再進行篩選和二次加工,從而激發創作者的靈感,開拓創作思路,縮短創作周期。ChatGPT 有著降本增效的優勢,可以有效幫助影視制作團隊降低在內容創作上的成本,提
93、高內容創作的效率,在更短的時間內制作出更高質量的影視內容2016年,紐約大學利用人工智能編寫劇本Sunspring,經拍攝制作后入圍倫敦科幻電影48小時前十強2020年,美國查普曼大學的學生利用OpenAI的GPT-3模型創作劇本并制作短片律師國內海馬輕帆科技公司推出的“小說轉劇本”智能寫作功能,服務了包括你好,李煥英流浪地球等爆款作品在內的劇集劇本30000多集、電影/網絡電影劇本8000多部、網絡小說超過500萬部圖58:內容生成在影視領域運用廣泛,ChatGPT在影視領域的商業化大有可為資料來源:中國信息通信研究院,國泰君安證券研究案例1案例2案例3誠信 責任 親和 專業 創新63人工智
94、能研究框架培訓請參閱附注免責聲明萬興已有商用賬號開通GPT-4的API接口,相關產品效果顯著萬興播爆具備AI數字人、場景化模板、多語言配音、智能腳本等創意功能。萬興播爆:輸入文案,一鍵生成“真人”營銷視頻,并且可用上百套專業級模板,覆蓋不同場景視頻需求。AI+營銷:萬興科技相關產品賦能顯著04圖59:萬興播爆有上百套專業級模板,覆蓋不同場景視頻需求資料來源:萬興科技官網,國泰君安證券研究圖60:萬興播爆屬國內領先AIGC短視頻生成軟件資料來源:萬興科技官網,國泰君安證券研究誠信 責任 親和 專業 創新64人工智能研究框架培訓請參閱附注免責聲明AI+辦公:解鎖生產力,釋放創造力04Copilot
95、嵌入辦公軟件后,以前需要手工操作的任務可以自動化、智能化執行微軟于2023年3月16日正式發布Microsoft 365 Copilot,并集成在微軟365的多個應用程序中,包括Word、Excel、PowerPoint、Outlook、Teams等。它還提供了一個全新體驗:商務聊天(Business Chat),它可以跨越LLM、微軟365應用程序和用戶的數據,根據用戶的自然語言提示生成文本內容。微軟Copilot的本質仍然是聊天機器人,但它的功能遠比簡單地“將ChatGPT嵌入到Microsoft 365中”更強大。圖61:Microsoft 365 Copilot可以幫助用戶釋放創造力,
96、解鎖生產力,提升技能資料來源:微軟官網,國泰君安證券研究根據用戶的簡短提示,在Word中生成文檔的初稿。在PowerPoint中創建漂亮的幻燈片,并根據用戶在微軟圖形中的數據添加相關內容。在Excel中幫助用戶分析數據,生成圖表和報告,并提供有用的見解和建議。在Teams中幫助用戶協作溝通,分享信息,創建任務和計劃,并提供相關的反饋和建議。遵循微軟對數據安全和隱私的承諾,在企業環境中保護用戶的數據不被濫用或泄露。在Outlook中幫助用戶管理日程安排,回復郵件,編寫摘要和提綱,并提供適當的語氣和禮貌。誠信 責任 親和 專業 創新65人工智能研究框架培訓請參閱附注免責聲明AI+寫代碼:“自動補全
97、代碼”開啟AI輔助人類工作時代04GitHub Copilot“自動補全代碼”開啟AI輔助人類工作時代微軟在Copilot領域的布局由來已久。最早GitHub Copilot是GitHub和OpenAI合作開發的一個人工智能工具,用戶在使用Visual Studio Code、Microsoft VisualStudio、Vim、Cursor或JetBrains集成開發環境時可以通過GitHub Copilot自動補全代碼;Power Platform Copilot:引領AI生成式低代碼應用開發新時代微軟Power Platform正通過AI驅動的無代碼智能方式重塑軟件開發2023年3月16
98、日,Power Platform宣布在Power Apps、Power Automate和Power Virtual Agents中加入Copilot,進一步實現開發普及化,讓更多人能夠通過自然語言創建創新的解決方案。也就是說,如果你能想象出一個解決方案,并能夠用簡單的日常語言描述它,Copilot就可以通過直觀且智能的低代碼體驗幫助你創建出來。Copilot in Power Apps可以輕松地把數據置于每個應用程序的中心,只需描述你構建應用程序的目的,Copilot就會自動生成數據表;Power Automate能將繁瑣的業務流程數字化并提高效率,開發者可以極大地縮短應用程序上市時間;Co
99、pilot in Power Virtual Agents可以幫助開發者快速構建和修改機器人,在幾分鐘內就能構建起智能對話式機器人。圖63:自從2019年以來,AI就被注入低代碼開發,實現編程開發普及化資料來源:微軟,國泰君安證券研究圖62:Copilot 的功能能夠幫助程序員減省閱讀軟件文檔的時間,快速瀏覽不熟悉的編碼框架和語言,其發展歷史如下所示資料來源:微軟誠信 責任 親和 專業 創新66人工智能研究框架培訓請參閱附注免責聲明04自動駕駛有四大核心支柱。感知,即發現周圍的環境和障礙;定位,即確定了自己的位置,精度在1-3 cm;規劃,即利用感知和定位,確定了從 A 到 B 的軌跡;控制,
100、即產生方向盤轉向角度和加速度值來沿著軌跡行進。而隨著神經網絡的發展,深度學習在這四大領域中發揮了重要作用。AI+自動駕駛:深度學習賦能自動駕駛深度強化學習已經開始出現同時在規劃和控制中,而且是和ALVINN 一樣的端到端的方法。規劃是無人駕駛汽車的大腦。從障礙物預測到軌跡生成。其核心是決策制定。而深度強化學習為決策的準確度提供了保障。及時定位和地圖構建需要運用深度學習算法,遠比傳統的GPS定位精度高。感知感知中運用了大量計算機視覺算法。近年來,利用深層神經網絡進行激光雷達檢測的技術正在蓬勃發展。這是自動駕駛汽車研究中最活躍的領域之一。定位規劃控制自動駕駛數據來源:國泰君安證券研究圖64:深度學
101、習賦能自動駕駛四大支柱67誠信 責任 親和 專業 創新人工智能研究框架培訓請參閱附注免責聲明05風險提示誠信 責任 親和 專業 創新68人工智能研究框架培訓請參閱附注免責聲明風險提示051)下游需求不及預期的風險 AI計算產業下游需求目前仍以政企客戶為主,若未來政企客戶購買力受到沖擊,可能出現下游需求不及預期的風險。2)核心元器件受制裁的風險 AI計算核心元器件數據科技前沿領域,對半導體先進制程有一定以來,若未來海外制裁加劇,可能帶來核心元器件斷供風險。3)市場競爭加劇的風險 AI計算行業尚處于發展早期階段,未來市場競爭有可能加劇。本公司具有中國證監會核準的證券投資咨詢業務資格分析師聲明作者具
102、有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業理解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響,特此聲明。免責聲明本報告僅供國泰君安證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。本報告的信息來源于已公開的資料,本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證
103、券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。在任何情況下,本公司、本公司員工或者關聯機構不承諾投資者一定獲利,不與投資者分享投資收益,也不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者務必注意,其據此做出的
104、任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個或多個領域、部門或關聯機構之間的信息流動。因此,投資者應注意,在法律許可的情況下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的情況下,本公司的員工可能擔任本報告所提到的公司的董事。市場有風險,投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素,亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有,未經書面許可
105、,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“國泰君安證券研究”,且不得對本報告進行任何有悖原意的引用、刪節和修改。若本公司以外的其他機構(以下簡稱“該機構”)發送本報告,則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議,本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。免責聲明北京地址:北京市西城區金融大街甲9郵編:200032電話:(010)83939888電話:(021)38676666上海深圳地址:深圳市福田區益田路6009號郵編:518026電話:(0755)23976888國泰君安證券研究所E-mail:地址:上海市靜安區新閘路669號郵編:200041