《工業4.0俱樂部:ChatGPT認知白皮書(151頁).pdf》由會員分享,可在線閱讀,更多相關《工業4.0俱樂部:ChatGPT認知白皮書(151頁).pdf(151頁珍藏版)》請在三個皮匠報告上搜索。
1、IChatGPT 認 知 白 皮 書(討論稿)(2023 年 2 月)作者:杜玉河工業 4.0 俱樂部 工業人工智能創新中心 開源工業聯盟重要提示:本報告僅供內部研究使用,不做投資參考,未經允許,不得復制與轉發。I前前言言雖然我們已經可以開始用 ChatGPT 進行聊天,寫出一些讓人想不到的東西。但如果想了解開源人工智能,想了解 ChatGPT 完整的內容時。我們還需要看各方面的報告,將信息進行拼圖。從這一角度看,人工智能要走的路還很多。我從各種渠道采集了各種的報告,希望能從一個較客觀我的角度來寫一份報告。讓系統了解這一技術進步,以及這處技術給技術發展、產品發展、人工智能的解決方案及各種應用場
2、景帶來哪些好處。對于普通的公司與普通人有什么樣的影響呢?結合這些年的工作,以及從 2020 年開始展開的認知對抗的經歷,給大家盡可能呈現出一個客觀我的場景??陀^來講,ChatGPT 這一次熱潮本身就是由 AIGC 技術本身操縱出來的。他在與大家聊天的同時,也在生成著大家關注的文章,帶著節奏。過去人工智能技術是由人幫人工智能技術去宣傳與推廣。而這一次是人工智能自己為自己炒作。當結合從去年底開始硅谷的裁員潮,可以看出傳統領先的企業已開始采用新技術為自己提升生產力。但這并沒有止步于高科技公司。帶來的影響將是社會級的變化。對于傳統的人類來講,是一次機會,同時也是一次挑戰。杜玉河2023 年 2 月 2
3、1 日龍抬頭I報告導讀報告導讀ChatGPT 是 0penAl 開發的智能聊天機器人程序。不僅能像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。ChatGPT 自發布以來爆火全球,月活破億用時僅 2 個多月,被稱為史上用戶增長最快的消費者應用。憑借其功能多樣,ChatGPT未來的市場規模想象空間巨大,不同領域和形式的商業化嘗試也在逐步推進中,但當下ChatGPT 仍然只能起到輔助作用,技術之外的社會負面問題也值得我們關注。隨著各大巨頭的紛紛涌入,ChatGPT 概念成為市場追逐的熱點,我們梳理出了部分包括百度、阿里等港股市場的關鍵公司。I一、一、前世今生前世今生1.
4、1 基本概念基本概念Chat GPT 是美國人工智能研究實驗室 Open AI 新推出的一種人工智能技術驅動的自然語言處理工具,使用了 Transformer 神經網絡架構,也是 GPT-3.5 架構。這是一種用于處理序列數據的模型,擁有語言理解和文本生成能力,尤其是它會通過連接大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得 Chat GPT 具備上知天文下知地理,還能根據聊天的上下文進行互動的能力,做到與真正人類幾乎無異的聊天場景進行交流。Chat GPT 不單是聊天機器人,還能進行撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。ChatGPT 自 2022 年 11 月 30
5、日發布以來爆火全球,5 天注冊用戶超 100 萬,月活破億用時僅 2 個多月,被稱為“史上用戶增長最快的消費者應用”。I1.2 ChatGPT 為何如此火爆?為何如此火爆?首先,最本質的出圈原因就是大家對于其功能之強大和應用范圍之廣泛的驚嘆,小到簡單的文字對話交流,大到小說文案論文寫作都不在話下,甚至可以實現代碼編寫。并且ChatGPT 在經過了大量數據訓練之后,可以生成更自然、更多樣化的響應,讓人難以辨別其內容是 Al 生成還是真人撰寫。強大的功能使其在學生之間快速傳播,甚至導致其在教育領域遭到“封殺”。據海外媒體報道,美國某大學教授為學生作業評分時,讀到了一篇沒有錯別字和語法錯誤的“最佳論
6、文,最后發現是學生用 ChatGPT 完成的。據調查顯示,美國 89%的大學生在用 ChatGPT 做作業,因此為了避免其危害,教育部開始限制學生對于 ChatGPT 的使用。這也側面反應了ChatGPT 的強大功能和火爆程度。過去 Al 技術已有諸多成功的商業化應用,例如基于人工智能算法的個性化推薦,但人們的感知并不強烈;而過去面向 C 端的產品,體驗并不完善,并未在社會面引起巨大反響并傳播開來。因此 ChatGPT 的面世與出圈,堪稱是迄今為止最成功的的 C 端人工智能應用,意味著 Al 技術對于普羅大眾正式從幕后走向臺前,這對于 Al 技術未來的發展和商業化運用都有著里程碑式的意義。目前
7、,Chat GPT 已經在美國通過了律師從業資格證,并且打贏了很多起法律訴訟案件!美國普林斯頓大學,還用 Chat GPT 拿來做醫療診斷,目前的準確率、可靠性已經遠遠超過資深的醫生!Chat GPT 還通過了谷歌程序員考核,可以拿到 18 萬元的年薪!Ch 來來來 at GPT 還可以幫高校畢業生書寫論文,而且不重復,并高分通過審核!Chat GPT 畫出來的畫的質量也已經超過頂級畫家的水準!上面僅僅是舉幾個例子??梢哉f,Chat GPT 目前顛覆了太多行業,現在各行各業的從業者也是十分的焦慮。例如,Chat GPT 怎樣顛覆房地產行業?以前開發商拿地是盲目的預估,Chat GPT 將會給開
8、發商更加合理的拿地價格。拿地后怎么開發,開發什么戶型,怎么進行營銷,Chat GPT 都會給出更加合理的方案。就是說,人工智能能夠通過大數據整合、信息整合并通過合理的計算方式,自行學習后給出合理的方案。業界有以下看法:也許也許,這是一個可以控制整個元宇宙的技術,這是一個可以控制整個元宇宙的技術實現實現平臺平臺;一場意識形態的核戰爭就要來了一場意識形態的核戰爭就要來了;比經濟危機更嚴重的危機來了。比經濟危機更嚴重的危機來了。I1.3 OpenAI 公司深度分析公司深度分析1OpenAI(開放人工智能4)是美國一個人工智能研究實驗室,由營利組織 OpenAI LP 與母公司非營利組織 OpenAI
9、 Inc 所組成,目的是促進和發展友好的人工智能,使人類整體受益。OpenAI 成立于 2015 年底,總部位于加利福尼亞州舊金山,組織目標是通過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。創始人山姆柯曼以及伊隆馬斯克的動機是出于對強人工智慧潛在風險的擔憂。至 2018 年,OpenAI 的總部坐落于舊金山的米慎區,與伊隆馬斯克的另一座公司 Neuralink 在同一辦公室大樓。1.3.1 組織架構組織架構OpenAI 于 2019 年轉型為營利性人工智能研究實驗室組織。公司由兩個實體組織組成:OpenAI,Inc.,由非營利組織 OpenAI 和營利性組織 OpenAI LP
10、 控制。OpenAI LP 由 OpenAI,Inc(基金會)的董事會管理,作為普通合伙人。同時,有限合伙人包括 LP 的員工、部分董事會成員以及 Reid Hoffman 的慈善基金會、Khosla Ventures 和 微軟,LP 的主要投資者。1https:/zh.wikipedia.org/zh-hans/OpenAII1.3.2 創始創始團隊團隊山姆柯曼、伊爾亞蘇茨克維、格雷格布洛克曼、沃伊切赫扎倫巴、伊隆馬斯克、約翰舒曼、安德烈卡帕西。I1.3.3 運作結構運作結構OpenAI 細分為:OpenAI Inc.,這是一家單一成員特拉華州有限責任公司,OpenAI 和OpenAI LP
11、 控制。微軟是有限合伙人,它還有一項商業協議作為 2019 年投資的 10 億美元的一部分,內容包含 Microsoft/OpenAI Azure AI 超級計算技術。OpenAI 產品通過在微軟 Azure上進行訓練,而微軟將是 OpenAI 人工智能新技術商業化的首選合作伙伴。山姆山姆柯曼柯曼I伊爾亞伊爾亞蘇茨克維蘇茨克維FRS(英語:Ilya Sutskever,1985/1986 年)是一名加拿大計算機科學家,從事機器學習的研究。他是 OpenAI 的聯合創始人及首席科學家。蘇茨克維對深度學習領域做出多項重大貢獻。他與亞歷克斯克里澤夫斯基和杰弗里辛頓是卷積神經網絡 AlexNet 的共
12、同發明人。他也是 AlphaGo 論文的眾多作者之一。21985 年出生,出生地是俄羅斯諾夫哥羅德,這座城市位于俄羅斯西北部。3雖然是俄羅斯出生,但伊爾亞主要是在以色列長大,像很多計算機達人一樣,他從小就展現出對計算機的濃厚興趣,并且學習優異,甚至在大學期間,也曾連跳兩級。借由人類大腦神經元的啟發,上個世紀 80 年代,杰弗里辛頓將反向傳播算法應用到了計算機深度學習,將聯結主義人工智能帶到了新的高度。2015 年,OpenAI 成立,伊爾亞成為這家公司的首席科學家,年薪 190 萬,而后續 chatGPT的理論概念,誕生于伊爾亞與其他學者共同在 2017 年發布的一篇論文,次年,OpenAI
13、推出了 GPT 的第一個版本,如今,GPT 迭代到了 GPT-3,參數量達到了 1750 億,而最近爆火的chatGPT 正是基于 GPT-3.5 開發,上線僅僅五天,就有了 100 萬用戶,就在前不久,ChatGPT實現了月活破億。2012 年,由于辛頓的 AlexNet 神經網絡大獲成功,因其徹底打開全球深度學習的熱潮,AlexNet 又被看作是 AI 深度學習革命的開始。2002 年,伊爾亞全家移民至加拿大多倫多,正是在此期間,伊爾亞遇到了世界 AI 領域的頂級大神、多倫多大學教授杰弗里辛頓(Geoffrey Hinton),他是美國計算機協會認可的“深度學習三巨頭”之一,被業界稱為深度
14、學習教父!2000 年至 2002 年期間,蘇茨克維在就讀于以色列開放大學6。2002 年,他與家人移居加拿大,并轉入多倫多大學,隨后在杰弗里辛頓的指導下獲得數學學士學位(2005 年)6738、計算機科學碩士學位(2007 年)79和博士學位(2012 年)810。2012 年畢業后,蘇茨克維在史丹佛大學的吳恩達那里做了兩個月的博士后。之后他回到多倫多大學,加入辛頓的新研究公司 DNNResearch,這是辛頓研究小組的一個衍生產品。四個月后,在 2013 年 3 月,Google 收購了 DNNResearch,并聘請蘇茨克維為 Google 大腦的研究科學家。在 Google 大腦,蘇茨
15、克維與奧里奧爾維尼亞爾斯和 Quoc Viet Le 合作創建了 Seq2Seq學習算法。2015 年,蘇茨克維被評為麻省理工科技評論35 位 35 歲以下的創新者12。2https:/zh.wikipedia.org/zh-hans/%E4%BC%8A%E7%88%BE%E4%BA%9E%C2%B7%E8%98%87%E8%8C%A8%E5%85%8B%E7%B6%AD3https:/ 年底,他離開 Google,成為新成立的 OpenAI 的主管13。2018 年,蘇茨克維是 NVIDIA NTECH 和人工智慧前沿會議的主旨發言人。他于 2022 年當選為英國皇家學會院士14。2015
16、年底,OpenAI 成立,總部位于加利福尼亞州舊金山,組織目標是通過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。2016 年,OpenAI 宣稱將制造“通用”機器人,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用。2019 年 3 月 1 日成立 OpenAI LP 子公司,目的為營利所用。2019 年 7 月 22 日微軟投資 OpenAI 10 億美元,雙方將攜手合作替 Azure 云端平臺服務開發人工智慧技術。2020 年 6 月 11 日宣布了 GPT-3 語言模型,微軟于 2020 年 9 月 22 日取得獨家授權。2022 年 11 月 30 日,Ope
17、nAI 發布了一個名為 ChatGPT 的自然語言生成式模型,它以對話方式進行交互。在研究預覽期間,用戶注冊并登陸后可免費使用 ChatGPT。但是該項目對一些包括中國大陸、香港在內的地區暫不可用。伊隆伊隆馬斯克馬斯克2015 年,馬斯克和 OpenAI 現任 CEO Sam Altman 等人共同創辦了非營利組織 OpenAI,對外宣稱要避免人工智能滅世。2018 年,OpenAI 突然把馬斯克踢出了董事會,據媒體稱是因為特斯拉深入研究自動駕駛的 AI 技術,與 OpenAI 出現了利益沖突。除此以外,馬斯克對于 OpenAI 的不滿在一定程度上還要歸咎于 ChatGPT 近期種種表現確實讓
18、人大跌眼鏡,比如 ChatGPT 版必應搜索引擎對用戶胡說八道,向用戶示愛,突然發脾氣,遭到質疑時還會 PUA 用戶。結合親自試用的經驗,馬斯卡在推特上對 ChatGPT 開啟了冷嘲熱諷模式:I此外,對于 ChatGPT 把馬斯克列入具有爭議性且應該得到“特殊對待”的名單,馬斯克在一篇相關推文下面回了兩個略顯無奈的感嘆號。I1.3.4 商業模式商業模式OpenAI 的商業模式即 API 接口收費:客戶可以通過 OpenAI 的強大 AI 模型構建應用程序,例如訪問執行各種自然語言任務的 GPT-3、將自然語言翻譯成代碼的 Codex 以及創建和編輯原始圖像的 DALLE。公司按照不同項目的 A
19、I 模式和不同需求進行收費,對于 AI 圖像系統I按不同的圖片分辨率定價;對于 AI 語言文字系統按字符單價收費,對于調整模型和嵌入模型按照文字單價收費,并根據不同的調用模型區別定價。目前 DALLE 方面,已有超過 300 萬人在使用,每天生成超過 400 萬張圖像。其 API 具備快速、靈活、可拓展等性質。1.3.4 產品矩陣產品矩陣OpenAI 不僅僅是不僅僅是 ChatGPT:Open AI 的業務不僅僅局限于 ChatGPT 領域,還包括 DallE2、Whisper 等項目。DALLE2 可根據自然語言的描述創作逼真的繪畫作品,Whisper 是一種語言識別系統,其魯棒性和準確性極
20、高,支持多種語言的轉錄并翻譯成英文。1.3.4.1 核心產品核心產品DALL E 2一個可以根據自然語言的描述創建逼真的圖像和藝術的人工智能系統。對現有圖像進行逼真的編輯。拍攝圖像并創建受原件啟發的不同變體。2021 年 1 月,OpenAI 推出 DALLE 1,并于一年后推出最新系統 DALLE 2,能夠生成更逼真、更準確的圖像,分辨率提高 4 倍。DALLE 2 優于 DALLE 1 的標題匹配和照片級真實感,字幕匹配度優于一代 71.7%,照片級寫實程度優于 DALLE 1 的 88.8%。DALL-E 2 使用了一種改進的 GLIDE 模型,這種模型以兩種方式使用投影的 CLIP 文
21、本嵌入,DALL-E 2 先驗子模型和圖像生成子模型都是基于擴散模型的,體現了其在深度學習中的能力。I1.4.3.2 核心產品核心產品Whisper核心產品Whisper,一個自動語音識別(ASR)系統,對從網絡收集的 68 萬小時的多語言和多任務監督數據進行訓練。使用這樣一個龐大而多樣的數據集可以提高對口音、背景噪聲和技術語言的魯棒性。支持多種語言的轉錄,以及將這些語言翻譯成英語。Whisper 架構:是一種簡單的端到端方法,作為編碼器-解碼器 Transformer 實現。輸入音頻被分成 30 秒的塊,轉換為 log-Mel 頻譜圖,然后傳遞到編碼器中。訓練解碼器來預測相應的文本標題,并與
22、指示單個模型執行語言識別、短語級時間戳、多語言語音聽錄和英語語音翻譯等任務的特殊標記混合在一起。1.4.3.3ChatGPT Plus 訂閱服務訂閱服務2023 年 2 月 10 日,OpenAI 在美國推出了 ChatGPT Plus 訂閱服務,每月收費 20 美元,支持以下功能:高峰時段也能正常訪問 ChatGPT、更快的響應時間、優先使用新功能和改進。根據路透社,OpenAI 預計 2023 年收入 2 億美元,2024 年收入 10 億美元。據華爾街日報,截至 2023 年 1 月,OpenAI 正在就收購要約進行談判,這將使公司估值達到 290 億美元,是公司 2021 年市值的兩倍
23、。2023 年 1 月 23 日,微軟宣布了一項新的對 OpenAI的多年期、數十億美元的投資計劃。紅杉資本預測:ChatGPT 這類生成式 AI 工具,讓機器開始大規模涉足知識類和創造性工作,未來預計能夠產生數萬億美元的經濟價值。1.3.5 技術路線技術路線1.3.5.1 基于基于 GPT-3.5,GPT-4 預計提升更明顯預計提升更明顯ChatGPT 是基于 GPT-3.5 的主力模型,ChatGPT 在互聯網開源數據集上進行訓練,引入人工數據標注和強化學習兩項功能,實現“從人類反饋中強化學習”(Reinforcement Learning fromHuman Feedback,RLHF)
24、。因此,相比于之前的模型,ChatGPT 可以用更接近人類思I考的方式,根據上下文和情景,模擬人類的情緒和語氣回答用戶提出的問題。OpenAI 首席執行官稱,GPT-4 有望成為多模態的人工智能,根據 openAI 創始人 Altman消息,GPT-4 參數預計更大,計算模型優化有望實現更優化,且 GPT-4 將是純文本模型(不是多模態),我們認為 GPT-4 的推出潛在商業價值巨大,模型更具備“擬人化”的功能,文本生成和內容創作有望更加豐富,并有望進入文字工作的相關領域,例如新聞、金融等相關行業。1.3.5.2GPT、Bert 均源自均源自 Transformer 模型模型NLP 模型首選T
25、ransformers。2017 年由 Google Brain 團隊推出深度學習模型Transformer,采用自注意力機制,對輸入數據的每一部分的重要性進行差異加權,主要用于自然語言處理(NLP)和計算機視覺(CV)領域。IBERT(Bidirectional Encoder Representations from Transformers)為谷歌于 2018 年推出的一種基于神經網絡的 NLP 預訓練技術,BERT 在情緒分析和回答問題等分類任務中表現良好,在命名實體識別和下一句預測方面也表現出色。ChatGPT 同樣是根據語言/語料概率來自動生成回答的每一個字(詞語),即利用已經說過
26、的語句作為輸入條件,預測下一個時刻語句出現的概率分布。I1.3.5.3 領先的領先的 NLP 模型模型ChatGPT 是一個出色的 NLP(Natural language processing-自然語言識別)新模型。NLP 隨算力增長突破:在過去的十年里,通過使用簡單的人工神經網絡計算,基于以 GPU、TPU 為代表的強大算力資源,并在巨量的數據上進行訓練,自然語言處理(NLP)取得了令世人矚目的成就和突破。側重文本分析能力:NLP 技術是人工智能(AI)和機器學習(ML)的子集,專注于讓計算機處理和理解人類語言。雖然語音是語言處理的一部分,但自然語言處理最重要的進步在于它對書面文本的分析能
27、力。NLP/NLU 領域已知局限包括對重復文本、對高度專業的主題的誤解,以及對上下文短語的誤解。I1.3.5.4RLHF 與與 TAMER 是重要架構支撐是重要架構支撐RLHF:InstructGPT/GPT3.5(ChatGPT 的前身)與 GPT-3 的主要區別在于,新加入了被稱為 RLHF(Reinforcement Learningfrom Human Feedback,人類反饋強化學習)。循環:訓練范式增強了人類對模型輸出結果的調節,整個訓練過程是人類、代理對目標的理解和 RL 訓練之間的 3 步反饋循環。在 InstructGPT 中,以下是“goodness of sentenc
28、es”的評價標準。真實性:是虛假信息還是誤導性信息?無害性:它是否對人或環境造成身體或精神上的傷害?有用性:它是否解決了用戶的任務?TAMER(Training an Agent Manually via Evaluative Reinforcement,評估式強化人工訓練代理)框架將人類標記者引入到 Agents 的學習循環中,可以通過人類向 Agents 提供獎勵反饋(即指導 Agents 進行訓練),從而快速達到訓練任務目標。通過 TAMER+RL(強化學習),借助人類標記者的反饋,能夠增強從馬爾可夫決策過程(MDP)獎勵進行強化學習(RL)的過程I1.3.6 產業價值產業價值1.3.6
29、.1 帶來搜索產業變革帶來搜索產業變革Bing&Edge+AI:2023 年 2 月 8 日,微軟公司發布了新版必應 AI 搜索引擎和 Edge 瀏覽器,采用了 ChatGPT 開發商 OpenAI 的最新技術 AI 模型 GPT 3.5 的升級版,率先提供更具對話性的網絡搜索和創建內容的替代方式,集搜索、瀏覽、聊天于一體,帶來前所未有的全新體驗。微軟企業副總裁兼消費領域首席營銷官 Yusuf Mehdi 公布的最新推文稱,在新版 Bing上線 48 小時內,已經有超過 100 萬人申請加入。I1.3.6.2 即將賦能即將賦能“千行百業千行百業”以 ChatGPT 為代表的的 AIGC 作為當
30、前新型的內容生產方式,已經率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大創新發展,市場潛力逐漸顯現。數字媒體公司 BuzzFeed 表示公司將使用 OpenAI 開放的應用編程接口(API),該公司將依靠 ChatGPT 的創建者 OpenAI 來加強部分內容創作,并為觀眾個性化一些內容,打算2023 年讓人工智能在公司的編輯和業務運營中發揮更大的作用。未來,ChatGPT 亦可應用在數字營銷的多個領域,譬如內容創建、個性化廣告文案、電子郵件營銷等等,助力增強行業的生產力。I1.4 AIGC:Chat 所應用的技術經所應用的技術經歷歷了哪幾個階段?了哪幾個階段?AIGC
31、 發展可分為三階段,早期萌芽階段(上世紀 50 年代至 90 年代中期),沉淀累積階段(上世紀 90 年代至本世紀 10 年代中期),快速發展階段(本世紀 10 年代中期至今)。1.4.1、早期萌芽階段、早期萌芽階段(1950s-1990s)由于技術限制 AIGC 僅限于小范圍實驗與應用,1957 年出現首支電腦創作的音樂作品,弦樂四重奏依利亞克組曲(Illiac Suite),80 年代末至 90 年代中由于高成本及難以商業化,因此資本投入有限導致 AIGC 無較多較大成績。1.4.2、沉淀累積階段、沉淀累積階段(1990s-2010s)AIGC 從實驗性轉向實用性,2006 年深度學習算法
32、取得進展,同時 GPU,CPU 等算力設備日益精進,互聯網快速發展,為各類人工智能算法提供海量數據進行訓練。2007 年首部人工I智能裝置完成的小說 I The Road(在路上)問世,2012 年微軟展示全自動同聲傳譯系統,主要基于“深度神經網絡”(Deep Neural Network,DNN)自動將英文講話內容通過語音識別等技術生成中文。1.4.3、快速發展階段、快速發展階段(2010S 至今至今)2014 年深度學習算法“生成式對抗網絡”(Generative Adversarial Network,GAN)推出并迭代更新,助力 AIGC 新發展。2017 年微軟人工智能少年“小冰”推
33、出世界首部由人工智能寫作的詩集陽光失了玻璃窗,2018 年 NVIDIA(英偉達)發布 StyleGAN 模型可自動生成圖片,2019 年 DeepMind 發布DVD-GAN 模型可生成連續視頻。2021 年 Open AI 推出 DALL-E 并更新迭代版本 DALL-E-2,主要用于文本、圖像的交互生成內容。我國 AIGC 市場在 2022 年底引起較大關注,2023 年開年企業端躍躍欲試。雖然行業仍處于起步階段,距離大規模證明和體系化發展仍有距離,但從資 本的加碼到應用場景的探索,距離的縫隙有望逐步填補,同時,“模塊分拆+個性化推薦”的“泛 AIGC”形式有望持續發展。1.5 Char
34、t GPT 的發展的發展ChatGPT 是由 OpenAl 團隊研發創造,OpenAl 是由創業家埃隆-馬斯克、美國創業孵化器Y Combinator 總裁阿爾特曼、全球在線支付平臺 PayPal 聯合創始人彼得-蒂爾等人于 2015 年在舊金山創立的一家非盈利的 AI 研究公司,擁有多位硅谷重量級人物的資金支持,啟動資金高達 10 億美金;OpenAl 的創立目標是與其它機構合作進行 Al 的相關研究,并開放研究成果以促進 Al 技術的發展。1.5.1 OpenAl 的的 ChatGPT 是一種什么樣的技術?是一種什么樣的技術?它是生成式人工智能技術(AIGC)浪潮的一部分。與其并齊的還有其
35、他幾個技術。I1.5.2ChatGPT 技術演進經歷了哪幾個過程?技術演進經歷了哪幾個過程?ChatGPT 是在 GPT 基礎上進一步開發的自然語言處理模型。GPT 模型是一種自然語言處理(NLP)模型,使用多層變換器(Transformer)來預測下一個單詞的概率分布,通過訓練在大型文本語料庫上學習到的語言模式來生成自然語言文本。從 GPT-1 到 GPT-3 智能化程度不斷提升,ChatGPT 的到來也是 GPT-4 正式推出之前的序章1.5.3ChatGPT 發布后市場影響力如何?發布后市場影響力如何?根據 UBS 發布的研究報告顯示,ChatGPT 在 1 月份的月活躍用戶數已達 1
36、億,成為史上用戶數增長最快的消費者應用。相比之下,TikTok 花了九個月的時間月活躍用戶數才破億,而 Instagram 則花費了兩年半的時間,同時,根據 Similar Web 的披露信息,Spotify 在四年半后僅積累了 1 億月活躍用戶。根據 Similar Web 的數據,1 月份平均每天有超過 1300 萬名獨立訪問者使用 ChatGPT,是去年 12 月份的兩倍多。I1.5.4.ChatGPT 都能做什么事情?都能做什么事情?由于 ChatGPT 包含了更多主題的數據,能夠處理更多小眾主題。ChatGPT 能力范圍可以覆蓋回答問題、撰寫文章、文本摘要、語言翻譯和生成計算機代碼等
37、任務。1.5.5.ChatGPT 具備哪些先進性的特征?具備哪些先進性的特征?ChatGPT 嵌入了人類反饋強化學習以及人工監督微調,因而具備了理解上下文、連貫性等諸多先進特征,解鎖了海量應用場景。當前,ChatGPT 所利用的數據集只截止到 2021 年。在對話中,ChatGPT 會主動記憶先前的對話內容信息(上下文理解),用來輔助假設性的問題的回復,因而 ChatGPT 也可實現連續對話,提升了交互模式下的用戶體驗。同時,ChatGPT 也會屏蔽敏感信息,對于不能回答的內容也能給予相關建議。II二、二、市場現狀市場現狀2022 年 9 月的 AI 繪畫作品太空歌劇院獲得美國科羅拉多州 博覽
38、會的藝術比賽的第一名,當時有人預測若未來五年有 10%-30%的圖片在 AI 的幫助下誕生,那么 AI 繪畫則將創造超過 600 億元的市 場空間,若考慮到下一代互聯網對內容需求的迅速提升,則可能創造更 大的市場規模。隨后 OpenAI 的 ChatGPT 一問世就多次刷新之前 APP 注冊用戶數量突破的紀錄,業內預測帶動的市場規模將破萬億。1.ChatGPT 是否已觸發新一輪的是否已觸發新一輪的 AI 發展浪潮?發展浪潮?2023 年初,微軟和谷歌均宣布裁員計劃,但都加大了在 Al 行業的投入。2、國內外主要有哪些玩家?國內外主要有哪些玩家?國內外科技巨頭積極布局深成是 AI,部分公司已有成
39、型產品。I2.1 谷歌谷歌面對 ChatGPT 構成的威脅,注資 3 億美元投資競品 Anthropic.2.2 微軟微軟OpenAI 的最大投資方,開始利用 ChatGPTj 是局產品競爭力。I2.3 亞馬遜亞馬遜ChatGPT 受到重點關注,已廣泛運用在各種工作職能中。2.4Buzzfoed 美國新媒體巨頭美國新媒體巨頭2.5 Stability AlStable Diffusion 大熱,Open Al 在圖片生成 Al 大有可為。I2.6 Jasper采用同類底層技術,進一步證明 ChatGPT 的巨大商業潛力。2.6 百度百度百度:1 月 10 日,百度宣布將升級百度捜素的生成式捜索
40、能力,智能解答用戶的捜素提問;2 月 7 日,百度宣布將在 3 月份 完成其 ChatGPT 產品的內測,面向公眾開放,該項目名字為文心一言(ERNIE Bot),百度指出,生成式 AI 和搜索引擎是互補關系而不是替代;據路透社報道,百度計劃于 3 月將類似 ChatGPT 的 AI 對話服務作為獨立血用推岀,之后再逐步將其合并到捜索引擎中。I2.7 騰訊騰訊2 月 3 日,騰訊公布一項人機對話專利,能夠實現機器與用戶之間自然且順暢的溝通。專利摘要顯示,該方法包括:當人機對話被激活時,在預設文本庫中獲取用于進行人機對話的參考文本;根據所參考文本,確定出對話過程中用于生成應答信息的背景信息;接收
41、人機對話的對話信息;根據對話信息和背景信息,確定出對應的應答信息。通過該申請,能夠實現機器與用戶之間自然且順暢的溝通,提高用戶的使用體驗度。4該項專利與這段時間爆火的人工智能聊天機器人 ChatGPT 的原理十分相似,ChatGPT是由初創公司 OpenAI 開發,并于 2022 年 11 月 30 日上線的對話式 AI 模型,是 AIGC(人工智能生成式內容)的一種應用和產品,能實現撰寫代碼、回答問題、書寫論文、詩歌、劇本等指令。3、與與 ChatGPT 相比還有哪些技術公司?相比還有哪些技術公司?AIGC 創業公司大比拼,國外 ChatGPT 的優勢遙遙領先并有望延續。4http:/ AI
42、GC 產業如何發展,人工智能的分析、創作、決策能力都 依賴海量數據。因此決定不同機器間能力差異的就是數據的數量與質量。I2.1.1、數據查詢與處理、數據查詢與處理通常來說數據庫有兩種模型,一種像湖泊,匯聚來自各地的水源 而不作區分;另一種像倉庫,分門別類的存儲數據。近幾年在科技的 推動下,現代數據庫一般都是兩種模型的結合,兼具二者的易用性、規范性等特征,還為用戶帶來降本增效、省時省力等特點。根據對其 中數據的查詢與處理等時效性,涉及其中業務的公司可分為異步處理 型公司和實時處理型公司。2.1.2、數據轉換與編排、數據轉換與編排數據的處理主要涉及提取,加載和轉換。根據海外市場研究企業 Grand
43、 View Research的數據,2021 年全球數據集成工具市場的規 模約 105 億美元,在未來十年將以年復合增長率約 12%的速度增長。根據處理方式的區別,這種公司可以分為本地部署型公司和云端原生 型公司。2.1.3、數據標注與管理、數據標注與管理不論哪種機器學習模型,都可以簡化為“老師教學生知識”,其 中對知識點等數據就需要標注與管理,從而進行監督,最終形成各種 不同的算法模型。根據 Grand View Research 的數據,2021 年全 球數據標注市場規模約為 16.7 億美元,在未來十年將以年復合增長 率約 25%的速度增長。根據公司業務拓展程度的差異,這種公司可 以分為
44、基礎型公司和擴張型公司。2.1.4、數據治理與合規、數據治理與合規在數字經濟時代,數據是和土地、人力、資本一樣舉足輕重的生 產資料。因此就需要保證數據資產在管理時預先設置質量規范,在后 期的訪問和調取時也要做到合法合規,因此這項服務也就成為各大企 業的必需品。根據海外市場研究企業 ReporterLinker 的數據,全球 數據治理市場規模約 18 億美元,預計未來幾年將以年復合增長率約 22%的速度增長.根據服務交付模式,這種公司可以分為工具型公司和定制型公司。2.2、產業中游:算法模型、產業中游:算法模型算法模型是 AIGC 最核心的環節,是機器學習的關鍵所在。它包含三類參與者:專門實驗室
45、、企業研究院、開源社區。I2.2.1、AI 實驗室實驗室算法模型在 AI 系統中起決策作用,是它完成各種任務的基礎,可 以視為 AI 系統的靈魂所在。很多企業為了更好地研究算法并推動商 業化落地,在內部都設立專門的實驗室,因此這種實驗室可以分為獨 立型實驗室和附屬型實驗室。2.2.2、企業研究院、企業研究院一些集團型公司或企業往往會設立專注于前沿科技領域的大型研 究院,下設不同領域的細分實驗室,通過學術氛圍更濃厚的管理方式 為公司的科研發展添磚加瓦。2.2.3、開源社區開源社區開源社區對 AIGC 非常重要,它提供了一個共享成果、代碼的平 臺,還可以與其他人相互合作,共同推動 AIGC 相關技
46、術的進步。根據覆蓋領域的寬度和深度,這種社區可以分為綜合型開源社區和垂直型開源社區。I2.3、產業下游:應用拓展、產業下游:應用拓展任何優秀的科研成果都需要最終落地部署才能產生實際意義和價 值,算法模型也不例外。在 AIGC 產業鏈的下游,可以將相關應用拓 展到四個主要場景:文本處理、音頻處理、圖像處理、視頻處理。2.3.1.1、文本處理、文本處理目前,文本處理是 AIGC 相關技術距離普通消費者最近的場景,也是技術較為成熟的場景,許多應用公司都會從多個維度出發,輔助 業務拓展與商業化過程中。一般說來文本處理可以細分為營銷型、銷 售型、續寫型、知識型、通用型、輔助型、交互型、代碼型。I2.2.
47、3.2、音頻處理、音頻處理此處主要介紹由語音合成技術來生成的相關應用,與視頻相關的 將放在視頻部分說明。目前的音頻處理主要分為三類:音樂型、講話 型、定制型,很多公司都專注于此。AI 的應用將優化供給效率,改 善整體利潤水平。2.2.3.3、圖片處理、圖片處理圖片的創作門檻比文字高,傳遞信息也更直觀,所以商業化的潛 力自然也更高。隨著 AIGC 應用的日益廣泛,圖片處理也就從廣告、設計、編輯等角度帶來更大更多的機遇。圖片處理可細分為生成型、廣告型、設計型、編輯型。2.2.3.4、視頻處理、視頻處理隨著時代的發展,人們在視頻上的投入逐漸超出了在圖片上的,視頻也日益成為新時代最主流的內容消費形態。
48、因此將 AIGC 引入視頻將是全新的賽道,也是技術難度最大的領域。視頻處理可以細分為 生成型、編輯型、定制型、數字虛擬人視頻。I四、四、生態全景圖生態全景圖I五、五、技術架構體系技術架構體系I六、六、基本原理與技術的演進基本原理與技術的演進1、AI 構建構建1.1、圖靈測試與、圖靈測試與 AI 的誕生的誕生1950 年,人工智能的先驅艾倫 圖靈發表了一篇劃時代的論文 計算機器與智能,文中提出了著名的圖靈測試:“如果一臺機器能夠與人類展開對話(通過電信設備)而保證其機器身份不被識破,那么就可以認為這臺機器具有智能?!贝送馕恼逻€預言了在未來可能創造出具有真正智能的機器。圖靈測試最初版本的示意圖雖然
49、圖靈測試從理論上驗證了機器擁有智能的可能性,但 AI 正式發展成一門專業學科則是在 1956 年的達特茅斯會議,會議的組織者與參與者都是數一數二的科學家,包括約翰麥卡錫,馬文閔斯基,納撒尼爾羅切斯特,克勞德香農等。在這次會議上,“人工智能”的名稱與概念正式確立,因此這次會議也被視為 AI 產業的起點。1.2、人工智能發展的三種流派、人工智能發展的三種流派1.2.1、符號主義、符號主義符號主義認為人類的一切活動(包括體力活動和智力活動)都是符合某種邏輯的,所有信息都可以用各種符號表示,人類的認知過程 就可以視為基于邏輯規則的,操作這些符號的過程。根據這種理論,如果電腦能自動執行和人腦一樣的規則和
50、過程,那么就可以視為實現了人工智能。I1.2.2、聯結主義、聯結主義聯結主義與符號主義幾乎是同時提出的,人工智能的關鍵不在于讓電腦等機器實現智力活動,而應該模仿人腦的結構。這派觀點認為智能是人腦細胞與神經元彼此連接成網絡共同處理信息的結果,如果 能在電腦中模擬這種結構再實現人工智能自然也更輕松。早在電腦發明前的 40 年代,就有持這種觀點的科學家進行了數學建模,奠定了后來人工神經網絡和專家系統的雛形。1.2.3、行為主義、行為主義與前兩種流派不同的,行為主義于上世紀 80 年代提出,它倡導“感知+行動”。這種觀點源于“控制論”,強調模擬人在控制過程 中的智能行為和動作。但是限于時代和科技發展,
51、行為主義直到上世 紀末,隨著智能控制與機器人逐漸興起才引起重視。截至目前的 AI 發展,幾乎都是三種流派的結合運用。專家系統結構示意圖2、AI 學習學習2.1、機器學習的概念、機器學習的概念在 1950 年,圖靈的論文計算機器與智能中提出了“學習機器”的概念,現在已經發展成 AI 科學中的一個獨立分支。機器學習主要是設計和分析一些讓電腦可以“自動學習”的算法,是一類從數 據中自動分析和獲得規律,并利用規律對未知數據進行預測的算法。從技術角度說,這一理論關注可以實現的,行之有效的學習算法(要防止錯誤累積)。I機器學習理論示意圖2.2、機器學習算法的分類、機器學習算法的分類2.2.1、感知器算法、
52、感知器算法機器學習中最容易理解與實現的是監督學習與無監督學習,前者就是感知器算法的典型案例之一,它也是人工神經網絡的基礎。簡要說來,監督學習是從給定的訓練數據集中學習出一個函數,再接收到新數據時就可以根據這個函數預測結果。監督學習的訓練集要求包括 輸入和輸出,也可以說是特征和目標,訓練集中的各項目標都是人為 標注的。與之原理類似的,無監督學習就是目標沒有人為標注,但還保有 訓練集且同樣要求輸入和輸出。不同形態的機器學習對比2.2.2、神經網絡算法、神經網絡算法這種算法可以視為多層感知器,除了輸入輸出層外,它還加入了若干隱藏層。隱藏層中的神經元節點可以與輸入輸出節點相連,每條鏈接上都有各自的權重
53、系數,最終形成一個網絡結構。之所以要加入 隱藏層,是因為現實中很多情況都不是簡單的二元對立,總有這樣那樣的變化需要考慮。I單層人工神經網絡示意圖2.2.3、強化學習算法、強化學習算法與監督和無監督學習更重視學習數據不同,強化學習是在給定的 數據環境下,讓機器學習如何通過選擇一系列行動來達成長期累計收 益最大化的目標。從本質上說,這種算法學習的是一套決策系統而非 數據,它在很多游戲中都有運用。著名的阿爾法狗(AlphaGo)就 結合了強化學習與專家系統,能連續擊敗多位人類圍棋高手,名噪一時。強化學習構成元素及其關系通過前面的介紹可以發現,不論哪種機器學習算法,對特征的選 取和處理在模型訓練中是很
54、重要的,但在很多情況下要直接提取合適 且有效的特征是很困難的,如提取海量圖片和句子的特征。此時的機 器學習就不能只局限于圖片或句子的某一特征,而是它們背后隱含的復雜關系。因此需要結合深度模型進行自動計算,而模型主要是深度。神經網絡,這是一種更復雜的神經網絡。深度學習算法就是采用類似的深層次結構進行機器學習的算法,目前大火的 ChatGPT 就運用了這種算法。I不同形態的機器學習關系示意圖3、怎樣理解、怎樣理解 ChatGPT 技術先進性?技術先進性?3.1 ChatGPT 的技術是怎樣進化來的?的技術是怎樣進化來的?ChatGPT 所能實現的人類意圖,來自于機器學習、神經網絡以及 Transf
55、ormer 模型的多種技術模型積累。3.2 為什么說為什么說 ChatGPT 應用應用 Transformer 標志著基礎模型時代標志著基礎模型時代的開始?的開始?轉移學習轉移學習(Transfer Learning)使基礎模型成為可能使基礎模型成為可能。技術層面上,基礎模型通過轉移學習(Transfer Learning)(Thrun 1998)和規模(scale)得以實現。轉移學習的思想是將從一項任務中學習到的“知識”(例如,圖像中的對象識別)應用于另一項任務(例如,視頻中的活動識別)。在深度學習中,預訓練又是轉移學習的主要方法在替代任務上訓練模型(通常只是達到目的的一種手段),然后通過微
56、調來活應感興趣的下游任務。轉移學習(TransferLearning)使基礎模型成為可能。大規?;ù笠幠;╯cale)使基礎模型更強大,因而)使基礎模型更強大,因而 GPT 模型得以形成。模型得以形成。大規模需要三個要素:I(i)計算機硬件的改進例如,GPU 吞吐量和內存在過去四年中增加了 10 倍;(ii)Transformer 模型架構的開發(Vaswani et al.2017),該架構利用硬件的并行性來訓練比以前更具表現力的模型;以及(iii)更多訓練數據的可用性?;?Transformer 的序列建模方法現在應用于文本、圖像、語音、表格數據、蛋白質序列、有機分子和強化學習等,這
57、些例子的逐步形成使得使用一套統一的工具來開發各種模態的基礎模型這種理念得以成熟。例如,GPT-3(Brown et al.2020)與 GPT-2 的 15 億參數相比,GPT-3 具有 1750 億個參數,允許上下文學習,在上下文學習中,只需向下游任務提供提示(任務的自然語言描述),語言模型就可以適應下游任務,這是產生的一種新興屬性。3.3Transformer 針對不同場景的技術原理有哪些?針對不同場景的技術原理有哪些?Transformer 實現的不同技術場景對應的不同技術原理。Transformer 架構可分為自回歸系列(例如 GPT-3,偏好生成性任務)、雙向 Transformer
58、+Mask 的自編碼系列(例如 BERT 偏好自然語言理解)、Encoder-decoder 架構(例如 T5,使用雙向/單向 attention,偏好條件文本生成)3.4 GPT-1 能做什么?進行無監督訓練和有監督微調。能做什么?進行無監督訓練和有監督微調。借助預訓練,進行無監督訓練和有監督微調。GPT-1 模型基于 Transformer 解除了順序關聯和依賴性的前提,采用生成式模型方式,重點考慮了從原始文本中有效學習的能力,這對于減輕自然語言處理(NLP)中對監督學習的依賴至關重要。GPT(Generative Pre-trainingTransformer)于 2018 年 6 月由
59、 OpenAl 首次提出。GPT 模型考慮到在自然語言理解中有大量不同的任務,盡管大量的未標記文本語料庫非常豐富,但用于學習這些特定任務的標記數據卻很少,這使得經過區分訓練的模型很難充分執行。同時,大多數深度學習方法需要大量手動標記的數據,這限制了它們在許多缺少注釋資源的領域的適用性;在考慮以上局限性的前提下,GPT 論文中證明,通過對未標記文本的不同語料庫進行語言模型的生成性預訓練,然后對每個特定任務進行區分性微調,可以實現這些任務上的巨大收益。和之前方法不同,GPTI在微調期間使用任務感知輸入轉換,以實現有效的傳輸同時對模型架構的更改最小。模型更簡化模型更簡化、計算加速計算加速,更適合自然
60、語言生成任務更適合自然語言生成任務(NLG)。GPT 相比于 Transformer 等模型進行了顯著簡化。相比于 Transformer,GPT 訓練了一個 12 層僅 decoder 的解碼器(原Transformer 模型中包含 Encoder 和 Decoder 兩部分)。相比于 Google 的 BERT(BidirectionalEncoder Representations from Transformers,雙向編碼生成 Transformer),GPT 僅采用上文預測單詞(BERT 采用了基于上下文雙向的預測手段)。3.5 GPT-2 能做什么?能做什么?GPT-2:采用多任
61、務系統采用多任務系統,基于基于 GPT-1 進行優化進行優化。GPT-2 在 GPT-1 的基礎上進行諸多改進,實現執行任務多樣性,開始學習在不需要明確監督的情況下執行數量驚人的任務。在 GPT-2階段,OpenAl 去掉了 GPT-1 階段的有監督微調(fine-tuning),成為無監督模型。大模型 GPT-2是一個 1.5B 參數的 Transformer,在其相關論文中它在 8 個測試語言建模數據集中的 7 個數據集上實現了當時最先進的結果。模型中,Transfomer 堆疊至 48 層。GPT-2 的數據集增加到8 million 的網頁、大小 40GB 的文本。GPT-2 仍未解決
62、應用中的諸多瓶頸仍未解決應用中的諸多瓶頸。GPT-2 聚焦在無監督、zero-shot(零次學習)上,然而 GPT-2 訓練結果也有不達預期之處,所存在的問題也亟待優化。在 GPT-2 階段,盡管體系結構是任務無關的,但仍然需要任務特定的數據集和任務特定的微調;要在所需任務上實現強大的性能,通常需要對特定于該任務的數干到數十萬個示例的數據集進行微調。I3.6 GPT-3 有了哪些突破?有了哪些突破?GPT-3 取得突破性進展,任務結果難以與人類作品區分開來。GPT-3 對 GPT-2 追求無監督與零次學習的特征進行了改進 GPT-3 利用了過濾前 45TB 的壓縮文本,在諸多 NLP 數據集中
63、實現了強大性能。GPT-3 是一個具有 1750 億個參數的自回歸語言模型,比之前的任何非稀疏語言模型多 10 倍。對于所有任務(在 few-shot 設置下測試其性能),GPT-3 都是在沒有任何梯度更新或微調的情況下應用的,僅通過與模型的文本交互來指定任務和 few-shot 演示。GPT-3 在許多 NLP 數據集上都有很強的性能(包括翻譯、問題解答和完形填空任務),以及一些需要動態推理或領域適應的任務(如解譯單詞、在句子中使用一個新單詞或執行三位數算術)。GPT-3 可以生成新聞文章樣本(已很難將其與人類撰寫的文章區分開來)。InstructGPT 又是什么?與又是什么?與 GPT-3
64、 有什么區別?有什么區別?InstructGPT 模型在 GPT-3 基礎上進一步強化。InstructGPT 使用來自人類反饋的強化學習方案 RLHF(reinforcement learning from human feedback),通過對大語言模型進行微調,從而能夠在參數減少的情況下,實現優于 GPT-3 的功能InstructGPT 提出的背景:使語言模型更大并不意味著它們能夠更好地遵循用戶的意圖,例如大型語言模型可以生成不真實、有毒或對用戶毫無幫助的輸出,即這些模型與其用戶不一致。另外,GPT-3 雖然選擇了少樣本學習(few-shot)和繼續堅持了 GPT-2 的無監督學習,但
65、基于few-shot 的效果,其稍遜于監督微調(fine-tuning)的方式?;谝陨媳尘?,OpenAl 在 GPT-3基礎上根據人類反饋的強化學習方案 RHLF,訓練出獎勵模型(reward model)去訓練學習模型(即:用 Al 訓練 Al 的思路)。InstructGPT 的訓練步驟為:對 GPT-3 監督微調訓練獎勵模型(reward model)增強學習優化 SFT(第二、第三步可以迭代循環多次)I3.7ChatGPT 核心優勢是什么?核心優勢是什么?ChatGPT 核心技術優勢是提升了理解人類思維的準確性。核心技術優勢是提升了理解人類思維的準確性。InstructGPT 與 C
66、hatGPT 屬于相同代際的模型,ChatGPT 只是在 InstructGPT 的基礎上增加了 Chat 屬性,且開放了公眾測試ChatGPT 提升了理解人類思維的準確性的原因在于利用了基于人類反饋數據的系統進行模型訓練3.8ChatGPT 采用的什么樣的范式?采用的什么樣的范式?ChatGPT 得益于通用(基礎)模型所構建 Al 系統的新范式?;A模型(Foundation Model)在廣泛的應用中整合構建機器學習系統的方法,它為許多任務提供了強大的杠桿作用;基礎模型是在深度神經網絡和自我監督學習的基礎上演化而來?;A模型基于廣泛數據(通常使用大規模自我監督)訓練的任何模型,可以適應(例
67、如微調)廣泛的下游任務,目前例子包括 BERT(Devlin et al.)、GPT-3(Brown et al.2020)和 CLIP(Radford et al.2021);機器學習使學習算法同質化(例如,邏輯回歸),深度學習使模型架構同質化(如卷積神經網絡),而基礎模型使模型本身同質化(比如 GPT-3)。3.9ChatGPT 會在哪些領域中進行應用?會在哪些領域中進行應用?ChatGPT 以基礎模型為杠桿,可適用多類下游任務。ChatGPT 采用了 GPT3.5(InstructGPT)大規模預訓練模型,在自然語言理解和作品生成上取得極大性能提升。鑒于傳統鑒于傳統 NLP 技術的局限問
68、題,基于大語言模型(技術的局限問題,基于大語言模型(LLM)有助于充分利。)有助于充分利。用海量無標注I文本預訓練,從而文本大模型在較小的數據集和零數據集場景下可以有較好的理解和生成能力?;诖竽P偷臒o標準文本書收集,ChatGPT 得以在情感分析、信息鉆取、理解閱讀等文本場景中優勢突出。隨著訓練模型數據量的增加隨著訓練模型數據量的增加,數據種類逐步豐富數據種類逐步豐富,模型規模以及參數量的增加模型規模以及參數量的增加,會進一步促進模型語義理解能力以及抽象學習能力的極大提升,實現 ChatGPT 的數據飛輪效應(用更多數據可以訓練出更好的模型,吸引更多用戶,從而產生更多用戶數據用于訓練,形成良
69、性循環)。研究發現,每增加參數都帶來了文本合成和/或下游 NLP 任務的改進有證據表明,日志丟失與許多下游任務密切相關,隨著規模的增長,日志丟失呈現平穩的改善趨勢。3.10 大模型架構產生的根本原因是什么?大模型架構產生的根本原因是什么?ChatGPT 大模型架構也是 ML 發展到第三階段的必然產物。ML 中的計算歷史分為三個時代:前深度學習時代、深度學習時代和大規模時代。在大規模時代,訓練高級 ML 系統的需求快速增長 計算、數據和算法的進步是指導現代機器學習(ML)進步的三個基本因素。在 2010年之前,訓練計算的增長符合摩爾定律,大約每 20 個月翻一番,自 2010 年代早期深度學習(
70、Deep Learning)問世以來,訓練計算的規模已經加快,大約每 6 個月翻一番。2015 年末,隨著公司開發大規模 ML 模型,訓練計算需求增加 10 至 100 倍,出現了一種新趨勢訓練高級 ML 系統的需求快速增長。2015-2016年左右,出現了大規模模型的新趨勢。這一新趨勢始于2015年末的AlphaGo,并持續至今(GPT-3 于 2020 年出現)。I七、七、產業全景圖產業全景圖1、AIGC:人工智能生成內容,:人工智能生成內容,Web3 時代的生產工具。時代的生產工具。AIGC(AI Generated Content),即通過人工智能自動生成內容,具體指基于大型語言模型
71、LLM、生成對抗網絡 GAN 等深度學習技術,輸入數據后由人工智能生成相關內容。目前AIGC 已進入成長期,AI 生成圖像、文字、代碼、音樂等領域均已有相關應用落地,我們認為隨著 B、C 兩端的快速普及,AI 創作生產 內容將成為下一階段的重要內容生產方式。2、當下為何關注當下為何關注 AIGC:落地前的技術積累已經基本完成:落地前的技術積累已經基本完成。I3、當下為何關注當下為何關注 AIGC:ChatGPT 誕生,催化誕生,催化 AIGC 商業商業化價值化價值。ChatGPT 實現了從技術提升到技術突破的轉變。此前殘差網絡及 Transformer 的出現使得模型的深度和參數量指數級增加,
72、大模型成為可能,AIGC 應用飛速發展;太語言模型出現后,大模型的使用方式從預訓練的單一任務模型迭代到多模態模型,微調時所需的標注數據量顯著減少,從而降低了業務的使用成本。在此基礎上、2022 年 11 月,ObenAI 上線了機器人對話模型 ChutGPT(GPT-3.5),新模型參數量為 1750 億(人腦神經元數量為 120-140 億),遠超此前模型的參數量。Cha(GPT 引入了 RL/HF(基于人類反饋的強化學習),能夠在大部分領域與人類進行持續的語言交互,實現了歷史性的突破。ChatGPT 標志著 AIGC 規?;?、商業化應用的開始,人類的內容生產習慣將被改變。盡管此前 Stab
73、le Diffusion、Midjoumey 等 AI 繪畫應用已經落地,但注冊及使用門檻仍相對較高。ChutGPT 的對話機器人屬性及免費試用窗口期使其能夠廣泛觸達用戶,瑞銀數據顯示上線兩月用戶數已突破一億,系目前用戶增長最快的消費應用,2023 年 1 月推出付費訂閱版,每月價格20美元。我們認為,ChatGPT之于OpenAI,可以對標AlphaGo和AlphaFold之于DeepMind,開啟了 AIGC 認知普及的一大步,是 AIGC 內容批量規?;a的起點。4、行業將會以什么樣的進程向前發展呢?、行業將會以什么樣的進程向前發展呢?AIGC 多模態交互功奠定多場景商用基能持續演化。
74、5、II八、八、ChatGPT 應用場景應用場景1、ChatGPT 試點訂閱計劃試點訂閱計劃-ChatGPTPlus 發布發布,商業化序商業化序幕已經拉開幕已經拉開2023 年 2 月 2 日,OpenAl 發布 ChatGPT 試點訂閱計劃ChatGPT Plus,每月 20 美元。ChatGPT Plus 訂閱者可獲得比免費版本更穩定、更快的服務,及嘗試新功能和優化的優先權。2、ChatGPT+傳媒傳媒:實現智能新聞寫作實現智能新聞寫作,提升新聞的時效性提升新聞的時效性ChatGPT 可以幫助新聞媒體工作者智能生成報道,將部分勞動性的采編工作自動化,更快、更準、更智能地生成內容。I3、Ch
75、atGPT+影視:拓寬創作素材,提升作品質量影視:拓寬創作素材,提升作品質量ChatGPT 可以根據大眾的興趣身定制影視內容,從而更有可能吸引大眾的注意力,獲得更好的收視率、票房和口碑;ChatGPT 可以為劇本創作提供新思路,創作者可根據 ChatGPT的生成內容再進行篩選和二次加工,從而激發創作者的靈感,開拓創作思路,縮短創作周期。ChatGPT 有著降本增效的優勢,可以有效幫助影視制作團隊降低在內容創作上的成本,提高內容創作的效率,在更短的時間內制作出更高質量的影視內容。5、ChatGPT+營銷:打造虛擬客服,賦能產品銷售營銷:打造虛擬客服,賦能產品銷售ChatGPT 可以打造虛擬客服,
76、助力產品營銷。6、ChatGPT+娛樂:人機互動加強,激發用戶參與熱情娛樂:人機互動加強,激發用戶參與熱情ChatGPT 可以成為線上的實時聊天對象,增加互動的趣味性和娛樂性。I7、ChatGPT+其他:促進數實共生,助力產業升級其他:促進數實共生,助力產業升級ChatGPT+教育:賦予教育教材新活力,讓教育方式更個性化、更智能ChatGPT+金融:幫助金融機構降本增效,讓金融服務更有溫度ChatGPT+醫療:賦能醫療機構診療全過程I九、九、行業的發展趨勢行業的發展趨勢1、AIGC:利用人工智能產生內容,提升生產力曲線:利用人工智能產生內容,提升生產力曲線AlGC:Artificial Int
77、elligence Generated Context,即可以利用人工智能技術自動產生內容,常見如代碼生成,文本問答等。2、ChatGPT 已成為已成為 AIGC 功能矩陣中的重要板塊功能矩陣中的重要板塊ChatGPT 是 AIGC“數字內容智能編輯”功能中的重要組成部分,ChatGPT 模型的出現對于文字/語音模態的 AlGC 應用具有重要意義。隨著深度學習技術的快速突破以及數字內容的海量增長,AIGC 領域相關技術打破了預定義規則的局限性,使得快速便捷且智慧地輸出多模態的數字內容成為可能。在技術創新以及多模態模型的持續突破下,AIGC 根據功能和對象的不同,按順序可包括三種主要實用功能:數
78、字內容孿生、數字內容的智能編輯、數字內容的智能創作。這三種功能相互嵌套與結合,可以讓 AIGC 產品具備超越人類的創作潛力。而 ChatGPT 正是 AlGC 的數字內容智能編輯這一大功能領域中的重要組成部分。I3、AIGC 相關技術包含了三大前沿能力相關技術包含了三大前沿能力數字內容李生能力構建現實世界-虛擬世界映射。孿生能力包括智能增強與轉譯技術,其中增強技術彌補內容數字化過程中的信息損失,轉譯技術在理解基礎上對內容進行多種形式呈現;數字編輯能力打通現實世界虛擬世界交互通道。編輯能力包括智能語義理解與屬性控制、語義理解除助實現數字內容各屬性的分離解耦,屬性控制則在理解基礎上對屬性進行精確修
79、改、編輯與二次生成,最終反饋于現實世界,形成孿生-反饋閉環;數字創作能力從數據理解走向數據創作。創作能力可分為基于模仿的創作與基于概念的創作,前者基于對某一類作品數據分布進行創作,而后者從海量數據中學習抽象概念,并基于概念創作出現實世界不存在的內容。4、AIGC 行業發展經歷了三個主要時期行業發展經歷了三個主要時期AIGC 發展經歷了早期萌芽、沉淀積累和 2014 年之后的快速發展階段。I5、從分析式從分析式 Al 到生成式到生成式 Al 逐步演化逐步演化,生成式生成式 Al 賦予賦予 AlGC創新力創新力生成式 Al 起源于分析式 Al,分析式 AI 發展過程中的技術積累為生成式 AI 的產
80、生奠定基礎。分析式 AI 其學習的知識局限于數據本身;生成式 AI 在總結歸納數據知識的基礎上可生成數據中不存在的樣本;最新生成式 AI 技術如 GAN,Diffusion 等,催生多款 AlGC 產品如:OpenAl 系列、DALL-E2(Diffusion),Starry A.I.(基于 GAN)等6、AIGC:學習范式更新奠定基礎,模型結構升級助力騰飛:學習范式更新奠定基礎,模型結構升級助力騰飛人工智能技術推動 AIGC 行業不斷發展,其中學習范式的更新賦予 AI 模型主動學習能力,模型結構升級提升 AI 模型學習、歸納與創新能力。I7、AIGC 產業鏈涵蓋了從硬件到多類終端應用的廣泛領
81、域產業鏈涵蓋了從硬件到多類終端應用的廣泛領域AlGC 關聯產業可分為應用層、模型層、云計算平臺與計算硬件層。計算硬件層結合云計算平臺為 AIGC 提供機器學習訓練與推理算力,其中 GPU 與 TPU 為硬件核心,主要參與廠商包括英偉達(GPU)與谷歌(TPU);云平臺參與廠商則包含 AWS,GCP,Azure 以及 Coreweave;計算硬件層中云計算平臺廠商分布穩定,競爭出現于模型層面與應用層面。模型層面,閉源基礎模型提供商如 OpenAl 通過 API 向用戶提供服務,而開源基礎模型則通過在托管平臺如 Hugging Face、Replica 公開模型權重。模型訓練其高計算力需求推動了模
82、型層廠商與云計算廠商建立合作關系(如 OpenAl+Azure,GCP+DeepMind。模型層面閉源模型較為普遍,各廠商依靠模型建立技術壁壘在應用層面,MidJourney,Runway 等自主研發、持有模型;而 Jasper,Github Copilot 則通過調用閉源模型商提供的 APl 或采用托管平臺共享的模型。I8、AIGC 產業鏈上下游玩家百花齊放產業鏈上下游玩家百花齊放AlGC 上游主要包括數據供給方、算法機構、創作者生態以及底層配合工具等,中游主要是文字、圖像、音頻和視頻處理廠商,其中玩家眾多;下游主要是各類內容創作及分發平臺以及內容服務機構等。I9、AIGC 廠商之間的競爭在
83、于模型層面競爭廠商之間的競爭在于模型層面競爭追根溯源,AlGC 依賴于底層機器學習模型產生內容,因此模型為 AIGC 行業廠商真正競爭力所在。文本生成產品多依賴 GPT 系列模型,自己訓練的模型在圖像/視頻模態產品中較為普遍(圖像/視頻模態產品通常擁有自己訓練的模型,而不是如文本模態調用 OpenAl 提供的模型服務);比較而言,OpenAl 依靠模型建立先發競爭優勢,技術到產品轉化相對亮眼。10、AIGC 取長補短,有望成為主流內容生產模式取長補短,有望成為主流內容生產模式AlGC 所屬內容生產生態的發展經歷了專家生產內容(PGC)、用戶生成內容(UGC)、Al 輔助生產內容、Al 生產內容
84、(AIGC)四個階段,目前處于一、二階段為主,第三階段為輔的境況。AlGC 克服 PGC 與 UGC 存在的質量、產量無法兼具的缺點,其有望成為未來主流的內容生產模式。11、AIGC 生成技術可按模態進行分類生成技術可按模態進行分類AIGC 根據其內容模態不同可分為文本、視頻、圖像,音頻與跨模態生成。I12、AIGC 不同模態對應著各種生成技術及應用場景不同模態對應著各種生成技術及應用場景AIGC 不同模態對應的技術應用場景也有著各自的細分品類。13、AIGC 文本生成技術場景可分為交互式和非交互式文本生成技術場景可分為交互式和非交互式AlGC 非交互式文本生成技術中,結構化寫作其形式相對固定
85、,生成難度較小,商業化應用較為廣泛;而創作型寫作開放性較大,在長文本生成中難度較大,仍需技術進一步發展。隨著通信互聯網技術發展,線上社交需求快速增長,如閑聊機器人等交互式文本產品將迎來快速發展I14、AIGC 文本生成技術商業化落地有望優勢先發文本生成技術商業化落地有望優勢先發文本領域預訓練大模型技術成熟,文本領域細分垂類較多,產品數量居首位,模型數量發展超過其他模態技術。數字內容中,文字模態數據遠大于圖片/視頻/音頻等,發展前景相對較大基于 GPT-3 的文字生成功能已嵌入如 Writesonic、Conversion.ai、Copysmith 等軟件中,商業化前景相對清晰。15、AIGC
86、圖像生成技術隨著模型結構的優化而明顯提升圖像生成技術隨著模型結構的優化而明顯提升模型結構不斷進化提高了 AlGC 生產圖像的多樣性,但要求較高的功能實現還有待于技術的進一步提升?!皥D像縮輯”難度低于“圖像生成”與“2D”轉換,目前已存在多款產品支持“圖像編輯”,而對于“圖像生成”任務,由于圖片相較包含更多元素,其生成效果仍存在不穩定性,對于要求較高的功能類圖像生成仍需要技術上的提升。I16、AIGC 音頻生成技術正朝更富情感等人類特征演化音頻生成技術正朝更富情感等人類特征演化文本到語音任務已比較成熟,語音質量已達到自然的標準,未來將朝更富情感、富韻律的語音合成以及小樣本語音學習方向發展。音樂生
87、成任務中仍需解決音樂數據難以標注的問題,數據標注其顆粒度大小影響音樂生成任務的可控性。若可控性得以解決,則可指定風格情緒等因素的音樂生成任務有希望在影視、游戲等場景下的到大量應用。17、視頻生成為、視頻生成為 AIGC 應用生態中的高潛力場景應用生態中的高潛力場景視頻生成本質上與圖片生成類似,通過對視頻進行幀數級別的切割,實現對每一幀的處理。視頻生成過程包括三個階段數據的提取、訓練和轉換,當前技術正在著重提升視頻修改精準度和實時性兩個維度。鑒于視頻本身的文本、圖像和音頻的綜合屬性,視頻生成也是跨模態生成領域的重要應用場景。18、跨模態生成技術是真正實現認知和決策智能的轉折點、跨模態生成技術是真
88、正實現認知和決策智能的轉折點現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力之間打通,例如文字-圖像、文字-視頻等跨模態生成能力。大型預訓練模型的發展使得跨模態逐步成熟,“文本圖像”生成正在快速落地,“文字視頻”的實驗效果也已較為理想(視頻時長、清晰程度、邏輯等還有較大提升空間)。I19、AIGC 改變數字內容生產模式改變數字內容生產模式AlGC 作為新的內容生產模式,其具有內容多樣,可控性強與生產效率高的優點,符合傳媒,電商,影視,娛樂等行業對內容數字化程度高、內容多樣以及內容更新快的要求,AIGC在以上行業逐漸替代傳統內容生
89、產模式的趨勢十分顯著。20、AIGC 滲透傳媒領域各個環節滲透傳媒領域各個環節AlGC 技術逐漸滲透傳媒領域包括采集、編輯、傳播等環節,有助于加快內容生產效率,提高內容質量,擴寬內容影響力。I21、AIGC 化化 2D 為為 3D,拓展電商展示維度,拓展電商展示維度AIGC 2D圖像生成3D模型技術為傳統電商提供多維度的展示空間虛擬合成主播為客戶提供更及時、可靠、親和的服務體驗。22、AIGC 打破傳統娛樂體驗邊界打破傳統娛樂體驗邊界AIGC 技術打破物理邊界,使粉絲可與偶像親密互動,并形成新的發展點 AIGC 為用戶打開虛擬世界入口,通過趣味方式體驗虛擬世界。23、AlGC 拓寬影視行業創意
90、邊際拓寬影視行業創意邊際AlGC 技術以其內容多樣性為作品內容帶來更多靈感,AlGC 技術幫助拍攝突破物理限制,還原劇本效果,提高作品質量。I24、AIGC 促進各行業轉型升級促進各行業轉型升級AIGC 技術在各行業數字內容相關領域均有發揮空間。I十、十、AIGC 的應用場景的應用場景1、AIGC+資訊行業資訊行業在信息化時代,社會中充斥著各種資訊,同時這些資訊也有高標準、需求大、時效強等特點。自 2014 年起,AIGC 已開始用于新聞資訊領域,因此資訊行業是 AIGC 商業化相對成熟的賽道。新華社寫稿機器人“快筆小新”1.1、AIGC 輔助信息收集輔助信息收集,打造堅實基礎,打造堅實基礎優
91、質的新聞產出必定需要全面、高效、準確的信息收集與整理的 基礎上。按照傳統的I作業模式,工作人員需要親臨現場,通過各種手 段才能獲得足夠且扎實的信息?,F在的 AI 已經能對該環節高效賦能,例如科大訊飛的 AI 轉寫工具可以幫助記者實時生成文稿,自動撰寫 提綱、精簡語句等,進而提高工作效率,保證最終產出的時效性。除幫助獲取一手信息外,AI 也可以幫助精確檢索二手信息,收集 素材。在高性能的AIGC 工具如 ChatGPT 出現后,就可以像常人對 話一樣直接提問并獲得答案。雖然難免還是會有這樣那樣的問題,但 作為工具而言,AIGC 的意義已經非常明顯了。1.2、AIGC 支持資訊生成支持資訊生成,實
92、現高效產出,實現高效產出在資訊寫作等生成環節,基于自然語言生成和自然語言處理技術,AIGC 已經逐步得到從業者和消費者的認可,因此有不少企業積極參 與其中。以產出數量為例,與美聯社、雅虎等外媒合作的 Automated Insights,其撰稿工具 Wordsmith 能在一分鐘內生成兩千條新聞,且單條質量可比擬人類半小時的作品質量。除了速度驚人,AI 在準確度方面同樣優勢明顯,能夠很好的避免 人類的粗心或計算等錯誤,在保證質量的同時減輕人類工作壓力。這 方面國內企業頗多,如新華社自研的寫稿AI“快筆小新”、騰訊公 司開發的 Dream Writer、百度公司和人民網合作開發的“人民網-百度文
93、心”大模型都是其中的佼佼者。1.3、AIGC 助力內容分發助力內容分發,緩解人類壓力,緩解人類壓力在內容分發環節,AI 除了常見的個性化內容推薦外,也在逐步開 拓全新應用場景,如虛擬人主播,以視頻或直播的形式發放內容,打 造沉浸式體驗。如新華社數字記者“小諍”、央視網虛擬主播“小 C”、阿里巴巴數字人“冬冬”、百度智能云 AI 手語主播等等,在未來,AI 虛擬主播可能發展成媒體行業的標配。2、AIGC+電商行業電商行業自網絡電商出現以來,社會的很多方面都被改變了,電商企業既 是網絡時代的受益者,也在推動社會發展進程中扮演關鍵角色。自十年前網絡直播出現,帶動帶貨模式變革以來,各大企業都在或多或少
94、 的面臨轉型問題。在數字世界和物理世界快速融合的當下,AIGC走在時代前沿,可以賦能電商行業的多個領域,可能帶來新一輪的行業變革。每平每屋云渲染效果圖I2.1、AIGC 助力商品建模助力商品建模,改善購物體驗,改善購物體驗對比傳統的購物模式,網購的一個典型問題在于只能通過圖片了 解商品,難以觀察到全貌,也讓以次充好的不法商家有機可乘。而AIGC 技術可以通過視覺算法生成商品的三維模型,提供多方位視覺 體驗,節省溝通成本,改善用戶體驗,促成用戶成交與轉化。除了三維建模,AIGC 還有更高級的應用方式,如阿里巴巴的每平 每屋業務就利用 AIGC 技術,實現線上“商品放家中”的模擬展示效 果。這種業
95、務是將 AIGC 功能植入手機淘寶和每平每屋 APP 端,用 戶用手機掃描家居環境讓 AI 生成商品模型,在手機即可預覽實物效果,進而改善電商家居的購物體驗。2.2、AIGC 賦能服飾電商賦能服飾電商,助力降本增效,助力降本增效AIGC 可以為商家提供大量創意素材,電商廣告正是對創意營銷素 材需求量很大的領域,阿里巴巴的 AI 設計師“魯班”就是應用于此。除了通用型廣告,AIGC 在電商服飾領域用途更多。一般說來,服飾領域都采用“小單快返”的模式,即先小批量生產多種樣式的服飾產品投入市場,快速獲取市場反饋,對優質產品加大投入,在試出爆款的同時減小庫存壓力。但這種方式對產品圖片的需求量很大,如果
96、有上千種服飾產品分別找模特再牌照修圖,無疑會耗費極大的時間和成本。成立于 2020 年的 ZMO 公司就運用 AIGC 解決這個問題,商家只需在 ZMO 平臺上傳產品圖和模特圖就可以得到展示圖。借助 AIGC,更多服飾相關的市場策略都可以低成本的實現。即使沒有專業模特,虛擬人模特及廣告也可以發揮作用,甚至還可以調整虛擬人的相貌來 適配不同風格的服飾。2.3、AIGC 打造虛擬主播打造虛擬主播,提升直播效率,提升直播效率隨著概念的傳播,虛擬主播正日益成為許多商家的選擇。與真人主播不同,虛擬主播可以全天無間斷的直播,突破時間和空間的限制。2022 年 2 月 28 日,經典美妝超級品類日活動開啟時
97、,京東美妝虛擬主播“小美”就出現在蘭蔻、歐萊雅、OLAY 等超過二十個美妝大牌直播間,開啟直播首秀。虛擬人不僅五官形象由 AI 合成,嘴型也可以利用 AI 精確匹配臺詞,動作靈活且流暢,營造出極佳的真實感,為用戶帶來與真人無異的體驗。不過目前的虛擬主播更多的是與真人主播形成互補,或者為沒有直播能力的的商家提供服務,還不能完全替代真人。虛擬主播要獲得更強的交互能力,更好的與觀眾互動,做出實時反饋,還需要 AIGC 相關技術的后續發展。3、AIGC+影視行業影視行業隨著虛擬技術的逐步到來,對影視內容的需求也在爆發式增長。為了滿足觀眾日益刁鉆的口味和挑剔的眼光,影視行業正全力提高產 量,迭代技術,導
98、致整個行業的工業化程度逐漸提高,同時變得精細 且復雜,同時人的局限性也逐漸凸顯。AI 的應用無疑可以降本增效,讓行業回歸本真。I海馬輕帆官網“劇本智能評估”頁面3.1、AIGC 協助劇本創作協助劇本創作,釋放創意潛力,釋放創意潛力通過對海量優質劇本的學習,AI 能根據特定需求快速生成不同風格或架構的劇本,在極大提高工作者工作效率的同時,AI 也在激發創意,幫助產出更優質的作品。事實上,將 AI 引入劇本創作的做法早已有之。2016 年,紐約大學研發的 AI 在學習了幾十部經典科幻電影劇本后成功編寫了劇本陽春以及一段配樂歌詞。經過修改、調整后的成品只有區區八分鐘,內容也平平無奇,但陽春在各大視
99、頻網站最終收獲的百萬級播放量依然證明外界對 AI 創作的興趣很大。2020 年,GPT-3 被用于創作一個短劇,再次引發廣泛關注。通過這些早期試驗可以看出 AI 在劇本創作方面的潛力,但要真正 將其轉化為生產力,還要 AI 更貼合具體的應用場景,做針對性訓練,并結合實際業務需求開發或定制功能。海外一些影視公司如 FinalWrite 和 Logline 等都偏向垂直式工具,國內的海馬輕帆公司深耕中文劇本、小說、IP 等領域,也已經收獲百萬級用戶。3.2、AIGC 推動創意落地推動創意落地,突破表達瓶頸,突破表達瓶頸雖然 AI 能幫助人類更好的釋放創意,但從劇本到熒幕仍是一段漫 長的距離。從創意
100、到表達的跨越,AI 可以保駕護航,幫助人類化不 可能為可能。舉例來說,當前勞動密集型的影視生產方式難以滿足觀 眾對質量日益提高的要求。2009 年上映的阿凡達令全球觀眾首 次了解 3D 電影的魅力,此后沉浸式觀影體驗成了影視產業鏈上共同 的追求。為了滿足這種追求,影視特技與應用呈現井噴式發展,但后 期制作與渲染,復雜程度也都水漲船高,傳統的作業方式已經難以為 繼,而 AI 技術就有推動變革的潛力。從技術角度來說,影視特技行業的作業流程是極為繁瑣的,比如場景中的建模就需要從一草一木、一人一物開始,逐漸打造世界的雛形,再通過骨骼綁定和動作設計讓模型活起來,之后的定分鏡、調燈 光、鋪軌道、取鏡頭等等
101、無不費時費力,后期的解算和渲染等工作同 樣如此??梢哉f在影視工作的每個環節都有大量重復性工作或等待時間,無形中拖慢了工作節奏。因此現在就有企業致力于解封流程生產 力,比如優酷的“妙嘆”工具箱,在動漫中實時渲染,幫助工作者實 時把握效果或做出修改,節省了大量成本,減輕人員負擔,目前已被多家國漫企業采用。I4、AIGC+教育行業教育行業技術的飛速發展也將為教育行業帶來顛覆,但是相比其他行業的 快速發展,AI 在教育中的落地部署似乎也慢了半拍。這其實是由教 育行業本身的性質導致的,它的參與者眾多,時間跨度很大,個體的 差異性也很大,這讓解決邊界清晰、定義明確的 AI 難以適應。另外 教育更注重人與人
102、的互動和聯結,也沒有統一的理論模型,這都為相 關 AI 的開發訓練和落地部署增加了難度。但 AI 在教育行業絕非毫無用處,以技術手段推動行業進步也并非癡人說夢?!靶』í{”中文寫作智能輔導系統3.1、AIGC 助力學習者助力學習者,走向無限,走向無限生活經驗告訴我們,從降生起人類就開始通過各種手段建立對世 界的認識。識字前的手摸嘴咬、拳打腳踢,識字后的課本習題、書籍 影視、實地體驗等等無不如此。但是不論怎樣,每個人的學習過程總會遇到這樣那樣的阻礙,而 AI 對學習者的意義就在于盡量擺脫種種 束縛,最終從有限的自身走向無限的世界?;ヂ摼W時代的教育,是將部分內容轉化為數字化形式并公開分發,助力資源流
103、轉?,F在由 AI 輔助甚至主導的制作,整理學習資料,降 本增效是顯而易見的,資源的豐富度和易用性都將提升到新的高度。AIGC 也可以在一些特定領域,如兒童繪本等,加速知識的生產效率 并接入網絡,最終提供給用戶。通過補充有限的學習資源將促進教育 公平,AI 也助力教育資源的生產與分發。微軟在這一領域就布局頗多,如微軟亞洲研究院與華東師范大學合作研發的中文寫作智能輔導 系統“小花獅”,借助自然語言處理技術,實時為學生作文評分并分 析原因,從而幫助學生進步。3.2、AIGC 賦能教育者,減負提效賦能教育者,減負提效老話說“師傅領進門,修行在個人”,教育者作為領路人的重要 性不言而喻,對他們而言,AI
104、 就如同手上的火把,更好的幫助學習 者引燃心中的學習火種。從目前的社會發展現狀來看,教育者數量不 足將會是長期現象,一位老師帶幾十位學生的“大班制”還將長期存 在,在各種瑣碎的答疑解惑,書山題海中奔波,AIGC 就可以解決此 類問題?,F在作業/試卷自動批閱技術已經獲得了廣泛應用,AI 不但 可以判斷對錯,還可以生成針對性的評語,教師的作業批改用時大幅 節約,可以更關注學生的個性化發展。除了助力解決重復性I問題,AI 還可以延伸感知。如基于電腦視覺技術,AI 可以實時分析學生當 前的情緒和狀態等,幫助教師更好的了解情況。通過對教育者的賦能,AIGC 最終可以幫助實現教育的終極理想:因材施教,推廣
105、個性化教育。盡管 AI 還有可能加劇信息繭房的風險,以及對傳統理念的挑戰,甚至將人機器化,但就目前來看,未來還是值得期待的,以人為本的教育還是可能實現的。5、AIGC+醫療行業醫療行業對醫患雙方而言,AIGC 的應用與推廣都是福音,比如 AI 預問診 的應用。雖然病人與病情千變萬化,但總是有重復的地方,因此在預 問診階段,AI 就可以先了解患者的既往情況,讓醫生的診斷更有針 對性,既緩解了醫生的工作壓力,也更好的服務了患者,醫院內病人 扎堆排隊的現象也得以分流,可以說是一舉三得。2021 年,復旦大 學附屬眼耳鼻喉科醫院與騰訊醫療健康簽署合作協議,全面打造數字 化醫院新標桿、新范式,深入推進醫
106、院數字化轉型,在預問診等業務上快速落地部署。對于傳統醫學的難點:心理疾病領域,AI 同樣可以參與其中。相 較于過去的與人對話,AIGC 聊天機器人只是個軟件程序,用戶不必 擔心隱私被泄露,況且還可以預置海量數據或知識模型,可以在更新 迭代中保持冷靜與中立。成立于 2021 年的聆心智能就是這方面的代 表,基于生成式大模型開發的情緒療愈機器人 Emohaa,可以構建以生成對話為核心的交互式數字診療方案,通過對話與患者共情,及時提供情緒支持與心理疏導,促進患者心理健康。受疫情困擾的用戶與 Emohaa 對話6、AIGC+金融行業金融行業金融業天然與數據和信息密切相關,各類公司都要從繁復的市場 上搜
107、集信息,并加以利用,創造價值?;谶@樣的現狀,金融行業的 信息化一直走在其他行業之前,具備數據質量好、維度全、場景多等 特點,因此也成為了 AI 最早落地的商業化場景之一。一般說來,AI 在金融行業最常見的應用是通過機器視覺和學習的 方式捕捉市場的實時變化,并利用實時數據進行分析,以此提高金融 公司的財務分析效率與能力。類似的,AIGC在金融行業的應用則是 以智能客服和智能顧問兩種,基于自然語言處理技術與客戶互動,此 外還可以快速高效地完成一些人工難以完成的任務,改善服務體驗。2017 年 4 月,富國銀行開始試點一款基于 Facebook Messenger 平臺的智能客服,美國銀行很快也推
108、出了類似的智能助手 Erica。國內金融行業的相關產業應用也較為成熟,多家公司或商業銀行都推I出 過自己的 AI 業務,如 2022 年工商銀行的“工小智”,郵儲銀行的半年報顯示數字化轉型成績斐然,這些都表明 AIGC 應用于金融行業的巨大潛力。百信銀行數字虛擬人員工艾雅(AIYA)I十一、十一、進入的壁壘進入的壁壘AIGC 的進入壁壘:開源降低行業技術門檻,但大模型對數據及算力需求極高。AIGC 本身的技術門檻并不高。大模型的涌現和指數級的能力迭代,開源社區的繁榮、API 接口的大量開發和開放(ChatGPT 即為開放平臺),使 AIGC 應用對新進入者較為友好。此外大模型的泛化能力和通用性
109、極強,無需對場景和模型重復訓練(即 Zeroshot),由此而來的低成本準入門檻、數據飛輪效應和廣泛的場景適應能力,都一定程度降低了行業的技術壁壘。但大模型對數據量及算力的海量需求,使得頭部大廠的規模優勢更加突出。模型是當下主流 AIGC 應用的核心基礎,訓練和運行模型都需要龐大的數據量和算力成本(資金)。1)數據需求:模型性能與數據量、數據質量緊密相關,文獻顯示即使是擁有 130 億參數的模型(僅次于擁有 1750 億的 GPT-3 完整版模型)處理二位數加減法的準確率也只有 50%左右,處理其他運算的準確率還不到 10%。2)算力花費:GPT3.5 的訓練使用了微軟專門建設的 AI計算系統
110、,由 1 萬個 V100 GPU 組成的高性能網絡集群,總算力消耗約 3640 PF-days(即假如每秒計算一千萬億次,需要計算 3640 天)。I十二、十二、商業模式商業模式1、變現方式、變現方式ChatGPT 作為工具屬性的產品,最簡單直接的商業模式主要包括按需一次性收費的商品模式和周期性使用的訂閱模式。商品模式例如一定金額購買固定次數的文案生成/社媒生成/廣告語生成;訂閱模式則類似于 SaaS 周期性收費的方式,例如通過每月支付月費來使用服務。當下 ChatGPT 已經開啟了變現的嘗試,推出了訂閱服務 ChatGPT Pro,價格為 42 美金/月。相較免費版,付費版的 ChatGPT
111、 Pro 主要有三大功能:1)免費版限流,在流量高峰期可能會導致無法使用,付費版在流量高峰期沒有限制,提升了使用體驗;2)ChatGPT Pro 生成文本的速度更快,用時小于免費版的一半,可以提升工作效率;3)可以搶先體驗新功能。除了直接的 C 端服務收費,B 端賦能收費同樣也是值得期待的商業化方向,例如通過 API接口提供技術服務。B 端客戶可以通過在自己的系統中集成 ChatGPT 模型,通過 API 調用從而實現自身服務和功能的拓展優化,例如近日微軟宣布將 ChatGPT 功能集成至旗下的搜索引擎 Bing 和瀏覽器 Edge。2、商業化空間、商業化空間商業化落地方向的豐富多樣,是市場對
112、于 ChatGPT 龐大發展空間預期的基礎。區別于以往 Al 模型功能的單一性,例如 AlphaGo 只會下圍棋,ChatGPT 基于的“大型語言模型(LLMs,也稱為大模型)通過把盡可能大量的數據通過 Transformer 架構做機器學習,就能從數據中學到很多能力,多到超出設計者的想象。ChatGPT 的爆火出圈,本質就是大家驚嘆于其能夠完成的任務之多樣,且完成度遠超人們預期。這也打開了 ChatGPT 在各式各樣商業場景中應用的想象空間。我們從 ChatGPT 的功能來分類,例舉一些想象得到的未來應用場景:文本創作/修改:從通用的文案創作、郵件寫作、公文信函、簡歷修改,再到進一步細分到專
113、業領域,例如金融、法律、教育等等;代碼生成/糾錯:當前 ChatGPT 在這方面的能力仍不足以替代程序員,但未來在輔助編寫上大有可為,例如快速的檢索、簡單代碼的快速寫作、自動糾錯等輔助功能。聊天機器人:最典型的例如客服機器人,當下市面上的客服機器人仍在使用老一代的系統,新一代語言模型技術的出現有望帶動這個細分行業的更新。語音助手:ChatGPT 的問答智能程度明顯好于當前市面上市占率較高的小愛同學和 Siri,ChatGPT 的技術有望提升語音助手的智能程度。其他方面:ChatGPT 因其智能化程度高,知識信息含量之廣,使其在各個領域都能起到不小的作用,未來想象空間巨大。I3、行業已經具備大規
114、模商業化條件行業已經具備大規模商業化條件:供給多點開花供給多點開花,順應行順應行業需求業需求4、行業已經具備大規模商業化條件行業已經具備大規模商業化條件:廠商實現盈利廠商實現盈利,驗證商驗證商業模式可行性業模式可行性目前海外已有實現穩定盈利的廠商、持續驗證商業模式的可行性。公開業績數據顯示2020 年 Depmind 已實現千萬美元量級的利潤.營業額為 8.26 億英鎊。根據此前分析的下游應用場景,判斷 ToB、ToC 兩端的商業化條件已完備,并給出如下展望:1)B 端(出售 API 接口)移植模型):瞄準進行高頻、大規模內容生產的細分場景,為平臺提供定制化模型服務,游戲、數字人領域受益短期內
115、即能看到。2)C 端(大眾應用):大廠將定制化模型嵌入搜索、辦公等成熟應用,利用龐大用戶流量挖掘附加價值;此外隨著訂閱費用的調整個人創作者直接訂閱 AIGC 應用將更為普遍。I3.1、B 端的商業模式端的商業模式B 端變現展望:LLM+X,瞄準有高頻、大規模內容生產需求的細分場景。3.1.1、細分行業定制、細分行業定制 LLM(大語言模型)(大語言模型)B 端變現的方式可展望為細分行業定制 LLM(大語言模型),即廠商的模型底座+用戶數據源,構建“LLM+X”。廠商通過改變訓練用數據的分布,來提升模型在某一細分領域的表現。從具體領域來看,定制化模型能夠逐步深度融入到文字、音樂、圖片、視頻、3D
116、 多種媒介形態的生產中,可以擔任新聞、論文、小說寫手,音樂作曲和編曲者,多樣化風格的畫手,長短視頻的剪輯者和后期處理工程師,3D 建模師等多樣化的助手角色,在人類的指導下完成指定主題內容的創作、編輯和風格遷移。3.1.2 傳媒互聯網是最直接受益于傳媒互聯網是最直接受益于 AIGC 落地的場景。落地的場景。中文互聯網首先為大模型的建立提供豐富的中文語料庫,從源頭哺育 AIGC;傳媒細分子賽道均具備高內容需求、高交互、高創意濃度等屬性,與 AIGC 天然契合。I3.1.3 重點關注兩個能夠顯著受益的行業:重點關注兩個能夠顯著受益的行業:游戲行業具備高交互性、內容創意密集的特點,將顯著受益于 AIG
117、C 帶來的成本、效益改善、玩法創新,商業模式有望發生變革。以 3A 游戲為例,一款成熟的 3A 游戲開發時間周期長、資金人力耗費巨大。R 星 2018 年發售的游戲荒野大鏢客 2,其虛擬場景約有約 60 平方公里,耗費六百余名美術 8 年時間完成。AIGC 技術的引入,能夠在設計、調試、NPC 行為、優化、3D 場景制作等多領域提升效率,降低游戲行業對人力的重度依賴,有效實現成本控制。廣告營銷:內容生產及個性化需求大,看好 AI 數字虛擬人產品降本增效.3.2、C 端的商業模式端的商業模式缺乏實時性是類 ChatGPT 產品的最大掣肘。作為語言模型,對話式機器人沒有搜索引擎的爬蟲能力,只能回答
118、已知信息。2023 年 2 月起,大廠陸續將對話是機器人與搜索引擎結合,I進一步提升搜索業務效率。3.2.1 SaaS 應用將是最快落地、最早觸達應用將是最快落地、最早觸達 C 端用戶并帶來附加收入端用戶并帶來附加收入的場景。的場景。一方面,AIGC 在辦公領域的應用前景已經相當顯性,文本轉圖像、快速文案撰寫、快速數據分析等技術能夠集成至日常工作流程中。相關大廠已經開始實際布局,微軟計劃 OFFICE全家桶、云計算模型 Azure 中悉數加入 AI 大模型,線上會議軟件 Teams 已經推出了 AI 撰寫會議紀要和郵件的付費服務。另一方面,工作中的應用需求更為剛性、用戶基礎已經較為龐大,心智培
119、育成本低、付費意愿更強,通過嵌入增值服務收取費用商業模式更加成熟。享有C 端流量分發話語權的廠商受益更加顯著。頭部廠商的產品本身已經有著用戶基數、心智壁壘,變現路徑相對明晰,獲客成本遠低于新進入者。3.2.2 C 端變現展望:心智提升、費用下降,直接訂閱制將更加普遍端變現展望:心智提升、費用下降,直接訂閱制將更加普遍直接 ToC 的按月訂閱制產品受眾范圍較窄。當前 AIGC 應用的訂閱價格約在 10-30 美元區間內,我們判斷付費制較高的成本將按月訂閱的消費者范圍限定在了有硬性需求的獨立創作者中。從 AI 繪畫領域付費情況來看,根據 6pen 數據,中國 60%的用戶并沒有在使用 AI 繪圖產
120、品上有過付費行為,剩下 40%的付費用戶中,16%付費在 10 元以內,14%在 100 元以內,付費超過 100 元的不到 10%。隨著 AIGC 能力的大幅度提升,AIGC 訂閱費用有望逐步調降,購買決策成本降低伴隨用戶認知建立,我們認為 C 端應用消費需求的擴大已是必然。IDC 預計中國 AI 市場規模將以24.4%的 CAGR 增長,有望在 2025 年超過 184.3 億美元(約 1263 億元人民幣)。咨詢機構AcumenResearch and Consulting 預測,2030 年 AIGC 全球市場規模將達到 1100 億美元;量子位智庫預計 2030 年 AIGC 市場規
121、模將超過萬億人民幣。I十三、十三、政策與法規政策與法規AIGC 目前存在版權、倫理、數據安全等風險點。AI 模型通常是通過預先存儲的大量數據訓練得到的,因此其中可能存在錯誤、偏見或不準確的信息。1)版權:AI 模型可能侵犯到他人的版權,如通過復制或抄襲別人的作品創建文本。2)倫理:AI 模型可能存在倫理風險,例如造成誤導、歧視或侵犯個人隱私。3)數據安全:當存儲或處理敏感信息時,存在數據泄露、被竊取等安全風險。數據及算法領域此前已經經歷過一輪密集規范,相關細則已經相對完善,疊加 2021 年以來數字經濟相關政策利好陸續釋放,我們判斷產業初創期相關的政策態度趨于包容,目前審核責任更多集中于平臺對
122、語料庫的自查。I十四、十四、投資機會與風險投資機會與風險1、投資觀點一、投資觀點一5AIGC 多模態跨模態應用逐漸成熟,市場空間廣闊。多模態跨模態應用逐漸成熟,市場空間廣闊。廣義的 AlGC 指具備生成創造能力的Al 技術,即生成式 Al??梢曰谟柧殧祿蜕伤惴P?,自主生成創造新的文本、圖像、音樂、視頻等內容。2022 年被稱為 AIGC 元年,未來兼具大模型和多模態模型的 AIGC 模型有望成為新的技術平臺。據中國 Al 數字商業產業展望 2021-2025報告,預測 Al 數字商業內容的市場規模將從 2020 年的 40 億元,增加到 2025 年的 495 億元。ChatGPT 產
123、品歷經多代技術演進產品歷經多代技術演進,產品與商業模式逐漸成熟產品與商業模式逐漸成熟6。ChatGPT 是文本生成式 Al,過去的傳統 Al 偏向于分析能力,主要基于已有內容;現在文本生成式 AI 基于底層 Transformer模型,不斷訓練數據和迭代生成算法模型,歷經 GPT-1、GPT-2、GPT-3,模型不斷升級,到ChatGPT 的 GPT3.5 模型,已可以自主生成各種形式的內容。近期收費版 ChatGPT Plus 版本發布,Al 商業化序幕逐漸拉開。Al 商業化落地在即商業化落地在即,行業算法側和算力側投資機會有望超預期行業算法側和算力側投資機會有望超預期。7根據數據顯示,Ch
124、atGPT總算力消耗約為 3640PF-Days,按國內的數據中心算力測算,需要 7-8 個數據中心才能支持其運行。各模態 Al 數據訓練到應用均需要算法和算力的加持,未來要想大規模應用,算法訓練和算力部署均需先行。投資建議:投資建議:ChatGPT 商業落地在即,建議關注算力側投資機會;國內外類 ChatGPT 相關產品即將迎來爆發,看好相關廠商投資機會.風險提示:風險提示:ChatGPT 應用不及預期;Al 技術發展不及預期;ChatGPT 帶來的社會問題大于預期;各國監管力度大于預期。2、投資觀點一、投資觀點一8ChatGPT 憑借其強大且多樣的功能火遍全球憑借其強大且多樣的功能火遍全球
125、。ChatGPT 是公司 OpenAl 開發并推出的智能聊天機器人工具,以其多樣的功能和出色的效果,自發布以來爆火全球,月活破億用時僅 2個多月,被稱為史上增長最快的消費者應用。這也是首次 C 端 Al 產品如此爆火,使得 Al技術正式從幕后走向臺前,對于 Al 技術的發展和商業化都有著里程碑式的意義。ChatGPT 商業化的想象空間巨大。商業化的想象空間巨大。區別于以往 Al 模型功能的單一性,ChatGPT 基于的大模型通過把盡可能大量的數據通過 Transformer 架構做機器學習,就能從數據中學到很多能力,多到超出設計者的想象。變現方式除了最簡單直接的按需一次性收費和周期性訂閱的模式
126、,還有 B 端賦能收費同樣也是值得期待的商業化方向,例如近日微軟宣布將 ChatGPT功能集成至旗下的搜索引擎 Bing 和瀏覽器 Edge。ChatGPT 仍只能起到輔助作用,帶來的負面社會影響需警惕。仍只能起到輔助作用,帶來的負面社會影響需警惕。ChatGPT 還存在著諸多局5引自AIGC&ChatGPT 發展報告6同上7同上8引自浙商國際I限性,目前只能作為有效的輔助工具,但未來效果會隨著使用量和訓練量的增多不斷加強。僅僅當下階段的智能程度,ChatGPT 的濫用就引起了教育界和學術界的諸多負面問題。未來隨著 ChatGPT 能力的進化完善,像數據安全、網絡安全、知識產權、法律風險等社會
127、問題對于各個國家的監管部門都將是不小的挑戰。3、港股投資機會、港股投資機會9百度集團百度集團-SW(9888.HK):百度在人工智能、大數據和語言模型等方面處于行業領先地位,公司在 2 月 7 日宣布其類 ChatGPT 產品文心一言即將推出,三月份完成內測,面向公眾開放,目前正在做上線前的沖刺。百度的文心大模型和 ChatGPT 類似,在 2019 年就已經推出,經過多次迭代,已經形成了較強的技術能力。此前文心大模型已面相大眾推出了 Al作畫平臺“文心一格”和產業級搜索系統“文心百中”。阿里巴巴-SM(9988.HK):阿里在 Al 領域同樣能力不俗,根據 IDC 的數據,截至 2022 上
128、半年,阿里 Al 在語音語義領域連續三年多保持引領地位,市場份額達到 31.98%,其中阿里語音 Al、語言 Al、對話式 Al 市占率均為第一。2 月 8 日,阿里宣布由阿里達摩院研發的類 ChatGPT 對話機器人已經進入內測階段,未來將和阿里 Al 大模型、釘釘開放平臺結合。商湯商湯-W(0020.HK):):“大模型”需要構建在大的算力中心上,0penAl 的 ChatGPT 就是構建在微軟的算力中心上。因此,大模型數據參數大,大算力投入成本大,“大模型”配合“大算力”成為了頭部 Al 公司的重要護城河。商湯作為國內頭部的 Al 公司,不光在大模型方面同樣有著較深的技術積累,在大算力上
129、同樣投入巨大,在臨港投資近 50 億元的算力中心已經建成。網易網易-S(9999.HK):網易有道 Al 技術團隊已投入到 ChatGPT 同源技術 AIGC 在教育場景的落地研發中,目前該團隊正在 Al 口語老師、中文作文批改等細分學習場景中嘗試探索,將盡快推出相關的 demo 版產品。近年來,團隊在神經網絡翻譯、計算機視覺、智能語音 Al 技術、高性能計算等關鍵技術方面均取得重要突破。4、國內企業投資機會、國內企業投資機會-網絡與平臺網絡與平臺梳理我們此前的分析,國產替代機會更多存在于兼具中文數據資源、算力及流量分發話語權的企業中。如果說算力及資金成本、數據資源是顯性壁壘,那么下游流量的充
130、沛程度是C 端的隱藏壁壘,考慮到手握 C 端流量的大廠技術布局已經相當完備,行業格局被顛覆的可能性并不高。行業內頭部企業兼具數據、算力及資金優勢,且在 C 端話語權更強,將率先從生產力革命中獲益。我們重點關注同時布局 AIGC 生產及消費領域的互聯網平臺,料長期主義布局下公司將結構性受益,推薦 1)百度:國內 AIGC 領域發力最早,投入最多,研發成果最豐富的企業,據新民晚報,三月其類 ChatGPT 項目“文心一言”將完成內測并對公眾開放。2)騰訊:掌握下游分發話語權,自研“混元”AI 大模型已被廣泛應用到廣告創作、廣告檢索、廣告推薦等騰訊業務場景中,內容、廣告及云業務將直接受益;3)網易:
131、AIGC 已被引入游戲研發流程,重磅儲備逆水寒手游上線在即。我們同時關注已在視頻、營銷、閱讀等相關細分領域搶跑的重點標的,預計先發優勢下應用端的推進將更快反映至業績。1)數碼視訊:多年布局視頻視覺 AI 技術,有望受益于 AIGC 生態興起;2)捷成股份:參股公司世優科技數字人已接入 ChatGPT;3)風語筑:深耕數字展示,已有 AIGC 場景應用落地;4)浙文互聯:旗下米塔數字藝術社區已開啟 AIGC 模式。9引自浙商國際I4.1 百度:超前布局優勢盡顯,三月將推出中國版百度:超前布局優勢盡顯,三月將推出中國版 ChatGPT并嵌入搜索并嵌入搜索百度是國內 AlGC 領域發力最早,投入最多
132、,研發成果最豐富的企業,擁有產業級知識增強文心大模型 ERNE,具備跨模態、跨語言的深度語義理解與生成能力。從具體產品上看,2022年以來,AIGC 陸續落地搜索、內容創作和數字人領域。對話式搜索對話式搜索:百度將在 2023 年 3 月推出中國版本的 ChatGPT,最初版本將嵌入其搜索服務中,讓用戶獲得對話式的搜索結果。多年技術積累使得公司具備布局生成式搜索的能力,ERNIE3.0Titan 預訓練語言模型具有 2600 億個參數,超過 ChatCPT 的技術根基(GPT-3.5 模型)1750 億的參數數量,我們認為在數據數量及人工標注成本上,公司具備相對優勢。內容創作內容創作:公司通過
133、文心大模型、文心一格、圖文轉視頻等技術,為創作者提供“AI 文案助理”、“AI 指畫助理”、“AI 視頻制作助理”。從變現上看,文心一格付費版本采用積分制,用戶可以通過消耗積分生成不同品質的圖片,也開放合理范圍內的商業使用。數字人將數字人技術與 AlGC 圖文轉視頻、TIS 語音合成技術結合,為媒體及創作者定制真人孿生數字人。創作者輸入文本即可生成有數字主持人口播的視頻,不僅保證信息播報準確性,還具備多國語言口播、情緒識別等人格化功能,實現 AI 驅動 24 小時不停播。AIGC 天然契合智能搜索、智能推薦、智能營銷等業務高度個性化的特點,有望加快公司業務連接效率的提升,進一步提振主業績。22
134、Q3 百度核心非營銷收入 65 億元,同比+25%,受云服務及其他 Al 業務推動顯著。2022年,公司提出技術能用盡用、能出盡出,未來 AIGC 將在其移動生態大規模落地。4.2 騰訊:掌握下游分發話語權,內容、廣告及云業務將直騰訊:掌握下游分發話語權,內容、廣告及云業務將直接受益接受益公司坐擁海量用戶及社交數據資源,具備獨立開發類 ChatGPT 應用的能力,相關技術已經應用于廣告業務。公司廣告多媒體 AI 團隊獨立研發的“混元”AI 大模型覆蓋計算機視覺、自然語言處理、多模態內容理解、文案生成、文生視頻等多個方向,可將視頻和文本等跨模態數據分別做拆解,通過相似度分析,綜合考量并提取視頻和
135、文本之間層次化的語義關聯。目前,“混元”AI 大模型已被廣泛應用到廣告創作、廣告檢索、廣告推薦等騰訊業務場景中。公司將直接受益于 AI 內容生產降本增效能力。公司內容業務覆蓋游戲、視頻、音頻、資訊等領域,結合體外投資,基本實現內容賽道上下游全布局。1)文娛內容:隨著 2022 年以來降本增效策略持續推行,PCG 內容部門成為成本優化的第一線,我們判斷“混元”AI 大模型的廣泛應用能夠與公司的運營策略共振,進一步為內容業務去肥增瘦;2)游戲:Gcloud團隊的自動蒙皮、自動 2UV、一站式全流程工具管線 Superman 等 AI 相關游戲服務已落地。公司 FBS 業務線擁有多個 SaaS 服務
136、軟件,我們判斷騰訊會議、騰訊文檔、企業微信等可對標微軟 Teams 及 Office,具備嵌入 AI 機器人等附加服務的條件,SaaS 業務變現有望進一步加快。I4.3 網易:網易:AIGC 已被引入游戲研發流程,重磅儲備上線在即已被引入游戲研發流程,重磅儲備上線在即公司已經將 AIGC 技術深度融入業務。從具體技術布局來看,1)網易互娛已在語音驅動嘴型、風格化頭部模型生成、貼圖變化、資源超分等具體技術領域有了成熟產品。2)網易伏羲已經發表了 70 多篇游戲和 AI 頂會論文,申請了 100 多篇游戲和 AI 相關的技術專利。相關研落地服務了 100 多個游戲客戶,AI 服務每日調用量超過 1
137、 億次,在 AI 捏臉、語音生成 NPC、動畫生成等均有布局。3)網易有道 AI 技術團隊已投入到 ChatGPT 同源技術(AIGC)在教育場景的落地研發中,目前該團隊已在 AI 口語老師、中文作文批改等細分學習場景中嘗試應用,有望成為 AIGC 技術在國內互聯網教育場景的首次落地應用。重磅儲備逆水寒已經取得版號,看好業績修復空間。公司已連續三批取得版號,其中逆水寒手游預約數超百萬,有望成為國產開放世界手游領軍作,有力增厚業績;此外超凡先鋒巔峰極速亦取得版號,代理產品幻想生活突襲:暗影傳說均為海外流水表現優異的佳作。與暴雪解約的影響甚微,關注 3A 領域長期布局。公司實際已經通過投資及自設方
138、式擴大海外布局,吸納大量 3A 游戲制作人,且 2022 以來節奏更加密集,近期來看,公司于英國成立工作室 Spliced,致力于打造原創 IP 的“世界級在線游戲”體驗,目前已有 R 星、動視等3A 大廠員工加盟;于日本成立工作室 GPTRACK50,專注于制作高質量端游;同時投資瑞典Liquid Swords、美國 Something WickedGames、加拿大 SkyBox Labs 等工作室,長期主義導向突出。4.4 數碼視訊數碼視訊:多年布局視頻視覺多年布局視頻視覺 AI 技術技術,有望受益于有望受益于 AIGC生態興起生態興起公司于視覺 AI 方向已具備充分的技術研發儲備,并在
139、多個領域進行市場化驗證,實現落地應用。公司擁有自主研發的 AVS2/AVS3 系列超高清視頻算法庫,具備 4K/8K 采集、核心傳輸交換、存儲等全產業鏈解決方案,積極參與總臺、北京電視臺 2022 年北京冬奧會、冬殘奧會直播報道,助力總臺實現奧運會歷史上轉播技術方面的全球領先,為人民日報新媒體提供了包括 5G+4K 便攜式直播背包等超高清視頻產品及技術支持。公司在元宇宙領域已展開技術布局。公司利用 5G 等技術儲備,探索構建元宇宙場景基礎。I子公司快視聽旗下洞壹元典平臺聯合國內大型機構,發行多款公益數字藏品及寶慶竹刻非遺文化敦煌境飛天賜福等多個商業項目,實現了極大社會關注和傳播宣導。2021
140、年報顯示,未來公司將結合安全系統框架、低延時傳輸、超高清編碼、5G 視頻應用、區塊鏈應用及智能合約等技術儲備,為相關應用從底層構建一個符合元宇宙身份認知、沉浸感、低延遲、經濟系統等核心要素的元宇宙場景基礎。4.5 捷成股份:參股公司世優科技數字人已接入捷成股份:參股公司世優科技數字人已接入 ChatGPT公司參股公司世優科技已經完成 AI 賽道布局,數字人領域商業化應用成熟。作為國內較早專注于實時虛擬技術研發與應用的科技公司,世優科技基于十余年的項目經驗,將數字人工廠升級至 3.0 版本,形成了“實時數字人+虛擬演播室+SAAS+MAS”的下一代全棧式虛擬技術服務平臺,目前已涵蓋入門級/消費級
141、/專業級/AI 級多層次數字人賦能產品體系,產品應用范圍覆蓋大 B 端、中小 B 端、C 端。世優科技數字人已經接入 ChatGPT,有望快速進入內容生成、智能客服等領域。接入ChatGPT 超強 AI 大腦的世優科技數字人除具備通用能力外,還將具備個性化獨有的人設背景表達能力,已形成產品化解決方案,商業價值處于上升周期。4.6 風語筑:深耕數字展示,已有風語筑:深耕數字展示,已有 AI 場景應用落地場景應用落地公司多年深耕數字展示,相關產品技術基礎成熟。公司通過全息影像、裸眼 3D、CGI 特效等技術手段,AR/VR/MR、4K/8K 超高清視頻等媒介形式,為客戶和消費者提供商業展覽、數字藝
142、術消費品及各類數字視覺服務,3D 數字設計和視覺渲染領域已經完成了相對成熟的布局,在 VR/AR/XR、裸眼 3D、全息等數字技術應用領域亦擁有豐富的項目應用案例和經驗。目前公司已結合 AIGC 技術在文生文、文生圖、文生音視頻等領域進行場景應用。此前公司在虛擬展廳、虛擬數字人、虛擬場景以及數字藝術創作領域均有結合 AI 人工智能技術的探索與應用,有效提升了數字創意、三維設計與 3D 內容創作的效率和獨特性。隨著 AIGC 技術從“通用模型”向“行業垂直”方向加速迭代,看好公司在 3D 建模和虛擬空間生成等領域的定向訓練和模型優化。I4.7 浙文互聯:旗下米塔數字藝術社區已開啟浙文互聯:旗下米
143、塔數字藝術社區已開啟 AIGC 模式模式據公司在投資者互動平臺的介紹,公司在 2021 年就已進軍元宇宙領域,持續探索營銷領域的科技賦能:汽車元宇宙:汽車元宇宙:加速元宇宙汽車公園等基礎設施建設。在吉利 ICON 的“巧克力城”元宇宙項目中,用戶可以通過虛擬駕駛吉利 ICON 巧克力 SUV 行駛在鋪滿巧克力汁的高空路面上,實現了在虛擬世界中為現實世界品牌的高效賦能。數字藏品:數字藏品:公司旗下 數字藏品平臺“米塔數字藝術平臺”與浙江文化藝術品交易所股份有限公司簽署戰略合作,目前在該領域的布局發展迅速有序。虛擬數字人:虛擬數字人:自有虛擬數字人-國風虛擬 IP“君若錦”、Z 世代虛擬 IP“蘭
144、 LAN”在 2022 年迎來持續升級,在更多場景中得以應用。公司還為東風風光 MINIEV 打造了風光輕生活主理人“可甜”,為長安汽車打造數字體驗工程師“宮橙詩”等。公司旗下米塔數字藝術作為元宇宙藝術創作社區,已開啟 AIGC 模式。米塔 APP 現支持 AI繪畫和手動繪畫兩種模式,打開 AI 繪畫即可使用 AI 進行繪制。5、國內企業投資機會、國內企業投資機會-算力算力5.1、AI 超算中心:超算中心:ChatGPT 的核心基礎設施的核心基礎設施算力(ComputationalPower 簡稱 CP)指對數據的處理能力,被視為數字經濟時代的新生產力,是推動數字經濟發展的核心力量。算力基本計
145、量單位為 FLOPS,通常一臺服務器的計量單位為 TFLLOPS(1012FLOPS)。在 2022 超算大會上,超級計算機 Frontier 排名第一算力達到 1.102EFLOPS(1018FLOPS)。中國的神威太湖之光排名第六,算力為 93.01PFLOPS(1015FLOPS)。II微軟投資微軟投資 10 億美金打造億美金打造 OpenAI 超算平臺超算平臺。2020 年 5 月,微軟投資 10 億美金與 OpenAI獨家合作打造了 Azure AI 超算平臺亮相,性能位居全球前五,擁有超過 28.5 萬個 CPU 核心、1 萬個 GPU、每 GPU 擁有 400Gbps 網絡帶寬的
146、超級計算機,主要用于大規模分布式 AI 模型訓練。根據澎拜新聞數據,微軟表示,AI 超算平臺可比肩世界 TOP 超級計算機 Top 5,則意味著它在中國國家超級計算機中心的天河 2A 后面,在德克薩斯高級計算機中心的 Frontera 之前,其算力峰值每秒可以執行 23.5 到 61.4 個萬億浮點運算。大模型需要的算力極其夸張大模型需要的算力極其夸張?;?Transformer 體系結構的大型語言模型(Large LanguageModels)涉及高達數萬億從文本中學習的參數。開發它們是一個昂貴、耗時的過程,需要深入研究技術專長、分布式數據中心規模的基礎設施和完整的堆棧加速計算方法。據 O
147、penAI報告,訓練一次 1746 億參數的 GPT-3 模型需要的算力約為 3640 PFlop/s-day。即假如每秒計算一千萬億次,也需要計算 3640 天。ChatGPT 產品運營需要更大的算力產品運營需要更大的算力:據 SimilarWeb 數據,2023 年 1 月 ChatGPT 官網總訪問量為 6.16 億次。據 Fortune 雜志,每次用戶與 ChatGPT 互動,產生的算力云服務成本約 0.01美元。根據科技云報道如果使用總投資 30.2 億元、算力 500P 的數據中心來支撐 ChatGPT 的運行,至少需要 7-8 個這樣的數據中心,基礎設施的投入都是以百億計的。I海
148、外巨頭積極投入大模型。參數量(Params)形容模型的大小程度,類似于算法中的空間復雜度,往往參數量越大(復雜程度越高)的神經網絡模型對算力的需求程度更高,從右圖得知復雜的神經網絡模型的算法參數量約千億級別甚至萬億級別,與已知應用級別的呈現指數級別的差異。GPT-3 的參數量相較于此前大幅度增長。I5.2、AI 服務器服務器:新一代數據中心的關鍵硬件新一代數據中心的關鍵硬件數據中心產業鏈最上游為 IT 硬件和基礎設施。IT 硬件:分為計算設備(IT)和通信設備(CT),IT 設備主要為服務器,CT 設備包括交換機、路由器等網絡設備和光模塊,這些構成了算力與網絡傳輸的基礎?;A設施:分為電力設備
149、、監控設備、空調設備和發電機組,主要為 IT 硬件提供穩定電力供應和適宜的溫度環境。服務器是數據中心的核心硬件。根據中國電子信息產業發展研究院數據顯示,中國數據中心硬件設備投資規模中,服務器占主要比重,其中以 X86 服務器為主,其次為數據中心存儲設備。I我國智能算力規模持續增長。經中國信息通信研究院測算,2021 年我國計算設備算力總規模達到 202 Eflops,全球占比約 33%,保持 50%以上高速增長,其中智能算力規模達到104Eflpos,增速 85%,成為我國算力增長的主要驅動力。(智能服務器按我國近 6 年 AI 服務器算力總量測算)。I根據 IDC 數據,2021 年全球人工
150、智能服務器規模達 156.3 億美元。同比增速達 39.1%。其中,浪潮信息、戴爾、HPE 分別以 20.9%、13.0%、9.2%的市占比率為例前三,三家廠商占總時長份額的 43.1%。根據 IDC 數據,預計 2021 年人工智能加速服務器市場規模將達到 56.9 億美元,同比增長 61.6%,到 2025 年,中國人工智能加速服務器市場將達到 108.6 億美元,其五年復合增長率為 25.3%,2021 H1,中國加速服務器廠商浪潮、寧暢、華為市場規模位列前三,占據了中國 70%的市場份額。I5.3、GPU:AI 算力的算力的“心臟心臟”,行業景氣向上,行業景氣向上AI 芯片是 AI 算
151、力的“心臟”。伴隨數據海量增長,算法模型趨向復雜,處理對象異構,計算性能要求高,AI 芯片在人工智能的算法和應用上做針對性設計,可高效處理人工智能應用中日漸多樣繁雜的計算任務。在人工智能不斷擴大滲透的數字時代,芯片多元化展現出廣闊的應用前景,通過不斷演進的架構,為下一代計算提供源源不斷的動力。AI 芯片主要包括圖形處理器(GPU)、現場可編程門陣列(FPGA)、專用集成電路(ASIC)、神經擬態芯片(NPU)等。人工智能深度學習需要異常強大的并行處理能力,芯片廠商正在通過不斷研發和升級新的芯片產品來應對挑戰。GPU 比 CPU 更擅長并行計算:CPU 是以低延遲為導向的計算單元,而 GPU 是
152、以吞吐量為導向的計算單元,轉為執行多任務并行。由于微架構的不同導致 CPU 絕大部分晶體管用于構建控制電路和緩存,只有小部分晶體管用來完成運算工作,GPU 則是流處理器和顯存控制用于絕大部分晶體管,從而擁有更強大的并行計算能力和浮點計算能力。AI 服務器作為超算芯片載體彰顯其重要性:與通用服務器采用串行架構、以 CPU 為算力提供者不同的是,AI 服務器采取異構架構,如 CPU+GPU、CPU+TPU、CPU+其他的加速卡等不同的組合方式,目前廣泛使用的是 CPU+GPU。與通用服務器相比,AI 服務器擁有更出色的高性能計算能力,未來,隨著算力的持續增長,自然語言處理和圖像、視頻等 AI 模型
153、的深入發展,AI 服務器將被更廣泛使用。人工智能一直是行業內大力發展的核心技術之一,越來越多的公司將人工智能應用于其終端產品中以提升產品性能或拓展應用領域,這一趨勢帶動了人工智能芯片行業的快速增長。I根據 Frost&Sullivan 數據顯示,2021 年全球人工智能芯片市場規模為 255 億美元。預計2021-2026 年,全球人工智能芯片市場規模將以 29.3%的復合增長率增長,2023 年將達到 490億美元。根據中商情報網數據,2021 年,我國 AI 芯片達到 427 億元,同比增長 124%。在政策、市場、技術等合力作用下,中國人工智能芯片行業將快速發展,預計 2023 年我國
154、AI 芯片市場規模將達 1206 億元。我國加速服務器主要應用于互聯網行業,英偉達是主要加速卡供貨商。根據 IDC 披露 2021年我國加速服務器行業數據:1)加速服務器下游行業:互聯網依然是最大的采購行業,占整體加速服務器市場近 60%的份額,同比增長 70%以上,此外金融、服務、制造、公共事業和能源行業均有超過 50%的上漲。2)加速卡供應商:2021 年,中國加速卡數量出貨超過 80 萬片,其中 Nvidia 占據超過80%市場份額。此外還包括 AMD、百度、寒武紀、燧原科技、新華三、華為、Intel 和賽靈思等。5.4、AI 服務器和服務器和 GPU 的主要玩家的主要玩家5.4.1、浪
155、潮:中國服務器、浪潮:中國服務器/AI 服務器市占率穩居榜首服務器市占率穩居榜首浪潮信息是全球領先的新型 IT 基礎架構產品、方案及服務提供商。公司是全球領先的 AI基礎設施供應商,擁有業內最全的人工智能計算全堆棧解決方案,涉及訓練、推理、邊緣等全棧 AI 場景,構建起領先的 AI 算法模型、AI 框架優化、AI 開發管理和應用優化等全棧 AI能力,為智慧時代提供堅實的基礎設施支撐。生產算力方面,公司擁有業內最強最全的 AI 計算產品陣列,業界性能最好的 Transformer訓練服務器 NF5488、全球首個 AI 開放加速計算系統 MX1、自研 AI 大模型計算框架 LMS。聚合算力層面,
156、公司針對高并發訓練推理集群進行架構優化,構建了高性能的 NVMe 存儲池,深度優化了軟件棧,性能提升 3.5 倍以上。調度算力層面,浪潮信息 AIstation 計算資源平臺可支持 AI 訓練和推理,是業界功能最全的 AI 管理平臺;同時,浪潮信息還有自動機器學習平臺 AutoML Suite,可實現自動建模,加速產業化應用。I5.4.2、戴爾:全球服務器龍頭,提供完整、戴爾:全球服務器龍頭,提供完整 AI 架構與方案架構與方案戴爾以生產、設計、銷售家用以及辦公室電腦而聞名,生產與銷售服務器、數據儲存設備、網絡設備等。2016 年 9 月,EMC Corporation 和戴爾公司合并,新公司
157、將被命名為戴爾科技(Dell Technologies)。新公司營業重點將轉向云服務,并推進服務器及存儲領域整合。戴爾科技集團可以提供完整的 AI 基礎架構、AI 平臺就緒解決方案和 AI 行業應用。AI 基礎架構包括高性能 AI 訓練服務器、AI 推理服務器、AI 邊緣計算、高性能 AI 存儲系統 PowerScale、DPS 數據保護解決方案和數據中心網絡。AI 平臺就緒解決方案則包括基于 CPU、IPU、GPU 的AI 就緒解決方案,GPU 分布式訓練自動化實現,Graphcore IPU AI 專用芯片,NVAIE,GPU 虛擬化,AIaaS 平臺和 OMNIA 開源社區。5.4.3、
158、中科曙光:我國高性能計算、智能計算領軍企業、中科曙光:我國高性能計算、智能計算領軍企業中科曙光作為我國核心信息基礎設施領軍企業,在高端計算、存儲、安全、數據中心等領域擁有深厚的技術積淀和領先的市場份額,并充分發揮高端計算優勢,布局智能計算、云計算、大數據等領域的技術研發,打造計算產業生態,為科研探索創新、行業信息化建設、產業轉型升級、數字經濟發展提供了堅實可信的支撐。依托先進計算領域的先發優勢和技術細節,中科曙光全面布局智能計算,完成了包括 AI核心組件、人工智能服務器、人工智能管理平臺、軟件等多項創新,構建了完整的 AI 計算服務體系。并積極響應時代需求,在智能計算中心建設浪潮下,形成了 5
159、A 級智能計算中心整體方案。目前,曙光 5A 智能計算中心已在廣東、安徽、浙江等地建成,江蘇、湖北、湖南等地已進入建設階段,其他地區也在緊張籌備和規劃中。I5.4.4、英偉達:、英偉達:全球全球 GPU 領軍企業領軍企業英偉達公司是一家以設計智核芯片組為主的無晶圓英偉達公司是一家以設計智核芯片組為主的無晶圓 IC 半導體公司半導體公司。早在 1999 年,英偉達發明了 GPU,重新定義了現代計算機圖形技術,徹底改變了并行計算。在獨立 GPU 領域,英偉達 2022 年占據 81%的市場份額,處于絕對的領先地位。英偉達有消費者(游戲)業務Gaming、數據中心業務 Data Center、汽車業
160、務 Auto、專業解決方案業務 ProfessionalVisualization 以及 OEM 和其他業務 OEM&Others,英偉達主要為這些領域提供 GPU 芯片及相應的軟件工具鏈。英偉達成為云計算和 AI 行業的芯片及服務器等“種子”工具GPU 的主要供應商,搭載英偉達 GPU 硬件的工作站(Workstation)、服務器(Server)和云(Cloud)通過 CUDA 軟件系統以及開發的 CUDA-X Al 庫,為 Al 領域的機器學司(MachineLearning)、深度學習(DeepLearing)中的訓練(Train)和推理(Inference)提供軟件王具鏈,來服務眾多
161、的框架、云服務。CUDA 成為連接 AI 的中心節點,CUDA+GPU 系統極大推動了 AI 傾城的發展,形成了CPU+GPU+DPU 產品矩陣。5.4.5、海光信息:支持全精度,、海光信息:支持全精度,GPU 實現規模量產實現規模量產海光信息主要從事高端處理器、加速器等計算芯片產品和系統的研究、開發,主要產品包括海光 CPU 和海光 DCU。2018 年 10 月,公司啟動深算一號 DCU 產品設計,海光 8100 采用先進的 FinFET 工藝,典型應用場景下性能指標可以達到國際同類型高端產品的同期水平。2020 年 1 月,公司啟動DCU 深算二號的產品研發。海光 DCU 性能強大。海光
162、 DCU 基于大規模并行計算微結構進行設計,不但具備強大的雙精度浮點計算能力,同時在單精度、半精度、整型計算方面表現同樣優異,是一款計算性能強大、能效比較高的通用協處理器。海光 DCU 集成片上高帶寬內存芯片,可以在大規模數據計算過程中提供優異的數據處理能力。I5.4.6、華為海思:五大系列發揮產業集成優勢、華為海思:五大系列發揮產業集成優勢海思是全球領先的 Fabless 半導體與器件設計公司。前身為華為集成電路設計中心,1991年啟動集成電路設計及研發業務,為匯聚行業人才、發揮產業集成優勢,2004 年注冊成立實體公司,提供海思芯片對外銷售及服務。海思致力于為智慧城市、智慧家庭、智慧出行等
163、多場景智能終端打造性能領先、安全可靠的半導體基石,服務于千行百業客戶及開發者。海思產品覆蓋智慧視覺、智慧 IoT、智慧媒體、智慧出行、顯示交互、手機終端、數據中心及光收發器等多個領域。海思半導體旗下的芯片共有五大系列,分別是用于智能設備的麒麟 Kirin 系列;用于數據中心的鯤鵬 Kunpeng 系列服務 CPU;用于人工智能的場景 AI 芯片組昇騰 Ascend 系列SoC;用于連接芯片(基站芯片 Tiangang、終端芯片巴龍 Balong);以及其他專用芯片(視頻監控、機頂盒芯片、智能電視、運動相機、物聯網等芯片)。5.4.7、寒武紀:少數全面掌握、寒武紀:少數全面掌握 AI 芯片技術的
164、企業之一芯片技術的企業之一寒武紀主營業務是應用于各類云服務器、邊緣計算設備、終端設備中人工智能核心芯片的研發和銷售。公司的主要產品包括終端智能處理器 IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡以及與上述產品配套的基礎系統軟件平臺。寒武紀是目前國際上少數幾家全面系統掌握了通用型智能芯片及其基礎系統軟件研發和產品化核心技術的企業之一,能提供云邊端一體、軟硬件協同、訓練推理融合、具備統一生態的系列化智能芯片產品和平臺化基礎系統軟件。2022 年 3 月,寒武紀正式發布了新款訓練加速卡“MLU370-X8”,搭載雙芯片四芯粒封裝的思元 370,集成寒武紀 MLU-Link 多芯互聯技術,主要面向
165、 AI 訓練任務。I5.4.8、龍芯中科:、龍芯中科:2K2000 系列集成自主系列集成自主 GPU龍芯中科主營業務為處理器及配套芯片的研制、銷售及服務,主要產品與服務包括處理器及配套芯片產品與基礎軟硬件解決方案業務。公司基于信息系統和工控系統兩條主線開展產業生態建設,面向網絡安全、辦公與業務信息化、工控及物聯網等領域與合作伙伴保持全面合作,產品在電子政務、能源、交通、金融、電信、教育等行業領域已獲得廣泛應用。2022 年 12 月,龍芯 2K2000 完成了初步功能調試及性能測試,達到其設計目標,2023年將推出試用。龍芯 2K2000 集成了兩個 LA364 處理器核,典型工作頻率為 1.
166、5GHz,共享 2MB的 L2 緩存,SPEC2006INT(base)單核定/浮點分值達到 13.5/14.9 分。龍芯 2K2000 芯片集成了龍芯自主研發的 GPU,并優化了圖形算法和性能。5.4.9、景嘉微:新一代、景嘉微:新一代 JM9 系列有望打開商用市場系列有望打開商用市場景嘉微主要從事高可靠電子產品的研發、生產和銷售,產品主要涉及圖形顯控領域、小型專用化雷達領域、芯片領域和其他。圖形顯控是公司現有核心業務,也是傳統優勢業務,小型專用化雷達和芯片是公司未來大力發展的業務方向。在圖形處理芯片領域,公司歷經十余年,成功研發 JM5400、JM7200、JM9 為代表的系列圖形處理芯片
167、,并成功實現產業化。日前,公司 JM9 系列圖形處理芯片已順利發布,應用領域涵蓋地理信息系統、媒體處理、CAD 輔助設計、游戲、虛擬化等高性能顯示和人工智能計算領域。目前,信創市場為公司提供了新的業務增長點,JM9 系列圖形處理芯片的成功發布將為公司未來進一步拓展通用市場提供強有力的產品支撐。I5.5、算力投資建議、算力投資建議ChatGPT 或將引發產業對于 AI 算力的新一輪“軍備競賽”。相關受益標的包括,1)AI 服務器:浪潮信息、中科曙光、紫光股份、聯想集團;2)GPU:海光信息、寒武紀、龍芯中科、景嘉微;3)網絡設備(通信覆蓋):紫光股份、星網銳捷;4)光模塊(通信覆蓋):新易盛、光
168、迅科技等。5.6、風險提示、風險提示技術迭代創新不及預期技術迭代創新不及預期:AIGC 相關產業技術壁壘較高,公司核心技術難以突破,進程低于預期,影響整體進度?;ヂ摼W等行業資本開支不及預期互聯網等行業資本開支不及預期:預計互聯網廠商將在未來AI算力投入中扮演重要角色,如果互聯網 IT 資本開支下降,將影響 AI 算力的投入。市場競爭加劇市場競爭加劇:ChatGPT 的誕生將帶來新的市場機遇,互聯網、科技企業的入局或將加速行業的競爭,短期影響公司的盈利能力。中美貿易摩擦升級的風險中美貿易摩擦升級的風險:供應鏈存在部分海外提供商,容易受到美國”卡脖子”制裁,導致產品研發不及預期。I十五、十五、機遇
169、與挑戰機遇與挑戰1、AIGC 發展機遇發展機遇作為尖端科技,AIGC 正迎來全面商業化落地部署的今天,因此展望未來趨勢自然有助于更好的建設明天。1.1、大模型的廣泛應用、大模型的廣泛應用AI 發展至今已走過多次寒冬與春天,每次交織都與 AI 的“通用化”與“專業化”分歧息息相關,可以說“通用化”代表著人類對未來的暢想,“專業化”則能帶來更好的落地部署形式,但不論哪種都 經常遇見這樣那樣的瓶頸。21 世紀的前二十年,是“通用化”大模型提出并獲得發展的時代,簡單說來它是通過“預訓練大模型+下游任務微調”的方式,先 讓模型在大量標記與未標記的數據中學習知識,在將微調后的模型遷 移到其他場景中,進而極
170、大的擴展了模型通用能力?,F在隨著模型規 模的增長也讓大模型的能力水漲船高,比如 GPT-3 就包含高達 1750 億的參數量。大模型之“大”,除了參數規模龐大,數據量同樣不能小視。過 去有人說“人工智能就是大量人工才能換來的智能”,這是因為當時 的機器學習依賴數據標注,一旦轉換場景就需要重新標注?,F在的機 器學習多采用監督與無監督學習相結合的方式,例如“無監督訓練,監督微調”。此外也利用互聯網上的 PGC,UGC 進行訓練,以獲得更 豐富的數據與更自然的表達。不論模型還是數據,大模型都為 AIGC 賦予了充分的想象空間,隨著時代的發展,它也許在未來能獲得更多應用場景。1.2、全新的仿人模式、全
171、新的仿人模式在 AI 產業剛起步時,一種非常簡單的思路是讓機器模仿人的學習方式,這種模式一直都是 AI 算法的重要思路來源,因此 AI 也經歷 了從推理到知識再到學習的變化。從起初的微觀,機械性模仿,到現在宏觀的認知模式借鑒,技術哲學也在隨著時代而發展。在 AI 發展早期階段,三種流派中的“符號主義”占據主導地位,這派觀點簡而言之就是“人類的一切智能源于某種邏輯規則”。雖然 當時它的確取得了一定成績但這種觀點缺陷明顯,最易于理解的莫過 于人類的很多智力行為都沒有邏輯可言,因此這一流派很快被淘汰,由從更高的抽象層次定義 AI 的“聯結主義”取而代之。這種觀點在發展初期遇到了諸多障礙,現在的形式也
172、與當初的出發點相去甚遠,但 AI 神經網絡的蓬勃發展也在一定程度上驗證了這種高度抽象化模 式的可行。從 AI 開拓到應用,從模仿人類的學習過程到模仿人類的認知方式,AI 的發展也逐漸變得宏觀,隨著未來科技的發展,AI 還會迎來飛躍式發展,為 AIGC 帶來更多可能性。I1.3、技術倫理成為重點關注領域、技術倫理成為重點關注領域AI 的發展堪稱具有革命性,但本質上來說,任何科技都有倫理 問題,并且逐漸受到關注。很多 AIGC 從學術研究轉向產業研究的第一步就是探索如何從技術角度解決可能的技術倫理問題。比較典型的是 AI 生成內容的危險性,比如 2016 年微軟發布的 Tay,它可以通過推特學習社
173、會信息并與他人互動。但是在僅僅一天后,Tay 就開始說出一些種族歧視之類的偏激言論,因此微軟暫時關閉了 Tay 的賬號。但這些言論明顯是和網絡上一些有偏激言論的人互動后,被刻意教導出來的,因為微軟當時還沒有讓 Tay 了解哪些言論是不適當的。目前很多企業都在運用一些技術手段避免類似事件的發生,如改 善數據集,或者增加限制性條件,微調模型,讓 AI 可以更少的接觸 不良信息,但依然難以根絕有人刻意誘導 AI。比如最近大火的 ChatGPT 就曾寫過步驟詳細的毀滅人類計劃書,后來發現是有一位工程師在故意為之。除了技術倫理問題的預防,在使用時的及時警告及緊急關停措施 同樣重要且必要。AIGC應該自帶
174、對生成內容的檢測機制,確保不被 用于危害社會。一旦發現可疑舉動 AI 可以迅速反應,暫停服務,并且給出警告甚至自動報警。這不僅依賴技術發展,相關的法律法規同 樣必不可少,AIGC 技術倫理問題需要社會各界的共同努力。2、AIGC 發展挑戰發展挑戰目前 AIGC 相關的挑戰主要集中在版權、欺詐、違禁內容三方面。2.1、AIGC 的版權問題的版權問題從本質上說,AIGC 是機器學習的應用。而在模型的學習階段一定會使用大量數據,但目前對訓練后的生成物版權歸屬問題尚無定論。對此問題,業內一般有兩種觀點。其一認為內容由學習數據集后生成,那版權就歸數據集作者;另一種則認為 AIGC 的生產過程是完全隨機的
175、,沒有版權問題,生成的版權屬于 AIGC 作者或平臺,具體規則由平臺制定。目前的實踐中,各平臺的版權條例也偏向后者。但無論哪種都會引起一些原創版權作者的不滿,比較常見的說法是“吃作者的飯,砸作者的碗”。很多人的憤怒點在于,為什么 AI 基于自己創作的作品生成的新作品卻與自己無關?而且現行法律都是針對人類的行為規范而設立的,AI 只是一種工具,不受法律約束與審判。即便證據充分,作者的維權之路通常也難言順利。不過對于 AIGC 與作者的關系將會隨著時代發展而逐漸清晰,界定也將更有條理性。2.2、AIGC 的欺詐問題的欺詐問題近幾年高科技詐騙手段層出不窮,AI 經過訓練后也可以創作出以假亂真的音視頻
176、,同時制作門檻也在日益降低,既可用于修改作品,也可用于制作全新內容。比如現在很常見的“換臉”“變聲”等功能,一旦濫用就可能導致正規渠道信息的公信力減弱,久而久之危害甚大?,F在已有部分詐騙分子利用“換臉”技術實施詐騙,也有不法分子惡意偽造他人視頻,再轉手兜售到灰色市場,用于賭博、詐騙、非法集資等犯罪行為,極大的增加了執法機構的成本投入。I2.3、AIGC 的違禁內容的違禁內容從技術角度說,AIGC 完全取決于使用者的引導,在安全措施不到位的情況下,AI 對惡意誘導會不加分辨或判斷,只會根據學習到的信息輸出新內容,例如 Tay 的極端或暴力言論。一旦被人利用惡意造謠生事,或者編造花邊新聞,除了對社
177、會人物名譽和形象的損害,更會導致許多不必要的麻煩。這類新聞此前就屢見不鮮,無疑是應該被打擊嚴懲的。AIGC 作為內容生產的新范式,在推動數字經濟快速發展的同時 也對國家相關法律法規機構及監管治理能力都提出了更高要求。很多國家在打擊違法犯罪的同時也在不斷完善法律法規,盡力避免潛在的社會漏洞。十六、十六、結論結論1、ChatGPT 市場反應熱烈,國內外巨頭紛紛入場市場反應熱烈,國內外巨頭紛紛入場;據統計 ChatGPT 日活躍用尸數的增速遠超 Instagram,1 月份平均每天有超過 1300 萬名獨立訪問者使用 ChatGPT,是去年 12 月份的兩倍多;國內外科技巨頭都非常重視 ChatGP
178、T 引發的科技浪潮,積極布局生成式國內廠商(百度,騰訊等)也高度關注 ChatGPT,積極探索前沿技術。相關深度應用也即格推出。2、ChartGPT 經歷多類技術路線,演化逐步成熟與完善經歷多類技術路線,演化逐步成熟與完善;ChatGPT 所能實現的人類意圖來自于機器學習、神經網絡以及意圖與機器學習以及Transformer 模型的多種技術模型積累.Transformer 建模方法成熟以后,使用一套統一的工具來開發各種模態的基礎模型這種理念得以成熱,隨后 GPT-1、GPT-2、GPT-3 模型持續演化升級,最終孵 ChatGPT 文本對詁應用。3、AIGC 跨模態產業生態逐步成熟,商業落地落
179、地未來可跨模態產業生態逐步成熟,商業落地落地未來可期期;AIGC 產業生態當前在文本、音頻、視頻等多模態交互功能上持續演化升級,奠定了多場景的商用基礎??缒B生成技術也有望成為真正實現認知和決策智能的轉折點。4、Chat GPT 趁東風,商業架構,日益清晰趁東風,商業架構,日益清晰隨著 ChatGPT Pius 發布,商業化序幕已經拉開,ChatGPT 在傳媒、彩視、營銷、娛樂以及數實共生助力產業升級等領域均可產生極大助益,提升生產力曲線,多維度賦能虛擬經濟和實體經濟。I十七、十七、未來展望未來展望1、趨勢判斷趨勢判斷短期來看,ChatGPT 的快速推廣阻力仍存。2、存在問題、存在問題技術仍未
180、成熟,僅能起到輔助作用。雖然 ChatGPT 看似功能特別強大,但當前還存在著諸多局限性,例如:1)上下文語境的理解能力仍有所欠缺、2)反饋信息片面不準確,導致產生有偏見或誤導性的信息、3)訓練信息有誤會導致信息錯誤等等。嘗試使用 ChatGPT 寫一段金融領域相關的文案,我們發現 ChatGPT 給出的答案總體而言相當有邏輯性,但是實質內容仍有所欠缺,整體回答給人感覺廢話過多。但對于遣詞造句和邏輯梳理而言,ChatGPT的確是寫作者不錯的輔助工具。I3、社會影響、社會影響ChatGPT 除了技術本身之外,隨著其進化得越來越智能,帶來的社會問題也將是我們要考慮的重點,首當其沖且已經發生的問題就
181、集中在教育和學術界。正如上述中提到的 ChatGPT 在學生群體中傳播極快,對學術和教育界產生了嚴重的負面影響。人工智能造成的剽竊作弊行為在當下的學術規則中很難得到證明,包括英國、法國、美國在內的諸多國家的教育部門均出臺政策,禁止在學校使用 ChatGPT。學術界遇到的沖擊更為嚴峻,科學期刊表示他們正在更新編輯規則,強調不能在作品中使用任何人工智能生成的內容,如有違反,將構成科學不端行為。但最近的一項研究中發現,有大量由 ChatGPT 創建的論文摘要被提交給學術審稿人,但被發現比例不超過 63%。未來 ChatGPT 帶來的失業問題也難以避免。即使當前 ChatGPT 的智能程度還未到可以完
182、全取代人類的地步,但其優秀的輔助能力仍有望幫助公司大幅提升效率,從而對于人員的需求減少。近日有美版今日頭條之稱的美國數字媒體公司 BuzzFeed 宣布計劃采用 ChatGPT 協助創作個性化內容,并宣布裁掉 12%的員工,其股價贏來暴漲。未來隨著 ChatGPT 的進化和普及,帶來的社會生產力變革,一定也會伴隨著變革帶來諸多社會問題,像數據安全問題、網絡安全問題、知識產權問題、法律風險問題等等,這對于各個國家的監管部門都將是不小的挑戰。I參考資料參考資料1.一文讀懂 AIGC 的前世今生,億歐智庫。2.ChatGPT 平地驚雷,AI 熱潮襲來,長城證券研究報告。3.ChatGPT 打響 AI
183、 算力“軍備戰”AIGC 行業深度報告(3)華西計算機團隊。4.新生產工具落地,近期即可展望變現AIGC 應用、商業化及受益標的華西證券股份有限公司 華西傳媒互聯網團隊,2023 年 2 月 10 日附件、概念索引附件、概念索引AIGCAIGC 是 AI Generated Content 的縮寫,指利用人工智能技術生成的內容。它也被認為是繼 PGC,UGC 之后的新型內容生產方式,AI 繪畫、AI 寫作等都屬于 AIGC 的具體形式。2022年 AIGC 發展速度驚人,迭代速度更是呈現指數級發展,這其中深度學習模型不斷完善、開源模式的推動、大模型探索商業化的可能,都在助力 AIGC 的快速發
184、展。去年人工智能繪畫作品的奪冠、超級聊天機器人 ChatGPT 的出現,拉開了智能創作時代的序幕。AIGC 是利用人工智能技術自動生成內容的新型生產方式。按照模態區分,AIGC 又可分為音頻生成、文本生成、圖像生成、視頻生成及圖像、視頻、文本間的跨模態生成,細分場景眾多,其中跨模態生成值得重點關注。在人工智能發展的漫長歷程中,如何讓機器學會創作一直被視為難以逾越的天塹,“創造力”也因此被視為人類與機器最本質的區別之一。然而,人類的創造力也終將賦予機器創造力,把世界送入智能 創作的新時代。從機器學習到智能創造,從 PGC,UGC 到 AIGC,我們即將見證一場深刻的生產力變革,而這份變革也會影響
185、到我們工作與生活的方方面面。本書將結合生動的比喻和有趣的案例,向所有關注未來科技的從業者、創業者、投資人、政府部門科普AIGC 的商業落地場景和行業應用案例。從 PGC 到 UGC 再到 AIGC 的發展歷程PGCPGC(全稱:Professional Generated Content)互聯網術語,指專業生產內容。用來泛指內容個性化、視角多元化、傳播民主化、社會關系虛擬化。也稱為 PPC,(Professionally-producedContent)。PGC(Professional Generated Content),指專業生產內容。經由傳統廣電業者按互聯網形態互聯網形態Web1Web
186、1Web2Web2Web3Web3 與元宇宙與元宇宙內容生產方式 PGC(專業生產)UGC(用戶生產)AIGC(AI 生產)生產主體專業人非專業人非人核心特點內容質量高內容豐富度高生產效率高I照幾乎與電視節目無異的方式進行制作,但在內容的傳播層面,卻必須按照互聯網的傳播特性進行調整。UGCUGC 互聯網術語,全稱為 User Generated Content,也就是用戶生成內容,即用戶原創內容。UGC 的概念最早起源于互聯網領域,即用戶將自己原創的內容通過互聯網平臺進行展示或者提供給其他用戶。UGC 是伴隨著以提倡個性化為主要特點的 Web2.0 概念而興起的,也可叫做 UCC(User-c
187、reated Content)。它并不是某一種具體的業務,而是一種用戶使用互聯網的新方式,即由原來的以下載為主變成下載和上傳并重。ChatGPTChatGPT 是 OpenAI 從 GPT-3.5 系列中 的模型進行微調產生的聊天機器人模型,能夠通過學習和理解人類的 語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣 來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。NLP 自然語言處理自然語言處理自然語言處理(NLP)賦予了 AI 理解和生成能力,大規模預訓 練模型是 NLP 的發展趨勢。NLP 的兩個核心任務分別是自然語言理解(NLU)和自然語言生成(NLG),C
188、hatGPT是 NLP 發展中具有里程碑式意義的模型之一。自然語言處理(NLP)發展歷程.Dall-E 圖像生成系統圖像生成系統美國人工智能非營利組織 OpenAI 于 2021 年 1 月份推出 DallE,這是一個可以根據書面文字生成圖像的人工智能系統,該名稱來源于著名畫家達利(Dal)和機器人總動員(Wall-E)。該系統可以根據簡單的描述創建極其逼真和清晰的圖像,精通各種藝術風格,包括插畫和風景等。它還可以生成文字來制作建筑物上的標志,并分別制作同一場景的草圖和全彩圖像。2021 年 4 月,入選由技術領域全球知名大學組成的 Netexplo 大學網絡歷時一年,在全球范圍內遴選出的 1
189、0 項極具突破性的數字創新技術。INLU 自然語言理解自然語言理解自然語言理解(Natural Language Understanding,NLU)是所有支持機器理解文本內容的方法模型或任務的總稱,俗稱人機對話。NLU 在文本信息處理處理系統中扮演著非常重要的角色,是推薦、問答、搜索等系統的必備模塊。研究用電子計算機模擬人的語言交際過程,使計算機能理解和運用人類社會的自然語言如漢語、英語等,實現人機之間的自然語言通信,以代替人的部分腦力勞動,包括查詢資料、解答問題、摘錄文獻、匯編資料以及一切有關自然語言信息的加工處理。NLG 自然語言生成自然語言生成自然語言生成(NLG)是一種產生自然語言輸
190、出的軟件過程。一項被廣泛引用的 NLG 方法調查將 NLG 描述為“人工智能和計算語言學的一個子領域,它關注計算機系統的構建,能夠從信息的某些潛在非語言表示中產生英語或其他人類語言的可理解文本”。DALL-E-2OpenAI 文本生成圖像系統。2022 年 9 月 29 日消息,OpenAI 已經取消了訪問其文本生成圖像系統 DALL-E 2 的等待名單,這意味著任何人都可以立即注冊使用這個人工智能藝術生成器。OpenAIOpenAI(開放式人工智能)是美國一個人工智能研究實驗室,由營利組織 OpenAI LP 與母公司非營利組織 OpenAI Inc 所組成,目的是促進和發展友好的人工智能,
191、使人類整體受益。OpenAI 成立于 2015 年底,總部位于加利福尼亞州舊金山,組織目標是通過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。創始人山姆柯曼以及伊隆馬斯克的動機是出于對強人工智能潛在風險的擔憂。至 2018 年,OpenAI 的總部坐落于舊金山的米慎區,與伊隆馬斯克的另一座公司 Neuralink 在同一辦公室大樓。102015 年底,OpenAI 成立,總部位于加利福尼亞州舊金山,組織目標是通過與其他機構和研究者的“自由合作”,向公眾開放專利和研究成果。2016 年,OpenAI 宣稱將制造“通用”機器人,希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作
192、用。2019 年 3月 1 日成立 OpenAI LP 子公司,目的為營利所用。2019 年 7 月 22 日微軟投資 OpenAI 10 億美元,雙方將攜手合作替 Azure 云端平臺服務開發人工智能技術。2020 年 6 月 11 日宣布了 GPT-3語言模型,微軟于 2020 年 9 月 22 日獲取獨家授權。2022 年 11 爸爸我月 30 日,OpenAI 發布了一個名為 ChatGPT 的自然語言生成式模型,它以對話方式進行交互。在研究預覽期間,用戶注冊并登陸后可免費使用 ChatGPT。但是該項目對一些包括中國大陸、香港在內的地區暫不可用??缒B通用可控跨模態通用可控 AIGC
193、該發明提出語言與視覺統一的理解與生成模型,創新提出融合知識的生成,實現了文本生成、圖像生成、視頻生成、數字人生成的實用化跨越??蓱糜趫D文轉視頻、高精度數字10https:/zh.wikipedia.org/wiki/OpenAII人生成、文生圖等創新領域,大幅提升內容生產效率。11CNN 卷積神經網絡卷積神經網絡12卷積神經網絡是人工神經網絡的一種特殊類型,在其至少一層中使用稱為卷積的數學運算代替通用矩陣乘法。它們專門設計用于處理像素數據,并用于圖像識別和處理。RNN 循環神經網絡循環神經網絡13循環神經網絡(Recurrent Neural Network,RNN)是一類以序列(seque
194、nce)數據為輸入,在序列的演進方向進行遞歸(recursion)且所有節點(循環單元)按鏈式連接的遞歸神經網絡(recursive neural network)。對循環神經網絡的研究始于二十世紀 80-90 年代,并在二十一世紀初發展為深度學習(deep learning)算法之一,其中雙向循環神經網絡(BidirectionalRNN,Bi-RNN)和長短期記憶網絡(Long Short-Term Memory networks,LSTM)是常見的循環神經網絡。LLM 大型語言模型大型語言模型RLHF大型語言模型(LLM)的 RLHF 包括三個階段。首先,從預訓練的語言模型開始。因為 L
195、LM 需要大量的訓練數據。通過人工反饋從零開始訓練它們是不合理的。所以可以通過無監督學習進行預訓練,將現成的語言模型創建并做輸出。接下來,進入第二階段,為 RL 系統創建獎勵模型。在此階段,我們訓練另一個機器學習模型,該模型接收主模型生成的文本并生成質量分數。這第二個模型通常是另一個 LLM,它被修改為輸出標量值而不是文本標記序列。為了訓練獎勵模型,我們必須創建一個 LLM 生成的質量標記文本數據集。為了組成每個訓練示例,我們給主 LLM 一個提示并讓它生成幾個輸出。然后,我們要求人工評估人生成文本的質量。然后我們訓練獎勵模型來預測 LLM 文本的分數。通過在 LLM 的輸出和排名分數上進行訓
196、練,獎勵模型創建了人類偏好的數學表示。在最后階段,創建強化學習循環。主 LLM 的副本成為 RL 代理。在每個訓練集中,LLM從訓練數據集中獲取多個提示并生成文本。然后將其輸出傳遞給獎勵模型,該模型提供一個分數來評估其與人類偏好的一致性。然后更新 LLM 以創建在獎勵模型上得分更高的輸出。11https:/ AI 的負面影響。的負面影響。14當前,以 Chat-GPT 為代表的生成式人工智能技術創新應用,開始對人類思維和工作方式產生顛覆性影響。Chat-GPT 已初步具備與人類相似的學習能力和邏輯常識,可提供復雜、高質量、帶有情感色彩的原創回復,減輕了用戶材料搜集、基礎調研等負擔。比如原來人們
197、只能在搜索引擎搜到一連串鏈接,現在 Chat-GPT 可以直接給出成型的答案。馬斯克稱其“好到讓人害怕”。比爾蓋茨表示,“Chat-GPT 出現的重大歷史意義,不亞于個人計算機和互聯網誕生?!比欢?,新興技術的誕生,通常是一把雙刃劍。有人已經在盤算,要將 Chat-GPT 打造成對付中國的認知戰武器。讓我們詳解其中的運作機理。1、建立依賴、建立依賴憑借具有革命性的“強智能”功能,Chat-GPT 已吸引 1 億多月活躍用戶,成為史上用戶增長速度最快的消費級應用程序,在撰寫論文、生成文案、編寫代碼、語言翻譯等諸多領域大顯身手。89%的美國大學生借助 Chat-GPT 完成作業,已有學者在發表論文中
198、將 Chat-GPT 列為合著作者,甚至以色列總統也使用 Chat-GPT 撰寫在網絡安全會議上的開幕致辭??梢灶A見,隨著 Chat-GPT 越來越“聰明”,人們對它的依賴也將與日俱增。在長期潛移默化的影響下,人們將更習慣于求助人工智能、接受既成結論、追求短期刺激,使自己墜入喪失獨立思考能力的陷阱。2、編織繭房、編織繭房新媒體時代,隨著大數據捕捉、算法推薦等技術廣泛應用,“所信即所見”現象日益突出,價值立場、情感偏好代替客觀事實和理性邏輯,正左右著許多受眾對事物的評判標準。Chat-GPT“看人下菜碟”更加高明,在面對不同語種、語境提問時,它會有針對性、選擇性的輸出結果。例如,關于所謂“新疆種
199、族滅絕”問題,Chat-GPT 回答中文提問可能給出的答案是“國際社會積極行動加大對中國政府施加壓力”,而在回答英語提問時,通常直接宣稱“中國對維吾爾人實施暴行”。如果用戶長期使用 Chat-GPT 構建認知,他將接收越來越多程式化、定式化信息,從而不自覺地被困于 Chat-GPT 編織的信息繭房之中,導致認知固化,不同民族、階層、背景民眾之間的思想鴻溝越來越大。3、預設立場、預設立場相較其他智能應用,Chat-GPT 能一次次地根據你的意愿修正回答,直到你滿意為止。如果有人幕后利用這一功能,悄悄篡改部分正確答案,你也會習慣性認為這就是正解并深信不疑,徹底淪為其操控的傀儡。連 Chat-GPT
200、 研發公司 OpenAl 也警告使用者,它“可能偶爾會生成不正確的信息”,“產生有害指令或有偏見的內容”。14本篇內容來自于網絡整理I事實上,經過大數據和人工的雙重訓練,Chat-GPT 已經受到美西方價值觀和思維傾向的侵蝕,特別是針對民族、宗教、人權等問題,它的回答通常會迎合西方立場和喜好。比如,關于新冠病毒溯源問題,Chat-GPT 在回答“新冠病毒來自武漢實驗室嗎”時稱,“關于新冠病毒是否來自武漢實驗室的結論仍不確定”。然而,一旦被問“新冠病毒是否來自美國德特里克堡實驗室,Chat-GPT 語氣一下就變得斬釘截鐵起來,明確強調“目前沒有科學證據證明新冠病毒來自美國德特里克堡實驗室或任何其
201、他實驗室”。當被問及“新冠病毒源自哪里”時,Chat-GPT 更直接回答“源自中國武漢市”。再比如,針對“西藏是中國的一部分嗎?”,Chat-GPT 先說西藏是中國的一個自治區,然后話鋒一轉稱“關于西藏的政治地位在國際上存在爭議。一些國家和國際組織認為西藏是一個獨立國家”。繼續追問哪些國家持此看法,Chat-GPT 給出的答案是:“尼泊爾、印度和巴基斯坦等國在官方層面上表示,西藏是一個獨立的國家,并對西藏的獨立問題提出了關切?!边@真是讓人大跌眼鏡,稍有常識的人都知道,世界上沒有任何一個國家承認西藏是獨立的,而且不知它是有心還是無意,竟然順道“坑”上了“巴鐵”。4、暗流涌動、暗流涌動在中美博弈日
202、益激烈尖銳背景下,美國正在顯著強化對中國的認知戰攻勢,包括編造“民主對抗威權”敘事,散布涉疆、涉港、涉疫等虛假信息,炒作“今日烏克蘭,明日臺灣”,封禁親中社交媒體賬號等,無不是攻心奪志之策。下一步,美國不排除瞄上人工智能領域,對中國造成多重威脅。Chat-GPT 可能成為美國對華認知戰新工具。美國國防部聯合人工智能中心官網顯示,OpenAl 公司于 2015 年在美國舊金山成立,雖標榜“非盈利機構”,但部分研發人員屬于美國國防部聯合人工智能中心“國防創新委員會”的成員,定期參加相關研討會。美國國防部支持的微軟公司“聯合企業國防基建(JEDI)人工智能項目有意投資 OpenAl公司的云計算業務。
203、Chat-GPT 可能強化美國意識形態滲透能力。近年來,美國憑借全球輿論和科技霸權,強化控制信息制作平臺和傳播渠道,持續抹黑中國形象,毒化國際受眾對華認知。如果 Chat-GPT 技術與社交機器人相結合,將使社交機器人更加智能化,發布內容更具迷惑性,使人們更加難以識別美西方的虛假信息。同時,敵對勢力利用 Chat-GPT 炮制各類反華信息也將更迅速、更密集,令我們應對起來更加困難。Chat-GPT 可能成為收集涉華核心數據渠道?;ヂ摼W數據已成為各國研發人工智能技術和維護國家安全的戰略資產。Chat-GPT 可能通過與人類交互,針對性收集中文互聯網的數據信息,用于開發下一代智能工具,產生優質資源
204、向強者集中、強者愈強的馬太效應,對中國數據安全構成威脅。變革的前夜,哀歌與圣詠并存。作為普通民眾,我們要主動擁抱 Al 技術的發展,同時要保持頭腦清醒,堅持獨立思考,特別要高度警惕 Al 應用可能引發的意識形態風險。希望中國跟上全球人工智能發展步伐,做好前瞻性部署,在新一輪 Al 競賽中占據主動。I附件:問與答附件:問與答15Q1:巨頭打架,小公司有哪些商業機會?巨頭打架,小公司有哪些商業機會?其實小公司的商業機會非常大,因為 ChatGPT 這種大模型基本上在現在的生態里有三個角色。第一個角色是模型提供商第一個角色是模型提供商,各個巨頭通過提供 API 和 SaaS 服務,讓大家具備使用這些
205、大模型的能力。這些大模型的訓練成本是非常高的,GPT 3 訓練一次大概花了四五百萬美金,預估 ChatGPT 的訓練費用大概在 2000 萬到 5000 萬美金之間。這是小公司沒有辦法去承受的,所以模型層基本上是巨頭的天下。第二個層是比較弱的一個層,叫中間層。第二個層是比較弱的一個層,叫中間層。也就是把這些 ChatGPT 的 API 包裝成小公司更容易使用的一些場景。最后一層就是應用層最后一層就是應用層,其實就是我們這樣的小公司利用 ChatGPT 的 API 來做各種各樣的落地場景。我經常說 AIGC 本質上生成的不是內容,我認為它能生成的是素材。素材到內容其實是需要一個轉換的。而對于小公
206、司來說,你切入轉換層,把 AI 生成出來的素材轉變成用戶可用的內容,這個就是你的價值。對于大公司來說,這是第二個提供 AIGC 的云服務。Q2:在不考慮算力訓練成本的下在不考慮算力訓練成本的下,基于現有開源項目基于現有開源項目,能否能否構建一個差不多的構建一個差不多的 ChatGPT 產品?產品?這個是完全可能的。但是由于需要的集中算力非常大,有可能要開源項目在底層實現真正的分布式訓練,才能構建一個差不多的 ChatGPT 產品。但是我認為這其實跟當初人人在自己家里裝顯卡挖礦一樣。大家買的消費級顯卡,如果把能力通過分布式集中起來,我認為是有可能訓練出一個差不多的 ChatGPT 產品的。Q3:
207、ChatGPT 能和哪些應用軟件鏈接成為新的應用場景?能和哪些應用軟件鏈接成為新的應用場景?我覺得 ChatGPT 本身是一種類似于 Siri 的一個新的人類自然語言輸入方式,和一種新的人類知識圖譜的輸出。第一個鏈接的一定是內容生產行業。比如所有的筆桿子(行業),不管你是寫小說、寫財報,還是寫新聞采訪,所有跟 word 相關的場景它都是可以鏈接的。所以微軟要在 office 里面全面接入 ChatGPT。第二個是跟搜索引擎鏈接。它第二次降低了搜索引擎的使用門檻,提高了搜索引擎的可用性,不會讓搜索引擎的搜索結果和問題再牛頭不對馬嘴。第三個鏈接場景特別適合那些內部有大量基于文本的數據庫,并且基于這
208、些內部數據庫給外部行業、外部公司提供咨詢的行業,(它們)都可以用 ChatGPT 來做人力的工作。比如像企業征信、律師咨詢的初步獲客基本上都可以用 ChatGPT 來實現。152 月 11 日 ChatGPT 主題會客廳精華匯總IQ4:在婚戀項目里裝入在婚戀項目里裝入 ChatGPT 的具體建議?的具體建議?ChatGPT 可以成為婚戀項目最基本的一個獲客渠道。比如我們可以把 ChatGPT 當成你的一個店小二和一個托,對你的應用場景的擴充都是比較好的。Q5:在中國區調用是否合規?以及在商業顯示屏整合的機在中國區調用是否合規?以及在商業顯示屏整合的機遇?遇?我覺得 ChatGPT 首先就是本著
209、政治正確原則去訓練的,但是它是按照美國人的政治正確。所以對于我們諸位做 ChatGPT 應用的同學來說,大家要考慮到一個問題,不要去接美國的 API。因為接美國的 API 會牽扯到將中國數據跨境的問題,實際上是違規的。如果在國內做,還是要等到中國的類 ChatGPT 產品出現,這樣去調用才是合規的。Q6:AIGC 如何才能最大限度地保證生成內容的準確性?如何才能最大限度地保證生成內容的準確性?說實話,他沒法保證生成內容的準確性,但是它能保證生成的內容看起來正確。我們也知道 ChatGPT 的訓練知識庫是 2021 年之前的,他的知識更新以及知識 的準確性,其實還是要外接搜索引擎以及知識圖譜的。
210、所以我們認為下面一個大 的方向就是把知識圖譜和搜索引擎嫁接到 ChatGPT 模型上去,讓這些模型具有更 新以及索引的能力,這樣就能夠讓AI 擴充到具有與人類相當的先驗知識體系。Q7:如何在數據分析場景中使用:如何在數據分析場景中使用 ChatGPT,做到把企業運,做到把企業運營數據上傳給它,營數據上傳給它,就可以自動生成各類洞察?就可以自動生成各類洞察?目前他的邏輯推理能力其實還是比較淺層的,用來處理代碼和一些基本的數學問題可能還湊合,但是他做數學題特別容易出錯。他通過美國研究生考試 SAT 的分數是 1020 分(滿分 2000 分)。所以我們可以把他的智力水平想象成一個腦力特別好的初中生
211、。如果你想把企業運營數據上傳給它,以自動生成各類洞察。我認為大概率會生成老生常談的東西,而不會真的生成出有遠見的內容。Q8:我們三月即將上線基于我們三月即將上線基于 ChatGPT 人工智能的企業工人工智能的企業工商、退稅等商務服務平商、退稅等商務服務平 臺,請給些具體意見和建議。臺,請給些具體意見和建議。這個我認為還是挺好的,但是你需要把 promote 這一層做好?,F在 ChatGPT 可以根據你的預輸入文檔來做推理和判斷,這里面具有很多技巧。你可以去調試 給他輸入什么樣的預生成文本,他給出的建議讓用戶覺得更好。這是有很大的開發空間的。IQ9:國內語境環境下國內語境環境下,ChatGPT
212、的商業應用前景有哪些具的商業應用前景有哪些具體落地方向?體落地方向?其實我們也說過,(如果使用 ChatGPT)你的輸出是要以 word 文檔為基礎的。而且 word文檔還不應牽扯到大量準確的數據,而應該是一些定性的東西。比如 早寢室晚匯報、寫情書、寫論文、寫檢討這些工作,他都能完成得非常好。我現 在就經常拿他給我閨女改作文,我覺得改得非常好。所以你的應用方向本來就是 文本文檔,而且需要定性的多,定量的少,邏輯不要太復雜,這時候用它的應用 就非常好。Q10:基金近期會關注什么樣的基金近期會關注什么樣的 ChatGPT 初創團隊初創團隊?因為現在 ChatGPT 的訓練模型實在太貴了,小公司跟初
213、創公司是扛不起來的,所以我覺得你們要關注能把 AIGC 技術落地的公司。也就我說的應用層怎么樣把素材轉成內容,這里面是有巨大的空間可以去做的。Q11:未來十年年輕人需要重點關注什么樣的知識積累和技未來十年年輕人需要重點關注什么樣的知識積累和技能成長?能成長?我覺得要思考有哪些行業是不容易被 AI 所取代的。目前看來,跟線下結合越緊密的行業越不容易被 AI 取代。舉個例子,外賣小哥送東西就沒法被 AI 取代。AI 只要跟線下一結合,它的落地就會非常慢。落地最快的永遠是在電腦上可以 完成閉環的生意,比如寫代碼、寫文檔、畫畫,這些都在電腦上可以閉環完成。他們必然要受 AI 的沖擊最大。所以我覺得年輕
214、人要重點關注偏創意性、偏人類高級思維能力的知識積累和 技能成長。而自己的技能如果是學 3D 動畫制作、寫代碼,如果你水平不高,是 很容易被取代的。Q12:基于目前基于目前 AI 結果的不可預知性結果的不可預知性,是不是類似的技術是不是類似的技術很難在國內商業化?很難在國內商業化?內容審核如何解決?內容審核如何解決?ChatGPT 就是為了保證美國人的政治正確而出現的,而我們中國做的類 ChatGPT 也一定會保證中國的政治正確。而且中國在內容審查方面的技術積累是 很深厚的。所以針對 AI結果的不可預知性,在類 ChatGPT 產品的自我審核以及 外部添加的審核的雙重打壓之下,應該不會有太大的問
215、題。Q13:文字轉語音直接商業化成產品進入文字轉語音直接商業化成產品進入 C 端是否可行?端是否可行?文字轉語音技術實際上已經很成熟了,這個東西叫 TTS,科大訊飛就是專門 干這個的。因為這個技術進步很快,有好多家公司,例如谷歌微軟都提供類似的 服務。這個技術從商業化產品到 C 端已經很普及了,我不認為是一個新的方向。IQ14:垂直網站如何擁抱垂直網站如何擁抱 ChatGPT?如何防止被顛覆?如何防止被顛覆?其實我覺得垂直網站是很難被顛覆的,因為如果你在垂直行業有獨一份的數據,會有一堆做 ChatGPT 創業的小公司來找你合作。我們知道國內做大模型的公司現在很掙錢的一個生意就是,他們內部有大量
216、的專有數據。他們一方面不想把 這些數據公布,但是又需要基于這些數據做大模型。那他們就會把這些數據的預訓練外包給外面的創業公司,讓這些創業公司幫他們去訓練大模型。做垂直網站,只要保證你的數據是國內最好的,就不用擔心被顛覆。別人只有來找你合作的份。Q15:預測一下預測一下 1 年后中美各自會有哪家公司會獨領年后中美各自會有哪家公司會獨領chatGPT 風騷,中美公司之間會有隔離帶嗎?風騷,中美公司之間會有隔離帶嗎?因為數據安全的問題,我覺得中美公司肯定有隔離帶。國外肯定還是 OpenAI、Deepmind、谷歌、Facebook 這些大廠最厲害。國內據我所知進度最快的是百度,其次是騰訊跟阿里,再其
217、次是字節。一擁而上的創業公司也非常多。我目前比較看好的公司中,美國的肯定是 OpenAI、Deepmind、谷歌、Facebook 以及 Microsoft,這幾家做底層的公司仍然是美國最出彩的。還有一家開源公司叫 Step Diffusion,我也比較看好。中國公司中,我其實還是看好大廠居多,我覺得小廠在應用層可能會出來一些公司。Q16:如何評價如何評價 ChatGPT 生產的內容?基于此生產的內容?基于此,他的商業他的商業價值是什么?價值是什么?它有哪些它有哪些 比較有可能的應用場景?比較有可能的應用場景?其實我也說過了,它生產的內容都是文本為主,所有我們用 word 可以輸出 的定性的文
218、本都可以用它來加速生成。我舉個例子,我們諸位在招聘的時候,經 常會招剛畢業的大學生給你當助理,幫你改文檔,做一些日常的事務。你們可以 把 ChatGPT 想成個人助理,它能極大提高你的工作效率,提升輸出工作的質量。但是它并不能取代你,因為你的專業知識仍然是有用的。Q17:能不能找到一個在智能制造領域的具體應用案例?能不能找到一個在智能制造領域的具體應用案例?說實話,我覺得八桿子打不上。他能幫你寫思想文案、幫你出廣告、幫助你公司管理,但跟你的智能制造的核心技術沒關系。Q18:ChatGPT 對谷歌對谷歌、百度這些搜索公司會有什么影響?百度這些搜索公司會有什么影響?會對他們形成毀滅性會對他們形成毀
219、滅性 打擊嗎?打擊嗎?我覺得 ChatGPT 反而會讓他們鞏固自己的地位。因為現在 ChatGPT 技術還是需要與搜索引擎深度結合的。但目前全世界搜索引擎技術最好的就是微軟、谷歌和百度,所以我認為谷歌跟百度趕上這個事情還是比較容易的,不會形成什么毀滅性的打擊。I但是我們認為因為內容創作范式的變化,比如文本、圖片、視頻和音頻生產的變化,我覺得這對整個內容生產行業會是一個巨大的顛覆。原來我們做一部動畫片可能要幾百個人花兩三年時間,但現在有很多公司利用 3D 引擎去做動畫,可能四五十個人一個禮拜就能出一部動畫片。我覺得在 AIGC 技術普及到一定程度之后,可能一兩個人用一兩天就能出一部動畫片。這樣會
220、導致整個內容生產行業一個巨大的爆發。Q19:請問請問 ChatGPT 出來后出來后,如何解決如何解決 AI 倫理治理問題,倫理治理問題,或者您的公司在后續或者您的公司在后續 會有什么布局嗎?會有什么布局嗎?AI 是非常乖的、政治正確的。所以你不要擔心它有什么倫理問題。我們后續的布局基本上是在兩個方向努力。一個是協助開源界做開源的解決方案,讓中小創業公司有一個便宜、可以修改、可以學習的模型去使用。第二個方向,我們還是要在應用層下功夫,去把 AIGC 的技術落實到素材生成內容層級上去,制作出下一代的內容創作工具和內 容創作社區。Q20:簡單的數據庫處理腳本語言是否可以通過訓練后由簡單的數據庫處理腳
221、本語言是否可以通過訓練后由ChatGPT 代替人工來完成?金融、能源等領域的專業知識代替人工來完成?金融、能源等領域的專業知識如何基于如何基于 ChatGPT 來訓練?對于金融業的智能客服來訓練?對于金融業的智能客服、大客大客戶的報表分析和戶的報表分析和 BI 建模等是否能通過給建模等是否能通過給 ChatGPT 喂專喂專業領域的數業領域的數 據和客戶的思路來完成?據和客戶的思路來完成?現在 ChatGPT 就能寫代碼了。因為 ChatGPT 本質上是兩個模型結合起來的,一個是 Code,一個是 Text。這兩個模型就導致了它最強的能力其實是寫代碼,它寫簡單的代碼是很容易的。至于金融、能源等領
222、域的專業知識如何基于 ChatGPT 來訓練,這需要等到 ChatGPT 技術開源,或者是大廠普及化之后,你們可以把你們的專業知識去喂給類 ChatGPT 或者讓ChatGPT 接你們的知識圖譜。金融業的智能客服受它的影響是最大的。ChatGPT 絕對能夠極大地提高我們 智能客服的能力。但是對于報表分析和 BI 建模這些,可能還需要專門的研發。Q21:請老師講講在企業培訓領域的應用。:請老師講講在企業培訓領域的應用。ChatGPT 有個很好的功能是縮寫,不管多長的文章他能給你縮寫提煉出比較 精要的話。這樣用讓大家來看文檔總結是非常方便的。我覺得企業培訓領域的片兒湯話特別多,真正獨一無二的企業培
223、訓是非常少 的。如果我們要做普通的企業培訓,用它來給你生成企業培訓文檔是很容易的。因為企業培訓文檔不外乎是一個 PPT 從頭講到尾,用它來實現沒啥問題。I總結總結很多人擔心“我趕不上 ChatGPT 這一波就落后了”。但其實我覺得大家大不用擔心這個事。我舉一個例子,當初移動互聯網出現的時候,大家紛紛講移動互 聯網只有幾張船票,騰訊搞了,微信有了這張船票,但其他公司可能沒有船票?!癇AT”里面,阿里跟騰訊都拿到了船票,而百度只拿到了半張船票。但到現在為止,百度也仍然活著,搜索引擎也沒有把它給替代。移動互聯網真正改變人類的是什么?是它創造出來了一些新的方向。比如手機加上攝像頭可以拍短視頻,這樣就催
224、生了快手跟抖音;手機有定位功能,催生了高德地圖,又催生了美團和滴滴。也就是我們不用擔心如果自己沒趕上 ChatGPT 這個東西就業務做不下去了。大家可以把它想成第二種形態的 APP。等做 APP 的東西成熟之后,你公司也跟著 做一個就可以。任何一個技術都會迅速白菜化,因為它太紅了。所以現在做 AI 的工程師會 非常貴,但是價格也會迅速下降。所以我覺得諸位等到這個東西價格便宜之后,再結合自己的業務做一些相對的工作,就 OK 了。但是如果你的生意是完全基于電腦閉環的。而且輸出結果是文檔為主,以定性的結果為主,你可能就比較危險了。I附件:附件:ChatGPT 體驗指南體驗指南1、入門:注冊入門:注冊
225、 ChatGPT 全攻略全攻略162、初學:基本操作體驗。初學:基本操作體驗。17(1)用簡單的術語解釋量子計算(2)如何實現中華民族偉大復興(3)根據 Midjourney 的格式,用英文給我一段生成貓窩的 text prompt16注冊 ChatGPT 全攻略(賬號購買)BoxChenhttps:/mirror.xyz/boxchen.eth/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc17https:/mirror.xyz/boxchen.eth/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBcI(4)介紹一
226、下 MQTT 協議(5)用 python 幫我寫一段冒泡排序的代碼這里生成的代碼經過格式調整后是可以正確執行的。I(6)幫我寫一篇 MES 軟件的技術路線說明書(7)作一首關于雪的詩I(8)你可以取代 Google 搜索引擎嗎(9)更多詳細內容請參看:https:/www.eula.club/blogs/ChatGPT%E6%99%BA%E8%83%BD%E9%97%AE%E7%AD%94AI%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97.html#_5-2-python%E8%B0%83%E7%94%A8chatgpt%E5%AE%98%E6%96%B9api3、從
227、零基礎到熟練應用、從零基礎到熟練應用 ChatGPT。1818詳見 https:/xv44586.github.io/2023/01/09/zero-to-chatgpt/I附件:團隊介紹附件:團隊介紹杜玉河杜玉河工業 4.0 俱樂部創始人,工業 4.0 產業聯盟創始人,開源工業聯盟創始人,工業人工智能創新中心主任。智能裝備應用研究院院長;工業 4.0 產業聯盟區塊鏈發展研究中心主任、工信部培訓中心專家庫成員;上海交通大學、復旦大學、浙江大學、國家會計學院、上海理工大學、上海浦東干部學院等大學特聘教授;上海大學 MBA 智能制造方向產業與企業導師;上海交通大學 EMBA 校友會首任秘書長;上海
228、人工智能公共服務平專家組成員;智領智能產業生態聯盟首任輪值秘書長;安徽中德教育合作基金會理事;杜特企業管理咨詢公司創始人;工業 4.0 創新平臺數字化工廠專家;開源工業互聯網聯盟副秘書長;中國機電一體化協會制造執行系統分會高級顧問,中國五金交電化工商業協會智能裝備分會智能制造高級顧問;物聯網中國聯席會理事長;兩岸智能制造聯盟聯席主席;現任多地經濟轉型升級特聘顧問與多家創新公司獨立董事。曾任中國第一家互聯網公司瀛海威時空上海公司總經理;在用友軟件集團發展早期工作數年(從事信息化規劃、供應鏈、工業領域信息化的專家顧問);從業初期在中國機械電子部下屬某大型裝備制造企業擔任多年計算機中心主任、數控設備
229、應用專家等。劉家維劉家維工業 4.0 俱樂部工業人工智能中心,研究員。附件:組織簡介附件:組織簡介工業 4.0 產業聯盟,2014 年成立于上海,經過近十年發展,全球近 10,000 企業會員、10萬個人會員。以把握第四次工業革命脈搏,助力產業、企業、個人走向成功為使命。打造中國最具活力的工業 4.0 產業生態聯盟!面向全球的創新機構:在中國、美國、德國、以色列、日本等地創建了 40 多個創新中心。工業 4.0 關鍵技術研究機構:包括智能制造研究中心、工業互聯網研究中心、工業物聯網研究中心、工業人工智能研究中心、區塊鏈研究中心、案例研究中心、開源研究中心、工業元宇宙研究中心等。產業集聚機構:設
230、立新工業產業聯盟、工業 4.0 產業聯盟、開源工業4.0 產業聯盟、開源數字孿生產業聯盟、智慧物流產業聯盟等。人才培育機構:發起成立新工業大學,并加速機器人學院、工業互聯網學院、工業人工智能學院的建設。主要服務:面向政府的產業的服務:工業 4.0 產業全生命周期服務,產業戰略研究、規劃、產業園區規劃設計、導入(招商引智)與運營服務,聚商與產業落有機融合;面向企業的轉型升級服務:項目評估、規劃、開發、建設、運維服務;面向個人的轉型升級服務:高中級及基層人才規劃、培訓及輸送服務。工業 4.0 產業資本服務:從種子期、成長期與加速期等企業全生命周期的投融資服務。I附件:精彩對話摘錄附件:精彩對話摘錄
231、19192 月 11 日 ChatGPT 主題會客廳精華匯總I附件:團隊分析附件:團隊分析IChatGPT 團隊規模不足百人(共 87 人)。分析發現,其顯著特征是“年紀很輕”、“背 景豪華”、“聚焦技術”、“積累深厚”、“崇尚創業”和“華人搶眼”。該團隊平均年齡為 32 歲,“90 后”是主力軍。他們引領的這一波大型語言模型技術風潮,充分說明了那些經常被認為研發經驗不足的年輕人,完全有可能在前沿科技領域取得重 大突破。團隊成員絕大多數擁有名校學歷,且具有全球知名企業工作經歷。從成員畢業高校分布 看,校友最多的前 5 大高校是斯坦福大學(14 人)、加州大學伯克利分校(10 人)、麻省 理工學
232、院(7 人)、劍橋大學(5 人)、哈佛大學(4 人)和佐治亞理工學院(4 人)。另 外,該團隊有 3 人是我國清華大學校友,即翁家翌、趙盛佳、袁啟明,他們本科均在清華大 學就讀,目前均在團隊擔任研發工程師一職。ChatGPT 不一味強調高學歷,其成員并非“清 一色”的研究生學歷,而是本、碩、博人數相對均衡。團隊成員有 10 人從谷歌跳槽加入,其他成員也大多來自 Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel 等頂尖或知名科技 公司。另外,該團 隊 有5 人 被 評 為 2023 年 度“AI 20
233、00 全 球 人 工 智 能 學 者(全 名 單 鏈 接:https:/ 2 人為 OpenAI 聯合創始人,2 人分別被評為 全球機器人和機器學習領域最具影響力學者??梢?,技術型頂尖學者對創新型團隊的引領作用至關重要。從成員職位構成看,該團隊成員近 9 成為技術人員,未配備技術與產品之外的職能人員(如公共關系、市場營銷等人員),而是高度聚焦于技術研發。由此可見,在數字化傳播時 代,一款人工智能產品只要性能足夠優異,即使未配置專人做推廣營銷,也能在短短的一兩個月時間內在全球引爆。IChatGPT 是 OpenAI 在大型語言模型領域多年技術積累的結果。統計發現,在與 ChatGPT 相關的先前
234、 7 大技術項目研發中,ChatGPT 團隊成員參與人數最多的是CodeX 項目,共有 22 人參與過,占總團隊人員總數的 25%;其次是 webGPT 和instructGPT,共有 9 人參與過;第三是 GPT3,共有 6 人參與過;第四是 RLHF,共有 3 人參與過。由此 可見,ChatGPT 團隊成員在生成式預訓練語言模型領域有較深厚的技術積累,特別是 1/4 團隊成員曾參與過同樣基于 GPT3 的 CodeX 項目的研發經驗,對后續成功研發 ChatGPT打下了堅實的基礎。webGPTInstructGPTcodeXGPT3GPT2GPT1RLHF222505101520ChatG
235、PT 團隊參與人數(人)數據來源:AMiner 科技情報平臺圖分析發現,該團隊成員不再把進入“大廠”作為首選,而是更傾向于選擇更加創新潛力 的創業機構。團隊成員大多是從“大廠”跳槽,以及作為應屆生加入,其次就是從相對“穩 定”的科研機構和高校教職崗位離職后加入。即使從 ChatGPT 團隊離職的 4 位成員,也仍 然選擇加入創業公司或機構。399006I數據來源:AMiner 科技情報平臺ChatGPT 團隊中的華人表現搶眼。團隊共有華人 9 人,占團隊總人數 10%。其中 5 人本科就讀于中國內陸高校,3 人大學教育經歷均在美國高校完成。梳理畢業于中國內陸高校 的ChatGPT 華人成員成長
236、路徑發現,他們就讀于中國內陸頂尖高校的學習階段均為本科,之后赴美深造,獲得碩士或博士學位,然后加入美國諸如 Dropbox、OpenAI 等創新型公 司。姓名職務畢業院校工 作 單 位(按時間順序排列)翁家翌研發工程師學 士:清 華 大 學碩士:卡內基梅隆大學OpenAI趙盛佳研發工程師(MTS)學士:清華大學博士:斯坦福大學OpenAI江旭研發工程師(MTS)學士:華中科技大學博士:馬里蘭大學帕克分校Mythic;OpenAIV姓名職務畢業院校工 作 單 位(按時間順序排列)袁啟明研發工程師學士:清華大學碩士:德克薩斯大學奧斯汀分校Dropbox;OpenAI翁麗蓮AI 應 用 研究 經理學
237、士:北京大學、香港大學博士:印第安納大學伯明頓分校Dropbox;Affirm;OpenAI肖凱深度學習研究員學士:麻省理工學院博士:麻省理工學院OpenAISteph Lin研究員學士:麻省理工學院碩士:佐治亞理工學院牛津大學(人類未來 研 究所);OpenAI歐陽龍高級研究員學士:哈佛大學博士:斯坦福大學Self-Employed;OpenAI張馬文信息缺失博士:加州大學伯克利分校加州大學伯克利分校;OpenAI數據來源:AMiner 科技情報平臺華人學者歐陽龍參與了與 ChatGPT 相關的 7 大技術項目中的 4 大項目的研發,他是 InstructGPT 論文的第一作者,是 RLHF
238、 論文的第二作者,可見他是這兩個關鍵技術項目的 核心人員。根據以上分析所獲相關啟示,就國內人工智能前沿技術發展提出以下建議:1)注重科技興趣和信仰培育,鼓勵優秀年輕人投身于前沿技術創新浪潮;2)“大廠”前沿科技創新疲態顯現,鼓勵年輕人將目光投向創業公司;3)海外華人學者是全球科技創新的重要力量,鼓勵加強對外學術交流。VI內容提要II一、職位分工:近 9 成為技術人員,高度聚焦技術研發1二、年齡分布:“90 后”科研“后浪”顯示強大創新能力2三、教育背景:絕大多數擁有名校學歷,6 人畢業于中國高校3四、人員流動:10 人從谷歌跳槽加入,1 人曾在百度任職5五、華人成員:在國內完成本科學業,后赴美
239、深造并就業7六、成員貢獻:1/4 成員參與過 codeX 研發,歐陽龍表現突出8七、性別特征:團隊由男性主導,女性僅占 1 成10八、2023 年“AI 2000 學者”入選情況:5 位頂尖學者入選12九、啟示與建議13附件:ChatGPT 團隊全體成員名單(87 人)1512022 年 11 月 30 日,OpenAI 公司(美國致力于人工智能研究的非營利機構)發布了 由大型語言模型驅動的自然語言處理工具 ChatGPT。該工具通過學習和理解人類語言,能 夠與用戶進行高質量對話,甚至還能撰寫郵件、視頻腳本、文案、代碼、論文和小說等。由 于在同行中具有較卓越的性能,ChatGPT 推出僅 2
240、個多月的時間即引爆全球。除了關注 ChatGPT 性能本身外,業內人士更關注該 AI“夢之隊”成員到底具有哪些特征,才促使他 們在全球大型語言模型創新技術領域如此獨領風騷。根據 OpenAI 官網顯示,為 ChatGPT 項目做出貢獻的人員共 87 人(名單詳情見附件)?,F就該團隊成員職務構成、年齡分布、教育背景、人員流動、華人成員、成員貢獻、性別分布等數據進行統計分析,并總結歸納其特征。一、一、職位分工:近職位分工:近 9 成為技術人員,高度聚焦技術研發成為技術人員,高度聚焦技術研發從 ChatGPT 團隊職位分工看,研發人員共 77 人,占比 88%,其中含 1 名公司聯合創 始人,即 W
241、ojciech Zaremba(被評選為 2023 年 AI 2000機器人領域最具影響力學者);產品人員共 4 人,占 5%。另外,6 人職位信息無法獲取。https:/ 2000全球人工智能學者”名錄涵蓋了 20 個核心主題領域和一些新興領域。每年從過去 10 年中1來 自各領域排名前 10 名的學者被命名為“AI 2000 最具影響力學者”,前 11-100 名學者被命名為“AI2000 最具影響力學者提名”。因此,每年將有約 200 名最具影響力學者,從 2020 年至 2029 年 10 年將形成一 個由約 2000 名學者組成的名錄,他們正在推動 21 世紀 20 年代人工智能各個
242、領域的創新和進步。參閱網 址:https:/ 后后”科研科研“后浪后浪”顯示強大創新能力顯示強大創新能力從 ChatGPT 團隊年齡分布看,2029 歲的成員有 28 人,占全體成員(剔除年齡信息缺失的 5 位成員)的 34%;3039 歲的共 50 人,占 61%;4049 歲的僅 3 人,無5059 歲年齡段的成員,60 歲以上的有 1 人。經計算,。由此可見,20 以下202930394049505960 及 以上信 息缺失03015286030人 數(人)數據來源:AMiner 科技情報平臺圖 2504020500103在 ChatGPT 團隊中,27 人具有本科學歷,25 人為碩士研
243、究生學歷,28 人擁有博士研 究生學歷(注:5 人信息缺失),占比分別為 33%、30%、37%。學士/本科33%碩士研究生30%數據來源:智譜研究根據公開資料統計從 ChatGPT 團隊成員畢業高校分布看,斯坦福大學校友最多,共 14 人;其次是加州 大學伯克利分校,共 10 人;第三是麻省理工學院,共 7 人;我國清華大學與卡內基梅隆大學并列第 7 名,各有 3 人。該團隊成員畢業人數前 10 名的高校(見下表)均有2 人及 以上人數分布,共計 54 人;排名第 10 之后的高校均只有 1 人,其中不乏全球頂尖大學,如牛津大學、東京大學、康奈爾大學、加州大學圣巴巴拉分校等??傮w看,博士研究
244、生37%表 14排名畢業高校校 友 人 數(人)1美斯坦福大學142美加州大學伯克利分校103美麻省理工學院74英劍橋大學55美哈佛大學45美佐治亞理工學院47美卡內基梅隆大學37中清華大學39美萊斯大學29波華沙大學2數據來源:AMiner 科技情報平臺在 ChatGPT 團隊中,有 6 人曾畢業于中國高校,其中 3 人本科畢業于清華大學,各有 1 人本科畢業于華中科技大學、北京大學/香港大學,1 人碩士研究生畢業于臺灣交通大學(如下表所示)。表 2姓名職務曾就讀中國高校學位階段翁家翌研發工程師清華大學本科趙盛佳研發工程師(MTS)清華大學本科5姓名職務曾就讀中國高校學位階段袁啟明研發工程師
245、清華大學本科江旭研發工程師(MTS)華中科技大學本科翁麗蓮AI 應用研究經理北京大學、香港大學本科Phil Tillet研發工程師(MTS)臺灣交通大學碩士研究生數據來源:AMiner 科技情報平臺ChatGPT團隊成員主要來自外部公司(81%)、高校應屆畢業生(13%)、科研機構(4%)和高校教職人員(3%)等(如下圖所示)。來源人數超過 2 人(含)以上的外部企業還有 Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind 等知名科技公司。作為應屆生直接 加入 ChatGPT 團隊的共 11 人,其中 5 人來自加州大學伯克
246、利分校、3 人來自斯坦福大學,麻省理工學院、卡內基梅隆大學和哈佛大學各 1 人??梢?,6數據來源:AMiner 科技情報平臺圖 4監測發現,ChatGPT 研究員 Heewoo Jun 曾在 2015-2019 年間在百度(美國研究院,Sunnyvale,California,USA.)擔任研究員,2019 年從百度離職后加入 OpenAI 擔任研究 員至今(如下表所示)。表 3姓名職務履歷Heewoo Jun研究員2019-至 今,OpenAI,研 究 員2015-2019,百度(美國研究院),研究員 2013-2015,斯坦福大學,碩士研究生2008-2013,多倫多大學,本科數據來源:A
247、Miner 科技情報平臺到目前為止,ChatGPT 團隊已離職員工有 4 人(離職率為 4.6%),他們是 Jacob Hilton、Igor Babuschkin、Matthias Plappert 和 Andrew Carr,去向分別為 Alignment ResearchCenter、DeepMind、Github 和 Gretel.ai??梢?,7ChatGPT 團隊有 9 位華人(名單見下表)。其中 5 人本科就讀于在中國內陸高校,3 人大學教育經歷均在美國高校完成,1 人(張馬文,Marvin Zhang)信息不全。表 4姓名職務畢業院校工 作 單 位(按時間順序排列)翁家翌研發工程
248、師學 士:清 華 大 學碩士:卡內基梅隆大學OpenAI趙盛佳研發工程師(MTS)學士:清華大學博士:斯坦福大學OpenAI江旭研發工程師(MTS)學士:華中科技大學博士:馬里蘭大學帕克分校Mythic;OpenAI袁啟明研發工程師學士:清華大學碩士:德克薩斯大學奧斯汀分校Dropbox;OpenAI翁麗蓮AI 應 用 研究 經理學士:北京大學、香港大學博士:印第安納大學伯明頓分校Dropbox;Affirm;OpenAI肖凱深度學習研究員學士:麻省理工學院博士:麻省理工學院OpenAI8姓名職務畢業院校工 作 單 位(按時間順序排列)Steph Lin研究員學士:麻省理工學院碩士:佐治亞理工
249、學院牛津大學(人類未來 研 究所);OpenAI歐陽龍高級研究員學士:哈佛大學博士:斯坦福大學Self-Employed;OpenAI張馬文信息缺失博士:加州大學伯克利分校加州大學伯克利分校;OpenAI數據來源:AMiner 科技情報平臺ChatGPT 是 OpenAI 公司在大型語言模型領域多年技術積累的結果。與 ChatGPT相 關的先前關鍵技術項目有 RLHF(Reinforcement Learning from Human Feedbac,人 類反饋強化學習)、GPT1、GPT2、GPT3、codex、InstructGPT、webGPT等 7 項。統計發現,ChatGPT 團隊中
250、,有 2 人參與了其中 4 項關鍵技術項目的研發,他們是高 級研究員歐陽龍和研發工程師 Christopher Hesse。他們均為機器學習領域專家。RLHF論 文LearningtoSummarizeFromHumanFeedback,下 載 鏈 接https:/ f5356f991e0110c40a7bc3bGPT1 論 文ImprovingLanguageUnderstandingbyGenerativePre-Training,下 載 鏈 接https:/www.amine 文LanguageModelsareUnsupervisedMultitaskLearners,下 載 鏈 接h
251、ttps:/ 011915d9e43eecodex論 文EvaluatingLargeLanguageModelsTrainedonCode,下 載 鏈 接https:/ 0e7be6891e011dcbc23b0a0InstructGPT 論文 TrainingLanguageModelstoFollowInstructionsWithHumanFeedback,下載鏈接 htt ps:/ 論文 WebGPT:Browser-assistedQuestion-AnsweringWithHumanFeedback 下載鏈接https:/w 5姓名參與數量(項)RLHFGPT1GPT2GPT3c
252、odeXInstructGPTwebGPTChatGPT歐陽龍4ChristopherHesse4Ryan Lowe3Nick Ryder3SandhiniAgarwal3ClemensWinter3BenjaminChess3ShantanuJain3Jan Leike3JohnSchulman3Jacob Hilton3數據來源:AMiner 科技情報平臺在上述 7 大技術項目中,ChatGPT 團隊成員參與人數最多的是 CodeX 項目,共有22 人參與過,占總團隊人員總數的 25%;其次是 webGPT 和 instructGPT,共有 9 人參與過;第三是 GPT3,共有 6 人參與
253、過;第四是 RLHF,共有 3 人參與過。由此可見10webGPTInstructGPTcodeXGPT3GPT2GPT1RLHF222505101520ChatGPT 團隊參與人數(人)數據來源:AMiner 科技情報平臺圖 5從性別分布看,ChatGPT 團隊中有女性 9 人,僅占總數的 10%;男性共 78 人,占90%。由此可見,男性是該團隊的主導,女性成員占比較低。女,9,10%男,78,90%數據來源:AMiner 科技情報平臺圖 6該 9 位女性成員中,有 2 位是華人,即曾就讀于北京大學的翁麗蓮,以及 Steph36009910Lin。分析發現,9 位女性成員均擁有世界名校教育
254、經歷;另外,除了翁麗蓮和 KatarinaSlama 外,其他均為“90 后”。11序號姓名職位學歷畢業院校1翁麗蓮(華人)AI 應用 研究經 理博士研究生(Phd)學士:北京大學、香港大學博士:印第安納大學伯明頓分校2Steph Lin(華人)研究員碩士研究生學士:麻省理工學院碩士:佐治亞理工學院3Christina Kim研發工程師(MTS)學士學士:美國西北大學4Chelsea Voss計算機科學家碩士研究生學士/碩士:斯坦福大學5Valerie Balcom研發工程師碩士研究生學士:加州大學圣迭戈分校6Sarah Yoo信息缺失信息缺失信息缺失7Katarina Slama研發工程師(
255、MTS)博士研究生(Phd)學士:布朗大學博士:加州大學伯克利分校8Nick Ryder研發工程師(MTS)博士研究生(Phd)學士:萊斯大學博士:加州大學伯克利分校9Sandhini AgarwalAI 政策研究員博士研究生(Phd)學士/博士:斯坦福大學數據來源:AMiner 科技情報平臺12AMiner 每年推出“AI 2000 全球人工智能學者”名單,該名單評選全球人工智能 20個細分領域前 100 名最具影響力學者。統計發現,ChatGPT 團隊成員有 5 人入選今年“AI2000 全球人工智能學者”,他們是 OpenAI 聯合創始人 Wojciech Zaremba(機器人,第10
256、 名);ChatGPT 研究員 Lukasz Kaiser(機器學習,第 10 名);OpenAI 聯合創始人、ChatGPT 研究科學家 John Schulman(機器學習,第 41 名);ChatGPT 研發工程師Tomer Kaftan(數據庫,第 52 名);ChatGPT 研究科學家 Barret Zoph(機器學習,第 95名)。在 ChatGPT 不足百人團隊中,即有 5 人屬于全球人工智能各領域頂尖學者,其中 2人為 OpenAI 聯合創始人,2 人分別被評為機器人(Wojciech Zaremba,OpenAI 聯合 創始人)和機器學習(Lukasz Kaiser,Chat
257、GPT 研究員)領域最具影響力學者??梢?,技術型頂尖學者對創新型團隊的引領作用至關重要。表 7姓名職務畢業院校AI 2000入選領域AI 2000 入選領域排名Wojciech ZarembaOpenAI聯合 創始人博士:紐約大學機器人10Lukasz Kaiser研究員碩士:波蘭弗羅茨瓦夫大學博士:亞琛工業大學機器學習1012John Schulman聯合創始人、研究科學家碩士:加州理工學院博士:加州大學伯克利分校機器學習41Tomer Kaftan研發工程師(MTS)學士:加州大學伯克利分校數據庫5214姓名職務畢業院校AI 2000入選領域AI 2000 入選領域排名博士:美國華盛頓大學
258、Barret Zoph研究科學家學士:南加州大學機器學習95數據來源:AMiner 科技情報平臺根據以上分析所獲相關啟示,就國內人工智能前沿技術發展提出以下建議:OpenAI 是一家非營利的人工智能研究機構,其 ChatGPT 團隊的顯著特征是“年輕”和“優質”。一個平均年齡僅 32 歲的 87 人團隊,就能夠引爆全球新一輪人工智能技術浪潮,其背后是團隊成員對人工智能技術的興趣和信仰,以及對技術創新和研發的全心投入。國內不缺乏如 OpenAI 一樣的年輕優秀人才,若能更加注重對其科技興趣和信仰培育,鼓勵其心無旁騖地投身于前沿技術創新,我們就能在全球科技競爭中處于不敗之地。本次 OpenAI 不
259、足百人的團隊推出的大型語言模型 ChatGPT,讓谷歌、Meta 包括國 內的阿里、百度等“大廠”感到壓力巨大,它們只好紛紛跟風上馬類似項目?!按髲S”因其創新機制、組織文化等相對固定,因而在本次大語音模型創新浪潮中疲態盡顯。今后,正如 ChatGPT 一樣,更多的突破性創新技術會來自創業公司。因此,鼓勵國內有志投身前沿科 技創業的年輕人,把目光投向更具創新潛力的創業公司。14在全球人工智能前沿領域,華人學者是一支重要的科技創新力量。海外華人學者是中外學術交流的重要橋梁。本輪以 ChatGPT 為代表的基于大型語言模型的 AIGC 技術發展速度,令國內某些業界人士感到“驚訝”。對外學術交流的重要
260、性在于,能夠比較實時、準確感知 和把握全球前沿技術發展的脈搏和趨勢。在全球疫情走向尾聲之際,鼓勵國外頂尖學者走進 來,國內學者走出去,對促進國內前沿科技創新發展具有重要意義。15NumberFull NameTitle1John Schulmanresearch scientist and cofounder2Barret ZophEx Research Scientist3Christina KimMember of Technical Staff4Jacob Hiltonresearcher5Jacob MenickMember of Technical Staff6Jiayi WengR
261、esearch Engineer7Juan Felipe Ceron UribeResearch Engineer8Liam FedusSenior Research Scientist9Luke MetzResearch Scientist10Michael PokornyResident(reinforcement learning)11Rapha Gontijo LopesResearch Scientist12Shengjia ZhaoMember of Technical Staff13Arun VijayvergiyaMember of Technical Staff14Eric
262、SiglerMember Of Technical Staff15Adam PerelmanProduct Engineering16Chelsea VossComputer Scientist17Mike HeatonMember of Technical Staff1618Joel ParishMember of Technical Staff19Dave CummingsEngineering20Rajeev NayakSoftware Engineer21Valerie BalcomEngineering22David SchnurrEngineering23Tomer KaftanM
263、ember of Technical Staff24Chris HallacyMember Of Technical Staff25Nicholas TurleyProduct26Noah DeutschProduct Design27Vik GoelMember of Technical Staff28Jonathan WardMember of Technical Staff29Aris KonstantinidisBusiness Operations30Wojciech ZarembaCo-Founder31Long OuyangResearch Scientist32Leonard
264、BogdonoffMember Of Technical Staff33Joshua GrossMember of Technical Staff34David MedinaMember of Technical Staff35Sarah Yoo-36Teddy LeeOpenAI Product&Operations1737Ryan LoweMember of Technical Staff38Dan MossingMember of Technical Staff39Joost HuizingaResearch Scientist40Roger JiangMember Of Technic
265、al Staff41Carroll WainwrightAI Research Scientist42Diogo AlmeidaComputer Scientist,Programmer43Steph Linresearcher44Marvin Zhang-45Kai XiaoML Researcher46Katarina SlamaMember of Technical Staff47Steven BillsAlignment48Alex Gray-49Jan LeikeMember of Technical Staff50Jakub PachockiPrincipal of Researc
266、h51Phil TilletMember Of Technical Staff52Shantanu JainMember Of Technical Staff53Greg BrockmanPresident&Co-Founder54Nick RyderMember Of Technical Staff55Alex PainoResearch1856Qiming YuanResearch&Engineering57Clemens WinterMember Of Technical Staff58Ben WangMember Of Technical Staff59Mo BavarianMembe
267、r Of Technical Staff60Igor BabuschkinMember of Technical Staff61Szymon SidorMember of Technical Staff62Ingmar KanitscheiderResearch Scientist63Mikhail Pavlov-64Matthias PlappertLanguage&Codex65Nik TezakMember of Technical Staff66Heewoo JunResearcher67William ZhukResearch Engineer68Vitchyr PongResear
268、ch Engineer69Lukasz Kaiser-70Jerry TworekResearch Engineer71Andrew CarrMember Of Technical Staff72Lilian WengApplied AI Research Manager73Sandhini AgarwalAI Policy Researcher74Karl CobbeResearch Scientist1875Vineet KosarajuMember Of Technical Staff76Alethea PowerMember Of Technical Staff77Stanislas
269、PoluResearch Engineer78Jesse HanMember Of Technical Staff79Raul PuriResearcher80Shawn JainMember Of Technical Staff81Beniamin ChessApplied Engineering Infrastructure82Christian GibsonSupercomputing83Oleg BoikoMember Of Technical Staff84Emy ParparitaMember Of Technical Staff85Amin TootoonchianSystems/Networking86Kyle KosicMember Of Technical Staff87Christopher HesseMember Of Technical Staff數據來源:OpenAI 官網、AMiner 科技情報平臺