《2023年AI大模型行業發展現狀及目前主流AI模型與其應用解讀報告.pdf》由會員分享,可在線閱讀,更多相關《2023年AI大模型行業發展現狀及目前主流AI模型與其應用解讀報告.pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、2023 年深度行業分析研究報告 4目錄目錄1 大模型發展歷程及發展現狀:科技巨頭引領行業,國內大廠布局較早,眾多廠商結合自身優勢積極布局2 海外及國內的熱門AI應用:國內自17年以來,一級市場AI+垂直賽道項目眾多3 目前主流AI模型及應用解讀:從文本生成輔助決策到視頻生成4 國內一級市場及二級市場公司在AI領域百花齊放,有所積累5目錄目錄1 1 大模型發展歷程及發展現狀:科技巨頭引領行業,國內大廠布局較早,眾多廠商結合自身優勢積極布局大模型發展歷程及發展現狀:科技巨頭引領行業,國內大廠布局較早,眾多廠商結合自身優勢積極布局2 海外及國內的熱門AI應用:國內自17年以來,一級市場AI+垂直賽
2、道項目眾多3 目前主流AI模型及應用解讀:從文本生成輔助決策到視頻生成4 國內一級市場及二級市場公司在AI領域百花齊放,有所積累61.1 大模型發展歷程:大模型發展歷程:ChatGPT引領引領AI迎來“奇點”,開啟迎來“奇點”,開啟AGI序幕序幕資料來源:CSDN,OpenAI,Google博客,量子位,機器之星,華安證券研究所整理圖表圖表1 1:大模型發展歷程圖大模型發展歷程圖7CSDN,GitHub,界面,IT之家,Google博客,Meta AI,量子位,機器之星,華安證券研究所整理圖表圖表2 2:海外公司大模型與落地場景海外公司大模型與落地場景1.2 海外大模型布局:科技巨頭持續創新,
3、引領行業發展方向海外大模型布局:科技巨頭持續創新,引領行業發展方向模型公司模型公司模型類型模型類型大模型分類大模型分類技術能力技術能力應用場景應用場景落地產品(軟件)落地產品(軟件)微軟微軟/OpenAI多模態GPT2018年6月,GPT-1發布,參數量達到1.17億個,語言泛化能力不足,無法解決通用的語言任務;2019年2月,GPT-2發布,參數量達到15億個,舍棄模型微調,通過大模型進行預訓練,開始能夠解決多語言任務能力;2020年5月,GPT-3發布,參數量達到1750億個,引入In-context訓練方式學習上下文,翻譯、聊天問答和文本填空等任務表現出色,能夠生成難辯真假新聞的能力;2
4、022年3月,InstructGPT發布,參數量達到5400億個;2022年11月,推出對話式AI模型ChatGPT,由GPT-3.5大型語言模型微調而來,并引入人工反饋的強化學習(RLHF)。能夠處理復雜語言工作,包括自動文本生成、自動問答、編寫和調試計算機程序及創作故事;2023年3月,GPT-4發布,能夠閱讀文字和識別圖像并生成文本結果,回復的準確性較歷史版本有提升生成、編輯和協助寫作任務,例如作曲、寫劇本和學習寫作風格Office、GitHub Copilot、Codex;Inworld AI,多鄰國、Yabble,Be My Eyes、Stripe、Khan Academy;Sale
5、sforce,Bain&Company,Snap,Shopify;Notion、newbing;Interact、Shop、Klarna谷歌谷歌多模態PaLM-E規模最大的模型“PaLM-E-562B”具有5620億個參數,將5400億的PaLM和220億的ViT集成在一起,是目前已知最大的視覺-語言模型,可用于感知推理任務、視覺語言任務和語言任務生成文本、對話、總結書面材料、解決數學定理、預測蛋白質結構Bard、Chrome、Gmail、Google Workspace多模態Claude-Next隸屬于AI研究初創公司Anthropic,公司成立于2021年,創始團隊大都來自OpenAI,包
6、括前研究副總裁Dario Amodei;2023年2月Google以30億美金投后估值投資3億美金,合作涉及谷歌Cloud為Anthropic構建大規模GPU和TPU集群,以訓練其AI系統;公司預計Claude-Next將需要10的25次方FLOPS的算力,比最大的模型還大上幾個數量級。計劃在18個月內投入10億美元,公司稱將比今天最大的AI還要強10倍運用“Constitutional AI”的訓練技術使AI與人類思維一致。成為對標ChatGPT的對話式人工智能產品Notion、Robin AI、AssemblyAI、PeoMetaMeta多模態AV-HuBERT2023年3月發布MuAVi
7、C,是基于多語言的視聽語料庫,首次將視聽學習應用于準語音翻譯,應用于AV-HuBERT模型訓練,可以進行有噪音環境下的端到端翻譯;使用MuAViC情況下,AV-HuBERT模型能夠結合面部特征和語音表現實現多模態輸入,提升識別的準確度。在World Error Rate和BLEU Score評測中,Meta模型都在嘈雜環境下取得更好的表現,在清凈環境下的表現與競對一致利用視頻和視覺輸入對語音進行轉錄,視聽語音、翻譯成文本亞馬遜亞馬遜多模態Bloom(Hugging Face&AWS)Bloom是開源AI模型,在規模和范圍上與OpenAI創建的ChatGPT模型競爭,并在AWS制造的專有人工智能
8、芯片Trainium上運行;2022年3月,Hugging Face聯合眾多學者宣布Bloom 1760億參數模型開始訓練;2022年5月,Bloom 1.0版本誕生。6月,epoch 1開始訓練;2022年7月,Bloom 1.3版本誕生,模型訓練結束;2023年2月,亞馬遜云科技宣布與Hugging Face進一步合作,加速對大語言模型和視覺模型的訓練、精調和部署,促進生成式AI應用的創建用戶針對特定用例優化模型性能和降低成本以構建生成式AI應用BLOOM、Qualtrics81.3 國內大模型布局:老牌大廠國內大模型布局:老牌大廠AI大模型布局較早,持續進階大模型布局較早,持續進階圖表圖
9、表3 3:國內:國內公司大模型與落地場景公司大模型與落地場景模型公司模型公司模型類型模型類型大模型分類大模型分類技術能力技術能力應用場景應用場景落地產品(軟件)落地產品(軟件)標的公司標的公司百度文心大模型文心大模型與飛槳共享生態,圍繞“產業級”和“知識增強”兩大特色,構建適合產業應用的模型體系電力、燃氣、金融、航天、傳媒等領域小度科技、度小滿、百度地圖、集度汽車百度集團-SW(9888.HK)NLP文心 NLP大模型 業界首個開放的千億參數的中文生成API智能創作、摘要生成、問答、語義檢索、情感分析、信息抽取、文本匹配、文本糾錯等各類自然語言理解和生成任務文心一格、文心百中(網頁&小程序)C
10、V文心 CV大模型VIMER-CAE創新性地提出“在隱含的編碼表征空間完成掩碼預測任務”的預訓練框架,實現圖像分類、目標檢測、語義分割等經典任務達到SOTA結果圖像分類、圖像檢測、圖像分割多模態文心 跨模態大模型基于知識增強的跨模態語義理解關鍵技術,實現跨模態檢索、圖文生成、圖片文檔的信息抽取等應用圖像生成、藝術創作、虛擬現實、AI 輔助設計等科學計算 文心 生物計算大模型融合自監督和多任務學習,將生物領域研究對象的特性融入模型。構建面向化合物分子、蛋白分子的生物計算領域預訓練模型,賦能生物醫藥行業小分子藥物研發文心 行業大模型 與各行業頭部企業合作,在通用大模型的基礎上學習行業特色數據與知識
11、,建設行業AI基礎設施能源、金融、航天、傳媒、城市、影視、制造、社科太平洋網絡(0543.HK)、財訊傳媒(0205.HK)、超媒體控股(0072.HK)、掌閱科技(603533.SH)、華策影視(300133.SZ)、藍色光標(300058.SZ)、風語筑(603466.SH);愛奇藝(IQ.O)、攜程集團(9961.HK)、汽車之家(2518.HK)、能鏈智電(NAAS.O)、微盟集團(2013.HK)華為NLP盤古NLP大模型 Encoder-Decoder架構,兼顧NLP大模型的理解和生成能力,保證模型在不同系統的兼容性。僅需少量樣本和學習參數,即可完成千億規模大模型快速微調和下游適配
12、智能輿論、智能營銷CV盤古CV大模型參數量30億,訓練數據10億級圖像,國內第一梯隊,約國外2021-2022年水平 智能巡檢、智慧物流科學計算氣象大模型借助3DEST網格結構以及分層時間聚合算法,提供秒級天氣預報氣象預報、臺風路徑預測騰訊NLP混元大模型騰訊AI大模型是萬億參數,ChatGPT是1750億,預計強于ChatGPT不如GPT4,偏自然語言處理。大模型被分到6個BG進行測試研發微信、游戲、短視頻、廣告和ToB業務騰訊控股(0700.HK)字節跳動NLPDA-Transformer 在大模型上已有布局,主要在語言和圖像兩種模態上發力。其中,語言大模型團隊組建于今年,團隊規模在十數人
13、左右,主要探索方向為同搜索、廣告等業務線的結合AI視頻創作,AI語音,數字人抖音,TikTok,Pico,電子閱讀器掌閱科技(603533.SH)阿里巴巴多模態通義千問超大規模語言模型,能力包括多輪對話、文案創作、邏輯推理、多模態理解和多語言支持,目前釘釘、天貓精靈正測試接入大模型文案創作、續寫小說、編寫郵件,阿里所有產品未來將接入大模型全面升級釘釘(自動寫工作方案)天貓精靈(提升智能化水平)阿里巴巴(9988.HK)多模態通義-M62021年11月推出的多模態大模型,參數由萬億躍遷至10萬億,成為當時全球最大的AI預訓練模型。使用521張GPU在10天內訓練出具有可用水平的10萬億模型,相比
14、GPT-3,M6同等參數規模,能耗僅為其1%模型實現架構、模態和任務統一,便于在M6基礎上精調得到豐富的小模型電商場景電商場景:光云科技(688365.SH)、值得買(300785.SZ)、凱淳股份(301001.SZ)、青木股份(301110.SZ)、若羽臣(003010.SZ)、三江購物(601116.SH)智能音箱智能音箱:奮達科技(002681.SZ)、炬芯科技(688049.SH)、中科藍汛(688332.SH)、漫步者(002351.SZ)、全志科技(300458.SZ)、智度股份(000676.SZ)傳媒板塊傳媒板塊:視覺中國(000681.SZ)、游族網絡(002174.SZ)
15、、絲路視覺(300556.SZ)、佳云科技(300242.SZ)、智度股份(000676.SZ)、風語筑(603466.SH)、元隆雅圖(002878.SZ)、捷成股份(300182.SZ)、焦點科技(002315.SZ)NLP通義-AliceMind 達摩院開源的深度語言模型體系,涵蓋預訓練模型、多語言預訓練模型、超大中文預訓練模型閱讀理解、機器翻譯、對話問答、文檔處理CV通義-視覺基于英偉達A10 GPU、阿里云CIPU芯片以及IaaS+軟件加速,實現新一代的GPU云服務,在AI計算和視覺計算能力獲得大幅提升電子商務、AI醫療、智能農業、自動駕駛、城市大腦、工業視覺、手機牌照、AIOT行業
16、模型層平臺解決方案服務商以通義大模型為底座,開發SaaS應用提供增值服務;傳媒和游戲運用AIGC實現體驗升級法律、醫療、電商、交通、娛樂CSDN,GitHub,界面,IT之家,Google博客,Meta AI,量子位,機器之星,公司官網,Wind,iFinD,華安證券研究所整理91.3 國內大模型布局:基于歷史業務經驗探索大模型國內大模型布局:基于歷史業務經驗探索大模型圖表圖表4 4:國內:國內公司大模型與落地場景公司大模型與落地場景模型公司模型公司模型類型模型類型大模型分類大模型分類技術能力技術能力應用場景應用場景落地產品(軟件)落地產品(軟件)標的公司標的公司網易多模態玉知多模態理解大模型
17、參數達到110億,結構由深層Encoder和淺層Decoder組成,大模型有優秀的理解能力和生成能力,浪潮提供AI算力支持云音樂、長視頻、廣告網易云音樂、網易游戲網易-S(9999.HK)、云音樂(9899.HK)快手多模態快手該模型的專家數量接近200個,模型參數兩達到100B快手短視頻中的推薦、搜索和廣告等核心業務快手快手-W(1024.HK)京東多模態織女大模型織女模型Vega v2憑借60億參數量規模大幅超過谷歌提出的5400億超大模型PaLM的復雜語言理解性能,刷新世界紀錄多模態ChatJD1個平臺、2個領域、5個應用作為落地路線圖內容生成、人機對話、用戶意圖理解、信息抽取、情感分類
18、京東集團-SW(9618.HK)商湯科技多模態日日新SenseNova取名為“持續更新”之意,提供to B服務,為政企客戶提供API接口。用戶可根據大模型的不同AI技術能力,實現圖片生成、自然語言處理、視覺感知通用任務與標注政企大模型使用商湯(0020.HK)三六零NLPTo C基于搜索場景推出人工智能個人助力類產品智能助理類產品360瀏覽器三六零(601360.SH)NLPTo SME基于生成式大模型推出SaaS化垂直應用,如結合生成式AI的“蘇打辦公套件”和“企業即時通訊工具-推推”,解決中小微企業數字化轉型難題解決中小微企業數字化轉型NLPTo G&B計劃結合數字安全業務推出企業私有化A
19、I服務,滿足客戶對私有知識、資產的索引需求滿足客戶對私有知識、資產的索引需求云從科技多模態3月30日,云從科技發布定增募集說明書,定增36億元用于行業大模型下游場景的應用研發重點行業大模型云從科技-UW(688327.SH)昆侖萬維多模態天工巧繪SkyPaint文本生成圖片模型,即提示詞文本編碼器模型和擴散模型兩大部分產生高質量圖片昆侖萬維(300418.SZ)多模態天工樂府SkyMusic商用級作曲AI模型音樂和娛樂STARX,starmakerNLP天工妙筆SkyText擁有14B和3B的參數模型;中文GPT3預訓練大模型,可以進行文章續寫、對話、中英翻譯、內容風格生成、推理、詩詞對聯等不
20、同任務文字創作OperaNLP天工智碼SkyCode擁有2.6B的參數模型;采用GPT3模型結構,模型能夠理解中文注釋并對代碼進行補齊編程NLPSkyChat基于中文GPT3 API研發的項目,可以像ChatGPT一樣,實現人機聊天、問答、中英文互譯、對對聯和寫古詩任務聊天機器人Minimax多模態(文本、視覺、聲音)MiniMax與火山引擎合作建立了超大規模實驗平臺,實現千卡級常態化訓練聊天社交軟件及toB API Glow資料來源:CSDN,GitHub,界面,IT之家,Google博客,Meta AI,量子位,機器之星,公司官網,Wind,iFinD,華安證券研究所整理各垂直領域廠商百花
21、齊放,結合自身所在領域,進行大模型探索,在視頻推薦、人機對話、智能助理、編程等多領域有所探索。各垂直領域廠商百花齊放,結合自身所在領域,進行大模型探索,在視頻推薦、人機對話、智能助理、編程等多領域有所探索。10目錄目錄1 大模型發展歷程及發展現狀:科技巨頭引領行業,國內大廠布局較早,眾多廠商結合自身優勢積極布局2 2 海外及國內的熱門海外及國內的熱門AIAI應用:國內自應用:國內自1717年以來,一級市場年以來,一級市場AI+AI+垂直賽道項目眾多垂直賽道項目眾多3 目前主流AI模型及應用解讀:從文本生成輔助決策到視頻生成4 國內一級市場及二級市場公司在AI領域百花齊放,有所積累11資料來源:
22、量子位,IT桔子,crunchbase,華安證券研究所整理圖表圖表5 5:海外熱門應用所使用的模型技術梳理:海外熱門應用所使用的模型技術梳理2.1 海外熱門應用所用模型梳理:從文本生成與圖像生成到視頻生成與海外熱門應用所用模型梳理:從文本生成與圖像生成到視頻生成與3D生成生成按照生成內容的種類,目前海外按照生成內容的種類,目前海外AIAI應用可以分為輔助決策類、文本生成類、圖像生成類、視頻生成類、代碼生成類、應用可以分為輔助決策類、文本生成類、圖像生成類、視頻生成類、代碼生成類、3D3D生成類等,生成類等,其中文本生成類和圖像生成類應用相對較為成熟,視頻生成類、代碼生成類、其中文本生成類和圖像
23、生成類應用相對較為成熟,視頻生成類、代碼生成類、3D3D生成類仍處于發展前期。生成類仍處于發展前期。文字生成及輔助決策類應用:文字生成及輔助決策類應用:以NLP領域中的transformer模型為主(transformer解決了RNN不能并行處理的問題,因此可以堆高模型參數)圖像生成類應用:圖像生成類應用:原本以CV領域中的GAN模型為主,現以多模態模型中的diffusion model為主(diffusion model解決了GAN模型效果不穩定的問題);4月以來,SAM、SegGPT、Grounded-SAM模型接連誕生,可以識別圖像和視頻中的一切物體,CV領域或亦迎來了“GPT-3時刻”
24、視頻生成類應用:視頻生成類應用:23年3月20日,首個多模態視頻生成模型Gen-2誕生模型所模型所屬公司屬公司模型名模型名稱稱模型類模型類型型應用軟件應用軟件應用上線應用上線時間時間軟件所屬軟件所屬公司公司公司是公司是否上市否上市軟件所屬公司融資情況軟件所屬公司融資情況應用描述應用描述商業模式商業模式戰略合作關系戰略合作關系OpenAlOpenAlDavinciDavincimodelmodelNLPNLPFRASEFRASEIOIO2019FRASE Inc否種子輪:2018年融資約95萬美金文本生成類:用于SEO(搜索引擎優化)營銷,幫助用戶創建高質量、契合搜索引擎的內容,以提高網站排名和
25、流量。收費,個人版$19.99每月digitas、ptc、talkspace等GPTGPT 3 3NLPNLPCopy.aiCopy.ai2020-10-1CopyAI Inc否種子輪:CraftVentures領投,融資數額290萬美金文本生成類:用于自動化文案生成,包括廣告文案、博客文章、社交媒體帖子、產品描述免費(有收費Pro版)groove、zoom、hubspot、confluent、seismic、datadogA輪:WingVentureCapital領投,紅杉、Tiger、個人天使投資人EladGil跟投,融資數額1100萬美金JasperJasper AIAI2021-1-1
26、Jasper否2022年10月:融資額1.31億美金,估值15億美元文本生成類:用于自動化生成高質量的營銷和廣告文案、博客文章、產品描述、電子郵件、社交媒體帖子等收費,基礎版$29.99每月intel、klarna、zoom、Deloitte、ibm、Google、airbnb、digital marketerNotion.AINotion.AI2022-11-1Notion否天使輪:2013年融資200萬美元A輪:2019年7月融資1800萬美金B輪:2020年4月融資5000萬美金C輪:2021年10月融資2.5億美元,投后估值103億美元文本生成類:能幫助用戶快速生成和修改文本內容,可運
27、用在文學、會議日程、新聞稿、銷售文案等內容的輔助性創作中免費(有收費Pro版)airbnb、nike、Amazon、uber、toyota、ibm等ReplicaReplica2016-02Luka Inc否A1輪:2016年4月獲442萬美元融資文本生成類:可以模擬人類對話,對用戶的輸入提供真實的反應,可用于心理健康咨詢、語言學習、娛樂等。免費(有收費Pro版)A2輪:2017年11月獲650萬美元融資ElaiElai2021Elai.io否2022年獲5萬美元融資視頻生成類:只需要文本就能制作出有真人主持的專業視頻,可用于教育、營銷、企業溝通、帶貨等用途收費,基礎版$29每月partner
28、:nVidia、amazon、Microsoft、thinkific、Google for startupInworldInworld:AIAI2022-04Inworld:AI否種子輪:21年11月融資700萬美元(投資方包括Meta)Pre-A輪:22年3月融資1000萬美元A輪:22年8月獲得Intel Capital領投的5000萬美元3D生成類:文生NPC,可創建角色、設定場景、設定世界觀常識等免費,(有收費基礎版$10/月、專業版、定制版)DisneyDALLEDALLE 多模態多模態CraiyonCraiyon2021-06Boris Dayma(個人)否圖像生成類:只需要在搜索
29、框中輸入相應場景的文字描述,就能生成各種或唯美、搞笑又或者是畫面驚悚的圖片。免費(有收費Pro版)CLIPCLIP多模態多模態starryaistarryai2021Mo Kahn(個人)否圖像生成類:能生成各種風格和主題的藝術作品,可為客戶提供所創建圖像的完全所有權,可用于個人或商業用途。免費(有收費會員和積分制度)GPTGPT-4 4 多模態多模態GitHubGitHubCopilotCopilot X X2023-03GitHub否A輪:2012年由Andreessen Horowitz領投,融資1億美元代碼生成類:具備對話、文本生成代碼、語音生成代碼、自動修復代碼Bug,以及解釋代碼等
30、功能收費,個人版$10每月微軟旗下的公司,與Open AI合作開發B輪:2015年由Sequoia Capital領投,融資2.5億美元12資料來源:量子位,IT桔子,crunchbase,華安證券研究所整理圖表圖表6 6:海外熱門應用所使用的模型技術梳理(續):海外熱門應用所使用的模型技術梳理(續)2.1 海外熱門應用所用模型梳理:從文本生成與圖像生成到視頻生成與海外熱門應用所用模型梳理:從文本生成與圖像生成到視頻生成與3D生成生成模型所屬公司模型所屬公司模型名稱模型名稱模型類型模型類型應用軟件應用軟件應用上線時間應用上線時間軟件所屬軟件所屬公司公司公司是公司是否上市否上市軟件所屬公司融資情
31、況軟件所屬公司融資情況應用描述應用描述商業模式商業模式戰略合作關系戰略合作關系DeepMindDeepMindBigGANBigGANCVCVArtbreederArtbreeder2019-05StudioMorphoge(工作室)否圖像生成類:用于創作人物肖像、人物形象、動漫角色、建筑、畫作、自然景觀等,還包括改變面部特征的能力免費(有收費Pro版)英偉達英偉達StyleGANStyleGANCVCVGoogleGoogleViTViTCVCVMurfMurf2020-10Murf否種子輪:Elevation Capital領投,獲150萬美元融資音頻生成類:支持文本轉語音、添加視頻旁白、
32、幻燈片旁白、語音克隆,可用于Youtubers、播客、有聲讀物、游戲、產品和解說視頻中免費(有收費基礎版、專業版、企業版)A輪:Matrix Partners領投,獲1000萬美元融資基于基于transformetransformer rNLPNLPMemMem2021-06Mem Labs否A輪:22年11月獲得OpenAI領投的2350萬美元輔助決策類:AI驅動的辦公記事應用,可以幫助用戶快速記錄和整理個人信息數據,并利用AI將這些數據連接成有意義的知識圖譜免費(有收費個人版$8/月,企業版$15/月、定制版)Open AI為其投資方;為Twitter打造專屬功能Mem itStabili
33、ty.aiStability.aiStableStable DiffDiffusion(usion(基于基于LatentLatent DiffDiffusionusionModelModels)s)多模態多模態Stability.Stability.aiai2022-08Stability.ai否種子輪:22年10月,由Coatue和Lightspeed領投,融資額1.01億美金,估值10億美元圖像生成類:根據所需圖像的文本描述,生成符合匹配該描述的高質量圖像。免費(有收費Pro版)partner:Krikey.ai、亞馬遜、GeeneeMidjourneyMidjourneyMidjourn
34、eyMidjourneyV5(V5(基于基于DiffusionDiffusion M Models)odels)多模態多模態MidjourneyMidjourney2022-03Midjourney否圖像生成類:根據所需圖像的文本描述,生成相對應的圖片,可以選擇不同畫家的藝術風格,例如安迪華荷、達芬奇、達利和畢加索等,還能識別特定鏡頭或攝影術語。收費,基礎版$10每月partner:MirrorX、Discard、NFT加州大學伯克加州大學伯克利分校、谷歌、利分校、谷歌、加州大學圣地加州大學圣地亞哥分校亞哥分校NeRFNeRF多模態多模態LumaLuma2021-09Luma AI否種子輪:2
35、021年10月,獲得South Park Commons、Matrix Partners等投資,數額為430萬美元A輪:23年3月,由Amplify Partners領投,NVIDIA(Nventures)等跟投,融資數額為2000萬美元3D生成類:基于神經渲染技術,可以拍攝少量照片來生成、著色和渲染產品的逼真3D模型。按次收費,每個視頻1美元,容量限制5GBAmplify Partners、General Catalyst投資RunwayRunwaygengen-2 2多模態多模態Runway AIRunway AI2023-03Runway否B輪:21年12月融資3500萬美元C輪:22年
36、12月融資5000萬美元視頻生成類:允許用戶從零開始生成視頻,可以文生視頻、文本+參考圖像生視頻、靜態圖片轉視頻gen-1免費,gen-2處于內測階段,尚未開放使用參與開發Stable Diffusion模型13資料來源:公司官網,IT桔子、華安證券研究所整理圖表圖表7 7:海外熱門應用的國內對標海外熱門應用的國內對標2.2 國內主要應用:以文本生成、圖像生成、音樂生成類為主國內主要應用:以文本生成、圖像生成、音樂生成類為主模型所屬模型所屬公司公司模型名稱模型名稱模型類型模型類型軟件所屬公司融資情況軟件所屬公司融資情況應用軟件應用軟件應用上線應用上線時間時間應用描述應用描述商業模式商業模式戰略
37、合作關系戰略合作關系彩云科技彩云科技 文字模型“小夢文字模型“小夢V2”V2”NLPNLPA輪融資:2017年融資630萬美元彩云小夢彩云小夢2021-2-1文本生成類:彩云小夢1.0主打功能是續寫;彩云小夢2.0的新功能是對話,定位是一款AI聊天續寫軟件付費訂閱制,非會員續寫字數有限。會員價格為36元/季度,190元/年喜馬拉雅:彩云小夢入駐喜馬拉雅,其續寫的小說故事將由喜馬拉雅AI主播“喜小道”演播并發布在喜馬拉雅平臺必優科技必優科技BoleBole模型(全球首模型(全球首個中文人力資源模個中文人力資源模型)型)多模態多模態天使輪:2021年6月獲得金山辦公投資近千萬人民幣HRHR-Lin
38、kLink(全網首個(全網首個人力資源行業知識人力資源行業知識圖譜)圖譜)簡歷輔寫與生成場景B端提供場景小模型能力,客戶包括:金山辦公、騰訊文檔、實習僧、新浪等垂直場景C端應用采用會員訂閱收費,用戶200W+,均價百元人民幣/年金山辦公、騰訊文檔為其客戶金山辦公為其投資人秘塔科技秘塔科技MetaLLMMetaLLM(基于基于TransfomerTransfomer自研)自研)LLMLLM大模型大模型天使輪:2018年獲得思滿科技、小豹AI音箱、獵豹移動數百萬元Pre-A輪:2021年融資數千萬元秘塔寫作貓(秘塔寫作貓(AIAI寫寫作輔助工具)作輔助工具)2020年文本生成類:有比較強大的糾正錯
39、別字、語法錯誤等功能,可用于論文靈感、方案報告、作文、電商種草文、小說寫作模板、廣告語有免費版與付費版,付費版最低每月24元起,使用高級糾錯創作算法模型,兩種模型之間的性能有超過30%的差距獵豹移動為其投資人秘塔翻譯(為法律秘塔翻譯(為法律人訓練的機器翻譯人訓練的機器翻譯系統)系統)2019年文本生成類:主要用于法律、公文類翻譯產品目前已在中國各大頂尖律師事務所、仲裁中心、數百家企業和其他法律相關機構中被使用。聆心智能聆心智能OPDOPD模型(采用模型(采用UniLM8UniLM8架構打造)架構打造)LLMLLM大模型大模型天使輪:2022年12月獲得連星資本(領投)、智譜AI的投資數千萬元P
40、re-A輪:2023年2月獲得無限基金SEEFund投資AIAI烏托邦烏托邦2022年12月文本生成類:PC端、小程序,雛形階段用戶可選擇與梅西、愛因斯坦、甄嬛等跨次元跨時空名人聊天,也可與程序員、心理咨詢師等群體屬性的角色交流,還可通過文字描述“捏出”自己想要的AI朋友即將推出商業化產品AI烏托邦pro,這一產品目前還在內測中已與一些游戲廠商和車廠落地深度合作項目,如與高端豪華電車品牌Beyonca合作,打造了新一代智能駕艙的貼心助手;基于知名IP合作,采用聆心智能的對話生成技術為品牌定制AI角色西湖心辰西湖心辰TextText-toto-ImageImage模型模型TextText-tot
41、o-ImageImage模型模型天使輪:2021年12月融資近千萬美元Pre-A輪:23年3月獲得百度風投(領投)等的投資數百萬美元AIAI畫圖產品“造夢畫圖產品“造夢日記”日記”2022年8月圖像生成類(現已開放視頻生成功能內測):用戶輸入簡單的描述詞或上傳參考圖即可生成原創圖片,可應用于繪畫、動漫游戲、運營策劃和電商等領域C端個人會員:按月付費(均價50/月)專屬模型定制:按個數付費(均價20元/個)合作關系:浙江立同德醫院、上海德濟醫院、杭州銀行、中國電信等RIORIO語言大模型語言大模型LLMLLM大模型大模型HeyFriday”AIHeyFriday”AI智能智能寫作產品寫作產品20
42、23年1月文本生成類:為不同的寫作場景開發和提供各種原創文本,包括產品描述、營銷信息、各類主題文章和廣告文案等主要為C端個人會員付費,共設3個付費套餐(每年188/388/1888元)RIORIO雙模態圖文模型雙模態圖文模型雙模態雙模態雙模態對話系統雙模態對話系統“心辰“心辰Chat”Chat”2023年2月文本生成+圖片生成類:自助上網,與心辰Chat的對話中,用戶除了能讓它寫作以外,還可以用它來生成圖像心辰大模型心辰大模型多模態多模態研發中23年3月6日宣布開始研發首個可自助聯網的多模態大模型“心辰大模型”退格數字退格數字TIAMATTIAMAT自研自研MorpherVLMMorpherV
43、LM多模態多模態天使輪:2022年10月融資數百萬元A輪:2023年2月融資近千萬美元小程序:小程序:TiamatAITiamatAI(AIAI繪畫生成)繪畫生成)2022文本生成圖像,可為個人用戶和企業客戶提供創意生產、廣告、數字藏品等場景形式下的服務現以toC為主,20%的用戶群體是小B端的設計師,60%是泛設計行業人群已與知名科幻IP、央視網、時尚芭莎嘉人等時尚大刊建立合作,與頭部游戲公司,特別是持有故宮文化相關IP的非遺文化IP機構知造局等開展了戰略合作智譜華章智譜華章大規模中英文預訓大規模中英文預訓練語言模型練語言模型GLMGLM-130B130BLLMLLM戰略投資:2019年8月
44、融資數千萬元A輪:2021年9月獲圖靈創投等投資數億人民幣B輪:2022年9月獲得君聯資本和啟明創投聯合領投的數億人民幣聊天機器人聊天機器人XDAIXDAI和和ChatGLMChatGLM2022知識具象化的對話系統,支持中英雙語問答免費,現有一定數量的政企客戶2022年8月,智譜AI與清華大學KEG共同研發的大規模中英文預訓練語言模型GLM-130B正式發布;目前聯合開發預訓練語言模型,參與悟道2.0研發。瀾舟科技瀾舟科技孟子系列大模型孟子系列大模型多模態多模態天使輪:2021年8月獲創新工場投資Pre-A輪:2022年獲聯想創投等投資近億元Pre-A輪:2023年3月獲中關村科學城投資數億
45、元AIGCAIGC智能創作平臺智能創作平臺 2022年12月包括文學輔助寫作、營銷文案協作、論文助寫、文圖生成(powered by stable diffusion)等功能主要以項目制合作方式提供底層技術能力接入客戶現有產品業務流客戶包括華為、中文在線、傳神、數說旗下容徽、同花順及華夏基金等目前已與華為云、傳神語聯網、中文在線等達成合作,并與北大、清華等10所高校進行產學研的合作機器翻譯平臺機器翻譯平臺2022年12月包括通用文本翻譯和垂直領域翻譯(針對財經金融、網絡小說、法律合同等)生成式對話機器人生成式對話機器人MchatMchat2022年12月具備通用對話能力、小說續寫能力、營銷文案
46、生成、處理行業任務(如金融場景)瀾舟金融瀾舟金融NLPNLP平臺平臺2022年12月包括金融翻譯、研報觀點分析、實體抽?。◤奈谋局凶R別公司實體)等DeepMusicDeepMusic自研自研AIGCAIGC音樂引擎音樂引擎“Mutrix”Mutrix”多模態多模態天使輪:2018年2月獲清華控股投資A輪:2020年7月獲完美世界投資A+輪:2023年4月獲GGV紀源資本領投的近千萬美金口袋樂隊口袋樂隊2022年1月 AI音樂工作站DeepMusic的音樂結構標準UMP已經被TME旗下全民K歌、QQ音樂多個場景應用BGMCATBGMCATAI音樂生成器,它可以快速生成BGM并對BGM進行智能化處
47、理LYRICALYRICAAI歌詞生成器,通過關鍵字輸入,可得到相關主題下的完整歌詞,并對歌詞進行智能化處理(如指定格式、定義韻腳、定義字數、逐句編輯)lazycomposerlazycomposerAI作曲軟件國內自國內自20172017年以來,年以來,AIAI領域一級市場投資頻繁,主要集中在特定領域的應用,如續寫、法律公文翻譯、簡歷生成、歌詞生成、輔助領域一級市場投資頻繁,主要集中在特定領域的應用,如續寫、法律公文翻譯、簡歷生成、歌詞生成、輔助作曲、廣告文案等作曲、廣告文案等14目錄1 大模型發展歷程及發展現狀:科技巨頭引領行業,國內大廠布局較早,眾多廠商結合自身優勢積極布局2 海外及國內
48、的熱門AI應用:國內自17年以來,一級市場AI+垂直賽道項目眾多3 3 目前主流目前主流AIAI模型及應用解讀:從文本生成輔助決策到視頻生成模型及應用解讀:從文本生成輔助決策到視頻生成4 國內一級市場及二級市場公司在AI領域百花齊放,有所積累15資料來源:機器之心,CSDN,華安證券研究所整理3.1 文字生成及輔助決策類應用模型:從文字生成及輔助決策類應用模型:從RNN到到Transformer文字生成及輔助決策類應用:文字生成及輔助決策類應用:17年以前NLP領域中應用最為泛的模型是基于RNN架構的Seq2Seq模型,但RNN為序列模型,訓練時間開銷較大,且難以實現并行處理;2017.6谷歌
49、提出了Transformer模型,解決了RNN不能并行處理的問題,可以堆高模型參數,大大提高了訓練和推理的速度。2020年5月,OpenAI發布GPT3,模型參數增大到了1750億。GPT3在許多NLP數據集上都取得了很強的性能,包括翻譯、問題回答以及一些需要即時推理或領域適應的任務RNN(循環神經網絡)是NLP里最常用、最傳統的深度學習模型。2017年之前,語言模型都是通過RNN、ISTM來建模,這樣雖然可以學習上下文之間的關系,但是無法并行化,給模型的訓練和推理帶來了困難。2017.62018.102020.5RNN2017.6谷歌提出了Transformer模型。Transformer擺
50、脫了NLP任務對于RNN、ISTM的依賴,使用了self-attention的方式對上下文進行建模,大大提高了訓練和推理的速度Transformer2018年底谷歌推出了BERT模型。作為一種基于Transformer encoder的雙向編碼預訓練模型。BERT解決了之前Transformer模型無法直接學習到上下文信息的問題,提高了自然語言處理能力BERTGPT3TransformerGPT2適合生成任務BERT適合特征提取解碼器編碼器2019.6谷歌推出了XLNet模型。XLNet可以獲得句子雙向信息并可以學習token 之間的依賴關系,解決了BERT模型忽視mask單詞間關系的問題。此
51、外XLNet使用了Transformer-XL,可以運用更廣闊的上下文信息XLnet2019.6長句解決方案Transformer XLXlnet長句模型引入缺點改進圖表圖表8 8:輔助決策及文字生成類應用所使用模型發展圖:輔助決策及文字生成類應用所使用模型發展圖16資料來源:Copy AI,華安證券研究所整理圖表圖表9 9:Copy.aiCopy.ai的應用場景的應用場景1)文本生成類)文本生成類-Copy.ai(文本生成工具)文本生成工具)以營銷文案為例,Copy.ai可以根據特定需求提供一站式解決方案Copy.ai是基于GPT3的文本生成工具,可應用于商業文章寫作、營銷文案、產品描述等場
52、景圖表圖表1111:Copy.aiCopy.ai的營銷文案撰寫演示的營銷文案撰寫演示生成文案生成文案1.選擇營銷模塊博客內容輸入產品/品牌名稱輸入產品描述選擇語言風格資料來源:Copy AI,華安證券研究所整理線上營銷文案電商廣告文案營銷文案社媒內容網頁文案營銷市場痛點營銷市場痛點Copy.aiCopy.ai時間緊迫運用AI提升文案創作效率靈感缺失運用AI尋找營銷靈感及思路文案缺乏亮點運用AI幫助進行頭腦風暴外包費用高昂Pro版每月僅36美元圖表圖表1010:Copy.aiCopy.ai對營銷市場痛點的對營銷市場痛點的解決解決資料來源:Copy AI,華安證券研究所整理17資料來源:Notio
53、n AI,華安證券研究所整理2)文本生成類)文本生成類-Notion.AI(智能在線文檔編輯工具)(智能在線文檔編輯工具)功能:具有智能化的協作、搜索、分類和推薦功能,具體包括生成新內容、編輯現有內容、總結內容、翻譯內容模型:基于GPT3應用場景:被廣泛應用于知識管理、團隊協作、個人筆記等領域。1.1.單擊空白頁面上的空格按鈕單擊空白頁面上的空格按鈕1)AI生成新內容2)AI續寫3)AI總結圖表圖表1212:NotionNotion.ai.ai的使用說明的使用說明查找行動項目翻譯解釋該文本文本改善修改拼寫與語法錯誤概括擴寫更改語氣簡化語言讓AI編輯頭腦風暴博客文案提綱社媒文案發布會文稿創意故事
54、論文詩歌待辦事項會議章程優缺點一覽職位描述銷售郵件擴寫功能舉例:擴寫功能舉例:2.2.選擇功能選擇功能1.1.輸入文字輸入文字2.2.選擇“擴寫”功能選擇“擴寫”功能3 3.輸出內容輸出內容18資料來源:智東西、CSDN,機器之心,華安證券研究所整理圖表圖表1313:圖像生成類應用所用模型代際變化:圖像生成類應用所用模型代際變化3.2 圖像生成類應用:從圖像生成類應用:從GAN到到diffusion model再到再到SAM類模型類模型 圖像生成類應用:原本以CV領域中的GAN模型為主,現以多模態模型中的diffusion model為主(diffusion model解決了GAN模型效果不穩
55、定的問題);4月以來,SAM、SegGPT、Grounded-SAM模型接連誕生,可以識別圖像和視頻中的一切物體,CV領域或將迎來GPT-3時刻生成式對抗網絡包括生成模型和判別模型。判別模型用于判斷一張圖片是不是真實的圖片,生成模型用于創造一個看起來像真圖片的圖片,兩個模型一起對抗訓練,生成模型產生一張圖片去欺騙判別模型,然后判別模型去判斷這張圖片是真是假,最終在這兩個模型訓練的過程中,兩個模型的能力越來越強,最終達到穩態。GANGAN擴散模型在前向階段對圖像逐步施加噪聲,直至圖像被破壞變成高斯噪聲,然后在逆向階段學習從高斯噪聲還原為原始圖像和GAN相比,Diffusion Model只需要訓
56、練生成模型,訓練目標函數簡單,而且不需要訓練別的網絡(判別模型等),所以可以實現更優的圖像樣本質量和更好的訓練穩定性。diffusion modeldiffusion modelSegment Anything Model可以為任何圖像或視頻中的任何物體生成 mask,甚至包括在訓練過程中沒有遇到過的物體和圖像類型(即具備零樣本性能,初步驗證了多模態技術路徑及其泛化能力);此外,SAM開創性地與Prompt結合了起來,標志著自然語言處理的Prompt模式開始被應用在了計算機視覺領域。SAMSAMGrounded-SAM:可以通過文本描述就可以找到圖片中的任意物體(檢測一切),然后通過Segme
57、nt Anything強大的分割能力,細粒度的分割出mask(分割一切),最后還可以利用Stable Diffusion對分割出來的區域做可控的文圖生成(生成一切)SegGPTSegGPTGroundedGrounded-SAMSAM2023.4.62023.4.62020202020142014可以通過上下文推理在圖像或視頻中執行任意的分割任務,與SAM的精細標注能力相比,SegGPT模型更偏重于批量化標注分割能力,無論是在圖像還是視頻環境,用戶在畫面上標注識別一類物體,即可批量化識別分割出其他所有同類物體19資料來源:Stability.ai,華安證券研究所整理圖表圖表1414:Drean
58、mDreanm StudioStudio使用界面使用界面1)圖像生成類)圖像生成類-Stable Diffusion(文生圖文生圖)+Stable Diffusion Reimagine(圖生圖圖生圖)Stable Diffusion和Stable Diffusion Reimagine都是Stability.ai創作的AI生成圖像模型/工具。Stable Diffusion:是Stability AI公司開源的AI文生圖擴散模型,通過DreamStudio的API將Stable Diffusion貨幣化。用戶只用輸入提示文本或者拼合的素材圖+文本就可以獲得完整的的設計圖,可用于創造新穎和獨特
59、的設計、輔助場景構圖等。Stable Diffusion Reimagine:2023年3月17日,StabilityAI推出Stable Diffusion Reimagine,用圖像編碼器取代了原來的文本編碼器,只要上傳一張圖片,就可以創作無數張外觀相似、但細節和構圖不同的圖像,該功能目前由Clipdrop工具實現。輸入描述圖片的文字,包括但不限于主題色彩、風格等輸入描述圖片的文字,包括但不限于主題色彩、風格等輸入原始圖片輸入原始圖片根據原始圖片生成的兩張新圖片根據原始圖片生成的兩張新圖片圖表圖表1515:Stable Diffusion ReimagineStable Diffusion
60、 Reimagine使用界面使用界面資料來源:Stability.ai,華安證券研究所整理20資料來源:Midjourney,華安證券研究所整理圖表圖表16:16:與與Midjourney botMidjourney bot交互得到圖片交互得到圖片2)圖像生成類)圖像生成類-Midjourney(文生圖文生圖+圖生文圖生文)功能:Midjourney是一款圖片生成應用,輸入prompt即可生成圖像。該產品搭載于該產品搭載于DiscordDiscord社區社區,用戶可通過與機器人Midjourney bot進行對話式交互,并選擇不同的主題、風格和分辨率,來生成圖像作品,可廣泛應用于游戲、影視等領
61、域;4月5日Midjourney是上線新功能“/describe”,可從圖像中反推prompt,極大的節省了創作者學習prompt的時間、提升了圖片輸出的精準度。模型:2023年3月16日,Midjourney宣布推出V5模型,與前一代V4相比,V5擁有更多風格選擇、更高分辨率、擁有刻畫更豐富細節比如手部細節的能力、對Prompt指令的理解力更強。輸入prompt即可生成圖片圖表圖表17:17:MidjourneyMidjourney新功能新功能/describe/describe1)選擇“/describe”或者直接在對話框中輸入“describe”2)上傳圖像3)根據圖像會產生4條prom
62、pt4)調整prompt即可輸出風格類似的4張圖片資料來源:Midjourney,華安證券研究所整理21資料來源:Runway,華安證券研究所整理圖表圖表1818:Runway GenRunway Gen-2 2功能演示功能演示3.3 視頻生成類視頻生成類-Runway Gen-2(文生視頻、圖生視頻、文(文生視頻、圖生視頻、文+圖生成視頻)圖生成視頻)功能:Runway是一款視頻生成應用,其Gen-1版本功能為視頻生視頻,Gen-2版本功能包括文生視頻、文本+參考圖像生視頻、靜態圖片轉視頻,該工具目前搭載于Discord社區。模型:23年2月公司推出模型Gen-1,通過提供初始視頻、疊加文字
63、提示語或圖片提示,生成新的視頻;23年3月20日,首個多模態視頻生成模型Gen-2誕生,相比Gen-1,Gen-2可實現從零開始自動創作短視頻的功能,大幅縮短視頻制作周期。應用領域:生成式AI視頻有望在游戲、影視、營銷等領域實現廣泛應用1)輸入文本prompt:在紐約市的一間閣樓里,傍晚的陽光透過窗戶溫柔地灑進屋內2)即可生成視頻2)輸入文本prompt:在一個低角度拍攝的畫面中,男子正沿著街道行走,周圍酒吧的霓虹燈照亮了他的身影3)即可生成視頻文生視頻文生視頻1)輸入圖像:文文+圖生視頻圖生視頻2)即可生成視頻1)輸入圖像:圖生視頻圖生視頻22資料來源:Luma,華安證券研究所整理功能:Lu
64、ma是一款3D內容方案平臺,具有文生3D模型、圖生3D、視頻生3D等功能模型:基于NeRF(神經輻射場)模型,其原理是利用深度神經網絡,從多個角度拍攝的圖片中學習一個連續的三維場景表示,該表示可以用于合成任意視角下的新圖片。Luma使用了NeRF的改進版本,可以在移動設備上實時運行,并提供了一些便捷功能,如自動對齊、背景消除、模型編輯等。3.4 3D生成類生成類-Luma(文生(文生3D、圖生、圖生3D、視頻生、視頻生3D)類似Midjourney,只需輸入文字描述,即可生成對應的3D模型。例如輸入:一只紅綠配色的毛線狗文生文生3D3D1)輸入視頻:盡可能的全方位視頻生視頻生3D3D可在Lum
65、a網頁上傳圖片壓縮包,通常照片比視頻質量更高,但需特定拍攝視角圖圖生生3D3D價格:按次收費,轉換一個視頻費用1美元,不管視頻容量大小,轉換時間在30分鐘左右。2)輸出3D:圖表圖表1919:LumaLuma功能演示功能演示23資料來源:Inworld AI,華安證券研究所整理3.4 3D生成類生成類-Inworld AI(AI生成生成NPC工具)工具)功能:Inworld AI是AI生成NPC工具,可以讓開發者和玩家通過文字描述創建和定制虛擬世界中的人物角色模型:包括GPT-3、StyleGAN2、OpenAI Codex等20個不同的機器學習模型,負責角色個性的不同方面應用場景:游戲領域N
66、PC生成效率提升點:1)大幅降低NPC生產成本,降低游戲制作門檻:可賦能人物設定-2D手繪-3D建模-動畫-配音的全過程2)提升游戲的沉浸感和社交性:接入LLM的NPC可以同玩家自由對話;圍繞LLM搭建擬人技術課題使NPC具備推動劇情的能力核心描述基礎信息設定個性、情緒背景知識選擇音色、音速以及語調3 3.設定常識設定常識:用戶可以定義所有角色都知道的世界觀信息,或者定義只適用于特定角色群體的知識;這對角色保持基本的設定狀態非常重要,合理的常識設置可以防止 AI NPC 脫離最初的設定,變得不受控制1 1.創建角色創建角色2 2.設定場景設定場景:描述角色所處的環境來提供故事背景。在寫好場景描
67、述后,將相關的角色(1 個或多個)添加到場景之中。還可以添加場景觸發器,為場景中可能發生的變化添加即時的背景,增加游戲體驗的多變性。圖表圖表2020:Inworld AIInworld AI使用演示使用演示24資料來源:GitHub Copilot X,華安證券研究所整理3.5 代碼生成類代碼生成類-GitHub Copilot X(代碼補全、代碼建議、代碼測試等功能)(代碼補全、代碼建議、代碼測試等功能)功能:功能:GitHub Copilot X是微軟與OpenAI共同推出的一款AI編程類開發工具,能夠實現代碼補全、代碼建議、代碼測試、代碼重構、生成代碼文檔等功能模型:23年3月22日推出
68、的CopilotX基于GPT-4 模型,21年推出的GitHub Copilot基于OpenAI的Codex模型(GPT-3模型的低配版),幫助開發者提高了55%的開發速度。功能更新:功能更新:相比GitHub Copilot,CopilotX新增了聊天和語音功能等,具體包括:1)Copilot Chat聊天功能:集成與VS Code和Visual Studio的聊天界面,幫助分析代碼、生成單元測試和修復bug2)Copilot Voice 語音功能:開發者通過口頭指令進行自然語言陳述意圖,Copilot Voice即可生成代碼片段2 2)提出請求:請求幫忙找出)提出請求:請求幫忙找出bugb
69、ug1 1)輸入原始代碼)輸入原始代碼3 3)輸出正確代碼)輸出正確代碼4 4)點擊此按鈕可將錯誤)點擊此按鈕可將錯誤代碼一鍵替換為正確代碼代碼一鍵替換為正確代碼圖表圖表2121:GitHub Copilot X GitHub Copilot X 找找bugbug功能功能使用演示使用演示25目錄1 大模型發展歷程及發展現狀:科技巨頭引領行業,國內大廠布局較早,眾多廠商結合自身優勢積極布局2 海外及國內的熱門AI應用:國內自17年以來,一級市場AI+垂直賽道項目眾多3 目前主流AI模型及應用解讀:從文本生成輔助決策到視頻生成4 4 國內一級市場及二級市場公司在國內一級市場及二級市場公司在AIAI
70、領域百花齊放,有所積累領域百花齊放,有所積累26功能功能:把一個類似“游戲引擎”的交互式平臺開放給開發者,讓開發者在上面可以開發出各種3D渲染的虛擬元宇宙空間,可以讓開發者在上面通過擺放角色,擺放場景物件,和加入實時交流功能,搭建出互動式的3D虛擬空間,最終可以用于會議,營銷,電商,現場活動,及游戲等。用例:用例:公司的平臺可以用戶搭建以下的場景并提供實時互動的交互體驗,包括在企業內部會議虛擬交互空間,市場營銷廣告巡展,線上購物商品展示及互動,和現場活動帶來沉浸式體驗。資料來源:Yahaha,華安證券研究所整理圖表圖表22:Yahaha功能演示功能演示4.1 Yahaha:元宇宙:元宇宙UGC
71、生產工具(搭建虛擬生產工具(搭建虛擬3D元宇宙空間及組件)元宇宙空間及組件)企業內部溝通企業內部溝通市場營銷市場營銷電商電商/購物購物現場活動27核心產品“混沌球”:采用強化學習的算法,可以通過算法自定義或生成劇情故事,故事的走向會隨著玩家交互行為改變而發生變化。用例:通過輸入文檔和基本信息,提取出角色核心的要素,通過調整參數,進行強化學習,運算出在各種觸發條件下可以生成的情節走向,最終生成有別于傳統敘事方法的“基于混沌球式的交互式敘事(即包含多種結局,無限種劇情樹)”。資料來源:RCT AI,華安證券研究所整理圖表圖表23:RCT AI功能演示功能演示4.2 RCT AI:為游戲開發提供人工
72、智能解決方案:為游戲開發提供人工智能解決方案輸入文檔和基本信息輸入文檔和基本信息傳統敘事方法傳統敘事方法調整參數和邊界情況,運算出調整參數和邊界情況,運算出各種各樣的情節可能性各種各樣的情節可能性基于混沌球的交互式敘事28秘塔寫作貓采用自研的大規模概率語言模型,是中文秘塔寫作貓采用自研的大規模概率語言模型,是中文AIAI生成文本內容的一項應用突破。生成文本內容的一項應用突破。發展歷程:發展歷程:2018 年 4 月,專門為法律從業者及其他文字工作者研發了包括翻譯功能在內的各類 AI 辦公工具;2020 年正式上線一款文書寫作助手:秘塔寫作貓,功能類似于中文 Grammarly 的 AI 軟件,
73、可以自動進行文檔糾錯、文書改寫、文字優化,適用于所有文字工作者如今在基于多年的 AI 研發經驗基礎上,進一步推出了對話寫作貓,彌補了交互聊天的短板,除了日常對話、知識解答、算數之外,具備寫小說、寫影評、制定財務計劃等數百種技能,采用秘塔科技自研的采用秘塔科技自研的 MetaLLM MetaLLM 大模型,這是一個超級大模型,有上億的大模型,這是一個超級大模型,有上億的參數,截至目前,對話寫作貓訓練花費不足參數,截至目前,對話寫作貓訓練花費不足1 1 億美金。億美金。模型特點:模型特點:注意力結構注意力結構:自研模型與GPT-3相比,優化了注意力結構,配合集成學習方法,降低對數據傳輸和GPU型號
74、的要求,降低訓練和使用成本;語料庫內容語料庫內容:GPT-3是基于英文語料訓練的模型,生成英文文本并適用英文語境;秘塔通過自研大模型訓練,語料庫來自全國各新聞網頁或其他公開資料清洗后的高質量數據,使中文AI生成本文產品能夠投入使用。產品功能:產品功能:文本校對、文章潤色、AI輔助創作:根據標題或文本一鍵生成大綱、文章,能夠自行糾錯和改寫,無限次數生成圖表圖表25 25:秘塔寫作貓功能展示:秘塔寫作貓功能展示4.3 秘塔寫作貓:文檔寫作助手及交互聊天工具秘塔寫作貓:文檔寫作助手及交互聊天工具資料來源:量子位,華安證券研究所圖表圖表2424:秘塔寫作貓與其他大廠:秘塔寫作貓與其他大廠AIAI寫作功
75、能對比寫作功能對比產品/公司功能收費情況是否支持中文秘塔寫作貓根據標題/文本一鍵生成大綱和文章,可自主修改;多種鍵盤快捷指令;10種寫作模板;其他功能:改寫糾錯可免費體驗AI寫作;每月24元檔(5000字/月);每月48元檔(20000字/月)是百度文心7種形式:寫作文、寫摘要、自由問答、對對聯、寫小說、補全文本、自定義;可選文本長度-是阿里達摩院小說續寫、專業文稿、詩詞生成、菜譜生成等-是Jasper博文、廣告、文章、郵件等50+細分模板;支持25種語言;快捷指令等每月40+美元檔(2萬英文,不支持修改/指令,僅支持短文案);每月82美元檔(所有功能支持)是NotionAI輸入標題或指令生成
76、指定類型文本,如博客、新聞稿、微博等-否2920192019年與閱文集團合作的年與閱文集團合作的3030部部AIAI翻譯網文作品,上線閱文旗下海外門戶起點國際;翻譯網文作品,上線閱文旗下海外門戶起點國際;20222022年年AIAI續寫應用彩云小夢入駐喜馬拉雅,由其續寫應用彩云小夢入駐喜馬拉雅,由其AIAI續續寫的小說故事由喜馬拉雅寫的小說故事由喜馬拉雅AIAI主播“喜小道”演播并發布。主播“喜小道”演播并發布。模型原理模型原理:彩云小夢2.0基于大規模語言模型的自然語言處理模型,進行各種類型文本創作;用 NLP 技術驅動對話場景,情節續寫的基礎上實現用戶與虛擬人物對話,提供互動和情感陪伴;模
77、型功能模型功能:AI文字聊天、AI語音通話、AI劇情文本續寫。應用領域包括文本營銷領域、劇情寫作領域、文本交互游戲領域模型效果模型效果:經過測試,對比1.0版本及其他開源模型。創新得分/邏輯得分/通順得分為43.889/52.778/64.444,均為最高產品定價產品定價:會員單價為2525元/月,按季售價36元,續費方式靈活;相比非會員,會員服務增加了續寫字數上限(100K字/月)、語音通話時長400分鐘/月和海量文本對話消息數?!白謹导恿堪蹦軌蛟黾永m寫字數,50K/100K/1000K字分別售價30/50/298元圖表圖表2727:模型效果對比圖:模型效果對比圖創新創新邏輯邏輯通順通順模
78、型模型28.88943.33357.222 某開源100億參數模型41.11147.22261.667 某開源1000億+參數模型43.88952.77864.444 彩云小夢V2模型圖表圖表2626:產品功能圖:產品功能圖-AIAI寫作及寫作及AIAI聊天聊天4.4 彩云小夢:彩云小夢:AI文本及語音工具,與閱文及喜馬拉雅合作文本及語音工具,與閱文及喜馬拉雅合作資料來源:彩云小夢官網,華安證券研究所資料來源:彩云小夢微信公眾號,華安證券研究所圖表圖表28 28:彩云小夢續寫界面:彩云小夢續寫界面資料來源:彩云小夢官網,華安證券研究所30發展歷程發展歷程:2021年成立,2023年2月完成近千
79、萬美元融資,孵化自中科院上??萍即髮W的AI繪畫工具,可以實現AI生成圖像(Text-to-image),支持中文輸入、創意生產、廣告設計、手辦設計等。與搭建在Discord上的Midjourney類似,TIAMAT也強調社區。應用原理應用原理:采用自研大模型MorpherVLM,通過異構的視覺編碼-解碼網絡結構,引入基于用戶反饋的強化學習(RLHF)和細粒度的提示-隱變量對齊技術,提高模型對圖像多尺度信息的建模能力,更好地理解用戶Prompt目前模型參數1010億左右億左右使用領域使用領域:服裝領域、廣告領域、動漫領域、游戲領域、知名IP、時尚領域等體驗效果:人工體驗效果:人工 VS Tiam
80、atVS Tiamat用時:人工繪畫23天/張,Tiamat分快速模式與慢速模式,快速模式下1分鐘可出4張圖;費用:根據繪畫要求、難易程度和繪畫者能力,費用為幾百到上千元/張不等,一般1500元。按照入門套餐,Tiamat繪畫單價為0.58元/張;變現方式變現方式:正處于內測階段,獲得邀請碼的用戶有20次免費生成圖片的限額,超出部分需訂閱,價格在58338元不等。22H1,月度新增活躍用戶數已逾數萬人,1/3的用戶有付費意愿;Tiamat已獲得數百萬合同訂單,與知名科幻IP、央視網、時尚芭莎等媒體或刊物建立合作,與持故宮文化IP的文化機構知造局開展戰略合作4.5 TiamatAI:AI繪畫工具
81、,可用于廣告設計、手辦設計等繪畫工具,可用于廣告設計、手辦設計等圖表圖表2929:Tiamat2022Tiamat2022年生成圖片示例年生成圖片示例圖表圖表3030:Tiamat2023Tiamat2023年生成圖片示例年生成圖片示例資料來源:Tiamat官網,華安證券研究所資料來源:Tiamat官網,華安證券研究所多模型訓練及圖像生成,由藍振忠博士帶領的西湖大學深度學習實驗室和西多模型訓練及圖像生成,由藍振忠博士帶領的西湖大學深度學習實驗室和西湖心辰科技有限公司共同推出,藍振忠此前曾在谷歌擔任研究科學家,也是湖心辰科技有限公司共同推出,藍振忠此前曾在谷歌擔任研究科學家,也是輕量化大模型輕量
82、化大模型ALBERTALBERT的第一作者。的第一作者。軟件功能軟件功能:創意繪畫,模型定制,姿勢識別,輪廓檢測,線稿上色,AI鑒圖,創意社區,創意生成器。使用模型使用模型:在Stable Diffusion的基礎上加以改進,形成由多個部分和模型一起構成的系統。效果提升效果提升:大幅提高繪畫效率,減少作畫時間與用人成本。原本需要20+小時完成的圖片僅需2秒即可用AI生成。接入Diffusion方法后,AI Art的生成速度被大幅提高,原本需要20+小時完成的圖片僅需2秒即可用AI生成。圖片生成的速度是決定是否能夠留住用戶的關鍵,一旦用戶在圖片生成的過程中切出,再次切回應用頁面的可能性就會降低,
83、可能造成用戶流失。應用領域應用領域:繪畫、平面設計、廣告、游戲、心理咨詢等。4.6 造夢日記:造夢日記:AI繪畫工具,可用于繪畫、設計、動漫游戲等繪畫工具,可用于繪畫、設計、動漫游戲等服務類服務類型型收費標準收費標準出圖速出圖速度度普通單張12元/150造夢星,28元/600造夢星,88元/2500造夢星平均3秒/張模型定制(每個模型贈送100張免費出圖額度)首單非首單19.9元/1個64.9元/5個119.9元/10個69元/1個255元/5個408元/10個會員1個月3個月12個月平均0.8秒/張50元送600星128元送2000星388元送8000星人工頭像插畫漫畫/動畫關鍵幀海報宣傳圖
84、風景/場景畫公眾號/微博/網站配圖1-100+小時不等根據個人能力及圖片完成度決定私稿100-600元/張300-5000元/張200-500/頁1000-2000元/張200-8000元300-1000元/張商稿版權的報價一般是使用權報價的3-5倍圖表圖表3232:造夢日記服務類型和收費:造夢日記服務類型和收費資料來源:公司官網、華安證券研究所整理圖表圖表3131:造夢日記使用界面:造夢日記使用界面32資料來源:各公司互動平臺,華安證券研究所整理4.7.1 上市公司上市公司AI領域布局:領域布局:AI+內容創作內容創作AIGCAIGC應用:目前內容創作、游戲、影視、電商、營銷為較早應用應用:
85、目前內容創作、游戲、影視、電商、營銷為較早應用AIAI的領域,可利用的領域,可利用AIAI技術賦能文字、圖片、視頻內容的創作。技術賦能文字、圖片、視頻內容的創作。1.AI+1.AI+內容創作應用具體包括:內容創作應用具體包括:1 1)文生文)文生文2 2)生成圖像及視頻(文生圖、圖生圖、文生視頻、圖生視頻):)生成圖像及視頻(文生圖、圖生圖、文生視頻、圖生視頻):一鍵生成圖片、人機共創畫作、靜態照片生產三維體積視頻等;3 3)文字配圖:)文字配圖:通過AI智能搜索為新聞稿件、創意文案、新媒體推文、教師課件等內容高效配圖;4 4)其他:)其他:包括生成音樂、音頻、代碼等領域。建議關注:中文在線、
86、昆侖萬維、萬興科技、浙文互聯、神州泰岳、利歐股份、視覺中國、當虹科技。建議關注:中文在線、昆侖萬維、萬興科技、浙文互聯、神州泰岳、利歐股份、視覺中國、當虹科技。公司名稱公司名稱股票代碼股票代碼日期日期公司業務對公司業務對AIGCAIGC技術的應用技術的應用是否接入是否接入ChatGPTChatGPT/GPTGPT是否接是否接入文心入文心一言一言其他模型其他模型中文在線300364.SZ3月8日公司目前已上線3款AIGC產品,分別為AI主播、AI繪畫和AI文字創作產品;瀾舟科技自研的類ChatGPT大語言模型公司基于瀾舟科技自研的類ChatGPT大語言模型,并以公司海量正版內容為數據和生態支撐,
87、探索AIGC技術在文學創作領域的應用,包括AIGC輔助創作、文本自動生成等3月24日 公司海外產品Chapters和My Escape已在做接入ChatGPT測試,應用在故事創作生成、劇本生成及改編、用戶與AI交互聊天等方面3月29日 海外公司已申請GPT4的API接口4月10日 國內多家模型公司就采購公司中文數據正在合作磋商昆侖萬維300418.SZ2月9日 公司宣布與奇點智源就ChatGPT、圖像視頻生成等技術達成戰略合作,啟動ChatGPT的聯合開發,將在今年內發布中國版類ChatGPT代碼開源2月24日公司AIGC產品包括天工巧繪、天工樂府、天工妙筆、天工智碼,布局AI生成圖像、音樂、
88、文本及代碼領域;公司Opera瀏覽器已接入ChatGPT4月10日 公司將全力推進“昆侖天工”系列模型的研發與迭代升級,即將推出對標ChatGPT的雙千億級大語言模型“天工”3.5,并定于4月17日啟動邀請測試萬興科技300624.SZ2月13日 公司旗下海外視頻創意軟件Wondershare Filmora接入OpenAI,用戶在創作視頻時,可自由調用OpenAI的AI繪圖功能,一鍵即可生成圖片素材2月14日公司旗下萬興愛畫推出“AI簡筆畫”新功能,成為全球首款交互型“圖生圖”AI繪畫軟件,支持AI文字繪畫、AI以圖繪圖、AI簡筆畫三種模式,用戶只需簡單描摹幾筆,“人機共創”5秒內便可繪出一
89、幅高品質畫作3月11日 公司已有商用賬號開通GPT4的API接口;浙文互聯600986.SH 3月20日公司旗下元宇宙藝術創作社區米塔數字藝術利用Stable Diffusion模型支持AI繪畫和手動繪畫兩種模式;公司自主研發并孵化“君若錦”“蘭 Lan”兩位虛擬形象,為東風風光mini定制的虛擬人“可甜”已交付使用Diffusion神州泰岳300002.SZ2月14日子公司鼎富智能已在語言理解、語音合成、語音識別等方向應用Transformer自研的預訓練語言模型公司在NLP領域積累了較為深厚的技術,已研發出語音機器人、文本機器人等產品3月4日 公司的文本機器人、語音機器人等能夠結合上下文信
90、息,理解用戶意圖,進行多輪問3月28日 AI領域公司擁有的關鍵技術包括預訓練語言模型、數據增強、算法的運用、語音合成等利歐股份002131.SZ 3月22日公司在集團內網搭建AI平臺,自己做原生模型,采用Diffusion開源的底層大模型,在此基礎上架構Lora模型,并對模型進行訓練實現定制和效果微調,生成更符合設計師要求、品牌調性的內容。目前產品奇思妙想(奇思為文字生成產品,妙想為圖片生成產品)已在測試階段Diffusion視覺中國000681.SZ 3月23日公司旗下VCG.com網站推出首個AIGC應用產品AI智能搜索(Beta版),使用多模態、自然語言理解以及知識圖譜等人工智能技術,可
91、為新聞稿件、創意文案、新媒體推文、教師課件等內容高效配圖當虹科技688039.SH 3月30日公司與咪咕視頻發布跨模態AIGC產品,能以靜態照片生產三維體積視頻,并在不同模態之間相互切換。體積視頻可以讓用戶在任何位置、任何方向自由地觀看,可應用于體育賽事、大型綜藝6DOF直點播以及出行元宇宙等場景網達軟件603189.SH2月3日網達視頻實時智能云剪系統,可以邊直播、邊錄制、邊剪輯,具有集錦自動制作、智能封面提取、熱點視頻自動制作、圖集快速制作、智能字幕剪輯等功能,在重大賽事中取得了非常良好的應用效果2月16日公司可對媒資內容進行視頻結構化分析,實現自動打點、自動標注、自動快剪、自動人物集錦等
92、功能,以減少了人工標注的工作量;實現了智能場景分析,智能抽圖截圖,智能實現情節分段,完成媒資的智能編目工作圖表圖表3333:AI+AI+內容創作領域上市公司布局內容創作領域上市公司布局334.7.2 上市公司上市公司AI領域布局:領域布局:AI+游戲游戲AIGCAIGC應用:目前內容創作、游戲、影視、電商、營銷為較早應用應用:目前內容創作、游戲、影視、電商、營銷為較早應用AIAI的領域,可利用的領域,可利用AIAI技術賦能文字、圖片、視頻內容的創作。技術賦能文字、圖片、視頻內容的創作。2.AI+2.AI+游戲主要應用在:游戲主要應用在:1 1)賦能)賦能PGCPGC,降低生產成本、提升游戲研發
93、效率:,降低生產成本、提升游戲研發效率:AI賦能劇情生成及動畫生成系統、語音互動、美術創作(圖片生成、游戲NPC生成、原畫設計等)、玩法設計等環節;2 2)賦能)賦能UGCUGC,提升內容豐富度:,提升內容豐富度:AI賦能玩法、地圖、身份技能、皮膚等UGC創作;3 3)賦能運營環節:)賦能運營環節:包括投放買量、游戲營銷、社區運營(AI自動生成攻略、頭像、表情包等)、智能游戲主播等等運營環節。建議關注:三七互娛、吉比特、湯姆貓、凱撒文化、電魂網絡、巨人網絡、盛天網絡。建議關注:三七互娛、吉比特、湯姆貓、凱撒文化、電魂網絡、巨人網絡、盛天網絡。公司名稱公司名稱股票代碼股票代碼日期日期公司業務對公
94、司業務對AIGCAIGC技術的應用技術的應用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型湯姆貓300459.SZ3月1日公司已嘗試應用ChatGPT模型進行AI語音互動產品功能原型測試,并已將湯姆貓IP形象植入產品功能原型當中,加入語音識別、語音合成、性格設定、內容過濾等功能Diffusion3月23日 公司海外美術團隊已在局部美術創作中使用Stable Diffusion進行美術創作凱撒文化002425.SZ3月1日 公司在AI視頻圖像和深度學習等領域和上海交大合作,積極攻關研發劇情動畫生成系統3月6日 代號“動物星球”游戲項目
95、會用到AI相關技術電魂網絡603258.SH 3月10日 目前公司已在部分在研游戲的研發過程中應用AI圖片生成及AI對戰博弈等AI技術巨人網絡002558.SZ2月21日公司將接入百度人工智能新產品“文心一言”,運用到游戲營銷、游戲NPC以及游戲原畫設計等游戲業務應用中3月21日公司旗下品牌“腦白金”正式推出老頭老太首個數字人形象,并與集團內的征途IP達成戰略合作,相關數字化資產將在原始征途的數字化營銷領域開展應用。3月24日公司旗下太空行動與百度文心一言聯合推出首個國產AI生成的手游形象“太空鯊”,用戶進入百度“涂鴉一格”微信小程序,通過自定義關鍵詞可以為其設計專屬形象;太空行動將進一步依托
96、百度AI技術賦能玩法、身份技能、皮膚等多元化UGC創作3月28日已經在積極推動相關工具在游戲NPC、原畫設計、玩法設計、游戲營銷等業務場景的應用,未來將繼續加大“游戲+AI”的投入盛天網絡300494.SZ3月5日盛天網絡打造了通過聲音社交的平臺“帶帶電競”,通過聲音鑒別技術分析用戶音色、性別、年齡,結合用戶興趣、行為標簽構建用戶多維畫像,進行深度學習和協調精準過濾等十幾種算法結合智能推薦給用戶精準內容服務和社交匹配用戶圖表圖表3434:AI+AI+游戲領域上市公司布局游戲領域上市公司布局資料來源:各公司互動平臺,華安證券研究所整理344.7.3 上市公司上市公司AI領域布局:領域布局:AI+
97、視頻視頻AIGCAIGC應用:目前內容創作、游戲、影視、電商、營銷為較早應用應用:目前內容創作、游戲、影視、電商、營銷為較早應用AIAI的領域,可利用的領域,可利用AIAI技術賦能文字、圖片、視頻內容的創作。技術賦能文字、圖片、視頻內容的創作。3.AI+3.AI+視頻領域應用包括:視頻領域應用包括:1 1)內容制作:)內容制作:影視劇本創作、AI換臉及換聲、場景及分鏡制作、數字人模擬虛擬角色、預告片剪輯、特效處理、配樂等2 2)內容宣發與運營:)內容宣發與運營:AI海報制作、渠道運營、內容宣發等3 3)IPIP版權庫:版權庫:影視公司手握充足IP版權,AI降低內容創作門檻的背景下,IP版權價值
98、有望迎來價值重估建議關注:華策影視、光線傳媒、上海電影、奧飛娛樂。建議關注:華策影視、光線傳媒、上海電影、奧飛娛樂。公司名稱公司名稱 股票代碼股票代碼日期日期公司業務對公司業務對AIGCAIGC技術的應用技術的應用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型華策影視 300133.SZ2月11日公司設立科技數字增長中心,推進正版影視素材庫、版權系統建設與升級、數字資產管理系統等的建設;公司已開通了ChatGPT的使用權限2月15日宣布成為百度“文心一言”首批生態合作伙伴,文心一言將在影視生產全鏈路中協助進行內容制作、內容宣發等,優
99、化中后臺工作等4月3日公司已全面接入百度文心一言,將充分利用 AIGC技術提升影視行業全管線效率,包括影視劇本創作、AI 換臉及換聲、場景及分鏡制作、數字人模擬虛擬角色、預告片剪輯、特效處理、AI 海報制作等未來將構建中國最大的影視素材版權運營平臺,已打造完整的版權運營管理平臺,正版視頻素材版權庫“華策元視界”已擁有574個在存IP,包括33部電影、34部網絡電影、248部電視劇,版權數量合計約3萬小時;在版權管理上建立了可確權可持續售賣的資產管理系統光線傳媒 300251.SZ3月20日公司已在內部部署對AI技術的探索式實踐,已參與百度文心一言的測試;海外動畫制作團隊已在摸索ChatGPT在
100、業務上的應用Diffusion3月22日光線傳媒官宣將推出動畫電影去你的島,并放出首張海報。去你的島的制作將有大量AI技術深度參與,僅影片的首張宣傳海報,就用到了圖片生成AI工具Midjourney、Stable Diffusion以及最新發行的GPT-4模型,輔以人類設計師給出的設計理念和關鍵詞生成上海電影 601595.SH3月7日上海電影擬收購上影元文化51%股權,上影元文化具有眾多IP:包括上美影的大鬧天宮葫蘆兄弟黑貓警長的獨占許可以及中國奇譚小蝌蚪找媽媽等普通許可,還有上影集團的廬山戀阿Q正傳的獨占許可4月11日上海電影集團有精品內容、大IP開發、數字化轉型三大核心戰略。轉型方面,A
101、I繪畫等對原創IP的開發有著推進作用,公司正積極推進類似AI、ChatGPT新技術和公司戰略間的融合。奧飛娛樂 002292.SZ2月27日公司把“超級飛俠”“巴啦啦小魔仙”等知名IP形象打造為虛擬偶像,應用場景包括客串電視臺晚會嘉賓、駐場線下活動參與互動、線上參與帶貨助播等計劃在今年推出“颶風戰魂:劍旋陀螺”下半部、“超級飛俠”第十四季和第十五季、“喜羊羊與灰太狼”系列劇集及全新恐龍IP動畫片等;“超級飛俠”首部大電影及“貝肯熊3”等動畫電影計劃在今年內上映3月26日 公司參股光年無限,其產品為AI對話機器人產品,開發者可自行快速接入并創建個性化機器人資料來源:各公司互動平臺,華安證券研究所
102、整理圖表圖表3535:AI+AI+視頻領域上市公司布局視頻領域上市公司布局354.7.4 上市公司上市公司AI領域布局:領域布局:AI+電商電商AIGCAIGC應用:目前內容創作、游戲、影視、電商、營銷為較早應用應用:目前內容創作、游戲、影視、電商、營銷為較早應用AIAI的領域,可利用的領域,可利用AIAI技術賦能文字、圖片、視頻內容的創作。技術賦能文字、圖片、視頻內容的創作。4.AI+4.AI+電商主要應用在:電商主要應用在:1 1)導購類:)導購類:類比Shopify,采用AI聊天對話模式為用戶提供導購服務、精準推薦、人工智能選品;2 2)工具類:)工具類:包括自動生成商品文本描述及智能客
103、服;3 3)營銷類:)營銷類:圖文和視頻廣告素材制作、廣告語智能輸出、廣告智能投放及搜索引擎優化等業務。建議關注:返利科技、焦點科技、吉宏股份、聯絡互動、華凱易佰、值得買。建議關注:返利科技、焦點科技、吉宏股份、聯絡互動、華凱易佰、值得買。公司名稱公司名稱股票代碼股票代碼日期日期公司業務對公司業務對AIGCAIGC技術的應用技術的應用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型返利科技600228.SH2月10日ChatGPT等新人工智能技術方案的部署在內測中,功能包括:精準推薦、自動比價、智能問答和交互式導購(7*24小時的在線
104、客服服務)等3月21日 公司與OpenAI的接口已升級至GPT 4.0版本,并組織技術團隊進行導購領域的產品開發3月20日推出基于ChatGPT的電商導購APP“如意”,采用AI聊天對話模式為用戶提供導購服務,尚未正式上線焦點科技002315.SZ3月24日 公司研發端已接入ChatGPT,運用于商品文本描述自動生成、智能客服等業務方向4月4日公司研發端目前接入的是CHATGPT 3.5Turbo,GPT4正在接入審核中吉宏股份002803.SZ3月17日公司23年1月接入ChatGPT的API接口賦能跨境電商業務,功能包括人工智能選品、圖文和視頻廣告素材制作/廣告語智能輸出、廣告智能投放、智
105、能客服回復等3月28日 公司已申請接入openAI的plugin聯絡互動002280.SZ3月31日子公司Newegg已接入OpenAI Api接口,用于PC Builder購物工具、優化Newegg網站的文本內容、智能客服、搜索引擎優化等業務中,目前處于測試運營階段光云科技688365.SH3月20日公司旗下客服機器人快麥小智是針對全類目電商,基于自然語言處理和個性化推薦技術所搭建的電商智能客服產品華凱易佰300592.SZ3月27日公司自主研發的智能應用系統有效提升了公司核心業務環節的運營效率和單位人效,包括調價、刊登、推廣、備貨四個環節值得買300785.SZ2月8日公司具有基于機器學習
106、的AI推薦系統,包括根據用戶畫像提供個性化的推薦信息、根據特定文章提供推薦文章和商品信息、根據特定商品提供相似產品推薦和文章信息2月15日公司已建立包含大量商品內容和用戶行為的大數據庫及用于千人千面推薦算法的精準用戶畫像,自2017年公司就嘗試通過算法和機器的方式生產內容,并稱為MGC(Machine-Generated Content),2021年MGC占比為18.97%資料來源:各公司互動平臺,華安證券研究所整理圖表圖表3636:AI+AI+電商領域上市公司布局電商領域上市公司布局364.7.5 上市公司上市公司AI領域布局:領域布局:AI+營銷營銷AIGCAIGC應用:目前內容創作、游戲
107、、影視、電商、營銷為較早應用應用:目前內容創作、游戲、影視、電商、營銷為較早應用AIAI的領域,可利用的領域,可利用AIAI技術賦能文字、圖片、視頻內容的創作。技術賦能文字、圖片、視頻內容的創作。5.AI+5.AI+營銷領域應用包括:營銷領域應用包括:1 1)賦能內容及創意生成(文生文)賦能內容及創意生成(文生文/文生圖):文生圖):通過文本對話模式完成策劃案撰寫、品牌slogan批量輸出、模板海報生成等工作2 2)賦能策略生成:)賦能策略生成:AI賦能行業分析、投放策略等建議關注:易點天下、藍色光標、風語筑、天地在線。建議關注:易點天下、藍色光標、風語筑、天地在線。公司名稱公司名稱股票代碼股
108、票代碼日期日期公司業務對公司業務對AIGCAIGC技術的應用技術的應用是否接入是否接入ChatGPTChatGPT/GPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型易點天下 301171.SZ3月23日公司基于AI能力的CyberCreative創意平臺實現了多項前沿技術的商業化測試,包括視頻人臉融合、多圖視頻生成、文本+綠幕生成多語種視頻、單文本生成數字人多語種視頻等3月27日公司已接入文心一言和CHATGPT,GPT4正在等待接入;公司配備了專業的團隊針對ChatGPT的語料輸出,進行二次訓練,與廣告業務場景相結合藍色光標 300058.SZ2月21日銷博特公測“蕭助理”移動
109、端Beta版本,將聊天機器人程序與銷博特AIGC輸出能力結合,通過文本對話模式,用戶可完成策劃案撰寫、品牌slogan批量輸出、模板海報生成等工作申請中3月9日公司旗下藍標傳媒宣布與Microsoft廣告達成戰略合作,成為中國區官方代理商3月16日 藍標已在申請接入GPT-4;公司作為微軟的ISV(獨立軟件開發商)后,會跟微軟產出聯合解決方案風語筑603466.SH2月14日 正在嘗試將公司打造的數字人接入ChatGPT以強化數字虛擬人的場景識別和更新能力3月16日已與百度簽署戰略合作協議共同探索并推進AIGC在文字、圖片、音視頻以及虛擬人、虛擬空間模型生成等3D內容場景的模型訓練、落地應用和
110、模型優化;公司基于文心大模型ERNIE和Stable Diffusion打造擊鼓舞獅的AI交互體驗天地在線 002995.SZ2月7日公司參股的虛擬技術提供商世優科技已將ChatGPT技術接入數字人產品當中,正在通過數字人自身的人設背景等相關數據集,基于OpenAI形成數字人專有大腦形成人性化模型。2月23日旗下子公司啟元天地自主研發的元宇宙虛擬數字商業綜合體“無限盒子”APP正式上線,是一款支持pc、vr、app、web等全終端接入使用產品,并具備AI序列化生成3d城市建筑、優化渲染技術,可快速并輕量化生成客戶元宇宙空間場景3月16日公司技術團隊已掌握包括建模、驅動和渲染等多項核心技術,硬件
111、設施方面已配備了白/綠箱數字影棚、廣播級演播室系統,光學&慣性動作捕捉設備等專業級軟硬件設施,在虛擬數字人和虛擬內容打造方面已形成了一套較為完善的技術操作流程和服務體系。3月22日公司目已在內部嘗試將ChatGPT與自身廣告業務場景做結合,輔助廣告創意、營銷內容創作、營銷方案生成等;公司正在持續關注品牌營銷、數字人、數字資產創造等方面與ChatGPT等模型的整合應用3月29日已在內部嘗試應用GPT-3.5模型,輔助業務團隊完成在行業分析、投放策略、廣告素材創意等環節的工作資料來源:各公司互動平臺,華安證券研究所整理圖表圖表3737:AI+AI+營銷領域上市公司布局營銷領域上市公司布局374.7
112、.6 上市公司上市公司AI領域布局:其他(如數字人、領域布局:其他(如數字人、AI內容檢測等)內容檢測等)AIGCAIGC應用:目前游戲、創作、電商、營銷為較早應用應用:目前游戲、創作、電商、營銷為較早應用AIAI的領域,可利用的領域,可利用AIAI技術賦能文字、圖片、視頻內容的創作。技術賦能文字、圖片、視頻內容的創作。6.6.其他其他AIAI應用包括:數字人(用于直播、主持、代言等)、應用包括:數字人(用于直播、主持、代言等)、AIAI內容檢測等。內容檢測等。建議關注:天娛數科、捷成股份、遙望科技、新華網、博瑞傳播、人民網。建議關注:天娛數科、捷成股份、遙望科技、新華網、博瑞傳播、人民網。資
113、料來源:各公司互動平臺,華安證券研究所整理圖表圖表3838:數字人、:數字人、AIAI內容檢測上市公司布局內容檢測上市公司布局類型類型公司名稱公司名稱股票代碼股票代碼日期日期公司業務對公司業務對AIGCAIGC技術的應用技術的應用是否接入是否接入ChatGPT/GPTChatGPT/GPT是否接入是否接入文心一言文心一言其他模型其他模型數字人天娛數科002354.SZ3月1日公司接入ChatGPT,并結合自研多模態智能算法,完成了AIGC互動直播功能的落地3月8日公司虛擬數字人已接入ChatGPT模型,GPT-4的正式接入正在申請中;目前公司采用的算法包括但不限于人臉擬合動態背景生成、表情驅動
114、、TTS等捷成股份300182.SZ2月1日參股子公司世優科技數字人已接入chatGPT,正在通過數字人自身的數據集訓練數字人專有大腦形成個性化模型2月14日世優科技數字人“阿央”已接入正在開發的ChatGPT微信小程序世優數字人元宇宙,接入ChatGPT后的數字人將進行實時內容解答,未來計劃重點嘗試在智能客服、電商、虛擬主播等領域拓展業務3月8日公司作為新媒體影視版權運營商,正嘗試將公司IP角色引入世優科技的虛擬技術中;世優科技的數字人已接入chatGPT并進行訓練,未來擬應用于線下展廳的AI講解介紹數字人、線上AI主播、AIGC快速短視頻系統等遙望科技002291.SZ4月3日公司在數字虛
115、擬人IP、數字化場景構建等方向上有規劃與布局,公司數字虛擬人孔襄是目前市場承接廣告代言最多的數字虛擬人之一;為提升直播業務中用戶的沉浸式體驗,公司直播中使用了較多的虛擬數字場景新華網603888.SH3月10日公司旗下新華智云發布元卯“極速數字人API”,在媒體、文旅、會議會展、金融等領域都有廣泛應用,例如數字主播、文化IP、代言人IP、游客數字分身等博瑞傳播600880.SH2月24日公司參股的成都每經傳媒有限公司旗下的虛擬主播是與微軟小冰合作的,目前已實現AI寫稿、信息抓取生成稿件及虛擬主播報播的功能。每日經濟新聞已作為文心一言首批合作伙伴3月23日公司參股的成都每經傳媒有限公司通過與紅棉小冰公司合作了包括AI電視、“虛擬主播”等項目,推出了應用數字孿生技術的虛擬主持人N小黑和N小白,并于2021年12月上線了7x24小時不間斷播出的每經AI電視。AI內容檢測人民網603000.SH3月1日國內首個AI生成內容檢測工具AIGC-X開始公測,可快速區分機器生成文本與人工生成文本,從而檢測出AI技術生成的假新聞、內容抄襲、垃圾郵件,在內容版權、網絡釣魚、虛假信息和學術造假檢測等內容安全、內容風控方面有廣闊的應用前景。未來,AIGC-X還會擴展為對人工智能生成文本、圖像乃至視頻的通用智能識別模型