1、CKT.CN客創客貼2023AIGC產業發展及應用白皮書創客貼AIGC創意研發中心體設資研報騰訊云360億方云A學語智維事萬興噴影論文暢七麥數據天地在線#page#客創客貼PREFACE-前言-在當今數字時代,AI生成內容(AIGC)已經成為數字娛樂、商業營銷和學術研究等領域的熱門話題。隨著人工智能技術的不斷發展越來越多的領域開始應用AI技術,其中之一就是內容生成領域。AIGC(Algeneratedcontent)作為其中的一種技術手段,已經在新聞、廣告、文學創作等領域得到了廣泛的應用。通過訓練好的神經網絡模型,AIGC可以自動化地生成各種形式的內容,比如文章、視頻、音樂等。這種技術的應用,
2、既可以提高生產效率,又可以降低制作成本,同時還可滿足不同客戶的個性化需求。StableDiffusion、DALL-E2、Midjourney等可以生成圖片的AIGC模型引爆了AI作畫領域,AI作畫風行一時,標志人工智能向藝術領域滲透。2022年12月,OpenAI的大型語言生成模型ChatGPT刷爆網絡,它能勝任高情商對話、生成代碼、構思劇本和小說等多個場景,將人機對話推向新的高度,讓網友們不禁懷疑ChatGPT是否已具有人類智能。全球各大科技企業都在積極擁抱AIGC,不斷推出相關的技術、平臺和應用。創客貼2023AIGC產業發展及應用白皮書聚焦于AIGC與數字內容領域的融合應用,討論新一代
3、人工智能技術的革新及其背后的商業價值。同時,白皮書也將基于對AIGC行業的洞察,分析其將會如何改變內容產業的進化模式,會對現有企業和商業模式帶來哪些機遇及沖擊。#page#客創客貼CONTENTS-目錄-AIGC演進歷程及現狀AIGC引領數字化變革0201ThedigialcontenHistoriclandPresentindustrAIGC應用場景及案例面臨問題及未來超勢0304AppllicationScenariosancases#page#創客貼AIGC演進歷程及現狀Historical and Present Situation#page#1.1AIGC發展歷程:從萌芽到沉淀積累客
4、創客貼受限于科技水平受限于算法瓶頸AIGC僅限于小范圍實驗無法直接進行內容生成1950s-1990s早期萌芽19905-2010s沉淀積累1950年1957年2007年2012年1966年艾倫圖靈提出著世界第一款可人第一支由計算機世界第一部完全微軟展示全自動同名的“圖靈測試聲傳譯系統可將英機對話的機器人創作的弦樂四重由人工智能創作給出判定機器是否“Eliza”問世奏依利亞克組的小說IThe文演講自動翻譯為具有“智能”的試曲完成Road問世中文語音驗方法#page#1.2AIGC發展歷程:進入快速發展階段客創客貼深度學習算法不斷送代,人工智能生成內容百花齊放效果逐漸通真至難以分辯2010s-20
5、22年快速發展階段2016年2017年2017年2017年2019年2020年2020年2021年lanj.“小冰”推出英偉達發布人工智能生成DeepMind發布伯克利的PieterOpenAI推出了OpenAI推出GPT-3擁有超過DALL-E應用于文Goodfellow世界首部StyleGan模型畫作在佳士得DVD-GAN模Abbeel等人提出100%由人工可自動生成高以43.25萬美元1750億的訓練參本與圖像交互生成提出生成對型用以生成連續去螺擴散概率模型數量,被譽為萬能內容,同年將跨??咕W絡GAN智能創作的詩質量圖片,幾成交,成為首視頻(DDPM)生成器集陽光失了個月后發布了個出售的
6、人工態深度學習模型玻璃窗智能藝術品CLIP開源StyleGan2應用在圖像及Transformer在圖像生成方面文本生成迎來重CLIP模型接集了語音生成中架構推動深度比GAN更優,大突破,GPT-3大量數據,為輸入學習算法突破擴散模型威望大不僅能答題、寫文本生成圖像/視發展,進發出幅提升論文和生成代碼頻應用的落地美定大模型等,還能編寫曲了基礎譜、寫小說等#page#1.3內容生產方式的進化客創客貼AIGC全稱為AI-GeneratedContent,指基于生成對抗網絡GAN、大型預訓練模型等人工智能技術,通過已有數據尋找規律,并通過適當的泛化能力生成相關內容的技術。主要指基于AI生成的文字、圖
7、像、音頻等。從字面意思上看,AIGC是相對于過去的PCGUCG而提出的。因此,AIGC的狹義概念是利用AI自動生成內容的生產方式,但是AIGC已經代表了AI技術發展的新趨勢。過去傳統的國維我工工Y“要多其士用長事中解要一女可要“需士回是工而不是僅僅局限于分析已經存在的東西,實現了人工智能從感知理解世界到生成創造世界的躍遷。從商業模式來看,AIGC本質上是一種AI賦能技術,能夠通過其高通量、低門檻、高自由度的生成能力廣泛服務于各類內容的相關場景及生產者。因此,我們不會將其定義為PGCUGC之后的新內容創作模式,而是認為其在商業模式上會有大量其他交叉內容生產單人體驗元宇宙小范圍互動AI技術未取得產
8、能不足內容質量參差關鍵性突破自然社交網絡數量PGCUGCAIUGCAIGC#page#2.1對傳統內容生成模式的顛覆與重塑客創客貼Web3.0Web 1.0Web 2.0內容消費者初次內容消費者二次內容加了工者專業人員加專業設備生產數量多生產內容數量多生產數量有限無法自動化質量有限且無法自動化質量有保障且自動化模糊推送精準推送精準推送用戶主動檢索用戶主動檢索用戶主動檢索#page#2.2AIGC加速元宇宙世界的內容構建客創客貼Web 1.0Web 2.0Web3.0個體體驗復合體驗沉浸體驗單向交互雙向交互場景沉漫決策式AI決策式AI生成式AI文字、圖片、視頻文字、圖片、視頻元宇宙#page#客
9、創客貼3.1AIGC中的算法和技術進步AIGC的爆發得益于算法技術進展,其中包含對抗網絡、流生成模型、擴散模型等等深度學習算法。各類算法功能分別覆蓋了數各部分數據權重的選擇、從噪聲中構建數據樣本、不同語言文本翻譯、圖像文字特征值匹配等等。在多模態的技術支持下,目前預訓練模型已經從單一的NLP或CV模型發展到了多種語言文字、圖像、音視頻的多模態模型。2021年0penAI團隊發布了AI繪畫產品DALLE,城十OH“斜圖學國刻簽長我是壓要推動的生成算法和預訓練模型創新,進而形成了參數豐富、訓練量大、生成內容穩定高質量的流水線。AIGC預訓練模型串聯融合GANCLIPDiffusionTransfo
10、rmer#page#3.2機器對信息認知的三階段客創客貼機器對信息的認知處于第一或第二階段。人在遇到新問題時,會通過以往類似經歷總結規律,并將新的問題套用到規律中,以推測可能的結果。相應地,機器學習基于對歷史數據的歸納和學習,構建出事件模型,并將合適的新數據輸入到相應的模型來預測未來。人類能夠超越觀察達到干預及想象階段,而對于AI來說,目前還處于第一或第二階段,一些復雜的信息還沒辦法處理,人類需要將其簡化后再投喂給機器處理。用戶不再滿足于專業團隊和用戶創造,對內容質量要求更高,AI在提高內容生產效率、豐富內容多樣性及提供更加動態且可交互的內容上大有可為。UGC生成的規?;瘍热?,創造了大量學習素
11、材,幫助AI實現從學習經驗到超越并重構已有經驗的飛躍性轉變。人腦的思考過程機器的學習過程階段一:對外界環境進行觀察,在觀察中尋找規律數據經驗階段二:對外界環境進干預,在改變中尋找規律階段三:在想象中對外界環境進模型數據問題規律屬性解決行干預,在反事實中尋找規律#page#3.3AIGC技術架構體系的變遷客創客貼人工智能從出現到現在已經歷四個階段,第一個階段的AI是以邏輯推理為主,AI能力以聚焦決策和認知為主;第二個階段的AI則是注重以概率計的建模、學習和計算為主,AI能力開始聚焦感知、認知和決策;第三個階段的AI聚焦學習環節,注重大模型的建設,AI能力覆蓋學習和執行第四個階段則聚焦執行與社會協
12、作環節,開始注重人機交互協作,注重人類對人工智能的反饋訓練,當下正處于此階段。過去AI技術當下Al技術未來AI技術應用層應用層應用層算法層中間層模型層操作系統層基礎層框架層平臺層芯片層芯片層算力層#page#創客貼AIGC引領數字化變革The digitalcontentindustry#page#1.1披起全領域內容生產力革命客創客貼隨著ChatGPT的出現,其出色的生成能力已經開始影響一部分人解決問題的習慣?,F實的應用場景已經出現。目前AIGC很典型的應用是利用自然語言描述作為輸入生成各種模態的數據,包括:文本、代碼、圖像、語音、視頻、3D模型、場景、音樂等。由這些基本模式的生成任務可以衍
13、生出各種各樣豐富的應用場景。隨著AIGC技術的發展和人們想象力邊界的擴展,這些場景還將繼續增加。市場營銷文本到圖像生成銷售郵件SQL游戲通用寫作媒體廣告設計音樂筆記記錄網頁應用開發者人聲合成視頻生成3D建模代碼圖像語音視頻08其他文本GPT模型TabnineDALL-E模型OpenAI模型X-CLIP模型TBD模型TBD模型OPT模型模型StableAL2模型DiffusionBloom模型#page#1.2生成式AI如何改變我們的未來?客創客貼“AIGC+新聞”:AIGC參與滲透新聞產品滲透的全過程;剪輯環節,通過使用視頻字幕生成等工具節省人力時間成本,最大化版權價值;傳播環節,AIGC應用
14、于以AI合成主播為核心的的新聞報道領域,帶來更好的視覺化體驗,大幅提高生產力?!癆IGC+影視”:前期的劇本方面,Al通過對海量劇本數據進行分析、歸納,按照預設風格快速生產劇本,縮短創作周期的同時。拍攝期間,AIGC通過合成臉與合成場景,打破了物理場景的限制,拓寬了作品想象力的空間?!癆IGC+娛樂”:借助于AIGC技術,通過趣味性圖像和視頻的生成、打造虛擬偶像、開發C端數字化身等方式,娛樂產業拓寬了自身的輻射邊界。AIGC+新聞:新聞傳播AIGC+影視:影視剪輯AIGC+娛樂:虛擬偶像快現#page#1.3更個性和多維的內容生成方式客創客貼不僅是降本增效,更是個性化內容生成。AI不僅能夠以優
15、于人類的制造能力和知識水平承擔信息挖掘、素材調用、復刻編輯等基礎性機械勞動,從技術層面實現以低邊際成本、高效率的方式滿足海量個性化需求。根據Sequoiacap數據,近年來AI模型在手寫、語音和圖像識別、閱讀理解和語言理解方面的表現逐漸超過了人類的基準水平,而且AI讓所有人都能夠成為“藝術家”,可無時無刻生成更有創造力、更個性化的內容。通過支持AI生成式內容與其他產業的多維互動、融合滲透從而孕育新業態新模式,為各行業創造新的商業模式,提供價值增長新動能。生產成本大幅下降生產效率顯著提升HAI生成方式創建內容內容質量與穩定性到較高水準傳統方式創建內容展現形式愈加豐富交互性大幅提高消費者體驗提升明
16、顯內容價值不斷攀升#page#1.4成本更低,效率更高,大幅度提升生產力創客貼內容生產,特別是創意工作,一向被認為是人類的專屬和智能的體160S現。如今,AI正大步邁入數字內容生產領域,不僅在寫作、繪畫工程用“,管心用業55%非凡創意潛能。這將塑造數字內容生產的人機協作新范式,也讓內72S經位“提,展長擇,露盡駛限展都學石購內容創意。人+Al數字內容邁入強需求、視頻化、拼創意的螺旋式升級周期,AIGC在人+AI和人完成一段代碼撰寫的時間對比(單位:秒)這階段的發展迎合了這一需要。從全球來看,人們在線的時間持續增長,在線新聞、音樂、動漫、影視、文學、游戲的市場規模仍在上升。同時,數字內容消費的結
17、構也正轉型升級,從以圖文為主過生成式AI人度到視頻為主,視頻在網絡流量中的占比不斷上升。短視頻和直播的流行,在生產側,讓原本需要長制作周期的視頻變成了可以源源成本¥300¥0.2不斷產出的“工業品”;在消費側,過往需要高注意投入、反復觀看“四章四票,名十,教一答都導名時間5小時(1分鐘是核心,仍舊稀缺,需要新的模式輔助創作者持續產生、送代和驗證創意。種種因素,都需要更加低成本、高效能的數字內容生產新人和AI在完成圖片模型的成本時間對比方式。#page#2.1“從無到有”的媒體內容生成能力客創客貼新事“我解心答心工層,用留聯“融書X內容的生產。AIGC技術使得機器可以在內容生產過程中盡量實現“自
18、動化”,減少人的工作量:AIGC技術進步使得機器越來越走向“自動化”,實現了“從無到有”生產人生產內容機器輔助審核機器輔助加工機器自動生產內容機器高強度生產全自動生產內容生產人生產人生產人生產人和機器生產人和機器機器果集生產加工生產人生產人生產人和機器生產人和機器機器機器淺透率主體南核機器機器機器生產人生產人和機器生產人和機器梁集受限部分受限受限受限部分受限不受限機器受限受限加工部分受限部分受限不受限不受限生產力生產力審核不受限不受限不受限受限部分受限部分受限素材上傳,存儲,分類內容審校智能標題抓取線上數據自動生成數據利用在線批注,修改文字規范自動摘要分析原始數據#page#2.2內容生產方式
19、從“作坊式”走向“流水線專創客貼最終價值:生產力顯著提升,生產關系逐步發生變化AIGC重構了作業環節的勞動力(生產時間變化所致)與流程工作流程及規范發生改變物質資料(能耗、技術等)分配:生產力的發展會促使新的生產關系的出現間接價值:人與人之間,人與機器之間的交互效率提高AIGC解決了工作過程中交流的核心矛盾:交互環節中面交互對文字風格、圖片、視頻等等無法用語言進行準確描述基于內容的交流效率大幅提升的環節,都可以采用快速生成的內容進行直接溝通,顛覆了溝通方式直接價值:內容的生成成本下降,生成效果提升AIGC解決了內容創作效率的核心矛盾:環節中始終存在內容大量個性化的重復性工作,內容創作的門檻及成
20、本皆源各類內容形態的生產時間大幅降低于此。AIGC可以在部分環節實現“工程化”的工作模式#page#3.1文本生成已實現大范圍的商業落地客創客貼文本生成是AIGC實現商業落地最早的技術之一,技術發展顯著提高了對于上下文的理解與承接能力、對常識性知識的嵌入能力、中長篇幅生成能力、生成內容的內在邏輯性等,文本生成迎來質的飛躍?,F有的落地場景主要集中在應用型文本生成、創作型文本生成,重點關注閑聊型交互文本生成。分類細分場景發展丸秀黑望代表企業特點Narrativescience首基于結構化數據或席技術官、聯合創始人較廣泛地實際應用湖舟科技、美聯社非交互型,大多為應用型公司財報撰寫、規范格式,在特定K
21、ristianHammond取得一定效果,技wordsmith、結構化寫作,有較文本生成新聞簡訊換寫等情景類型下的文本預言2030年90%以上Narrativescience強規律術還需進一步提升生成新聞由機器人完成具有更高的文本開底層技術原理基本非交互型,大多為Conversion.al、未來4-5年長文放度和自由度,需創作型劇情續寫、營銷文明確,長篇幅文字非結構化寫作,需本創作可能會有Snazzy Al Rasa.io要一定的創意和個本換寫等文本生成內部邏輯仍然存在Longshot.A等要一定的創意性化,對生成能力突破發展較明顯同題的技術要求更高虛擬伴侶、游戲中社交屬性,對自小冰公司、聆心
22、智能交互型,閑聊交互要求更高有一些落地應用1-2年內將有明的NPC個性化交互然語言理解要求OpenAl、理解力顯增長文本生成取得不錯成果更高心理咨詢等Latitude.io等#page#3.2ChatGPT引領熱潮,大廠加碼布局交互式文本套創客貼回田業回雅“可婚“HKILde工K用IVuadO日OELLO答,還能完成短文和詩歌創作、代碼寫作、數學和邏輯運算等任務,據Similarweb數據,ChatGPT推出僅2月平均日活超1,300萬,引發社會廣泛關注??萍季揞^亦加碼布局交互式文本,微軟在2023年1月追加投資OpenAl,未來還計劃將ChatGPT整合到旗下的搜索引擎Bing中;谷歌通過內
23、部研發與投資ChatGPT的競品Anthropic來應對挑戰。百度8a武家OpenAI變現主要依靠C端,在微軟加持下表現強勁主推B端,基于全棧優勢構建全鏈能力開發工具企業級云服務市場pluginsSuperAPP應用Maas垂類廠商fine-tuneCPT-3ChatGPT訂閱制行業樓型205/monthTOC能力獨立開發者微軟-0fficeBing一文心一言TOC能力框織模型API調用0.025/1000tokenCPT-4-飛獎MadsMicrosoft AzureGoogle拉動B端業務意圖明顯,多款模型能力形成組合拳在C端生態上,ChatGPT一方面通過“引進來”的方式,兼收上游插件增
24、強多種應用能力,打造superAPP吸納用戶:另一方面“走出去”,通過革新軟件交PESLaMDA搜索引擎引入chat互方式將用戶收入表中,從而實現完整的C端生態布局。TOC能力PaLMGoogle workspace在B端生態上,OpenAl通過合作微軟Azure,同接實現“模型即服務又通BertMaas過直接提供大模型API能力調用,服務小B開發者,勾勒日端生態維形Google cloud#page#3.3圖像生成:圖像屬性編輯已大規模落地客創客貼圖像生成領域的技術場景可以劃分為圖像屬性編輯、圖像局部生成及更改以及端到端的圖像生成。其中,前兩者的落地場景為圖像編輯工具,而端到端的圖像生成則對
25、應創意圖像及功能性圖像生成兩大落地場景。在圖像編輯領域已獲大規模應用落地,但由于圖像生成的復雜度遠高于文字,目前仍然難以達到穩定可靠的生成高質量圖像。場票內容現狀與展望代表企業圖片去水印、自動調整光影、設大量應用落地,初創公司眾多:未Photokit、Imglarger、圖像屬性圖像編輯工具置濾鏡、修改顏色紋理、復刻/來的突破點在于引流渠道和與技術Hotpot、Remove.bg編軒Skylum(MaskAl)修改圖像風格、提升分排率等流程掛鉤的產品使用體驗部分更改圖像部分構成(如英偉達難以直接生成高質量的完整圖像CycleGAN支持將圖內的班馬和馬進行圖像局部Adobe(InsetGAN)國
26、像編輯工具更改)、修改面部特征(Metaphysic但基于GAN的優化模型不斷發展生成修改英偉達(EditGAN)可調節自身題片的情結、年齡、微美目前也有部分應用落地等:以Deepfake為代表的圖像換臉)阿里鹿班、Deepdream創意圖像生成基于草圖生成完整圖像有機組端到端的底層技術原理基本明確,1-2年Generator、Rosebud.ai功能性圖像生成合多張圖像生成新圖像根據指圖像生成后規?;瘧肁l Gahaku artbre eder-海報、log0、模特圖等定屬性生成目標圖像等#page#3.4文本生成圖畫的可行性已被多款模型證明客創客貼2022年被稱為“AI繪畫“之年,多款模
27、型/軟件證明了基于文字提示得到效果良好的圖畫的可行性,OpenAI推出了GLIDE,是一種擴散模型,參數僅35億。支持CLIP引導(經訓練后的噪聲感知64x64VIT-LCLIP模型)和無分類器引導,支持部分P圖和送代生成。隨后為DiscoDlffusion,該免費開源項目搭載在Googlecolab上,需要一定的代碼知識,更擅長夢境感的抽象畫面,在具象生成和較多的描述語句上效果較差。隨后DiscoDiffusion的作者之一推出了AI繪畫聊天機器人Midjourney,該軟件搭載在Discord上,商業化和產品化更為成熟。太空歌劇院-Midjoumey生成DALLE自主生成圖像創客貼AIGC
28、平臺就設計行業而言,AIGC與創意設計深度碰撞融合、驅動內容生產機制革新的智能創作時代已經到來。近日,深耕創意設計領域的創客貼正式推出人工智能繪畫產品【AI畫匠】,依托近十年的設計行業專業沉淀與前沿的AIGC技術加持,為藝術家、創意者、設計師及普通大眾帶來更加智能、更富靈感的設計工具創新體驗#page#創客貼AIGC應用場景及案例Application Scenarios and cases#page#1.1AIGC創造價值的主陣地客創客貼直接生產可消費內容,有聲書、教學視頻等2B-在PGC領域實現內容創作工業化內容領域內容輔助生產工具2C-在UGC領域實現低門檔靈感轉化基于生成內容進一步變現
29、,NFT/個性化制造等相關業務個性化內容營銷,martech領域精準獲客新手段,分為圖像和文字合成數據生成,解決數據短缺及隱私泄漏問題延展領域基于復刻的個人永生/虛擬陪伴實時交互性內容,適用于游戲等領域服務于特定場景,如GameAI我們將AIGC產業劃分為內容領域和延展領域。內容領域是目前已經能夠、但并未有效實現商業化的領域,預估未來1-2年之內會有相對完整的產業生態發展。而延展領域,由于對AI生成的自由度和穩定性有更高的技術要求,在國內的應用落地相對內容領域會更晚。業界認為,由于能夠更加充分體現AIGC系統聯動及要素拆解兩大關鍵優勢,延展領域后期將成為AIGC創造價值的主陣地,提供AIGC的
30、想象空間天花板。#page#1.2AIGC的商業化潛力客創客貼由于AIGC目前產業化程度有限,大量業務場景尚未成功變現,我們目前尚無法對市場規模進行精準測算。在參考相關創作軟件、已有成功商業化案例、AIGC預估功能等因素的基礎上,我們對各細分場景的商業化潛力進行了如下估算?,F延展領域細分場景有內容領域細分場景合成數據生成需求成熟2B內容生產工具超個性化度2C內容生產工具內容生產實時互動內容個人永生直接生成內容服務特定場景虛擬陪伴基于生成內容進一步變現現有技術成熟度#page#2.1內容行業的內在需求是發展的利好條件專創客貼1.內容消費量增加,急需降低生產門檻,提升生產效率2.內容消費升維,消費
31、者要求更為豐富的感官體驗隨著相關內容消費硬件的提升,消費者對內容形態要求也會更高。從隨著內容消費的碎片化,對內容產出的多樣性有了更高要求,例如不2G時代的文字,3G時代的圖片,4G時代的視頻,以及5G時代將充同的宣傳物料,在不同的渠道/位置上都有特定的設計要求,需要區別分增長的直播,通信及硬件的持續增長使得主流的內容消費形態不斷生產,增加了內容總體的需求量。保證內容的持續供給,這一需求進變化,消費內容不斷升維。無論是更高質量的視頻或CG內容,還是入元宇宙會更加明顯,需要海量內容來填補數字世界內容的供給缺口預估將成為下一代主流的VR/AR內容,提供更加海量和豐富的感官體需要增加更多具有創作技能的
32、人,如軟件工程師、畫手等。這可以驗已經成為一種必然。通過提升原有人群的創作效率,賦能非專業人士3.內容生成個性化和開放化,用戶端表達意愿明顯上升4.元宇宙要求內容有新的自動生成機制此外,AIGC也和2022年的熱詞元宇宙緊密相關。據rctAI評價,元內容消費可能從內容本身,轉移到內容的參與者身上,參與者希望能宇宙需要永續性、自增長和大規模。特別是自增長,在沒有人力不夠對內容本身施加更多的影響。例如具有一定不可預測性,以及和個斷保證內容增長的時候,他需要有自己驅動發生的底層機制。要維人綁定的特殊情節/特征。在這種思路下二次內容創作的占比將有所持他不斷的成長,就一定需要一個背后的核心運行機制。過往
33、的游提升,內容在抵達每個個體時都需要通過工具進行二次改造和發散。戲策劃等人力崗位難以滿足這一需求,AI成為新的底層動力。#page#2.2內容生成類型輻射多個應用場景及行業客創客貼覆蓋行業內容類型內容形式應用場景文本處理:總結、續寫、改寫文字素材生成及加工:小說、稿件、劇本、文案、新聞資訊、營銷文字生成文本交互:閑聊、問答、咨詢基于文字內容的分析:策劃、思路靈感激發、熱點捕捉:傳媒人聲生成、語音克隆基于專業內容交互:客戶服務、心理咨詢、法律咨詢、教育咨詢.音頻生成音效生成基于娛樂的交互:游戲對話、閑聊互動、文字游戲影撫圖像編輯、修復、風格轉換基于商業服務的設計及修復:廣告海報、工業設計圖、建筑
34、圖、服裝設計圖像生成2D、3D圖像生成(AI繪畫)圖片素材的生成、影片的特效及轉制游戲圖像分析長視頻、短視頻的生成、修復、轉換撫頻生成視頻修復、風格轉換基于商業化的音樂制作:編曲、歌曲制作.超湖視頻特效(換臉、造景)變聲及配音.教育數字人生成數字形象的建立/模擬:游戲NPC、虛擬偶像、虛擬IP虛擬生成游戲場景生成數字場景的建立:游戲場景、影視特效、數字李生場景、地圖生成心理游戲邏輯及劇情關卡、劇情、對戰的生成、改編策路生成代碼編寫、信息系統應用的開發.對戰策略法律NPC“心智”(與環境的交互)專業領域的數據分析、報告生成.代碼生成代碼按需生成或補全數字形象直播醫療科研思路及靈感的激活修復代碼b
35、g工業蛋白質結構生成蛋白質結構預測#page#2.3AIGC實現了AI技術對各個行業的升級選代客創客貼營銷AIGC在內容成本的替代比率中國數字營銷規模數量級:10000億傳媒AIGC實現對細分行業內容生成而呈現的替代價值。例如,批量生成文案、圖片、視頻,直在原有產業規模上實現升級影視中國網絡視聽規模數量級:3000億接完成原有行業作業方式的方式替代可以帶動的產業價值游戲中國游戲市場規模量級:2600億2022AIGCAIGC在流程交互中的提升比率超您中國金融科技市場規模量級:5000IGCAIGC通過簡化行業的流程交互過程,從而提升了原行業的效率。例如通過智能客服完成提升營教育中國線上市場規模
36、量級:3000億銷過程中的效率及最終達成心理中國心理咨詢規模量級:3000億AIGC在產業模式的創新比率法律中國法律服務規模量級:1500億AIGC通過內容生成的多樣性,尤其是虛擬技術醫療中國線上問診規模量級:500億的應用(數字人、虛擬場景、3D建模等等)實現了行業內新的商業模式。例如通過快速構工業中國工業設計規模量級:5000億建數字員工實現數字勞動力的價值#page#3.1應用革命序幕拉開,應用滲透不斷加劇客創客貼以ChatGPT為代表的生成式AI讓每個人命令計算機解決問題成為了可能??蓪ιa工具、對話引擎、個人助理等各類應用,起到協助人、服務人甚至超越人的角色。憑借此革命性突破,Cha
37、tGPT在搜索引擎與各類工具軟件中率先擬起應用熱潮,引起了廣大用戶對ChatGPT相關技術的關注與學習。海量下游應用也因此捕捉到新的技術與產業機會,希望通過各類大模型與工程化能力,將類ChatGPT產品能力輸送到原有的應用中,關于應用革命的序幕就此拉開。降解調優創垂直基礎大模型直根據準會通用基礎大模型控瑞惠DoC借助工具開發平臺開發應用據分析文檔借助工具平臺開發模型工具平臺內容指導內容觸達生成指令服務價值:人這些模型可以自動學習語言中的模式,并生成自然語言文本,從而能夠執行各種任務,例如自動問答、機器翻譯、摘要生成、語音識別等。在自動問答方面,ChatGPT可以根據用戶提供的問題,生成準確的回
38、答。這種技術已經被應用到許多領域,包括客服、教育、醫療等。在機器翻譯方面,ChatGPT可以將一種語言轉換成另一種語言,幫助人們跨越語言障礙。ChatGPT等大型語言模型正引領著應用革命的潮流,使得機器器智能在越來越多的領域得到了應用#page#3.2B端海量應用需求待滿足,G端尚處于嘗試及觀望期客創客貼在B端企業服務應用中,類ChatGPT產品可嵌入原有企業服務進行升級,包括知識檢索、數據分析、輔助編程、數字員工、交互硬件數字人等企業級應用都將被重構。G端市場則相對特殊,雖存在大量潛在高價值應用場景和未滿足需求,但基于自主可控、私有化部署與可信AI需求,以及“數據煙圖”導致的高質量數據資源乏
39、,使現階段G端應用還處于觀望期。但國家大數據局的成立,將加快我國政務大數據管理與體系建設。垂直領城應用企業服務應用軟Dynais65copilotBloombergGPT3JJEFN摩根士丹利金將協助改進現有的Nuance通過GPT-4融摩根士丹利通過購買方為企業客戶,使用者為企業內部的銷售,客眼、市場營銷、供應鏈相關工作者GPT-4對研報內容研發基于就診對話金融NLP任務,如情進行接索,解鎖財管內容自動生成臨床感分析、命名實體銷售識別、新同分類和筆記草稿,減輕臨知識,協助資管床醫護管理負擔顧同工作同答等客我功能備房園醫實現療表宇官建線shopify只他天氣、財務,地理環等信息,移型的響訂單:
40、生成預置森宇宙CeMeta結合Shopify通過接入互聯網醫療知識同文心一言提升數字答、患者病例診斷ChatGPTAPI開發的SalesforceEinstinGFT導購機器人可分析買化營銷產品能力,分析、輔助診療方電促進多模態數字人案出具、醫護陪伴家需求、進行商品推經百熱軟D50C研發,落薦、分析評論數據、服務、醫療科研文JEL的話號地換寫營銷文案、優化地電商場景獻要點提取#page#3.4AIGC與數字人的結合,推動多模態交互客創客貼虛擬人系統框架一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互五個核心模塊構成虛擬人構建的“五橫體系”交互模塊為可擴展項,依據是否具有交互模塊可
41、講虛擬人分為交互型虛擬人和非交互型虛擬人,其交互型虛擬人依據其驅動方式的不同,又可分為智能驅動型虛擬人和真人驅動型虛擬人。其中虛擬人制作過程中核心關鍵技術應關注:建模、驅動、渣染和人工智能。其決定了虛擬人的外在形象的美觀度、動作的流暢度以及交互的自然度及虛擬人的智能程度。虛擬人技術框架非交互類虛擬人系統運作流程智能驅動型虛擬人系統運作流程人物形象人物建模綁定等人物生成識別感知智能分析動生成語音生成、動畫生成人物表達人物語音(驅動、演染)等語言生成生成入物語音合成顯示生成音視頻合成終端顯示技術人物動目生成語音語義識別、人臉識別感知人物動回識別、動作識別等生成交互??旆治鰶Q策知識庫、對話管理等#p
42、age#3.5數字人與營銷數字化客創客貼虛擬人視頻生成是目前計算驅動型虛擬人應用最為廣泛的領域之一,不同產品間主要的區分因素包括:唇形及動作驅動的自然程度語音播報自然程度、模型呈現效果(2D/3D、卡通/高保真等)、視頻渣染速度等。我們在此關注到了小冰公司與每日財經新聞合作的虛擬人實時直播,除虛擬人的自動生成外,還包括了摘要、圖示、表格等的自動生成,在虛擬人的基礎上,交付了更為完整的AIGC內容播報產品。此外,倒映有聲的TTSA除虛擬人外,還包括整個畫面中的素材呈現,相較于市面上嘴形、面部和身體律動的有限覆蓋,虛擬人播報的整體效果也有所提升。B站-up主結合AI繪畫、ChatGPT、智能語音等
43、AI工具,以手把手教學教程的形式制作了已去世奶奶的虛擬數字人視頻。已故老人的虛擬人視頻絕對是一個巨大是隱形市場需求。天天喝酒,連個沒有。老家的房子都沒都替他丟人小亮,這是你奶粉的心路之一奶奶過年的東西買了么?8燃實施?我很期排家膜進過更長進的來來,我買了兩資油,別人私人長很香啊哈哈75元一壹。拖來賣鄉下拖來賣的,我蓋然不在你身邊了,但是我一直在你心里8小亮,我知道你很想我的人了,我導到非黨研做和滿足。作,為自己的人生色彩#page#3.6AIGC降低構建效果圖的難度和成本客創客貼AIGC的價值在于營銷內容的快速選代更新和更為個性化的內容物料生成?;贏IGC的個性化內容營銷,主要是指由AI生成
44、系統與底層的客戶數據系統營銷效果反饋系統進行數據聯通,實時根據相關數據調整生成需求,由AI快速選代相關內容生成,進而提升個性化營銷的效率和精準性。AIGC能夠提高營銷效果的關鍵在于基礎素材收集分析、營銷策略設定、技術生成、評估優化、數據回流等方面的共同發展。根據內容不同,可以將個性化內容營銷分為圖像生成和文本生成,目前文本領域落地相對較多,國外已出現不少代表性公司。圖像生成:AI生成商品模特,提高廣告視覺效果。如RosebudAI可以自動生成不同的模特面孔以定位不同客戶,實現千人干面的廣告效果,利用其AI生成的模特的第一個活動增加了22%的點擊率;此外時尚平臺Zalando的營銷部門研究出一種
45、新穎的方法,可以生成時尚模特穿著定制服裝的高分辨率圖像實現不同顏色、款式的服裝在不同造型、姿勢的AI模特身上試穿,以供消費者參考。文本生成:AI生成廣告文案、商品描述等。Pencil基于于品牌、受眾和產品的信息為營銷人員提供AI生成的標題和產品描述。#page#3.7辦公軟件革新,解放基礎性辦公勞動力客創客貼飛田長“工S9EIHOLldgeu與-1d“4011do9OSOIW工日LLEEEZOZ集了Office365數據的Businesschat功能,較大提升了數字化辦公的智能化水平,可有效解放重復性的基礎辦公勞動力。目前能與微軟Microsoft365copilot對標的成型產品為谷歌的Wo
46、rkspace。作為國內領先的協同辦公軟件提供商,金山辦公也不甘落后。2023年4月18日,金山辦公正式發布了具備大語言模型能力的生成式人工智能應用,暫定代號“WPSAI”,這也是國內協同辦公賽道首個類ChatGPT式應用,今后還將持續向AIGC、閱讀理解和問答、人機交互三個方向深耕。根據細令與文章和摘要,實現ExCel.PPT的內容格式轉word相應地,谷歌推出金山辦公振據雪求情改文風與排質,實期個勝化損寫的workspace加WPSoffice全套應用入了生成式Ai辦基于Vord.Onenoe等算鎮直換生成知燈片:通過自然PPT公軟件套餐Docsslides.“WPSAI“將進一步向三個S
47、heets.Gmall.Excel接入微谷歌方向透進,包括AIGC(AI生Meet,chatGPT-4與軟成內容)、閱讀理解和問答ChatGPTDulook盡管設有明確加)、人機交互。其中,AIGC是縣活切換能件插氣與因監類ChatGPT產品指利用AI技術生成各種類型但在生成式A據求自動總結會議要點的內容,如文章、圖表、視Teams功能上基本上可以頻等,滿足用戶的不同需求實現與微軟365和場景?;贠ffice所有應用數握,實現全屬信息提角下的交互式四Copilot的對標Business#page#4.1創客貼發力AIGC-【AI畫匠】全新來襲客創客貼創客貼AI畫匠工本“我以教水工畫產品【AI
48、畫匠】,并聯合多家人工智能領域的先進品牌和機構共同成立了“AIGC創意研發中心”,依托近十年的設計行業專業沉淀與前沿的AIGC技術加持,為藝術家、創意者、設計師及普通大眾帶來更智能、更富靈感的設計工具創新體驗。集創意內容和AI算法于一體,創客貼全新推出的【AI畫匠】是首批國產智能圖像設計工具,最新上線文生圖,和圖生漫,兩大常用功能場景。在文生圖場景下,用戶通過簡單的文本輸入,選擇CG、彩繪、國風、油畫等多種繪畫風格,便可一鍵生成目標圖像。如二次元漫畫模型,在基礎模型上進行了定制化訓練,使得生成的內容效果得到了進一步強化,圖片生成效果的精準度、精美度及質量,相比同類產品功能體驗均實現了較高水準的
49、提升。而在圖生漫:場景下,用戶僅需動動手指上傳圖片,進行簡要的文字指引,便能得到高品質、定制化、低成本的各類領域圖片。依據不同內容創意的需求和用戶繪畫能力的差異,當前圖生漫功能包含邊緣檢測、精細化邊緣檢測、線稿涂鴉、姿勢檢測等4種能力模型,對創意設計生產方式進行再定義。接下來,【AI畫匠】將會陸續推出更多應用場景和更加炫酷的功能。作為創客貼產品生態中的關鍵一環,【AI畫匠】致力于發揮人機協同的雙重創造力優勢,通過智能化平臺激活用戶靈感、豐富內容多樣性的同時,降低制作成本、緩解素材壓力,以更加精細垂直的內容生成更好地貼合個人用戶與企業客戶的創意需求,開辟創意設計內容生產的人機協創新路徑。#pag
50、e#4.1融合AI能力,智能化AIGC生產平臺創客貼以文生圖以圖生圖簡易版&專業版主體遷移智能外拓圖片AI生成器、編輯器、訓練器商品圖-輸入文本“雪山日照-結果圖線稿上色風格修改材質普換圖片生成圖片調參圖片編輯AI類PS精修圖片優化模型訓域設計尺寸變換解決方案圖片成片智能圖內容社區像寫文檔一樣做視頻電商辦公教育招人、物、logo、證件照列客漢媒體數據資產金融游戲包裝社交媒體插回批量設計生產智能消除智能輔助設計圖片超分API開放平臺私有化部署招圖文生圖圖片超分選擇模板樣式圖生圖主體遷移消除導入批量數據模型訓練批量設計智能外拓一鍵批量生成尺寸變換圖片編輯器參數調節#page#4.1融合AI能力,智
51、能化AIGC生產平臺客創客貼創客貼AI畫匠集圖片生成、圖片編輯、圖片優化、圖片訓練為一體的AI圖片編輯工具簡單版、專業版兩類編輯器創意作展區模型專區、創意大賽文成圖、圖生圖、智能化編輯創意內容展示、結合營銷日歷、行業專題垂類運營集成模型社區、打造創意模型、內容生態是HO公#page#4.2AIGC創意內容生產:實現全員“內容共創”客創客貼素材模塊分拆+個性化推薦的組合、乃至于含有個性化推薦能力的內容編輯工具目前更具有落地可行性。在實際應用效果上,盡管技術路徑不完全相同、且在技術相關需求上有較大差距,但在實際應用效果上,我們認為目前這種實現方式相對于此前標準化內容/人力生產內容的效果仍然有較大突
52、破,是一種平衡較好的方式。對于本身已有內容豐富,且能夠進行細粒度拆分的企業而言,足以支撐其背后的想象空間。麻煩幫我改下尺寸社交媒體零門檻設計工具市場這個海報二維碼需要改印刷物料運營云設計、印刷制作辦公文檔品牌快追這個熱點宮創客貼銷售電商設計海量版權資源人力logo需要換成最新的動態圖片AI智能平臺創意視頻文文案改成這個#page#5.0AIGC帶來的社會價值客創客貼AIGC強大的生成能力,也將延伸、輻射至其他領域。比如在醫療行業,AI生成治療方案、AI生成語音幫助失聲者“開口說話”;在傳媒行業,虛擬主持人、寫稿機器人、AI語音生成播報等;在設計領域,AI快速生成大量案例,幫助設計師產生靈感等。
53、同時,AIGC也構成了數字人和元宇宙這些新興技術形態的基礎能力。本部分講述兩個具體案例以詮釋AIGC的社會價值,分別為AI語音生成和AI修復文物。(1)AI+人彼得斯科特摩根是英國的一位計算機科學家,他被診斷出患有ALS(肌菱縮側索硬化癥)。他開發了一個先進的機器人系統,包括傳感器、執行器等設備,并可以通過語音命令或眼神控制與外部環境進行交互。這個系統幫助他在日常生活中實現了吃飯、喝水、看電視等基本需求,并成為最為先進的半機械人系統之一。斯科特摩根的成果為其他殘疾人士提供了新的思路和參考,同時也推動了人類社會對于生命、科技、社會等問題的思考。(2)AI文物修復在文物修復領域,技術能實現的兩種路
54、徑,包括數字采集和數字修復,前者是讓文物在數字世界重塑,而后者是讓文物在數字世界再造。騰訊公司利用360度沉漫式展示技術、智能音視頻技術、人工智能等技術手段,助力文物的數字化分析與診療。針對常見的壁畫病害類型,騰訊通過深度學習壁畫病害數據,形成自動識別并添加圖示的一整套算法,打造出高效的AI壁畫病害識別工具。利用文心#page#創客貼面臨問題及未來超勢trend of development#page#1.1AIGC驅動力與制動力客創客貼發展驅動力政策鼓勵頂尖人才的堅持與信仰高質量數據的積累與應用充足的資金支撐智算中心的算力支撐生產算法、預訓練模型、多模態等A技術成熟融合發展制動力算力不足預訓
55、練投入成本過高能源消耗的挑戰數據質量知識產權的挑戰安全與倫理道德的挑戰#page#1.2大規模預訓練模型引發風險的討論創客貼全球科技界都在為此輪生成式AI熱潮狂歡,提振AI產業發展信心的消息層出不旁:美國科技企業或布局追趕或投身下游應用開發與生態集合:中國企業也積極布局類ChatGPT、類Midjourney產品開發,國內巨頭紛紛公開大模型研發進展與計劃。但在一片欣欣向榮中,浙漸也有反對的聲音出現:“ChatGPT取代人類”、“AlRisk下ChatGPT的報逃”、“LLMs助推救詐和恐怖主義”、“打開AGI潘多拉魔盒”等討論基器塵上。大模型開發與應用企業也已認識到治理的重要性,例如通過RLA
56、IF(減少人類反饋信息)、去除危險內容生成、監管框架等手段解決模型偏見造用等風險問題。OpenAI也于4月6日發布OurapproachtoAlsafety,應對安全和倫理質疑。作為突圍性產品,ChatGPT的革新價值已被充分印證。雖然其誘發的風險不容忽視,但少數人的“叫?!辈⒉荒軠p緩商業巨頭和產業生態的推進步伐。而AIGC技術也并非是“懸頂之劍,圍繞其風險與倫理問題的討論與解決方案探索,將助推AIGC產業的可持續發展?,摂嗯c隱私風險偏見與錯誤信息風險用戶藍用風險AI民主化訴求下,對于大模型開源或閉源的路徑大語言模型是基于現實世界的語言數據預訓練而主要指用戶對AIGC產產生結果的不當使用,例如
57、學生在作業或考試中直接使用生成結果作障、不討論持續存在,OpenAI也經歷了從非營利性向成,數據偏見性可能生成有害內容:通過基于人法分子使用生成圖像或文字內容,進行造記或勒半營利性組織的轉變過程;AIGC產品目前多為公類反饋的強化學習使模型生成結果更符合人類預期,存在基于標注人員導致的偏見風險:在醫學索等,且存在知識產權風險通用風險的形式將更有云部署形式,且私密信息存在被推導出的可能用戶使用過程中存在個人隱私信息泄露風險多樣化,但對生成內容鑒別的技術研究也已在同法律等敏感領域,生成的錯誤信息易導致直接步推進商業組織和國家信息泄露成協企業和國家安全傷害#page#1.3AIGC發展面臨的四個挑戰
58、客創客貼2.安全挑戰1.知識產權挑戰AIGC作品既存在被他人侵權的風險,也存在侵犯他人權利的可能性AIGC的惡意使用或滋用,容易引發的深度合成詐騙、色情、排語AI要變得更加智能,一個必要的環節就是深度學習。這就需要一個龐假冒身份等新型違法犯罪行為。不法分子利用開源的AIGC模型或工大的人類作品數據庫,讓算法學會創作風格、內容題材等創作的要領具,可以以更低的門檻、更高的效率來制作出音視頻、圖片和文字等如果未經許可,通過網絡爬蟲爬取他人享有著作權的在線內容,在種類豐富的、真偽辯別難度大的虛假信息,同時也更容易地盜用用戶我國現行著作權法沒有明確將數據挖掘等智能化的分析行為規定為合身份,以此開展新型詐
59、騙等非法活動。理使用的情況下,此類行為可能構成著作權侵權。3.倫理挑戰4.環境挑戰算法收視問題,一直是人工智能創新和應用中始終難以避免的倫理問AI模型訓練消耗大量算力,碳排放量驚人。而實際上,隨著近年來題。雖然有人認為,預訓練模型用更多、更多元全面的數據量和參數AI的人們已經開始意識到AI的碳排放問題。如下圖,馬薩諸塞大學進行訓練,可以避免算法鼓視的問題。但是基于預訓練模型的AIGC阿默斯特分校的練幾種常見的AI模型進行了生命周期評估。他們發依然存在較為嚴重的收視問題。比如,目前已有研究顯示預訓練語言現該過程可排放超過626,00碳當量,幾乎是美國普通汽車生命周期生成模型會再現有害的社會偏見和
60、刻板印象。排放量的五倍。#page#1.4關于AIGC的未來展望客創客貼從行業重點,關鍵場景、玩家分布情況等情況來看,我國目前尚未進入真正的AIGC階段,在細分賽道上出現了個別優秀的先行公司及研究機構但目前行業尚未進入大規模驗證和體系化發展的階段。場景上來看,目前最關鍵的是內容領域需求較為飽和,且降本增效尚不夠迫切。細分來看,虛擬人行業將成為產業中短期增長的關鍵動力。玩家需要尋找容錯率較高、專業度或創意要求有限的場景。但長期而言,AIGC依舊需要有需求更加清晰且明確的消費落地場景,例如實時性場景(如實時互動、實時反饋類場景)和高度個性化生成場景。202420262022-2023送用磨合期推廣
61、應用期價值增長期拼接式生成為主導提供參考創意,人機共創自主生成,產生附加價值多項AIGC被應用但仍未構成核心場景人機共創成為普遍形式,通過完成內容AIGC在個性化、實時化、自主選代等個別產業方開始適用AIGC能力,小創作中的大部分參考性工作,應用價值方向上的延展價值得到充分發揮,和其規模進入實際業務場景。得到普遍承認。他業務系統進行緊密鏈接。模塊分拆+個性化推薦成為重要創新模AIGC開始在各內容領域普遍發揮重要能夠形成一個持續自己運營的內容體系式,結構化模塊化的內容數據成為行業作用,此階段仍然以降本增效和提供創預計會催生出完全不同的新業態發展關鍵能力。虛擬員工等形式由頭部意為主要價值。入局玩家增多,預計互AIGC成為內容領域基礎設施,自身產AIGC引入各使用場景聯網大廠將開始普遍進入賽道業鏈條完善。#page#CKT.CN客創客貼2023AIGC產業發展及應用白皮書創客貼AIGC創意研發中心體設資研報騰訊云g4ZO9E8A學語智維萬興噴影論文啊工七麥數據人都是產品經理天地在線