《北京大學:2025年DeepSeek系列報告-DeepSeek與AIGC應用(99頁).pdf》由會員分享,可在線閱讀,更多相關《北京大學:2025年DeepSeek系列報告-DeepSeek與AIGC應用(99頁).pdf(99頁珍藏版)》請在三個皮匠報告上搜索。
1、DeepSeek內部研討系列-DeepSeek與AIGC應用AI肖睿團隊(孫萍、周嶸、李娜、張惠軍、劉譽)2025年2月20日 北大青鳥人工智能研究院 北大計算機學院元宇宙技術研究所 北大教育學院學習科學實驗室摘要1.本次講座為DeepSeek原理和應用系列研討的講座之一,主要介紹DeepSeek的基本概念,以及大模型技術和AIGC工具應用,不需要大家具備專業的AI或IT技術背景。2.本次講座首先分析當前備受矚目的DeepSeek-R1 的概念、優勢和歷史地位。然后進一步探討 大模型和AIGC的底層工作機制,旨在幫助讀者突破工具應用的局限,理解DeepSeek和AIGC的深層次價值。最后,介紹
2、如何科學選擇與高效使用 AI 工具,為大家提供更具深度與實用性的應用場景的指導,給聽眾帶來更落地的AI應用價值。3.盡管 DeepSeek-R1 以其低成本和開源策略為行業帶來變革,但當前網絡上的大量相關內容僅停留在工具應用層面,易對初級AI應用人員造成概念和思維方式的誤導,這也是本次講座希望解決的問題。3 01詳解DeepSeek R102AIGC的概念和應用03AIGC的能力揭秘04選擇AIGC工具目 錄詳解DeepSeek-R1PART 01簡介本部分介紹了DeepSeek-R1模型的技術特性、發展歷程、應用場景及其在AIGC領域的定位。首先介紹人工智能的發展歷程,以及大模型相關術語,并
3、對比DeepSeek-R1與其他模型的性能表現。DeepSeek-R1以其低成本、開源策略和卓越的推理能力脫穎而出,尤其在復雜邏輯推理、數學和編程任務中表現優異。隨后介紹DeepSeek公司的背景、市場定位以及DeepSeek-R1的技術原理和應用場景,揭示了其在推理密集型任務、教育、科研、知識應用和文檔分析等領域的獨特優勢,并列舉接入該模型的第三方應用。通過對人工智能發展歷史以及DeepSeek-R1的介紹和分析,本部分旨在為聽眾提供一個對DeepSeek的客觀、全面的認識,并理解該模型在AIGC領域的重要地位和應用潛力。人工智能發展歷程2023年GPT-4AIGC的發展歷程1950s-19
4、90S1990s-2010S2010s-2022年大模型相關術語 多模態 文本、圖片、音頻、視頻 AI工具(國內)DeepSeek、豆包、Kimi、騰訊元寶、智譜清言、通義千問、秘塔搜索、微信搜索.通用模型 大語言模型(LLM,Large Language Model)視頻模型 多模態模型 行業模型(垂直模型、垂類模型)教育、醫療、金融等大模型的關鍵發展生成模型ref:中文大模型基準測評2024年度報告(2025.01.08)推理模型生成模型與推理大模型的對比比較項GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位專注于通用自然語言處理和多模態能力,適合日常對話、內容生成、翻譯
5、以及圖文、音頻、視頻等信息處理、生成、對話等。側重于復雜推理與邏輯能力,擅長數學、編程和自然語言推理任務,適合高難度問題求解和專業領域應用,在中文表達上容易出彩。推理能力在日常語言任務中表現均衡,但在復雜邏輯推理(如數學題求解)上準確率較低。在復雜推理任務表現卓越,尤其擅長數學、代碼推理任務,在部分基準測試(如 GPQA)中準確率高于 GPT-4o。多模態支持支持文本、圖像、音頻乃至視頻輸入,可處理多種模態信息。當前主要支持文本輸入,不具備圖像處理等多模態能力。應用場景適合廣泛通用任務,如對話、內容生成、多模態信息處理以及多種語言相互翻譯和交流;面向大眾市場和商業應用。適合需要高精度推理和邏輯
6、分析的專業任務,如數學競賽、編程問題和科學研究;在思路清晰度要求高的場景具有明顯優勢,比如采訪大綱、方案梳理;在對中文語言表達和情感表達方面有明顯優勢。用戶交互體驗提供流暢的實時對話體驗,支持多種輸入模態;用戶界面友好,適合大眾使用??烧故敬蟛糠宙準剿伎歼^程,便于專業用戶理解推理過程;界面和使用體驗具有較高的定制性,但整體交互節奏較慢。推理模型的優劣勢優勢劣勢-演繹或歸納等推理能力強(如謎題、數學證明)-響應速度慢且計算成本高(需要更多推理時間)-鏈式思維推理出色(善于分解多步驟問題)-基于知識的任務更容易出錯(容易產生幻覺)-擅長復雜決策任務-處理簡單任務的時候效率低(容易過度思考)-可以呈
7、現思考過程常見推理模型DeepSeek R1OpenAI o1OpenAI o3-miniGemini 2.0Grok3Kimi 1.5火爆全網的DeepSeek-R1爆火原因DeepSeek-R1的推理能力進入了第一梯隊(媲美OpenAI o1),但訓練和推理成本低、速度快、全部開源DeepSeek打破了硅谷傳統的“堆算力、拼資本”的大模型發展路徑對AI行業的重大影響DeepSeek-R1以低成本和開源特性打破以往頭部企業巨頭割據局面DeepSeek-R1的API定價僅為行業均價的1/10,推動了中小型企業低成本接入AI,對行業產生了積極影響DeepSeek-R1促使行業開始從“唯規模論”轉
8、向更加注重“性價比”和“高效能”方向010203打破壟斷價格下調推動創新DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作為由知名私募巨頭幻方量化孕育而生的公司,DeepSeek獲得了強大的資金支持和行業影響力,幻方量化與九坤投資、明汯投資、靈均投資并稱量化私募領域的“四大天王”,管理資金規模均超過600億元。這為DeepSeek提供了清晰的市場定位和投資者背景DeepSeek專注于開發先進的大語言模型(LLM)和相關技術,旨在通過這些技術推動人工智能在多個領域的應用和創新DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一
9、家創新型科技企業,專注于人工智能基礎技術的研究與開發公司成立背景與發展歷程大語言模型(LLM)的創新應用投資者背景與市場定位里程碑DeepSeek產品信息官方渠道官網:新聞:https:/api- Eval編碼任務通過率是65.2%在需要邏輯思考的測試里很棒,比如DROP任務F1分數能達到92.2%,AIME 2024的通過率是79.8%應用的范圍適合大規模的自然語言處理工作,像對話式AI、多語言翻譯還有內容生成等等,能給企業提供高效的AI方案,滿足好多領域的需求適合學術研究、解決問題的應用和決策支持系統等需要深度推理的任務,也能拿來當教育工具,幫學生鍛煉邏輯思維DeepSeek-R1 工作原
10、理讓模型進行慢思考思維鏈(Chain of Thought)在不損失能力的情況下縮小模型蒸餾(Distillation)讓模型自我探索和訓練強化學習(Reinforcement Learning)DeepSeek R1論文:https:/ DeepSeek R1論文圖解:https:/ 版本模型名稱DeepSeek-R1-671B滿血版,能力最強DeepSeek-R1-Distill-Qwen-7B蒸餾版,能力稍弱-實際上是增加了推理能力的Qwen或Llama模型DeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R
11、1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B部署DeepSeek-R1 滿血版的算力要求和性能DeepSeek-R1的優勢理科能力強,且準確率高 數學推理 代碼生成 復雜任務處理DeepSeek-R1 的局限通用能力 R1 的通用能力(尤其是生成能力)低于DeepSeek-V3 R1的幻覺仍舊比較明顯(可能源于R1的中文語言表達能力更強)語言混雜 R1 在處理非中英文問題時,偶爾會出現語言混雜現象 這個現象在R1 Zero版本中更加明顯提示詞工程 使用 few-shot 提示可能會降低R1性能 使用過多的過程指導指令可能會降低R1的推理能力De
12、epSeek-R1 應用場景 推理密集型任務 編程任務中的代碼生成、算法設計,媲美Claude 3.5 Sonet 數學問題求解、科學推理和邏輯分析等需要復雜推理的場景。教育與知識應用 可用于解決教育領域的問題,支持知識理解與解答??捎糜诳蒲腥蝿盏膶嶒炘O計、數據分析和論文撰寫。文檔分析與長上下文理解 適合處理需要深入文檔分析和理解長上下文的任務,例如復雜信息提取與整合。開放領域問答與寫作 在內容生成、問題回答以及創造性寫作中具有廣泛應用,例如生成高質量文本或進行內容編輯。如何使用DeepSeek R1 DeepSeek官方網站和官方app 騰訊系 騰訊元寶 微信AI搜索 騰訊ima個人知識庫
13、AI搜索 秘塔搜索 納米AI搜索 知乎直答 其它接入DeepSeek-R1的產品 Molly R1(向量智能)問小白接入DeepSeek R1第三方服務的廠家 互聯網大廠:騰訊:騰訊元寶、ima、微信、騰訊云 百度:百度搜索、文小言 字節跳動:豆包、扣子、飛書 阿里:釘釘 互聯網小廠:科大訊飛、知乎、秘塔、納米AI搜索、AI初創公司:零一萬物、階躍星辰、minmax、AI應用公司(教育類):學而思、北大青鳥、網易有道、猿輔導、作業幫、.手機廠商:華為、榮耀、魅族、.其它云服務平臺:三大運營商、云服務商(硅基流動等)AIGC的概念和應用PART 02簡介本部分著重介紹人工智能生成內容(AIGC)
14、的定義、應用范圍及其在各行業的實際影響:首先梳理AIGC相關的術語,包括AI、AGI、生成式AI和決策式AI等,明確了其在人工智能領域的定位。隨后,詳細列舉AIGC在文本、圖像、音頻和視頻生成方面的多樣化應用,并探討其在電商、新聞傳媒、影視、游戲、教育和金融等行業的具體實踐,展示AIGC在提升效率、降低成本和增強創新方面的核心價值。此外,還分析AIGC帶來的挑戰,如數據隱私、倫理問題、生成質量控制以及對就業結構的影響。通過深入探討AIGC的應用現狀和未來趨勢,本部分旨在幫助讀者全面理解AIGC的潛力和影響,為應對技術變革提供參考。本部分的內容參考了人工智能通識課(微課版)和相關的視頻(B站的思
15、睿觀通)初 識 AIGC眼花繚亂的名詞眼花繚亂的名詞AI(人工智能)AGI(通用人工智能)(artificial general intelligence)AI Generated Content(人工智能生成內容)決策式AIAIGCChatGPT生成式AIAIGC能干什么生成視頻生成音頻生成文本生成圖像生成內容AI文本 Perplexity 知乎直答 秘塔AI搜索引擎 納米AI搜索 微信搜索(DeepSeek R1、元寶)小紅書的筆記助手 短視頻平臺的內容創意 自動回復機器人 企業微信的智能回復 英國廣播公司(BBC)的Juicer 彭博社的Cyborg 新華社的快筆小新 人民日報的創作大腦
16、 第一財經的DT稿王 微軟“小冰”出版詩集 AI撰寫劇本電影陽春 百萬字小說天命使徒 清華大學的機憶之地 Cursor Windsurf MarsCode GitHub Copilot 阿里云通義靈碼新聞作品創作社交媒體代碼AI搜索AI繪畫太空歌劇院2022年8月,獲得比賽“數字藝術/數字修飾照片”一等獎AI繪畫AI繪畫新西湖繁勝全景圖全景圖是一副百米畫卷,再現了當下西湖邊的景觀特色、生活場景,還有一些已經消失的景觀,比如曾經聞名遐邇的大佛寺。圖中包含5000個建筑,作者白小蘇說如果這些建筑都要自己親手畫,一天畫10個都要500天。最后他借助于AI技術,在一年內完成了作品AI音頻語音對話語音克
17、隆創作音樂AI視頻千秋詩頌視頻特效杜 甫視頻添加圖片AIGC 的 行 業 應 用AIGC的行業應用各行各業.電商行業01其它行業(教育、金融.)06新聞傳媒03內容廣告02影視行業04游戲行業05電商行業商品3D模型改善購物體驗AI模特產品拍攝降本增效虛擬主播提升直播帶貨效率內容廣告全流程參與提高效率雪花啤酒虛擬偶像提升品牌宣傳效果錄音語音轉寫智能新聞寫作智能視頻剪輯應用場景拓展應用功能升級應用形態完善采編環節傳播環節對傳媒機構大幅提高生產效率,并帶來新的視覺化、互動化體驗;豐富了新聞報道的形式,推動傳媒向智媒轉變對媒體從業者將部分采編、播放工作自動化,讓其更專注于思考創造如將精力集中于深度報
18、道專題報道等更需發揮人類精準分析事物、妥善處理情感的領域;對傳媒用戶短時間獲得更多新聞,提高獲取及時性及便捷性;降低傳媒門檻,使得受眾可以參與內容生產,增強參與感AIGC對傳媒行業參與主體的影響新聞傳媒傳媒影視行業影視劇本文稿創作拓展角色范疇賦能影視剪輯拓展場景空間AIGC游戲研發環節作用游戲行業01體驗02 功能03角色04劇情05策略增強游戲體驗特定風格模擬:AI通過模仿職業選手,玩家則感覺像在與真實的職業選手對抗;玩法教學:幫助玩家快速熟悉操作與游戲玩法,提高游戲可玩性。游戲性能測試前期平衡性測試:充分模擬玩家在某套數值體系下的游戲體驗,提出優化策略;游戲功能測試:針對性找出游戲交互的可
19、能性,發現潛在漏洞輔助游戲策劃。NPC角色生成AI創造不同的面孔、服飾、聲音甚至性格特征,甚至可同步驅動嘴型、表情等面部變化,達到高度逼真;并通過大量數據模擬人類運動,完成行走、跑步等一系列動作反應。劇情生成AI智能NPC能夠分析玩家的實時輸入,與玩家動態交互,構建幾乎無限且不重復的劇情;AI能夠生產相關的圖文、音樂等,創造游戲素材,輔以劇情鋪排,提升劇情飽滿度。游戲策略生成讓AI感知環境、自身狀態并基于特定目標決定當下需要執行的動作,基于特定問題和場景,自主提出解決方案。游戲運營環節AI自動化廣告投放:目前抖音等平臺的廣告分發、內容推薦已通過算法實現,且效果較高;生成廣告素材:素材主要是圖像
20、及音視頻內容,預計AIGC的加持下廣告素材生成會更高效、高質量;玩家分類提升體驗:通過不同玩家的數據,將用戶細分類型,為不同類型玩家提供獨特的玩法,提高用戶體驗。其他行業教育行業金融行業其它 自動批改作業和考試 虛擬實驗室 生成學習資料 翻譯文獻資料其它 風險管理 自動處理和分析金融文檔 合規管理AIGC 的 未 來AIGC的核心價值降本增效增強創新企業賦能個人賦能AIGC的挑戰泄露隱私數字身份冒用制作虛假信息詐騙數據隱私及安全侵權與被侵權知識產權挑戰結果幻象、可控性、理解能力生成精準度、還原度、仿真度生成質量社會偏見、性別歧視等“復活”逝者損害已故人的隱私權倫理挑戰01020304AIGC的
21、未來AIGC的生成質量和準確性將得到提升在更多領域得到應用,如保險、醫療和法律服務等更多地與人類專家協作,以提供更高質量的內容和服務預計將出現更多關于內容生成和使用的監管框架01020304技術進步更廣泛的應用人機協作監管框架的發展生成式人工智能(AI)目前處于期望膨脹期,預計將在25年內產生巨大效益到 2026 年,Gartner預測超過80%的企業將使用生成式AI的API或模型,或在生產環境中部署支持生成式AI的應用,而在2023年初這一比例不到5%。數據來源:Gartner(2023年8月)工作崗位需求變化顯著上升STEM(科學、技術、工程和數學)相關職業醫療保健和其他高技能職業下降顯著
22、辦公室職員生產工人客戶服務代表等傳統職業2024年5月24日麥肯錫報告:工作的新未來:在歐洲及其他地區部署人工智能和提升技能的競賽到 2030 年,歐洲和美國多達30%的工作時間可能實現自動化技能類型需求變化技能類型需求變化技術技能大幅增長炙手可熱的“新寵”技能是社會和情感技能體力和手動技能的需求預計將保持大致穩定認知技能(文字和信息處理、編程、科研、工程等)的需求預計將減少14%2024年5月24日麥肯錫報告:工作的新未來:在歐洲及其他地區部署人工智能和提升技能的競賽與AI共舞 學習AIGC基礎知識 積極使用AIGC工具 關注AIGC在各行業的應用案例 跟蹤最新發展趨勢AIGC的能力揭秘PA
23、RT 03簡介本部分深入剖析AIGC背后的技術原理,涵蓋文本生成和圖像生成兩大核心領域。通過對比文本生成和圖像生成的不同路徑,大家能夠全面理解AIGC在不同模態下的工作原理,以及如何利用這些技術實現高效的內容創作和應用。在文本生成方面,以OpenAI的GPT-4o為例,詳細介紹了通用大語言模型(LLM)的工作原理,包括其基于Transformer架構的生成機制、上下文編碼、自注意力機制以及預訓練和微調過程。探討了GPT-4o在多輪對話、語言轉換、意圖理解、文本生成和推理能力等方面的優勢,同時也指出其在知識局限、上下文窗口限制和生成幻覺等方面的不足。在圖像生成方面,以Stable Diffusi
24、on模型為例,解釋了其核心組件(文本編碼器、圖像信息生成器和圖像解碼器)的工作流程,揭示了文生圖和圖生圖技術的優勢與局限。本部分的內容參考了人工智能通識課(微課版)和相關的視頻(B站的思睿觀通)。文 本 生 成 的 奧秘AIGC與GPT(通用大模型的代表)1950s-1990S1990s-2010S2010s-2022年20232023年年OpenAI GPT4OpenAI GPT4-多模態大模型多模態大模型OpenAI GPT的學霸養成記GPT:生成式預訓練變換模型(Generative Pre-trained Transformer)3大核心能力 多輪對話 任意語言的轉換能力 意圖和情感理
25、解能力 對比能力 窮舉能力 假設推理能力 文本總結能力 文本改寫能力 文本生成能力推理能力創作能力對話能力工作原理-1概率預測+文字接龍1.收到提示詞示例:“今天天氣不錯,我決定”4.基于上下文預測下一個token為可能的單詞分配概率分數示例:“去”:0.7.“停:0.2,“站:0.15.根據概率分數選擇標記示例:“去”3.采用Transformer架構處理token理解token之間的關系識別提示詞的整體含義2.將輸入拆分為token“今”,“天”,“天”,“氣”,“不”,“錯”,“,”,“我”,“決”,“定”自回歸:重復步驟4和步驟5直到形成完整的句子示例:今天天氣不錯,我決定去公園GPT
26、Generative(生成式)Pre-trained(預訓練)Transformer(變換器)LLM:Large Language Model工作原理-2預訓練(自監督)監督微調人類反饋強化學習接收輸入處理輸入進行推理生成輸出上下文+訓練知識階段1:模型訓練階段2:推理大模型工作過程工作原理-3數據來源說明維基百科在線百科,嚴謹圖書經典為主的古登堡計劃和自助出版 平臺Smashwords等雜志期刊論文:ArXiv等鏈接WebText,RedditCommon Crawl開源項目,爬取互聯網所有數據GitHub程序員聚集地合計700 多GB,約有19萬套四大名著 的閱讀量5 000億左右的tok
27、en數量。(13萬億token:gpt4)100個標記大約等于75個英語單詞訓練語料(gpt-3)模型參數:1.8萬億參數(GPT-4)GPT-4o上下文窗口大?。?192個token(標記)典型的新技能學習曲線:規模到達臨界點之后才會迅速增長生成式通用大語言模型的優勢與劣勢vs優勢劣勢語言理解和生成能力世界知識能力一定的推理能力幻覺(生成錯誤答案)知識庫有限上下文窗口限制如何與GPT對話多輪對話引導基本對話方法對話工具:ChatGPTPOE各種對話能力邊界智慧對話使用對話工具ChatGPT:聊天機器人應用訪問地址:https:/ 問題+回答總數 包括字符、標點、空格限制分段對話定期總結使用關
28、鍵詞提醒精簡輸入使用建議 GPT-3.5:4096,大約3000 個英文單詞或 4000 個漢字 GPT-4:8192,大約6000 個英文單詞或 8000 個漢字(https:/ 像 生 成 的 奧 秘Stable Diffusion 模型如何實現圖像生成?文生圖圖生圖Stable Diffusion 模型的構成三大核心組件文本編碼器圖像信息生成器圖像解碼器(翻譯官)(工匠)(畫家)文本編碼器 解析用戶輸入的提示詞 將提示詞轉化為高維向量表示圖像信息生成器 將輸入信息逐步處理和轉換為圖像數據圖像解碼器 接收來自圖像信息生成器的處理后的信息矩陣 將信息矩陣轉換為可視化的圖像文生圖的優勢與局限精
29、確控制困難隨機性太強復雜場景理解局限 降低門檻 提高效率 藝術風格多樣化優勢選擇AIGC工具PART 04簡介本部分聚焦于如何科學選擇和高效應用AIGC工具,以滿足不同場景下的多樣化需求。首先介紹當前AIGC領域的工具類型,包括聊天對話機器人、圖像生成工具、音頻與視頻生成工具以及搜索工具等,并列舉了國內外代表性工具。隨后,以DeepSeek-R1、Kimi、豆包、騰訊元寶等具體工具為例,詳細分析了它們的特點、優勢及適用場景,展示了不同工具在推理能力、多模態支持、長文本處理和搜索效率等方面的差異。最后,還提出了選擇AIGC工具的依據,包括明確需求、評估工具性能和考慮使用成本等,幫助讀者根據自身需
30、求做出合理選擇。通過深入分析和對比,本部分旨在為讀者提供一份實用的AIGC工具選擇指南,助力其在AIGC時代更好地應用人工智能技術,提升工作效率和創新能力。AIGC工具公眾號:AI產品榜AIGC工具AI工具導航平臺:https:/AI工具集:https:/ai-AIGC工具工具類型國內國外聊天對話機器人DeepSeek、騰訊元寶、豆包、Kimi、智譜清言.ChatGPT,Claude,X.com(Grok)圖像生成工具通義萬相、即夢、豆包ChatGPT,Midjourney,Stable Diffusion音頻工具音瘋、網易天音、海綿音樂Suno視頻生成工具SkyReels、Vidu、可靈、海
31、螺AI、即夢Sora,Runway,Pika搜索工具秘塔、納米AI、天工PerplexityAIGC工具現場演示騰訊元寶 https:/ Copilot插件音樂工具:音瘋 https:/ https:/ 文本類、繪圖類、視頻類、語音類、搜索類、設計類、專用工具類(辦公類、筆記類、內容轉化類.)、智能體類 以12個為主,其它為輔3.真實使用中測試和篩選4.保持2-3周的更新頻次97/38總結AIGC技術正在重塑各個行業的未來,從內容創作到科學研究,從教育到商業應用,潛力無限。然而,技術的快速發展也帶來了新的挑戰,面對這些挑戰,我們需要保持開放的心態,積極學習AIGC的基礎知識,關注其在各行業的應用案例,跟蹤最新發展趨勢。與AI共舞,實現AI與人類的完美融合。讓我們以DeepSeek-R1為起點,持續探索AIGC的無限可能。在AI時代的技術浪潮中,我們既是見證者,更是參與者。謝 謝99