《北京大學:2025年DeepSeek原理和落地應用報告(57頁).pdf》由會員分享,可在線閱讀,更多相關《北京大學:2025年DeepSeek原理和落地應用報告(57頁).pdf(57頁珍藏版)》請在三個皮匠報告上搜索。
1、DeepSeek原理與落地應用AI肖睿團隊(孫萍、吳寒、周嶸、李娜、張惠軍、劉譽)2025年03月01日廈門大學大數據百家講壇 北大青鳥人工智能研究院 北大計算機學院元宇宙技術研究所 北大教育學院學習科學實驗室7 人工智能概念辨析人工智能概念辨析DeepSeek R1大模型原理大模型原理落地應用落地應用目目 錄錄C O N T E N T S人工智能概念辨析人工智能概念辨析PART 01大模型相關術語l 多模態 文本、圖片、音頻、視頻l AI工具(國內)DeepSeek、豆包、Kimi、騰訊元寶、智譜清言、通義千問、秘塔搜索、微信搜索.l 通用模型 大語言模型(LLM,Large Langua
2、ge Model)視覺模型(圖片、視頻)音頻模型 多模態模型 l 行業模型(垂直模型、垂類模型)教育、醫療、金融等 大模型的前世今生人工智能人工智能:讓機器具備動物智能,人類智能,非人類智能(超人類智能)運算推理:規則核心;自動化知識工程:知識核心;知識庫+推理機機器學習機器學習:學習核心;數據智能(統計學習方法,數據建模)常規機器學習方法:邏輯回歸,決策森林,支持向量機,馬爾科夫鏈,.人工神經網絡人工神經網絡:與人腦最大的共同點是名字,機制和架構并不一樣傳統神經網絡:霍普菲爾德網絡,玻爾茲曼機,.深度神經網絡:深度學習深度學習傳統網絡架構:DBN,CNN,RNN,ResNet,Incepti
3、on,TransformerTransformer架構架構:可以并行矩陣計算(GPU),核心是注意力機制(Attention)編碼器(BERT):多數embedding模型,Ernie早期版本,.混合網絡:T5、GLM解碼器(GPTGPT):大語言模型(大語言模型(LLMLLM),也是傳統的多模態模型的核心生成式人工智能生成式人工智能(GenAIGenAI):):AIGCAIGCDeepSeekDeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、OpenAI GPTOpenAI GPT(ChatGPTChatGPT)、Claude、Llama、Grok、Di
4、ffusionDiffusion架構架構:主要用于視覺模型(比如Stable Diffusion、DALLE),現在也開始嘗試用于語言模型Diffusion+Transformer架構:例如SoraSora的DiT(加入Diffusion的視覺模型),部分新的多模態模型架構大模型的發展階段生成模型ref:中文大模型基準測評2024年度報告(2025.01.08)推理模型生成模型與推理大模型的對比比較項OpenAI GPT-4o(生成模型)OpenAI o1(推理模型)模型定位專注于通用自然語言處理和多模態能力,適合日常對話、內容生成、翻譯以及圖文、音頻、視頻等信息處理、生成、對話等。側重于復雜
5、推理與邏輯能力,擅長數學、編程和自然語言推理任務,適合高難度問題求解和專業領域應用。一般是在生成模型的基礎上通過RL方法強化CoT能力而來推理能力在日常語言任務中表現均衡,但在復雜邏輯推理(如數學題求解)上準確率較低。在復雜推理任務表現卓越,尤其擅長數學、代碼推理任務。多模態支持支持文本、圖像、音頻乃至視頻輸入,可處理多種模態信息。當前主要支持文本輸入,不具備圖像處理等多模態能力。應用場景適合廣泛通用任務,如對話、內容生成、多模態信息處理以及多種語言相互翻譯和交流;面向大眾市場和商業應用。適合需要高精度推理和邏輯分析的專業任務,如數學競賽、編程問題和科學研究;在思路清晰度要求高的場景具有明顯優
6、勢,比如采訪大綱、方案梳理。用戶交互體驗提供流暢的實時對話體驗,支持多種輸入模態;用戶界面友好,適合大眾使用??勺灾麈準剿伎?,不需要太多的過程指令,整體交互節奏較慢。D e e p S e e k R 1PART 02DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作為由知名私募巨頭幻方量化孕育而生的公司,DeepSeek獲得了強大的資金支持和行業影響力,幻方量化與九坤投資、明汯投資、靈均投資并稱量化私募領域的“四大天王”,管理資金規模均超過600億元。這為DeepSeek提供了清晰的市場定位和投資者背景DeepSeek專注于開發先進的大語言模型(LLM)和相關技術,
7、旨在通過這些技術推動人工智能在多個領域的應用和創新DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技企業,專注于人工智能基礎技術的研究與開發公司成立背景與發展歷程大語言模型(LLM)的創新應用投資者背景與市場定位里程碑DeepSeek模型系列DeepSeek最新的生成模型和推理模型版本對比比較方面生成模型(V3)推理模型(R1)設計初衷想要在各種自然語言處理的任務中都能表現好,更通用重點是為了搞定復雜的推理情況,比如深度的邏輯分析和解決問題性能展現在數學題、多語言任務還有編碼任務里表現不錯,像Cmath能得90.7分,Human Eva
8、l編碼任務通過率是65.2%在需要邏輯思考的測試里很棒,比如DROP任務F1分數能達到92.2%,AIME 2024的通過率是79.8%應用的范圍適合大規模的自然語言處理工作,像對話式AI、多語言翻譯還有內容生成等等,能給企業提供高效的AI方案,滿足好多領域的需求適合學術研究、解決問題的應用和決策支持系統等需要深度推理的任務,也能拿來當教育工具,幫學生鍛煉邏輯思維常見推理模型DeepSeek R1OpenAI o1OpenAI o3-miniGemini 2.0Grok3Kimi 1.518為什么火:能力突破、開源、低成本、國產化為什么火:能力突破、開源、低成本、國產化DeepSeek以“推理
9、能力+第一梯隊性能”為核心基礎,疊加:開源開放、超低成本、國產自主研發三大優勢,不僅實現技術代際跨越,更推動AI技術普惠化與國產化生態繁榮,成為全球大模型賽道的重要領跑者。核心加分項:開源、低成本、國產化 開源:技術共享,生態共建全量開源訓練代碼、數據清洗工具及微調框架,開發者可快速構建教育、金融、醫療等垂直領域應用,推動社區協同創新。低成本:普惠企業級AI應用做了大量的模型架構優化和系統工程優化。訓練成本僅$557w:顯著低于行業同類模型,打破高價壁壘。推理成本降低83%:千億參數模型適配中小企業需求,加速商業化落地。國產化:技術自主,縮短差距將國產模型與美國的代際差距從3-5年縮短至3-5
10、個月,突破“卡脖子”技術瓶頸。構建多行業專屬模型矩陣,全面支持國內產業智能化升級?;A能力:進入推理模型階段,躋身全球第一梯隊推理能力躍升:DeepSeek大模型核心技術突破,實現復雜推理任務的精準處理與高效執行,覆蓋多模態場景應用。國際競爭力對標:模型綜合性能躍居全球第一梯隊,技術指標與國際頂尖水平(如GPT系列、Claude等)直接對標,奠定國產大模型的行業標桿地位。19 19DeepSeek R1達到了跟o1相當、或者至少接近的推理能力,且將推理過程可視化它做到這個水平只用到少得多的資源,所以價格十分便宜它是完全開源的并且還發布論文,詳細介紹了訓練中所有的步驟和竅門DeepSeek深度求
11、索公司是一家純粹的中國公司混合專家混合專家MOEMOE多頭潛在注意力多頭潛在注意力MLAMLA強化學習強化學習GRPOGRPODeepseek官網地址:http:/https:/DeepSeek-R1 訓練技術全部公開,論文鏈接:https:/ 21模型有三種使用方式:在軟件系統中調用官方API、模型微調、直接使用。前兩種涉及到IT技術比較多。這里講的是直接使用的三種方法,適合普通用戶。DeepSeek直接使用直接使用22DeepSeek官方官方-開袋即食開袋即食23官網:https:/ Molly R1(小程序)DeepSeek私有化部署私有化部署25模型的私有化部署的方式:Ollama部署
12、:個人本地部署【推薦】,方便快速,適用于蒸餾模型vLLM部署:生產、開發、垂直領域私有化部署,精度可控,更專業其它ModelModelBase ModelBase Model特點特點DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B蒸餾模型,能力稍弱實際上是增加了推理能力的Qwen模型和Llama模型 DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7BDeepSeek-R1-Distill-Llama-8BLlama-3.1-8BDeepSeek-R1-Distill-Qwen-14BQwen2.5-14BDeepSe
13、ek-R1-Distill-Qwen-32BQwen2.5-32BDeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-InstructDeepSeek-R1-671BDeepSeek-V3-Base滿血版,能力最強DeepSeek R1全家桶部署DeepSeek-R1 滿血版的算力要求和性能模型原理模型原理PART 03GPT工作原理-1概率預測+文字接龍1.收到提示詞示例:“今天天氣不錯,我決定”4.基于上下文預測下一個token為可能的單詞分配概率分數示例:“去”:0.7.“停:0.2,“站:0.15.根據概率分數選擇標記示例:“去”3.采用Transfo
14、rmer架構處理token理解token之間的關系識別提示詞的整體含義2.將輸入拆分為token“今”,“天”,“天”,“氣”,“不”,“錯”,“,”,“我”,“決”,“定”自回歸:重復步驟4和步驟5直到形成完整的句子示例:今天天氣不錯,我決定去公園GPTGenerative(生成式)Pre-trained(預訓練)Transformer(變換器)LLM:Large Language ModelGPT工作原理-2預訓練(自監督)監督微調人類反饋強化學習接收輸入處理輸入進行推理生成輸出上下文+訓練知識階段1:模型訓練階段2:推理大模型工作過程GPT工作原理-3數據來源說明維基百科在線百科,嚴謹圖
15、書經典為主的古登堡計劃和自助出版 平臺Smashwords等雜志期刊論文:ArXiv等鏈接WebText,RedditCommon Crawl開源項目,爬取互聯網所有數據GitHub程序員聚集地合計700 多GB,約有19萬套四大名著 的閱讀量5 000億左右的token數量。(13萬億token:gpt4)100個標記大約等于75個英語單詞訓練語料(gpt-3)模型參數:1.8萬億參數(GPT-4)GPT-4o上下文窗口大?。?192個token(標記)典型的新技能學習曲線:規模到達臨界點之后才會迅速增長生成模型的優勢與劣勢vs優勢劣勢n語言理解和生成能力n世界知識能力n一定的推理能力n幻覺
16、(生成錯誤答案)n知識庫有限n上下文窗口限制推理模型(DeepSeek-R1)工作原理讓模型進行慢思考思維鏈(Chain of Thought)在不損失能力的情況下縮小模型蒸餾(Distillation)讓模型自我探索和訓練強化學習(Reinforcement Learning)l DeepSeek R1論文:https:/ DeepSeek R1論文圖解:https:/ 0434 34DeepSeek讓人類與AI對話更加簡單,提示詞讓對話質量提升立竿見影,適合所有層級使用者快速上手。DeepSeek的深度思考模式基于DeepSeek R1模型,是一種推理模型。相比較于傳統的生成模型,使用De
17、epSeek R1模型時的提示詞技巧有較大的變化。35 35DeepSeekDeepSeek提示詞技巧提示詞技巧1.DeepSeek提示詞技巧提示詞技巧-真誠真誠+直接直接36你現在是一個新能源汽車的市場研究分析師,這里有一份調研報告總結需要寫成周報,請按周報的格式幫我完成并進行潤色,不少于500字。幫我把這份報告包裝一下,我要寫成周報給老板看,老板很看重數據。傳統DeepSeek2.DeepSeek提示詞技巧提示詞技巧-通用公式通用公式我要(做)*,要給*用,希望達到*效果,但擔心*問題37例如:我要做一個從北京到日本的旅游攻略,要給爸媽用,希望讓他們在日本開心的玩20天,但我擔心他們玩的累
18、,腿和腰不太好 先抓住總原則 全面非??紤]o()正式回答38DeepSeek輸出的日程安排清晰明確貼心準備清單甚至細致考慮到了每日5000步2.DeepSeek提示詞技巧提示詞技巧-通用公式通用公式2.DeepSeek提示詞技巧提示詞技巧-通用公式通用公式39任務背景負面限定目標做什么給誰用期望效果擔心的問題“內心戲”3.DeepSeek提示詞技巧提示詞技巧-說人話說人話適合場景:科研,了解新事物40了避免DeepSeek的回答過于官方、專業,可以嘗試這三個字“說人話”你問:什么是“波粒二象性”,DeepSeek大概率會給出專業且看不懂的回答,和百度百科差不多。但如果給ta一句“說人話”,ta
19、就會生動形象的做一些舉例說人話說人話4.DeepSeek提示詞技巧提示詞技巧-反向反向PUA41DeepSeek有一套自己的思維鏈,也就是ta自帶的思考邏輯,那么如果你想要DeepSeek更賣力給你搬磚,就需要你運用“反向PUA”“請你列出10個反對理由再給方案”“如果你是老板,你會怎樣批評這個方案?”“這個回答你滿意嗎?請你把回答復盤至少10輪”5.DeepSeek提示詞技巧提示詞技巧-善于模仿善于模仿42如果你想寫一篇文案,用提示詞約束,可能效果一般般,但如果你給一篇文章模仿或者讓ta模仿誰的語氣,DeepSeek大概率會寫到你的心趴上。6.DeepSeek提示詞技巧提示詞技巧-擅長銳評擅
20、長銳評43DeepSeek自帶情商,各種語氣也能完美拿捏!44”_,笑死“句式,觸發DeepSeek的毒舌屬性6.DeepSeek提示詞技巧提示詞技巧-擅長銳評擅長銳評7.DeepSeek提示詞技巧提示詞技巧-激發深度思考激發深度思考45Normal Model深度思考在提示詞結尾加入:“在你的回答中,同時加入你的批判性思考在你的回答中,同時加入你的批判性思考”“在你回答之前,先自己復盤在你回答之前,先自己復盤100遍遍“DeepSeek Model復盤推理批判回復 DeepSeek官方提示詞解讀官方提示詞解讀46代碼類內容分類結構化輸出角色扮演(人設、情景)創作類翻譯類提示詞生成官方文檔鏈接
21、:https:/api- 應用場景l 推理密集型任務 編程任務中的代碼生成、算法設計,媲美Claude 3.5 Sonet 數學問題求解、科學推理和邏輯分析等需要復雜推理的場景。l 教育與知識應用 可用于解決教育領域的問題,支持知識理解與解答??捎糜诳蒲腥蝿盏膶嶒炘O計、數據分析和論文撰寫。l 文檔分析與長上下文理解 適合處理需要深入文檔分析和理解長上下文的任務,例如復雜信息提取與整合。l 開放領域問答與寫作 在內容生成、問題回答以及創造性寫作中具有廣泛應用,例如生成高質量文本或進行內容編輯。48教育與學術賦能教育與學術賦能-教學設計教學設計49教學設計提示詞示例需求:北大青鳥基于所提供的課程相
22、關信息,包括主題、教學目標、課時安排以及學情等內容,按照特定流程來設計一份課程大綱草案,重點在于給出大概的課程內容、設計思路技 能+教 學 目 標+工 作 流教育與學術賦能教育與學術賦能-教學活動教學活動50教學活動https:/ 2.符合教學目標,并且能夠應用課程內容指導生活請生成分組演練中的話術,用表格輸出,要求:角色、話術習題設計問題課后作業教學活動教育與學術賦能教育與學術賦能-作業批改作業批改51作業批改提示詞示例需求:課工場需要AI輔助老師批改大量作業為作業中的客觀題添加答案解析為作業中的編程題該處解題思路工 作 流 程+工 作 要 求教育與學術賦能教育與學術賦能-個性化教案個性化教
23、案52個性化教案生成需求:根據北大青鳥分層教學模式設計原則,為大一機器學習基礎章節設計A/B/C三級難度習題組,并標注難度。為年級機器學習基礎章節設計A/B/C三級難度習題組,按布魯姆認知分類理論標注題目難度系數年 級+學 科+題 目 要 求提示詞示例:為大一機器學習基礎章節設計A/B/C三級難度習題組,按布魯姆認知分類理論標注題目難度系數教育與學術賦能教育與學術賦能-醫學專業病理診斷醫學專業病理診斷53醫學專業-病理診斷需求:模擬臨床思維訓練,患者主訴胸痛伴呼吸困難,可能的鑒別診斷有哪些?,根據癥狀列表生成5種可能疾病,按優先級排序并給出檢查建議任 務+示 例提示詞示例教育與學術賦能教育與學
24、術賦能-論文全流程輔助論文全流程輔助54論文全流程輔助-1第一步:用DeepSeek精準鎖定選題第二步:5分鐘生成論文大綱第三步:精準的文獻綜述第四步:根據大綱擴寫內容教育與學術賦能教育與學術賦能-論文全流程輔助論文全流程輔助55論文全流程輔助-2第五步:研究方法設計第六步:數據分析與討論第八步:潤色與查重第七步:撰寫方法討論教育與學術賦能教育與學術賦能-論文選題論文選題56論文選題需求:尋找專業領域的選題方向提示詞示例領域痛點掃描+創新維度矩陣+可行性熔斷機制+學術資源導航教育與學術賦能教育與學術賦能-學術研究學術研究57學術研究-1用 300字 總結論文核心結論,標注 3 個創新點和2個潛
25、在缺陷。提取關鍵數據和觀點,聚焦研究目的、方法和結果,突出貢獻與不足。文獻速讀查找近 3 年關于 主題 的 5 篇高被引論文,按 APA格式列出。注明作者、年份、期刊名、卷號、頁碼,確保引用規范。參考文獻將中文摘要翻譯成英文,確保專業術語準確、符合 IEEE 標準。注意句式結構,保持原文邏輯,突出研究重點,避免語義模糊。學術翻譯以 Nature 期刊格式重寫方法論部分,突出實驗設計的可重復性。詳細描述實驗步驟、樣本選擇、數據分析,確保清晰易懂。潤色重寫教育與學術賦能教育與學術賦能-學術研究學術研究58學術研究-2列舉支持與反對 理論 的各 3 個證據,用表格對比權重。從實驗數據、理論基礎、應用
26、場景等方面分析,明確正反雙方觀點。學術辯論對 數據集 進行統計分析,生成一份報告,包含描述性統計、相關性分析和回歸模型結果,用圖表輔助展示關鍵發現,解釋數據背后的科學意義。數據分析報告針對 研究主題,提出 3 個可驗證的研究假設,結合現有文獻說明假設依據,設計初步實驗方案驗證假設,確保邏輯嚴謹、可操作性強。研究假設設計撰寫一篇關于 主題 的綜述文章,梳理近 5 年研究進展,歸納 3 個主要研究方向,分析當前研究熱點與未來趨勢,引用至少 10 篇權威文獻。綜述撰寫教育與學術賦能教育與學術賦能-知識付費知識付費59知識付費-1設計一門 主題 的 30 天入門課程大綱,每天明確學習目標和作業。目標聚
27、焦核心知識點,作業結合實際操作,確保學員循序漸進掌握技能。課程大綱設計生成一個 時長 的直播腳本,包含開場互動、干貨分享和促銷環節。開場設計趣味問答,干貨突出實用內容,促銷環節明確優惠信息。直播腳本撰寫為 XXX 平米三室一廳戶型提供 3 種 風格 效果圖,標注各空間利用率。突出功能布局、色彩搭配和材質選擇,滿足不同需求。室內裝修設計為 主題 社群設計 7 天運營話術,每天包含歡迎語、每日話題和互動游戲。歡迎語溫馨親切,話題聚焦熱點,游戲增強互動性。社群運營話術教育與學術賦能教育與學術賦能-知識付費知識付費60知識付費-2生成一期 主題 的星球日更內容,包含 2 個干貨知識點和 1 個互動問題
28、。知識點簡潔實用,互動問題引發思考,提升用戶參與度。知識星球內容制作一套 主題 的線上課程,包含 5 節視頻課和配套 PPT,每節課時長 20 分鐘,注重內容的系統性和互動性,適配網易云課堂、【思睿貫通】等。線上課程制作為 主題 設計一份付費問答腳本,包含 5 個常見問題及專業回答,突出答案的實用性和權威性,適合知乎、分答等平臺。付費問答設計為 主題 知識付費社群制定 7 天運營計劃,每天發布 1 條優質內容、1 個互動話題,設計 2 次付費轉化活動,提升用戶粘性和續費率。知識付費社群運營教育與學術賦能教育與學術賦能-作業輔導作業輔導61需求:孩子小學四年級,被學校老師要求輔導孩子作業。發現自己不懂如何教學?也不懂如何以小孩的視角分析問題。眼看要到半夜了,忍不住急躁想要動手。作業輔導(教輔行業)p第一步:知識點錨定p第二步:分步教學引導p第三步:互動練習設計p第四步:錯誤分析與糾正p第五步:能力拓展銜接提示詞示例62擁抱AI,與AI共舞,實現AI與人類的完美融合。人類需要的是判斷力和表達力,不再是記憶力和知識儲備讓我們以DeepSeek-R1為起點,持續探索AI的無限可能。在AI時代的技術浪潮中,我們既是見證者,更是參與者。