《浙江大學:2025年DeepSeek之火可以燎原報告(56頁).pdf》由會員分享,可在線閱讀,更多相關《浙江大學:2025年DeepSeek之火可以燎原報告(56頁).pdf(56頁珍藏版)》請在三個皮匠報告上搜索。
1、DeepSeek之火可 以 燎 原浙江大學DeepSeek系列專題線上公開課報告提綱從中華文化基因看DeepSeek成功之道DeepSeek私有化應用方法DeepSeek的二點爭議關于人工智能未來發展之路的思考維克多-D.O.-桑托斯圖片來源https:/ https:/ 牛meat 肉beaf 牛肉fly 飛airplane 飛機machine 機器英語發展簡史維克多-D.O.-桑托斯漢語的高效和可傳承圖片來源 https:/ 搭積木,知識遷移現代常用字3700康熙字典46933甲骨文+金文5000存量增量中華字海8.5萬生僻字,含古字5萬0年幾乎為維克多-D.O.-桑托斯DeepSeek與
2、ChatGPT訓練語料對比ChatGPT 4DeepSeek 總語料規模 13萬億token 英文語料 占比約92.6%,主要來源于互聯網公開文本,包括維基百科、新聞報道、書籍、學術論文、程序代碼等 中文語料 占比僅約0.1%,來源單一,學術文獻不足,中文互聯網內容(如社交媒體、論壇)噪聲較多,需復雜清洗 總語料規模:14.8 萬億 token,涵蓋多語言、數學、編程等領域,其中 87%代碼、10%英文、3%中文 中文語料特點:有約 2.3 億字精校的古典文獻;覆蓋網絡文學、社交媒體、學術論文等現代文本;通過“千字文”式分詞算法增強對成語、典故理解 數據處理技術:過濾機制:采用多層凈化技術(如
3、“八面受敵法”),數據噪音剔除精度達 99.7%。分詞優化:結合古典語法與現代漢語的分詞算法,使成語理解準確率提升 38%。長上下文支持:通過兩階段擴展訓練,將上下文窗口擴展至 128K,增強長文本處理能力。維克多-D.O.-桑托斯用漢字進行模型訓練將在這場AI之爭中勝出?中文:英文DeepSeek 1:3.33 ChatGPT 1:900 維克多-D.O.-桑托斯大力出奇跡的范式增加參數增加數據提升性能增加算力增加算力算力性能AI壟斷產業壟斷思想禁錮學術壟斷AlexNet18FLOPsBERT-Large20FLOPsGPT323FLOPsGrok32FLOPsGPT-4o27FLOPs維克
4、多-D.O.-桑托斯中華民族的不屈不撓精神我命由我不由天若前方無路我便踏出一條路DeepSeek的技術突圍打破CUDA標準庫壁壘,為非英偉達算力芯片提供機會采用思維鏈提升邏輯性能,實現模型的頓悟時刻知識蒸餾+MOE,證明小規模高質量數據遠勝低質量大規模數據算力優化算法革新架構創新人工智能三要素報告提綱從中華文化基因看DeepSeek的成功之道DeepSeek私有化應用方法DeepSeek的二點爭議關于人工智能未來發展之路的思考維克多-D.O.-桑托斯爭議一:知識蒸餾是抄襲還是創新 知識蒸餾(Knowledge Distillation)是一種模型壓縮和加速技術,旨在將大型模型(教師模型)的知識
5、遷移到小型模型(學生模型),在減少計算資源消耗,縮短推理時間的同時,盡可能達到接近大型模型的性能。知識蒸餾的實現過程怒發沖冠憑欄?借?維克多-D.O.-桑托斯爭議一:知識蒸餾是抄襲還是創新牛頓第一定律:如果一個物體所受合外力為0,那么這個物體將保持靜止或勻速直線運動牛頓第二定律:物體的動量隨時間的變化率與受力成正比。牛頓第三定律:相互作用的兩個物體之間的作用力和反作用力大小相等,方向相反,作用在同一條直線上。牛頓三大定律我也知道,所以這些定律是我發現的何為抄襲和剽竊?維克多-D.O.-桑托斯爭議一:知識蒸餾是抄襲還是創新基于牛頓定律等物理實現航天器制造零件機械式機床數控式機床何為創新?維克多-
6、D.O.-桑托斯爭議一:知識蒸餾是抄襲還是創新。維克多-D.O.-桑托斯無情吞噬地球資源的黑洞爭議二:人工智能是資源黑洞還是效率革命Grok320萬H1002千H800智能決策提高效率低能耗來源:https:/ 2025年2月18日VS報告提綱從中華文化基因看DeepSeek的成功之道DeepSeek私有化應用方法DeepSeek的二點爭議關于人工智能未來發展之路的思考維克多-D.O.-桑托斯AI的道與術從哪里來?人工智能到哪里去?維克多-D.O.-桑托斯AI的道與術堆量不堆質商高定律:記錄在公元前1世紀左右編寫的 周髀算經。商高與周公的對話中提及:“故折矩,勾廣三,股修四,經隅五?!贝蟮乐梁?/p>
7、道德經:有道無術,術尚可求也,有術無道,止于術。道是規律、道理和本源,而術則是指具體的方法和技巧。這句話告訴我們在解決問題時,只有掌握了事物發展的規律,才能更好地尋求技巧和方法,而只有真正理解和掌握了“道”和“術”,才能更好地應對各種問題,舉一反三,不斷取得成功道不足則多術維克多-D.O.-桑托斯AI的道與術道德經.第四十二章:道生一,一生二,二生三,三生萬物。萬物負陰而抱陽,沖氣以為和。易經系辭:形而上者謂之道,形而下者謂之器。何為道?維克多-D.O.-桑托斯AI的道與術道生一智能維克多-D.O.-桑托斯AI的道與術道生一一生二智能智:為陰,即心智,內心之所思所想,即人工智能的算法能:為陽,
8、即行動,外在的表現,即人工智能帶給我們的能力擴展智能維克多-D.O.-桑托斯AI的道與術道生一一生二能智二生三智能智:為陰,即心智,內心之所思所想,即人工智能的算法能:為陽,即行動,外在的表現,即人工智能帶給我們的能力擴展智+能+倫理安全,才是最完美的人工智能,這個倫理安全就是需要解決的三三生萬物智能道生一,一生二,二生三,三生萬物。萬物負陰而抱陽,沖氣以為和。維克多-D.O.-桑托斯AI的倫理安全與道德困境電車困境緊急情況左轉撞死一人功利主義直行撞死多人康德道義自動駕駛車上乘客路上行人緊急情況VSVS維克多-D.O.-桑托斯AI的算法偏見和統治只有算法的不是人工智能有了算法也能行動的也還不是
9、真正的智能只有能落地應用給人類帶來美好生活的人工智能才是真正的人工智能超過20分鐘罰款20分鐘不到20分鐘獎勵超過18分鐘罰款不到18分鐘獎勵強化學習18分鐘圖片來源:百度維克多-D.O.-桑托斯陰陽氣和是人工智能的一條發展之道機器人三守則,機器人能做到嗎?我們該把人工智能當工具還是人?當個人隱私與公共安全沖突時,該如何選擇?人工智能是否會造成教育不公?面對AI的算法統治和偏見怎么辦?不同種族和宗教信仰的人群又如何達成倫理共識?AIGC幻覺是不是造假?通過AI換臉進行詐騙該如何杜絕?學術誠信如何防范?.能智問題的根源基于0-1的布爾代數建立起來的系統只有陰陽,非陰即陽現實世界系統非陰非陽,陰陽
10、氣和二生三,三生萬物找到這個三,找到這個氣智能報告提綱從中華文化基因看DeepSeek的成功之道DeepSeek私有化應用方法DeepSeek的二點爭議關于人工智能未來發展之路的思考維克多-D.O.-桑托斯增強本地DeepSeek能力的二個方案針對特定任務或領域定制,顯著提高任務性能適應特定領域的細微差別、語氣或術語依賴足夠高質量標注數據適合目標任務明確、數據相對靜態的場景微調Fine-tuning利用外部知識庫增強答案提供支持性的證據能夠動態檢索相關知識適合數據頻繁更新的場景成本效益高更可信、更可解釋、時效性和準確性高檢索增強生成Retrieval-Augmented Generatio,R
11、AG通過精心設計輸入提示,引導LLM生成期望的高質量輸出無需重新訓練模型,不需要標注數據一些提示工程框架可以顯著增強LLM的推理能力靈活性、使用簡單提示詞工程Prompt Engineering訓練實習生提供項目資料任務布置清晰維克多-D.O.-桑托斯本地部署檢索增強-RAGUI界面維克多-D.O.-桑托斯本地部署檢索增強-RAGUI界面API接口維克多-D.O.-桑托斯本地部署檢索增強-RAGUI界面API接口基座模型DeepSeek系列LLaMA系列嵌入模型BGE-M3embed-qa-4維克多-D.O.-桑托斯本地部署檢索增強-RAGUI界面API接口基座模型DeepSeek系列LLaM
12、A系列嵌入模型BGE-M3embed-qa-4知識庫TXTDOCXXLSXHTMLPDFEPUBPPTCSV維克多-D.O.-桑托斯RAG部署過程1、下載安裝OLLAMA:https:/ Studio:https:/cherry- pull deepseek-r1:7b4、下載嵌入模型:Ollama pull bge-m3:latest維克多-D.O.-桑托斯RAG部署過程-配置OLLAMA接口382 激活Ollama接口3 管理模型DeepSeek模型詞向量化模型1 打開配置5、配置Cherry Studio指定Ollama API維克多-D.O.-桑托斯RAG部署過程-管理OLLAMA模型
13、391 管理模型2 加入DeepSeek3 加入詞向量化模型6、管理Ollama 模型維克多-D.O.-桑托斯RAG部署過程-管理知識庫401 打開管理界面3 選擇向量化模型4 輸入知識庫名字2 添加新知識庫5 保存維克多-D.O.-桑托斯RAG部署過程-知識庫向量化411 選擇知識庫3 等待向量化2 添加文件維克多-D.O.-桑托斯RAG部署過程-對答421 開啟對話4 輸入問題3 選擇知識庫2 選擇模型5 輸出答案維克多-D.O.-桑托斯關于Ollama的安全報告43https:/ LoRA(Low-Rank Adaptation of Large Language Models)的核心思
14、想是通過僅訓練低秩矩陣,然后將這些參數注入到原始模型中,從而實現模型的微調,這種方法顯著減少了所需的訓練資源,特別適合在資源有限的環境中使用。經過LoRA微調后的參數會覆蓋原來基礎模型的部分參數,因此模型的參數規模不會改變,但是輸出已經跟專業數據對齊了LoRA訓練基礎模型參數訓練參數BaseModel維克多-D.O.-桑托斯大模型微調的二種技術LoRA45 LoRA(Low-Rank Adaptation of Large Language Models)的核心思想是通過僅訓練低秩矩陣,然后將這些參數注入到原始模型中,從而實現模型的微調,這種方法顯著減少了所需的訓練資源,特別適合在資源有限的環
15、境中使用。經過LoRA微調后的參數會覆蓋原來基礎模型的部分參數,因此模型的參數規模不會改變,但是輸出已經跟專業數據對齊了LoRA訓練基礎模型參數訓練參數凍結訓練維克多-D.O.-桑托斯大模型微調的二種技術Backbone46Backbone訓練基礎模型參數訓練參數 Backbone微調就是通過設計一個專業的骨架模型,這個骨架模型可以是不同類型的深度神經網絡,如MLP、CNN等,但是參數較小。將這個骨架模型裝載在基礎模型的輸出端,在微調訓練時,基礎模型的參數凍結,只訓練骨架模型。這種微調的方法非常實用,不同的骨架模型完成不同的專業場景任務,推理的時候,只需要切換不同的骨架模型。就好比一個專業的攝
16、影師通過更換不同的鏡頭和濾鏡完成專業水平照片的拍攝。BackboneBaseModel維克多-D.O.-桑托斯大模型微調的二種技術Backbone47Backbone訓練基礎模型參數訓練參數 Backbone微調就是通過設計一個專業的骨架模型,這個骨架模型可以是不同類型的深度神經網絡,如MLP、CNN等,但是參數較小。將這個骨架模型裝載在基礎模型的輸出端,在微調訓練時,基礎模型的參數凍結,只訓練骨架模型。這種微調的方法非常實用,不同的骨架模型完成不同的專業場景任務,推理的時候,只需要切換不同的骨架模型。就好比一個專業的攝影師通過更換不同的鏡頭和濾鏡完成專業水平照片的拍攝。凍結訓練維克多-D.O
17、.-桑托斯輕代碼微調方法-基于LLaMA-Factory481、LLaMA-Factory的安裝部署:git clone https:/ install-upgrade pip pip3 install bitsandbytes=0.39.0 進入LLaMA-Factory目錄中,執行pip3 install-e.torch,metrics3、LLaMA-Factory的主要子目錄說明 config:存放自定義模型訓練腳本 data:存放示例的訓練數據集樣本,采用json格式 examples:存放示例的訓練腳本,包括train_full、train_lora、train_qlora、infe
18、rence(推理)、merge_lora(模型合并)saves:微調模型臨時存放目錄 models:模型合并臨時存放目錄維克多-D.O.-桑托斯輕代碼微調方法-基于LLaMA-Factory494、訓練模版制作 在examples目錄下找到train_lora子目錄,復制llama3_lora_sft.yaml文件的一個備份,進行修改,重新命名,比如deepseek_lora.yaml,存放到config目錄中維克多-D.O.-桑托斯輕代碼微調方法-基于LLaMA-Factory505、修改模板(deepseek_lora.yaml)的訓練參數,根據自己的項目修改相應的參數,幾個主要的參數說明
19、如下:聯系郵箱:維克多-D.O.-桑托斯輕代碼微調方法-基于LLaMA-Factory516、將訓練的數據集拷貝到data目錄下,并修改dataset_info.json文件,增加數據的索引7、訓練:執行命令 llamafactory-cli train deepseek_lora.yaml 即可開始訓練維克多-D.O.-桑托斯DeepSeek本地微調的簡單應用52deepseek-r1:32b選擇題思考過程自測選擇題選擇推理模式AI智能助教維克多-D.O.-桑托斯DeepSeek本地微調的簡單應用53推理模式答疑模式我現在有點發熱,咳嗽3天,38度,應該怎么辦?推理過程AI智能助教維克多-D.O.-桑托斯智能助教系統與虛擬仿真實驗室的集成醫學院基礎醫學實驗教學中心 一體式機能智慧教學實驗室維克多-D.O.-桑托斯展望走一條屬于中國的AI之路55總有一天,我們將會用AI技術揭開推背圖、梅花易數的神秘面紗也許人工智能正走在不斷論證中醫和周易的路上感謝聆聽敬請批評指正