《山東大學:2025年DeepSeek應用與部署(80頁).pdf》由會員分享,可在線閱讀,更多相關《山東大學:2025年DeepSeek應用與部署(80頁).pdf(80頁珍藏版)》請在三個皮匠報告上搜索。
1、DeepSeek應用與部署山東大學經濟學院 教授山東大學國家治理研究院 研究員李鐵崗聽聽真我數字人講DeepSeekAIGC發展歷程AIGC 2014-2024自然語言處理與語言模型大語言模型LLM:2018 2024DeepSeek介紹DeepSeek:2023 DeepSeek:技術創新模型架構|V2(Multi-HeadLatentAttention)DeepSeek:技術創新模型架構|V3DeepSeek:技術創新推理模型|RL強化學習讓智能體(Agent)在環境(Environment)中不斷嘗試、學習,并優化自己的策略(Policy),最終獲得最大化的獎勵(Reward)。PPO:
2、Proximal Policy OptimizationGRPO:Group Relative Policy OptimizationDeepSeek應用場景DeepSeek的能力層級 1.基礎能力層 多模態數據融合與結構化理解,包括跨模態語義對齊(文本、圖像、音頻、視頻、代碼、傳感器數據統一語義)和動態數據治理(解決數據缺失、噪音干擾、概念飄逸等),支持200多種數據格式自動解析。2.中級能力層 領域問題建模與復雜推理,包括領域自適應學習(建立醫、教育、金融垂直應用于模型)、因果推理引擎(建立因果圖模型)和多目標優化決策(求解帕 累托最有解)。3.高級能力層 復雜系統建模與自主決策,包括數字
3、孿生仿真系統(構建物理于數字融合虛擬環境模擬天氣等)、多智能體協同優化(將每個個體作為智能體通過聯邦學習模擬群體行為)和元認知調控機制(實施監控自身決策、動態分配資源、自動觸發行為)。4.終極能力層 自主進化與創造性突破,包括概念空間探索(通過對抗網絡探索新合金成分等)、范式轉移預警(監控跨領域知識流、識別技術革命前兆)和自編程能力(自動模塊設計、代碼編寫、測試用例)。Deepseek V3Deepseek R1Deepseek r1鞅的證明Deepseek r1 Roy安全準則組合模型推理Deepseek r1推理玻尿酸配方DeepSeek提示詞工程提示詞工程Deepseek十類提示詞 1.
4、內容生成類:文本生成、代碼生成、創意生成和數據模擬。2.信息處理類:文本摘要、信息抽取、情感分析和多語言翻譯。3.對話交互類:角色扮演、多輪對話、反問引導。4.技能應用類:數學計算、代碼解釋、邏輯推理。5.個性化定制類:風格遷移、知識庫綁定、偏好記憶。6.系統操作類:模式切換、資源優化、記憶管理。7.知識查詢類:事實核查、概念解釋、溯源檢索。8.教育與研究類:題目生成、論文潤色、實驗設計。9.多模態處理類:圖文互譯、表格解析、視頻腳本。10.倫理與安全類:內容審核、價值觀對齊、風險預警。DeepSeek部署方案Deepseek部署全線圖本地部署蒸餾小模型第三方UI客戶管接入服務云端網站接入服務
5、移動手機應用DeepseekDeepseek模型及蒸餾模型API接入API及蒸餾模型API及蒸餾模型Chatbox API及網絡調用本地網絡調用Chatbox API及網絡調用DeepseeK替代部署方案 本地部署蒸餾小模型:可通過ollama平臺、LM Studio平臺快速本地部署基于Llama和Qwen蒸餾的DeepSeek-R1推理模型,涵蓋多種不同參數規模,適合想在本地運行模型的用戶。第三方UI客戶管接入服務:可通過Anything LLM、Cherry Studio、Chatbox等選擇API接入。秘塔AI搜索:接入滿血版DeepSeek-R1推理模型,無廣告且搜索結果直達。以學習J
6、DK21新特性為例,能詳細給出學習計劃,包括快速預覽、深入學習核心特性、實戰與總結等階段。硅基流動:注冊即送2000萬Tokens,提供多個基于DeepSeek-R1蒸餾訓練的模型,如DeepSeek-R1-Distill-Llama-70B等,在推理能力上表現出色。阿里云百煉:提供多個DeepSeek系列模型,如DeepSeek-V3、DeepSeek-R1-Distill-Qwen-1.5B等,部分限時免費,涵蓋文本生成等功能。百度智能云:千帆ModelBuilder全面支持DeepSeek-R1/V3調用,且限時免費,其模型在百科知識、數學推理等任務表現突出。英偉達:可通過特定接口調用D
7、eepSeek-R1 671B全量模型,獲取API Key后能進行相關操作。DeepSeek API調用API 調用方法 DeepSeek API model=deepseek-chat 即可調用 DeepSeek-V3model=deepseek-reasoner,即可調用 DeepSeek-R1。Token 用量計算 token 是模型用來表示自然語言文本的基本單位,也是我們的計費單元,可以直觀的理解為“字”或“詞”;通常 1 個中文詞語、1 個英文單詞、1 個數字或 1 個符號計為 1 個 token。一般情況下模型中 token 和字數的換算比例大致如下:1 個英文字符 0.3 個 t
8、oken。1 個中文字符 0.6 個 token。但因為不同模型的分詞不同,所以換算比例也存在差異,每一次實際處理 token 數量以模型返回為準,您可以從返回結果的 usage 中查看。阿里云部署Deepseek以 DeepSeek-R1 滿血版為例進行演示,通過百煉模型服務進行 DeepSeek 開源模型調用,可以根據實際需求選擇其他參數規模的 DeepSeek 模型。百煉平臺的 API 提供標準化接口,無需自行搭建模型服務基礎設施,且具備負載均衡和自動擴縮容機制,保障 API 調用穩定性。搭配 Chatbox 可視化界面客戶端,進一步簡化了調用流程,無需在命令行中操作,通過圖形化界面即可
9、輕松配置和使用 DeepSeek 模型。https:/chatboxai.app/zh#downloadDeepSeekDeepSeekDeepSeek-R1-Ditill-Qwen-1.5BDeepSeek-R1-Ditill-Qwen-7BDeepSeek-R1-Ditill-Qwen-14BDeepSeek-R1-Ditill-Qwen-32BDeepSeek-R1-Ditill-Ollama-7BDeepSeek-R1-Distill-Ollama-7BDeepSeek-R1DeepSeek-V3騰訊云部署流程 Cloud Studio:登錄騰訊云官網,進入Cloud Studio,可
10、一鍵部署,即開即用,能快速體驗7B以下DeepSeek-R1蒸餾模型。云原生構建:登錄騰訊云,云原生構建相關服務,一鍵體驗DeepSeek,無需等待下載,支持1.5b/7b/8b/14b/32b多款模型。TI平臺:登錄騰訊云TI平臺,提供專屬算力、多種尺寸模型、0代碼模型部署等功能。HAI:登錄騰訊云HAI控制臺,新建DeepSeek-R1應用,創建完成后可通過站內信獲取密碼,選擇可視化界面(ChatbotUI)或命令行(JupyterLab)直接調用DeepSeek-R1模型。云應用:登錄騰訊云找到云應用服務,直接購買成品DeepSeek應用,或利用云應用定制化軟件功能,快速部署AI應用或定
11、制傳統軟件。搜索方案:大模型知識引擎:注冊并登錄騰訊云,在控制臺搜索“大模型知識引擎”體驗”開通服務。新建應用并配置基礎信息,選擇DeepSeek-R1/V3模型,即可在右側調試窗口提問搜索。API接口:申請騰訊云DeepSeek API接口,獲取API Key后,可在自己的應用或程序中通過調用API來實現DeepSeek模型的搜索功能。騰訊云API調用開發者首選,DeepSeek部署簡單、直觀、高效!HAI 提供 GPU 算力和 ollama 環境,支持 1.5B,7B,8B,32B 等多個 DeepSeek-R1 蒸餾模型。企業級首選,DeepSeek部署穩定、安全、易用!騰訊云智能全棧A
12、I服務上架DeepSeek系列模型創建應用華為云+silconflow通過創建API key 調用 邀請碼:z0sI0urY邀請鏈接:https:/ 蒸餾模型老師模型和學生模型小模型:相當于一枚小學生,知識面非常有限,但是勝在沒教授那么大譜,給個板凳坐著就夠了(部署成本低,推理成本低)。大模型:像一位見多識廣、知識儲備龐大的“大教授”,無所不知,但是“供養”他很貴。什么是模型蒸餾?“模型蒸餾”就是把大模型學到的本領,用“濃縮”的方式教給小模型的過程,在保證一定精度的同時,大幅降低運算成本和硬件要求。模型蒸餾 蒸餾是一種機器學習技術,其中較小的模型(“學生模型”)被訓練來模仿較大、預訓練模型(“
13、教師模型”)的行為。1.數據蒸餾 在數據蒸餾中,教師模型生成合成數據或偽標簽,然后這些數據用于訓練學生模型。2.Logits蒸餾 在logits蒸餾中,學生模型被訓練來匹配教師模型的logits,而不僅僅是最終的預測。這種方法保留了更多關于教師模型置信水平和決策過程的信息。3.特征蒸餾 特征蒸餾涉及將教師模型中間層的知識轉移到學生模型中。通過對齊兩個模型的隱藏表示,學生模型可以學習到更豐富和更抽象的特征。蒸餾、微調、RAG蒸餾:是學生通過模仿老師的解題思路,達到和老師相似的知識水平。微調:又叫精調,相當于學生意識到自己某門課有短板,然后自己找參考書惡補了一下,從而補上短板。蒸餾、微調、RAGR
14、AG:直譯過來叫做“檢索增強生成”。相當于這題我不會,但是我有“小抄”,我回答的時候,就看一眼小抄,然后再綜合我腦子里的已有知識,進行回答。DeepSeek本地部署1.GPU要求 推薦NVIDIA顯卡(RTX 3090/4090/A100等)顯存要求:7B模型:至少16GB顯存 13B/20B模型:至少24GB顯存 70B模型:需多卡并行(如2xA100)支持CUDA 11.7+和 cuDNN 8.5+DeepSeek本地部署-硬件環境準備2.系統要求Linux(Ubuntu 20.04+)或 Windows WSL2Python 3.8+,推薦使用Anaconda/Miniconda管理環境
15、方法1:使用Hugging Face Transformers方法2:使用vLLM加速推理方法3:Docker部署DeepSeek本地部署-部署辦法Anything LLM接入下載安裝 打開官網,根據自己的系統選擇下載對應的版本。安裝文件,按照安裝向導的提示進行操作,默認路徑安裝或修改默認安裝路徑都可以。安裝完成后,點擊完成自動跳轉到AnythingLLM界面。模型配置 LLM Selection(大語言模型選擇):選擇Ollama,如果本地已通過Ollama部署了DeepSeek等模型,AnythingLLM會自動檢測。這意味著模型和聊天記錄僅在運行Ollama模型的機器上可訪問,保證了數據
16、的安全性和隱私性。Embedding Preference(嵌入偏好):使用AnythingLLM Embedder嵌入工具,文檔文本會在AnythingLLM的實例上私密嵌入,文本數據的處理和轉換在本地進行,不會泄露給第三方。Vector Database(向量數據庫):使用LanceDB作為向量數據庫,向量和文檔文本都存儲在AnythingLLM實例上,進一步確保數據的私密性和安全性。接入DeepSeek模型 通過Ollama接入:先在本地通過Ollama部署DeepSeek模型,然后在AnythingLLM中選擇Ollama作為語言模型推理后端,AnythingLLM會自動連接到本地Ol
17、lama服務中的DeepSeek模型。通過DeepSeek R1 API接入:在AnythingLLM工作區右側點擊設置,選擇聊天設置,更改LLM模型為DeepSeek,輸入API Key并選擇DeepSeek R1模型,點擊更新工作區即可。搭建本地知識庫 在AnythingLLM左側工作區找到上傳按鈕,選中要上傳的文檔,點擊移動到工作區,再點擊“Save and Embed”,對文檔進行切分和詞向量化。完成后,點擊圖釘按鈕,將文檔設置為當前對話的背景文檔,即可在聊天窗口基于上傳的文檔內容與模型進行對話。本地部署方法Ollama+DeepseekLM Studio+DeepSeekAnythi
18、ng LM+Ollama+Deepseek+向量模型(Embessing Model)Dify+Ollama+Deepseek+向量模型(Embessing Model)OllamaLM StudioDeepSeek模型下載模型OllamaLM StudioDeepSeek模型下載模型Anything LMDify調用模型Ollamau下載Ollamau運行Ollamau運行Ollama run deepseek-r1LM Studio本地部署 前期準備:確保設備滿足一定硬件要求,顯卡需GTX 1060(6GB)及以上,推薦RTX3060及以上;內存8GB及以上,推薦16GB及更高;C盤剩余2
19、0GB空間,建議使用NVMe固態硬盤。安裝LM Studio客戶端:在官網lmstudio.ai下載對應操作系統的安裝包,雙擊運行并按提示完成安裝。啟動后,點擊右下角設置圖標將語言改為簡體中文。加載模型:自行下載獲取模型,下載到本地后,點擊左上方文件夾圖標選擇模型目錄導入;若不會找模型,可在LM Studio的設置里,勾選“Use LM Studios Hugging Face”,再點擊左上方搜索圖標搜索deepseek選擇模型。注意參數規模不同,性能和硬件需求有差異。例如,1.5B適合體驗嘗鮮,7B適合普通創作及開發測試,8B適合對內容要求更高的場景,14B適合專業及深度內容創作。LM St
20、udio+DeepSeekLM Studio可以通過huggaface下載Deepseek各種蒸餾模型(GGUF)DeepSeek UI客戶端使用Anything LM+Ollama+Deepseek RAG數據庫工程LLM首選項向量數據庫Embedder首選項文本分割RAG中的Embedding模型Embedding模型貫穿RAG流程多環節Cherry LM+DeepSeek API大模型智能體工程五大 AI Agent 多智能體開發框架微軟AutoGen:Github 地址:https:/ 地址:https:/ 地址:https:/ Swarm:Github 地址:https:/ 地址:h
21、ttps:/ Coze+Deepseek API(Deepseep R1)業務流 Dify+Deepseek API搭建本地知識庫 Langchain+Deepseek API 業務流工程2025七款RAG1.R2R:官網:https:/r2r-docs.sciphi.ai/功能:用于開發本地RAG應用程序,支持多模態內容攝取、混合搜索、知識圖譜構建、GraphRAG,具備用戶管理、可觀測性、配置及可視化交互等功能,適用于處理動態數據和復雜實體關系的應用程序。2.Cognita:官網:https:/ Pipeline和50+小型專用模型,適用于定制特定領域解決方案。4.LangChain:官網
22、:https:/ 賦能各行業的應用場景 1.DeepSeek賦能酒企場景-市場分析與消費者洞察-智能營銷與個性化推薦-生產優化與質量控制 -供應鏈管理與庫存優化 -品牌故事與文化傳播 -智能客服與消費者互動 -新品研發與口味預測 2.DeepSeek賦能房產裝修-智能設計與方案生成 -虛擬現實(VR)與增強現實(AR)體驗 -施工進度管理與優化 -材料采購與供應鏈優化 -客戶需求分析與個性化服務 -智能客服與售后支持 -裝修質量檢測與問題預測 -市場趨勢分析與營銷策略優化 xu 3.DeepSeek賦能知識產權服務-專利檢索與分析 -侵權檢測與風險評估 -知識產權法律咨詢 -專利撰寫與優化 -
23、知識產權交易與估值 -知識產權管理與監控 -知識產權培訓與教育 -知識產權戰略規劃 4.DeepSeek賦能金融行業-智能投顧與投資分析 -風險管理與欺詐檢測 -客戶服務與智能客服 -信用評分與貸款審批 -市場趨勢分析與預測 -自動化交易與算法交易 -金融產品設計與定價 -合規管理與報告生成 5.DeepSeek賦能跨境貿易-市場分析與需求預測 -供應鏈優化與物流管理 -跨境支付與匯率風險管理 -合規管理與海關申報 -多語言客戶服務與溝通 -貿易伙伴匹配與談判支持 -風險管理與信用評估 -跨境電商營銷與推廣 6.DeepSeek賦能健康醫美-個性化治療方案設計 -客戶管理與智能咨詢 -市場分析與需求預測 -治療效果預測與優化 -智能營銷與個性化推薦 -健康數據管理與分析 -醫美產品設計與優化 -合規管理與報告生成 7.DeepSeek賦能智庫咨詢機構-智能研究與數據分析 -政策分析與預測 -行業趨勢分析與市場預測 -智能報告生成與優化 -客戶服務與智能咨詢 -知識管理與信息檢索 -多語言支持與跨文化分析 -風險管理與決策支持 謝 謝!2025.2.15