1、版權聲明版權聲明本文件內容主要來源于公開新聞報道。所有新聞內容均基于已公開發表的信息。本文件內容受版權保護,禁止任何形式的商業性使用。未經 DAC 全球數據資產理事會明確書面授權,任何單位或個人不得以任何方式復制、傳播、展示、表演、制作衍生作品或進行其他商業性利用。本聲明的解釋權歸 DAC 全球數據資產理事會 所有。對于違反本聲明規定的行為,DAC 全球數據資產理事會有權采取法律手段維護自身權益。1第一章:第一章:DeepSeekDeepSeek 概述概述1.11.1 DeepSeekDeepSeek 核心功能與優勢核心功能與優勢在人工智能技術高速迭代的時代背景下,推理模型作為核心驅動力,持續
2、重塑各行業的發展格局。杭州深度求索科技推出的新一代推理模型 DeepSeek-R1,憑借卓越的性能表現與創新性技術架構,在核心功能與競爭優勢方面實現多維度的突破性進展,成為人工智能領域的重要成果。1 1、構建完備推理能力體系,實施參數規模分層設計、構建完備推理能力體系,實施參數規模分層設計DeepSeek-R1 運用獨特的參數規模分層設計理念,構建了一套完備的推理能力體系。其最大版本的參數規模高達 6710 億,龐大的參數規模賦予模型強大的學習與推理能力,使其在復雜任務處理中表現出色。在數學推理領域,于 AIME測試中,DeepSeek-R1 成功達成 79.8%的準確率,這一數據表明其具備高
3、效且精準解決高難度數學問題的能力,彰顯出深厚的數學推理底蘊。在編程能力方面,DeepSeek-R1 在 Codeforces 競賽中超越 96.3%的人類選手。Codeforces 競賽匯聚全球頂尖編程人才,DeepSeek-R1 在此脫穎而出,充分證明其強大的編程代碼生成與邏輯推理能力。為滿足不同用戶群體的多元化需求,DeepSeek-R1 推出精簡版模型。該精簡版模型采用知識蒸餾技術,將大規模模型的知識進行提煉與濃縮,從而實現于日常設備的本地化部署。這一創新設計意義重大,它使得從科研級的復雜計算到消費級的日常應用,均能受益于 DeepSeek-R1 的強大推理能力,形成覆蓋范圍廣泛、層次分
4、明的完整產品矩陣。2 2、凸顯高性價比優勢,實現推理性能與成本的優化平衡、凸顯高性價比優勢,實現推理性能與成本的優化平衡與 OpenAI-O1 系列對比,DeepSeek-R1 在推理性能上毫不遜色。在 MATH-500測試中,DeepSeek-R1 達到 97.3%的準確率,與 OpenAI-O1 系列保持同等推理性能水平。然而,DeepSeek-R1 的優勢不僅體現于性能,更體現在極具競爭力的性價比方面。通過對強化學習策略的優化,DeepSeek-R1 有效降低成本。其 API 服務成本僅為競品的三分之一,輸入/輸出 tokens 單價分別為 1 元/百萬和 16 元/百萬。在需要高頻調用
5、推理服務的商業場景中,這一成本優勢具有決定性意義。2以電商領域為例,商家在進行商品推薦、用戶行為分析等任務時需頻繁調用推理服務,DeepSeek-R1 的低成本特性能夠助力商家在確保服務質量的同時,大幅降低運營成本,提升企業盈利能力與市場競爭力。3 3、創新雙軌訓練機制,以前沿技術驅動卓越性能、創新雙軌訓練機制,以前沿技術驅動卓越性能在技術架構層面,DeepSeek-R1 采用獨有的雙軌訓練機制。一方面,借助長思維鏈微調技術,模型能夠深入學習將復雜問題拆解為簡單子問題的方法,進而逐步解決復雜問題,顯著提升復雜問題的拆解能力。另一方面,運用無監督強化學習技術,突破傳統訓練范式的局限。在傳統訓練模
6、式下,模型通常依賴大量標注數據,而無監督強化學習使 DeepSeek-R1 在有限標注數據的情況下,仍能維持卓越的推理性能。這種創新的技術路徑取得顯著成效。在 SWE-bench 等工程類測試中,DeepSeek-R1 成功超越 O1 系列。尤為值得關注的是,它實現推理過程的自我反思與迭代優化。如同人類在解決問題時會不斷總結經驗、反思方法,DeepSeek-R1在推理過程中能夠持續優化自身推理策略,形成類似人類的問題解決思維鏈。這一特性使模型在面對復雜多變的問題時,能夠更加靈活、高效地尋求解決方案。4 4、強化靈活部署能力,拓寬模型應用邊界、強化靈活部署能力,拓寬模型應用邊界DeepSeek-
7、R1 在部署靈活性方面表現卓越。它支持 4bit 量化壓縮技術,通過對模型參數的壓縮,在不影響模型性能的前提下,減少模型的存儲空間與計算資源需求。同時,動態模型切換技術的應用,使模型能夠依據不同的應用場景與需求,靈活切換不同的模型版本,以實現最佳性能表現。這種強大的部署靈活性,使 DeepSeek-R1 既能適配云端分布式系統,如在電商數據爬蟲架構中,能夠高效處理海量數據,為電商企業提供精準的市場數據與用戶信息;又能在本地設備實現每秒 60 tokens 的高效響應,在智能座艙交互場景中,能夠快速響應用戶語音指令,提供流暢的交互體驗;在工業級數據處理中,亦能憑借高效的計算能力與靈活的部署方式,
8、滿足工業生產對數據處理的高要求。從智能座艙交互到工業級數據處理,DeepSeek-R1 的彈性部署能力顯著拓寬其應用邊界,為各行業的智能化升級提供有力支撐。5 5、促進開源生態與商業服務協同,重塑行業發展格局、促進開源生態與商業服務協同,重塑行業發展格局在市場應用層面,DeepSeek-R1 通過獨特的開源策略構建強大的生態優勢。3它將部分版本的模型權重免費開放,這一舉措極大降低開發者的準入門檻,吸引全球眾多開發者參與基于 DeepSeek-R1 的應用開發。同時,DeepSeek-R1 提供標準化 API 與定制化訓練框架的雙重支持。對于企業用戶而言,標準化 API 使其能夠快速接入基礎服務
9、,節省開發時間與成本;定制化訓練框架則允許企業針對私有數據進行深度優化,打造契合企業特定需求的 AI 應用。相較于同類模型,DeepSeek-R1 的顯著特征在于成功平衡專業級推理性能與普惠化服務供給。在 LiveBench 測試中,其問題解決率較前代提升 46%,而單位解題成本降至傳統方案的 1/30。這種技術突破與商業模式的協同創新,正深刻重塑 AI 推理服務的行業格局。它不僅為開發者和企業提供更強大、更經濟、更靈活的 AI 推理解決方案,也推動整個 AI 行業朝著更加開放、創新、普惠的方向發展。DeepSeek-R1 憑借在參數規模分層設計、性價比優勢、雙軌訓練機制、靈活部署以及開源生態
10、與商業服務協同等多維度的創新與突破,展現出強大的核心功能與競爭優勢。展望未來,DeepSeek-R1 有望在更多領域發揮關鍵作用,推動人工智能技術的持續發展與廣泛應用。41.21.2 如何快速上手如何快速上手1.2.11.2.1 訪問方式訪問方式DeepSeek-R1 提供了網頁版和 App 兩種使用方式,無論你是電腦黨還是手機黨,都能找到適合自己的方式。網頁版:直接訪問官網 chat.DeepS 使用,完全免費,無需下載,隨時隨地都能使用。App:在各大應用商店搜索“DeepSeek”,認準藍色鯨魚圖標,下載安裝后即可開啟 AI 之旅。51.2.21.2.2 基礎功能基礎功能基礎功能進入 D
11、eepSeek-R1 的聊天界面,你會看到兩個關鍵開關:“深度思考”和“聯網搜索”。深度思考:開啟這個功能,便是調用 DeepSeek-R1 模型,它會根據你的問題進行深度推理,給出更精準的答案、更有深度的回答。如果不開啟,默認情況下,DeepSeek 使用的是 V3 模型。聯網搜索:這個功能讓 DeepSeek-R1 能夠參考最新的網絡信息,確?;卮鸬臅r效性和準確性。如果不開啟,默認情況下,DeepSeek 使用的是截至 2023 年 10月的訓練數據。而且,如果提供的是網絡鏈接,一定要打開這個功能,否則他會告訴你無法訪問。6第二章:提示詞使用技巧第二章:提示詞使用技巧早期的 AI 模型(如
12、 SFT 模型)像剛學走路的孩子,需要明確的指令和分步驟示范(比如 Chain-of-thoughts 和 Few-shots),才能輸出符合預期的內容。但像 GPT-o1、Deepseek-R1 這類經過強化學習訓練的模型,已經像學會自主解題的學生它們通過大量 Q&A 訓練出了自己的推理能力。這時候如果還用第一步、第二步的詳細指令,反而會干擾它們的思考節奏,就像給高中生強行規定用小學算術步驟解題。以基金報告案例為例舊版 SFT 模型適用寫法:請按以下步驟制作基金分析報告:先收集基金凈值、收益率等數據用 Excel 計算各項指標對比同類基金表現分析市場環境最后整理成報告新版 RL 模型適用寫法
13、:“我需要一份某基金的財務分析報告,請包含核心財務指標、市場對比和風險評估等要素”RL 模型會自動生成完整分析框架(數據收集指標計算橫向對比環境分析報告整合),而分步驟指令反而會限制其發揮已掌握的金融分析能力。就像讓大學生用小學算術步驟解題,反而降低效率。72.12.1 把握把握 DeepSeek-R1DeepSeek-R1 提示詞的兩大核心要素提示詞的兩大核心要素2.1.12.1.1 輸入輸出設計輸入輸出設計DeepSeek-R1 在輸入輸出設計以用戶需求為導向,構建了極為簡潔高效的模式。用戶在使用時,只需向模型輸入清晰明確的問題,無需復雜的格式編排或冗余表述,模型便會依據自身強大的算法和豐
14、富的知識儲備,快速處理信息,精準輸出精煉且切題的結果。這種直接明了的輸入輸出設計,不僅大幅減少了用戶與模型交互時的理解成本和操作難度,還顯著提升了交互效率,讓用戶能更便捷、快速地獲取所需信息,在各類應用場景中都展現出了極高的實用性和易用性。1 1、輸入設計:簡潔明確的任務指令設定、輸入設計:簡潔明確的任務指令設定在輸入環節,旨在讓用戶以最簡潔的方式傳達核心任務目標。就如同給朋友布置任務時,我們只需清晰說明“要做什么”,而無需詳述具體的操作步驟。例如,當用戶希望進行金融領域的分析時,直接輸入“請分析基金投資價值”,模型便能迅速捕捉到核心任務。這與傳統的模型使用方式形成鮮明對比,以往在使用某些模型
15、時,用戶可能需要像教導實習生一樣,詳細羅列從數據收集、整理到分析的每一個步驟,過程繁瑣且低效。DeepSeek-R1 這種設計的背后,依托于其強大的深度推理能力。模型能夠基于用戶輸入的簡潔指令,自動在海量的知識儲備中進行檢索和分析,理解任務的深層含義和潛在需求。以委托專業顧問制定家庭理財方案為例,用戶只需告知“制定家庭理財方案”,模型就如同專業顧問一樣,明白需要綜合考慮用戶的收入、支出、資產狀況、風險承受能力等多方面因素,進而展開全面的分析和規劃。2 2、輸出設計:精準可控的成果交付標準、輸出設計:精準可控的成果交付標準DeepSeek-R1 在輸出環節,對于成果交付標準設定明確。這就像建筑工
16、程驗收時,不僅要求完成大樓建造,還需明確達到如 LEED 金級認證標準等具體要求。在與模型交互中,用戶通過清晰表述“要什么樣的結果”,能夠引導模型輸出更符合預期的內容。例如,當用戶要求模型“用中學生能理解的體育競技案例解釋金融風險對沖”時,模型接收到這一目標導向的指令后,會充分調動其強大的類比推理能力。它可能會將金融市場中的風險比作體育比賽中的各種不確定因素,如比賽中的對手實力、突發狀況等,而將風險對沖策略類比為運動員或團隊為應對這些不確定因8素所采取的戰術安排,如防守策略、戰術調整等。通過這樣生動形象的類比,模型能夠以中學生易于理解的方式,清晰闡述金融風險對沖這一復雜概念。這種輸出設計,使得
17、用戶能夠根據具體需求,精確引導模型的輸出方向和內容風格。無論是在學術研究、商業分析還是日常創作中,用戶都能通過設定明確的輸出標準,獲得針對性強、質量高的結果。例如在撰寫學術論文時,用戶可以要求模型“以嚴謹的學術語言,結合最新的研究成果,闡述人工智能在醫療領域的應用前景”,模型便會遵循這一要求,輸出符合學術規范、內容詳實的文本。DeepSeek-R1 的提示詞輸入輸出設計,通過簡化輸入流程、明確輸出標準,降低了用戶的使用門檻,提高了交互效率,還充分發揮了模型的深度推理和強大的語言處理能力,為用戶帶來了更加智能、便捷、高效的使用體驗,在眾多應用場景中展現出獨特的優勢和價值。隨著技術的不斷發展和應用
18、的深入,這種設計理念有望進一步拓展和優化,為人工智能與各行業的融合發展提供更有力的支持。2.1.22.1.2 信息傳遞原則信息傳遞原則在 DeepSeek-R1 的提示詞輸入輸出體系中,動態平衡原則起著關鍵作用,它涉及任務描述與結果要求兩個維度的連續光譜調節,旨在實現用戶與模型之間高效、精準的信息傳遞,從而達成最優的交互效果。1 1、任務描述維度:隱式模糊與顯式具體的動態調節、任務描述維度:隱式模糊與顯式具體的動態調節在任務描述維度,存在著從隱式模糊到顯式具體的遞進空間,這一空間為用戶提供了多樣化的交互選擇,以適配不同的應用場景和需求。(1)隱式指令:賦予模型探索空間隱式指令類似于布置開放式研
19、究課題,僅傳達寬泛的任務核心,如“分析基金表現”。這種指令方式給予 DeepSeek-R1 充分的探索自由,模型憑借其強大的知識儲備和深度推理能力,對任務進行全面的理解與分析。在這一過程中,模型會自主檢索相關的金融數據、市場動態以及各類基金評價指標,從多個維度對基金表現展開研究,包括但不限于基金的歷史收益情況、風險波動特征、投資策略的有效性等。通過這種方式,模型能夠挖掘出潛在的、多層面的信息,為用戶提供較為全面且具有探索性的分析結果,適用于用戶對基金表現僅有初步了解需求,希望獲取廣泛信息的場景。(2)顯式指令:提升輸出針對性9顯式指令則如同設計實驗參數,通過精確限定任務范圍和關鍵要素,使模型輸
20、出更具針對性。例如,“對比 2022-2024 年中美新能源基金夏普比率與最大回撤”。在此指令中,明確了時間范圍(2022-2024 年)、研究對象(中美新能源基金)以及具體的分析指標(夏普比率與最大回撤)。DeepSeek-R1 接收到此類指令后,能夠聚焦于特定的數據和分析方向,快速篩選出相關信息,避免在無關信息上的無效運算,從而高效地生成滿足用戶特定需求的結果。這種指令方式適用于用戶對分析內容有明確要求,需要獲取精準、特定信息的場景,如在投資決策過程中,投資者需要基于特定時間段和特定指標對基金進行對比分析,以做出合理的投資選擇。2 2、結果要求維度:抽象、結果要求維度:抽象-具體軸的精準校
21、準具體軸的精準校準在結果要求維度,沿著抽象-具體軸進行校準是實現精確信息傳遞的另一關鍵。(1)抽象目標:依賴模型自主構建框架抽象目標的設定類似要求“提供專業級行業分析”,這主要依賴 DeepSeek-R1的知識儲備和對行業的理解來自主構建分析框架。模型會根據任務描述和自身對行業的認知,確定分析的關鍵要點和邏輯結構。例如,在進行金融行業分析時,模型可能會從宏觀經濟環境、行業政策法規、市場競爭格局、主要企業發展態勢等多個層面展開,運用專業的金融分析方法和理論,對行業的現狀和未來發展趨勢進行綜合評估。這種方式能夠充分發揮模型的專業能力和知識整合能力,為用戶提供一個全面、系統的行業分析框架,適用于用戶
22、對分析結果的結構和內容沒有具體要求,僅希望獲取專業視角的整體分析的場景。(2)具體目標:引導輸出結構化形態具體目標則如“生成含五年收益波動率、管理費比較等 10 項指標的對比矩陣”,通過明確的結構化要素引導模型輸出特定形態的結果。在這種情況下,用戶清晰地定義了所需結果的結構和內容要素,DeepSeek-R1 會按照這些要求,有針對性地組織數據和信息,生成符合要求的對比矩陣。這種方式能夠確保輸出結果的格式和內容滿足用戶的特定需求,便于用戶直接應用于實際工作或決策中,如在投資研究報告撰寫過程中,需要以特定的表格形式呈現基金對比數據,以便直觀地進行分析和比較。103 3、信息傳遞的整體動態平衡:類比
23、導航系統的精準交互、信息傳遞的整體動態平衡:類比導航系統的精準交互DeepSeek-R1 提示詞信息傳遞的動態平衡原則,可類比為使用導航軟件。在導航過程中,用戶只需準確輸入起點和終點信息,導航系統便會依據算法自動規劃出合理的路線。若用戶在導航過程中頻繁進行不必要的干預,如不斷指揮“下個路口左轉”,反而可能干擾系統的正常運算邏輯,導致導航結果的混亂。在與DeepSeek-R1 交互時,用戶應明確告知任務描述和結果要求,例如“我要從北京南站到首都機場 T3,要避開擁堵路段”,其中“從北京南站到首都機場 T3”相當于任務描述,“避開擁堵路段”則類似結果要求。用戶通過這種清晰、準確的信息傳遞方式,將任
24、務交給 DeepSeek-R1 的算法進行處理,模型便能依據自身的能力和算法,生成滿足用戶需求的高質量輸出結果,實現高效、精準的交互。DeepSeek-R1 的提示詞信息傳遞原則,通過在任務描述和結果要求兩個維度上的動態平衡調節,為用戶提供了靈活且精準的交互方式。這一原則不僅充分發揮了模型的強大能力,還提升了用戶與模型交互的效率和質量,在金融分析、學術研究、商業決策等眾多領域展現出顯著的應用價值,為推動人工智能在各行業的深度應用奠定了堅實基礎。112.22.2 DeepSeek-R1DeepSeek-R1 提示詞的具體使用技巧提示詞的具體使用技巧在運用 DeepSeek-R1 進行任務處理時,
25、編寫清晰、具體的提示語是確保輸出高質量結果的核心要素,其關鍵在于精準明確問題以及清晰界定期望的結果。掌握科學有效的提示詞使用技巧,能夠充分發揮 DeepSeek-R1 的強大功能,實現用戶與模型之間的高效交互。1 1、精準識別任務類型,適配提示詞形式、精準識別任務類型,適配提示詞形式(1)隱式任務:引導模型自主探索隱式任務的目標通常較為模糊,這就需要 DeepSeek-R1 憑借自身的算法和知識儲備,對任務的具體要求進行自主推斷。例如,當用戶輸入“探討科技發展趨勢”時,這屬于典型的隱式任務。此時,模型會從多個維度展開探索,包括但不限于當前熱門的科技領域,如人工智能、量子計算、生物技術等,以及這
26、些領域在技術突破、市場應用、政策導向等方面的發展趨勢。為了引導模型更全面且深入地探索,用戶可以在提示詞中適當補充背景信息或限定一定的探索范圍,如“基于當前全球經濟格局,探討未來五年內可能對經濟產生重大影響的科技發展趨勢”。這樣的提示詞能夠在給予模型探索自由的同時,避免其探索方向過于發散,從而獲取更具針對性和價值的信息。(2)顯式任務:精確傳達任務指令顯式任務具有明確的目標,且對具體步驟和結果都有詳細說明。以“計算2023 年全年滬深 300 成分股的平均市盈率,并按照市盈率從低到高進行排序”為例,這一任務明確了時間范圍(2023 年全年)、研究對象(滬深 300 成分股)、具體操作(計算平均市
27、盈率)以及結果呈現方式(按照市盈率從低到高排序)。在處理顯式任務時,用戶務必確保提示詞的準確性和完整性,避免出現歧義或信息缺失。每一個關鍵要素都應清晰表述,DeepSeek-R1 才能快速準確地理解任務要求,高效篩選和處理相關數據,輸出符合要求的結果。(3)復合任務:合理拆解與整合復合任務包含多個子任務,每個子任務可能具有不同的具體要求。比如,“為一家計劃進入新能源汽車市場的企業制定市場戰略,包括市場調研分析、目標客戶群體定位、競爭對手分析以及初步的產品推廣策略”。這一任務涵蓋了市場調研、客戶定位、競品分析和推廣策略等多個子任務。在編寫提示詞時,用戶需要12將復合任務合理拆解,明確每個子任務的
28、具體要求和先后順序??梢圆捎媒Y構化的表述方式,如“首先,進行新能源汽車市場的全面調研分析,包括市場規模、增長趨勢、政策環境等;其次,基于調研結果,精準定位目標客戶群體,分析其消費特征和需求;然后,對主要競爭對手進行詳細分析,包括其產品特點、市場份額、競爭優勢等;最后,根據前面的分析結果,制定初步的產品推廣策略”。通過這種方式,DeepSeek-R1 能夠有條不紊地完成各個子任務,并將結果進行有效整合,形成完整的市場戰略方案。2 2、根據任務類型,明確結果預期、根據任務類型,明確結果預期(1)抽象結果:給予模型發揮空間當任務預期的是抽象結果時,結果通常較為寬泛,不包含具體細節。例如,要求 Dee
29、pSeek-R1“對當前教育行業的變革進行分析”,模型可能會從教育理念的轉變、教學模式的創新、技術應用對教育的影響等多個宏觀層面進行闡述。在這種情況下,用戶可以在提示詞中適當引導模型的分析方向,如“從社會發展和技術進步的角度,對當前教育行業的變革進行深入分析”,但無需對結果的具體內容和形式進行過多限制,讓模型能夠充分發揮其知識整合和分析能力,輸出具有宏觀視野和深度洞察的內容。(2)具體結果:清晰界定形式與結構對于期望獲得具體結果的任務,結果具有明確的形式和結構,如數據表格、圖表等。比如,“生成一份近五年中國智能手機市場份額的年度對比表格,包含主要手機品牌及其市場份額數據”。在編寫此類提示詞時,
30、用戶必須清晰界定結果的具體形式和結構,包括表格的列標題(年份、手機品牌、市場份額等)、數據的準確性要求以及數據來源的限定等。這樣,DeepSeek-R1 能夠根據明確的要求,準確地收集和整理數據,生成符合標準的數據表格,方便用戶直接使用或進一步分析。(3)結構化結果:規范模塊內容與格式結構化結果包含多個模塊或部分,每個部分都有明確的內容和格式要求。以撰寫一份商業計劃書為例,要求 DeepSeek-R1“生成一份包含項目概述、市場分析、產品或服務介紹、營銷策略、財務規劃和風險評估等模塊的商業計劃書,每個模塊內容不少于 500 字,采用嚴謹的學術格式,引用權威數據和案例進行論證”。13在這種情況下
31、,用戶不僅要明確各個模塊的內容要求,還要規范格式,如字體、字號、段落間距、引用格式等。通過詳細的提示詞設定,DeepSeek-R1 能夠按照既定的結構和要求,生成內容豐富、格式規范的商業計劃書,滿足用戶在實際商業活動中的需求。3 3、編寫提示語的技巧、編寫提示語的技巧(1)使用量詞和限定詞量詞:在提示詞中運用“5 種”“10 個”等量詞,能夠有效突破思維慣性。例如,當要求 DeepSeek-R1 生成解決某類問題的方案時,使用“提供 5 種不同的創新解決方案”,可促使模型從不同角度思考,生成多樣化的解決方案,避免方案的單一性和局限性。這是因為模型在處理任務時,會依據量詞的限定,全面調動其知識儲
32、備,進行更廣泛的搜索和推理,從而挖掘出更多潛在的解決方案。限定詞:通過領域限定詞能夠保持思維的發散方向,避免思維過于發散或過于狹窄。例如,“在遠程辦公場景下,探討提高團隊協作效率的方法”,“在遠程辦公場景下”這一限定詞明確了問題的應用場景,使模型能夠聚焦于該場景下的相關因素,如遠程溝通工具的使用、虛擬團隊管理等,生成更具針對性的內容。又如,“基于 SaaS 平臺,分析企業數字化轉型的策略”,“基于 SaaS 平臺”限定了分析的基礎平臺,模型會圍繞 SaaS 平臺的特點、優勢以及在企業數字化轉型中的作用等方面展開分析,輸出更貼合實際需求的內容。(2)結構化指令模塊化設計:對于復合任務,將任務分解
33、為多個模塊,每個模塊設定明確的要求,有助于提高模型處理任務的效率和準確性。例如,“生成含三大模塊(宏觀影響、企業對比、投資建議)的 Markdown 文檔”,這種模塊化的指令使模型清晰地了解任務的組成部分和各部分的具體要求,能夠有針對性地進行內容生成。在生成過程中,模型會分別對宏觀影響、企業對比和投資建議這三個模塊進行獨立的分析和內容創作,然后按照 Markdown 文檔的格式要求進行整合,最終生成結構清晰、內容完整的文檔。具體格式要求:明確輸出的具體格式,如 PDF、Excel 表格、Mermaid 圖等,能讓模型生成符合特定格式要求的結果,方便用戶使用。例如,“制作包含時間序列折線圖和數據
34、表格的 PDF”,用戶明確要求輸出為 PDF 格式,且包含時間序14列折線圖和數據表格。模型在處理任務時,會根據 PDF 格式的規范,生成相應的圖表和數據,并進行合理的排版,確保生成的 PDF 文件能夠滿足用戶在展示、打印或進一步分析等方面的需求。(3)明確任務步驟分步指導:對于復雜的任務,分步驟給出指導,每一步驟都有具體的要求,能夠幫助模型更好地理解任務流程,提高任務處理的準確性。例如,“按概念-公式-應用結構排列,對機器學習中的決策樹算法進行詳細闡述”,模型會按照這一結構要求,首先對決策樹算法的概念進行清晰的解釋,然后給出相關的公式推導,最后結合實際案例說明其應用場景和方法。通過這種分步指
35、導的方式,模型能夠有條不紊地完成復雜任務,生成邏輯連貫、內容詳實的結果。示例參考:提供示例或參考模板,能幫助 DeepSeek-R1 更好地理解任務要求,生成更符合用戶期望的內容。例如,“用廚房用具類比說明歐姆定律,包含至少3 個生活案例”,通過給出“用廚房用具類比”這一示例和“至少 3 個生活案例”的要求,模型能夠明確任務的表達方式和內容豐富度要求。模型會將歐姆定律中的電流、電壓、電阻等概念與廚房用具中的水流、水壓、水管粗細等進行類比,然后結合具體的廚房場景,如使用水龍頭調節水流大小類比調節電壓改變電流等,生成生動形象、易于理解的內容。(4)專業術語和標準專業術語:在提示詞中使用專業術語和行
36、業標準,能夠確保輸出的專業性和準確性。例如,在醫療領域,“使用最新臨床指南標準,對某疾病的診斷和治療方案進行分析”,模型會依據最新的臨床指南標準,運用專業的醫學術語,對疾病的診斷方法、治療原則、藥物選擇等進行準確的分析和闡述。這使得生成的內容能夠滿足醫療專業人員的需求,為臨床決策提供可靠的參考。技術規范:對于技術任務,明確技術規范和標準至關重要。例如,“處理 n100 的輸入,設計一個高效的算法”,“處理 n100 的輸入”明確了算法的輸入范圍,模型在設計算法時會考慮在這一輸入范圍內的效率和準確性。又如,“提供狀態碼 415/503 應對方案”,模型會針對 HTTP 狀態碼 415(不支持的媒
37、體類型)和 503(服務不可用),按照相關的網絡技術規范,給出相應的故障排查和解決方法,確保生成的應對方案符合技術標準和實際應用需求。15在使用 DeepSeek-R1 時,用戶通過精準識別任務類型,合理編寫提示詞,并根據任務類型明確結果預期,同時運用上述編寫提示語的技巧,能夠實現與模型的高效交互,充分發揮其強大的功能,獲得高質量的輸出結果。這不僅有助于提升工作效率和決策質量,還能推動 DeepSeek-R1 在更多領域的深入應用和創新發展。162.32.3 生活場景實戰案例示范生活場景實戰案例示范1 1、金融投資分析場景、金融投資分析場景(1)隱式任務+抽象結果Q:評估特斯拉股票投資價值A:
38、“給出專業風險評估報告”(2)顯式任務+抽象結果Q:對比特斯拉與比亞迪 2023 年 Q3 財報中的研發投入占比A:“用汽車制造業的行業標準進行分析”(3)顯式任務+具體結果Q:提取近五年蘋果公司股息支付率的季度數據A:“制作包含時間序列折線圖和數據表格的 PDF”(4)復合任務+結構化結果Q:分析美聯儲加息對科技股的影響,對比微軟/谷歌/亞馬遜的系數變化A:“生成含三大模塊(宏觀影響、企業對比、投資建議)的 Markdown 文檔,每模塊不超過 300 字”2 2、教育輔導場景、教育輔導場景(1)隱式任務+抽象結果Q:解釋光速不變原理A:“讓初中生能理解基本概念”(2)顯式任務+抽象結果Q:
39、用廚房用具類比說明歐姆定律A:“包含至少 3 個生活案例”(3)顯式任務+具體結果Q:設計三角函數入門課程的 5 個知識點A:“按概念-公式-應用結構排列”(4)復合任務+結構化結果Q:創建針對高考物理的 30 天復習計劃A:“輸出 Excel 表格,含每日主題/重點公式/典型例題編號,按力學-電磁17學-熱學模塊劃分”3 3、醫療咨詢場景、醫療咨詢場景(1)隱式任務+抽象結果Q:分析我的體檢報告異常項A:“給出專業醫學建議”(2)顯式任務+抽象結果Q:對比幽門螺桿菌感染不同治療方案的優劣A:“使用最新臨床指南標準”(3)顯式任務+具體結果Q:列出高血壓患者飲食禁忌的 20 種食物A:“按鈉含
40、量/膽固醇/嘌呤等指標分類”(4)復合任務+結構化結果Q:根據患者數據(男/55 歲/BMI28/空腹血糖 7.8)制定健康管理方案A:“包含運動處方(頻率/強度/時長)、膳食模板(早中晚熱量分配)、監測指標(每周檢測項目)”4 4、代碼開發場景、代碼開發場景(1)隱式任務+抽象結果Q:開發 TODO 列表應用A:“實現基本功能”(2)顯式任務+抽象結果Q:用 React 構建支持分類標簽的 TODO 應用A:“遵循組件化設計原則”(3)顯式任務+具體結果Q:編寫 Python 函數計算斐波那契數列第 N 項A:“包含時間/空間復雜度注釋,處理 n100 的輸入”(4)復合任務+結構化結果Q:
41、創建分布式爬蟲系統抓取電商價格數據A:“輸出包含架構圖(Mermaid 格式)、核心類偽代碼(Java/Python 雙版本)、異常處理流程(狀態碼 415/503 應對方案)的技術文檔”。18第三章:第三章:DeepSeekDeepSeek 部署教程部署教程3.13.1 本地部署本地部署3.1.13.1.1 選擇適合你的選擇適合你的 DeepSeekDeepSeek 模型大小模型大小在部署前,要根據自己的硬件配置和使用場景選擇合適的模型大小,具體參考如下:模型版本模型版本CPUCPU內內存存顯卡顯卡存存儲儲網絡網絡DeepSeek-R1-1.5B任意四核處理器8GB無需 GPU12GB本地部
42、署無需高帶寬,云端需100MbpsDeepSeek-R1-7BRyzen7 或更高16GBRTX3060(12GB)或更高80GB本地部署無需高帶寬,云端需100MbpsDeepSeek-R1-14Bi9-13900K或更高32GBRTX4090(24GB)或更高200GB本地部署無需高帶寬,云端需100MbpsDeepSeek-R1-32BXeon8 核+128GB 或更高64GB2-4 張 A10080GB 或更高320GB多卡需 PCle4.0 互聯,云端部署建議1Gbps 帶寬DeepSeek-R1-70BXeon8 核+128GB 或更高128GB8+張 A100/H100,顯存80
43、GB/卡500GB+NVIDIANVLink/lnfiniBand(200Gbps)互聯193.1.23.1.2 安裝安裝 OllamaOllamaOllama 是一個本地模型運行工具,可以方便地下載和運行各種開源模型,正好適合我們的 DeepSeek。下載地址:https:/ Ollama 版本,并進行安裝203.1.33.1.3 下載并運行下載并運行 deepseekdeepseek 模型模型按 Win 鍵輸入 cmd 打開命令提示符并輸入【Ollama】后按下回車,如下圖所示即為安裝成功。21安裝命令如下:安裝完成后出現【success】則代表安裝成功1、內存低于 4GB 安裝命令如下:
44、ollama run deepseek-r1:1.5b2、內存在 8GB-12GB 安裝命令如下:ollama run deepseek-r1:7bollama run deepseek-r1:8b3、內存在 12GB 以上安裝命令如下:ollama run deepseek-r1:14b4、內存在 32GB 以上安裝命令如下:ollama run deepseek-r1:32b5、內存在 70GB 以上安裝命令如下:ollama run deepseek-r1:70b注意:內存越高,效果越好,但占用儲存會更多。223.23.2 云端部署云端部署如果你電腦配置不夠,又想直接在客戶端應用里體驗
45、DeepSeek-R1&V3 模型,可在本地安裝以下產品,接入 SiliconCloud 或者阿里云百煉等 API 后(可自定義添加這兩款模型),即可體驗 DeepSeek-R1&V3。大模型客戶端應用:ChatBox、Cherry Studio、OneAPI、LobeChat、NextChat代碼生成應用:Cursor、Windsurf、Cline大模型應用開發平臺:DifyAI 知識庫:Obsidian AI、FastGPT翻譯插件:沉浸式翻譯、歐路詞典接下來以 Cherry Studio 為例,來學習如何部署3.2.13.2.1 安裝安裝 CherryCherry StudioStudi
46、oCherry Studio 是一款支持多模型服務的桌面客戶端,內置了超過 30 個行業的智能助手,旨在幫助用戶在多種場景下提升工作效率。它兼容 Windows、Mac和 Linux 系統,無需復雜設置即可使用。進入 Cherry Studio 官網(https:/cherry- Cherry Studio 即可直接使用。233.2.23.2.2 配置配置 SiliconCloudSiliconCloud 等線上模型服務等線上模型服務1、打開并點擊 Cherry Studio 左下角的“設置”,在模型服務中選擇默認的【硅基流動】。2、注冊硅基流動訪問下面的鏈接注冊硅基流動 https:/ 14
47、 元的 2000 萬 token 的額度,可以用于后續模型使用。24登錄后在左邊的導航欄找到 API 密鑰。點右上角的新建 API 密鑰。密鑰描述隨便寫,可以建多個密鑰,別忘記這是啥就行。新建完成后會得到一個加密的 API Key 了,就是你的密鑰,點擊密碼就能復制,后面會用到這個 API Key。25點擊 API 密鑰新建或復制已有密鑰,并將密鑰填入 Cherry Studio 的 API密鑰。點擊管理/添加模型??蛇x擇添加 SiliconCloud 上的其他各類模型。點擊左側菜單欄的“對話”按鈕,然后在輸入框內輸入文字即可開始聊天。你可以選擇頂部菜單中的模型名字切換模型。26第四章第四章
48、DeepSeekDeepSeek 的應用場景和前景的應用場景和前景4.14.1 DeepSeekDeepSeek 應用場景應用場景DeepSeek-R1 以其卓越的性能、創新的技術架構和出色的性價比,在多個行業實現了規?;瘧媒尤?,構建起一個覆蓋消費電子、云計算、金融、通信等多領域的立體化生態布局,展現出強大的技術滲透力和生態擴展性,成為推動各行業智能化變革的重要力量。1 1、消費電子領域:主流品牌深度融合,打造智能交互新體驗、消費電子領域:主流品牌深度融合,打造智能交互新體驗在消費電子領域,DeepSeek-R1 的應用成果顯著。華為率先接入,開啟了該模型在消費電子產品中的應用先河。隨后,O
49、PPO、榮耀、魅族、vivo 四大手機廠商迅速跟進,相繼完成系統級整合,深度挖掘 DeepSeek-R1 的技術優勢,為用戶帶來智能化交互升級。OPPO Find N5 借助小布助手,依托 DeepSeek-R1 強大的自然語言處理能力,實現了精準的語音喚醒功能。用戶只需說出喚醒詞,手機便能迅速響應,執行各類指令,大大提升了操作便捷性。同時,其本地文件生成功能利用模型的智能創作能力,能夠根據用戶輸入的簡單提示,生成結構清晰、內容豐富的文檔、郵件等,滿足用戶多樣化的創作需求,有效提升了工作效率。榮耀MagicOS8.0用戶可通過YOYO智能體商店直接調用DeepSeek-R1的模型服務。無論是智
50、能問答、信息檢索,還是復雜的內容創作,用戶都能在 YOYO 智能體商店中一站式完成。這不僅豐富了用戶的交互體驗,還為榮耀手機在智能助手領域樹立了差異化競爭優勢,進一步提升了產品的市場競爭力。魅族 21 系列及 AR 眼鏡產品線也已啟動 DeepSeek-R1 的功能上線。在魅族21 系列手機中,模型賦能語音助手,使其具備更智能的語義理解和交互能力,能夠根據用戶的語境和習慣,提供更加個性化的服務。在 AR 眼鏡產品線中,DeepSeek-R1 助力實現實時的圖像識別與信息交互,為用戶帶來沉浸式的增強現實體驗,推動 AR 技術在消費級產品中的普及和應用。目前,DeepSeek-R1 已形成覆蓋國內
51、主流手機品牌(除小米外)的移動端應用矩陣,構建起一個龐大的智能交互生態系統,推動消費電子行業朝著智能化、27個性化方向加速發展。2 2、云計算領域:十大云平臺深度對接,賦能云服務智能化升級、云計算領域:十大云平臺深度對接,賦能云服務智能化升級在云計算領域,華為云、騰訊云、阿里云、百度智能云、移動云、中國聯通、京東云等十大云平臺已完成與 DeepSeek-R1 的深度技術對接,共同探索智能化云服務的新范式。移動云依托其分布廣泛的 13 個智算中心,為 DeepSeek-R1 提供蒸餾與智能體編排服務。智算中心強大的計算能力,能夠對模型進行高效的優化蒸餾,在保證模型性能的前提下,減少模型的計算資源
52、需求,使其能夠更加高效地運行。同時,智能體編排服務根據不同用戶的業務需求和場景特點,靈活組合DeepSeek-R1 的各項功能,為用戶提供定制化的智能解決方案,滿足企業多樣化的業務需求。京東云通過言犀平臺實現了 DeepSeek-R1 的一鍵部署,極大地簡化了企業接入模型的流程。企業只需通過言犀平臺,即可快速將 DeepSeek-R1 集成到自己的業務系統中,無需復雜的技術搭建和配置,便能享受其強大的智能服務,大幅降低了企業使用人工智能技術的門檻,加速企業數字化轉型進程。中國聯通星羅平臺支持私有化與公有化場景的靈活切換,滿足不同企業對數據安全性和隱私性的不同需求。對于對數據安全要求極高的金融、
53、政府等行業客戶,星羅平臺提供私有化部署方案,確保企業數據在本地安全可控;對于一般性企業,公有化場景則提供便捷、高效的智能服務,降低企業運營成本。通過這種靈活的部署方式,中國聯通能夠為不同類型的客戶提供定制化的云計算服務,進一步拓展了 DeepSeek-R1 的應用場景。通過與十大云平臺的緊密合作,DeepSeek-R1 為云計算服務注入了強大的智能動力,推動云服務向智能化、個性化、定制化方向邁進,助力企業在數字化時代實現更高效的發展。3 3、金融行業:頭部券商集中接入,加速金融智能化轉型、金融行業:頭部券商集中接入,加速金融智能化轉型金融行業對 DeepSeek-R1 的應用呈現爆發式增長態勢
54、。春節前后,包括華安證券、東興證券、光大證券、中信建投證券等在內的 13 家頭部券商已完成DeepSeek-R1 的本地化部署,將其深度融入金融業務的核心環節。在智能投研方面,DeepSeek-R1 強大的數據分析和預測能力,能夠對海量的28金融市場數據進行實時分析和挖掘,為投資決策提供全面、準確的市場洞察和風險評估。通過對宏觀經濟數據、行業動態、公司財務報表等多維度數據的深度分析,模型能夠快速生成投資研究報告,為分析師提供高效的研究輔助工具,大大提升了投研效率和質量。在風險建模領域,DeepSeek-R1 利用其卓越的機器學習能力,構建更加精準的風險預測模型。通過對歷史數據和實時市場數據的學
55、習,模型能夠準確識別潛在的風險因素,提前預警風險事件,幫助金融機構及時采取風險控制措施,降低風險損失。例如,在信用風險評估中,模型能夠綜合考慮客戶的信用記錄、財務狀況、行業風險等因素,給出更加準確的信用評分,為金融機構的信貸決策提供有力支持。隨著越來越多的金融機構接入 DeepSeek-R1,其在金融行業的應用場景將不斷拓展,有望推動金融行業實現智能化、數字化轉型,提升金融服務的效率和質量,為實體經濟的發展提供更有力的支持。4 4、通信基礎設施領域:三大運營商全面接入,提升通信智能化水平、通信基礎設施領域:三大運營商全面接入,提升通信智能化水平在通信基礎設施層面,中國移動、中國電信、中國聯通三
56、大基礎電信企業已全面接入 DeepSeek-R1 模型,結合自身的 5G 網絡與云平臺能力,在多個領域實現了技術突破。在客服系統優化方面,DeepSeek-R1 的自然語言處理能力使得客服機器人能夠更加準確地理解用戶的問題和需求,提供更加智能、高效的服務。通過對用戶語音和文字信息的實時分析,客服機器人能夠快速給出準確的解答和解決方案,大大縮短了用戶等待時間,提升了客戶滿意度。同時,模型還能夠對客服對話數據進行分析,挖掘用戶需求和潛在問題,為運營商優化服務策略提供數據支持。在網絡智能運維方面,DeepSeek-R1 利用其強大的數據分析和預測能力,對網絡運行數據進行實時監測和分析,提前預測網絡故
57、障和性能瓶頸,實現網絡的智能化運維。通過對網絡流量、設備狀態、用戶行為等多維度數據的分析,模型能夠及時發現網絡中的異常情況,并提供相應的優化建議,幫助運營商提高網絡的穩定性和可靠性,降低運維成本。此外,三大運營商還為 DeepSeek-R1 提供專屬算力方案,確保模型在通信領域的高效運行。通過與運營商的合作,DeepSeek-R1 能夠更好地服務于通信行業,29推動通信基礎設施的智能化升級,為 5G 時代的各種應用場景提供更強大的技術支持。國家超算互聯網平臺的上線標志著 DeepSeek-R1 進入“國家隊”應用序列,支持 6710 億參數滿血版部署,進一步發揮其在大規模數據處理和復雜計算方面
58、的優勢。同時,DeepSeek-R1 與平頭哥玄鐵芯片完成 RISC-V 架構適配,為工業級應用場景的拓展奠定了堅實基礎,有望在工業自動化、智能制造等領域發揮重要作用。304.24.2 DeepSeekDeepSeek 應用前景應用前景在數字化轉型加速的當下,數據已然成為企業與組織的核心資產,全過程數據資產管理對于釋放數據價值、驅動精準業務決策起著決定性作用。DeepSeek-R1作為先進的人工智能模型,以其卓越的參數規模、強大的推理能力和高效的學習機制,在全過程數據資產管理中展現出極具潛力的應用前景。1 1、數據收集階段:智能精準采集與篩選、數據收集階段:智能精準采集與篩選數據收集是全過程數
59、據資產管理的基礎環節,DeepSeek-R1 憑借強大的自然語言處理能力,能夠從海量且復雜的數據源中實現智能精準采集與篩選。面對網絡輿情、金融市場交易數據、電商用戶行為日志等多源異構數據,DeepSeek-R1可深入理解數據源的結構和語義內容,依據企業業務目標自動篩選出關鍵數據。在金融行業,DeepSeek-R1 能實時監控全球財經新聞、社交媒體上的金融討論群組以及各國監管政策發布平臺等信息源。通過對這些數據的實時分析,精準提取利率變動趨勢、行業政策調整以及新興投資機會等關鍵信息,為金融機構的投資決策提供時效性強、準確性高的數據支持。在電商領域,DeepSeek-R1 可從數以億計的用戶評論和
60、瀏覽記錄中,挖掘出用戶對產品功能、外觀、價格等方面的反饋,以及潛在的消費行為模式,助力電商企業精準把握市場需求和用戶偏好,優化產品選品和營銷策略。2 2、數據存儲階段:語義理解與智能分類、數據存儲階段:語義理解與智能分類傳統的數據存儲方式多依賴簡單的關鍵詞匹配或基礎元數據分類,難以挖掘數據的深層價值。DeepSeek-R1 在數據存儲階段可基于深度語義理解,實現精準的語義標注與智能分類。以醫療行業為例,面對海量的病歷數據,DeepSeek-R1 能夠深入分析病歷中的癥狀描述、診斷依據、治療方案以及康復記錄等內容,按照疾病種類、嚴重程度、治療階段等多個維度進行精細分類標注。這不僅極大提高了數據存
61、儲的效率,減少存儲空間浪費,還為后續的數據檢索和分析提供了便利,確保醫療數據在臨床研究、疾病預測等方面的準確性和可用性,為醫療決策提供有力支持。3 3、數據分析階段:深度關聯分析與精準預測、數據分析階段:深度關聯分析與精準預測數據分析是挖掘數據價值的核心環節,DeepSeek-R1 強大的推理和學習能力使其在多源異構數據的深度關聯分析與精準預測方面表現卓越。31在制造業中,DeepSeek-R1 可以整合生產過程中的設備運行數據、原材料質量數據、環境參數數據以及產品質量檢測數據等。通過對這些數據的深度分析,挖掘出影響產品質量的關鍵因素,如設備的關鍵運行參數閾值、原材料的特定質量指標對產品性能的
62、影響等。同時,基于歷史數據和實時監測數據,精準預測設備故障的發生概率,幫助企業提前制定維護計劃,降低生產中斷風險,提高生產效率和產品質量。在市場營銷領域,DeepSeek-R1 通過分析用戶的人口統計學數據、消費歷史數據、社交媒體互動數據以及地理位置數據等,構建 360 度精準用戶畫像。利用這些畫像,DeepSeek-R1 能夠準確預測用戶的購買行為和偏好變化,為企業制定個性化的營銷活動提供科學依據,提高營銷效果和投資回報率。4 4、數據應用階段:智能決策支持與服務優化升級、數據應用階段:智能決策支持與服務優化升級在數據應用階段,DeepSeek-R1 為企業提供全方位的智能決策支持和服務優化
63、升級方案。在企業戰略決策層面,DeepSeek-R1 基于對市場動態、競爭對手態勢以及自身業務數據的綜合分析,為企業提供戰略規劃建議。例如,通過對行業趨勢、技術創新方向以及市場競爭格局的分析,幫助企業確定業務拓展方向、新產品研發策略以及資源配置方案,把握市場機遇,應對競爭挑戰。在客戶服務方面,DeepSeek-R1 作為智能客服的核心引擎,根據客戶的問題、歷史交互記錄以及用戶畫像數據,快速準確地提供個性化解決方案。在通信行業,DeepSeek-R1 可分析用戶的通信行為數據,如通話時長、流量使用習慣、套餐偏好等,幫助運營商優化套餐設計,推出更符合用戶需求的通信服務套餐,提高用戶滿意度和忠誠度,
64、進而增加業務收入。5 5、數據管理全流程:自動化與智能化深度融合、數據管理全流程:自動化與智能化深度融合DeepSeek-R1 能夠深度融入數據管理全流程,實現自動化與智能化的深度融合。它可以根據預設的業務規則和數據分析模型,自動完成數據的清洗、轉換、整合等繁瑣操作,減少人工干預,降低人為錯誤,提高數據處理的效率和準確性。同時,DeepSeek-R1 具備實時監測數據質量和安全性的能力。通過對數據的實時分析,及時發現數據異常波動、數據缺失、數據重復等質量問題,以及潛在的數據安全風險,如數據泄露風險、非法訪問行為等,并提供相應的預警信息和32解決方案。在數據合規管理方面,DeepSeek-R1 可根據不同行業的法規政策要求,對數據的收集、存儲、使用和傳輸等環節進行合規性檢查,確保企業的數據管理活動嚴格遵守法律法規,避免法律風險。DeepSeek-R1 在全過程數據資產管理中具有廣泛且深入的應用潛力。通過與數據資產管理的各個環節緊密結合,DeepSeek-R1 能夠幫助企業充分挖掘數據價值,提升業務運營效率和競爭力,推動企業在數字化時代實現可持續發展。隨著技術的不斷創新和應用場景的持續拓展,DeepSeek-R1 有望在數據資產管理領域發揮更為關鍵的引領作用,推動行業智能化變革邁向新的高度。