1、DeepSeek+Deep Research應用DeepSeek+Deep Research應用2025年2月10日 歡迎關注視頻號歡迎關注視頻號清華沈少陽清華沈少陽 系列直播系列直播詳細頁首屏置頂博文評論區首條內容首條評論二級高贊置頂回答2月10日微博熱搜實時壹 參與式觀察一個團隊的參與式觀察一個團隊的 大模型應用與內化大模型應用與內化貳Deep ResearchDeep Research應用概述應用概述叁推理大模型推理大模型使用心得使用心得目 錄AI大事記(大事記(簡版)簡版)通用大模型怎么了?推理大模型通用大模型怎么了?推理大模型這么火!這么火!概述:概述:推理大模型建立在通用大模型基礎
2、之上,在推理框架上線之前,通用大模型直接回答。那現在就讓他基于思維鏈,一步一步做好規劃、調整、校對并完成輸出。所以通用大模型和推理大模型它不是矛盾的存在。簡單來看,推理大模型和通用大模型功能不一,如果把AI模型比作工具包,DeepSeek把傳統通用大模型比作一把瑞士軍刀,功能多但不夠鋒利;推理大模型則像手術刀,專精切割但用途單一。1.1.需求明確度需求明確度 任務模糊(如閑聊):選通用模型-HER 目標明確(如解數學題):選推理模型-Deadline2.2.容錯成本容錯成本 允許試錯(如寫詩):通用模型 必須精確(如醫療診斷):推理模型3.3.資源限制資源限制 算力充足:可疊加使用兩者 預算有
3、限:按核心需求單選選擇指南選擇指南核心對比核心對比通用大模型通用大模型+推理大模型也是推理大模型也是“王炸王炸”組合組合通用模型:處理90%的常規咨詢(查訂單、退換貨)推理模型:解決5%的復雜糾紛(多環節理賠計算)實戰案例應用:實戰案例應用:電商客服場景電商客服場景顧客顧客:你好,我想查一下我的訂單號為123456789的訂單狀態。通用客服模型通用客服模型:您好!很高興為您服務。您的訂單號123456789目前處于“已發貨”狀態,發貨時間是2025年2月9日。根據物流信息,預計將在2月12日送達。您可以通過以下物流單號在快遞官網查詢詳細物流信息:物流單號。如果您還有其他問題,歡迎隨時咨詢。顧客
4、顧客:好的,謝謝!另外,我收到商品后發現有一件商品損壞了,我需要申請退換貨。通用客服模型通用客服模型:非常抱歉給您帶來不便。關于商品損壞的問題,您可以選擇退貨或換貨。請先告訴我以下信息:1.您要申請退換貨的商品名稱和數量;2.損壞的具體情況(最好提供照片);3.您希望選擇退貨還是換貨。顧客顧客:是這款智能手表,我需要換貨。手表的屏幕碎了,我這就拍照上傳。通用客服模型:通用客服模型:好的,麻煩您上傳照片,我會為您核實情況并處理換貨申請。同時,請您確保商品包裝完整,配件齊全,以便我們順利為您處理換貨。(顧客上傳照片后)通用客服模型:通用客服模型:感謝您提供照片,商品損壞情況已經確認。我們已為您發起
5、換貨申請,預計換貨商品將在3-5個工作日內發出。您可以在“我的訂單”-“售后服務”中查看換貨進度。如果還有其他問題,可以隨時聯系我們。顧客:顧客:好的,我知道了。還有一個問題,我在購買時購買了商品的延長保修服務,這次換貨后,保修期怎么計算?推理客服模型:推理客服模型:您好,關于延長保修服務的問題,我來為您詳細解答。根據我們的保修政策,當您購買商品并附加延長保修服務時,保修期是從商品購買日期開始計算的。如果在保修期內發生換貨,新的商品保修期將從換貨完成日期重新計算,但總保修時長不會超過原購買的延長保修期限。例如,您購買的商品保修期為1年,同時購買了1年的延長保修服務,總保修期為2年。如果在保修期
6、內換貨,新的商品保修期將從換貨完成日期開始,再計算剩余的保修時長。如果換貨發生在保修期的第10個月,那么新的商品將有14個月的保修期(2年總保修期減去已過的10個月)。如果您還有其他疑問,或者需要進一步確認保修細節,可以提供您的訂單號,我為您查詢具體的保修信息?!皼]有最好的模型,只有最合適的工具通用模型是社交達人,推理模型是解題高手,用好這對黃金組合,才是AI時代的生存之道?!盌eepSeek行業產品端融合:行業產品端融合:谷歌PaLI-3、Anthropic Claude已嘗試在通用模型中嵌入推理模塊技術突破:技術突破:思維鏈(Chain-of-Thought)技術讓兩類模型能力邊界逐漸模糊
7、當前建議:當前建議:優先關注垂直領域優化模型(如醫療推理專用模型)直觀感受通用大模型和推理大模型的差異直觀感受通用大模型和推理大模型的差異實戰案例應用:分析實戰案例應用:分析輔助輔助Prompt:在推理大模型的幫助下,沒有建立起獨立思考能力的人來說,是一種退步大模型2:進一步明確任務大模型1:將觀點作為核心結論,細化后成文DeepSeek:呈現擬人化思考過程1、對核心定義的具象化和確定性思考:你說的是啥?顆粒度對齊一下2、需求場景和用途思考,決定大方向正確與否:用來干什么?呈給誰看?3、定寫作方向、基本思路,乃至一級提綱確立類思考:從哪個角度切入?此刻我的此刻我的os:結果怎么樣再說,看這個思
8、考過程挺靠譜,很有想法?。航Y果怎么樣再說,看這個思考過程挺靠譜,很有想法!直觀感受通用大模型和推理大模型的差異:直觀感受通用大模型和推理大模型的差異:DeepSeek生成生成實戰案例應用:分析實戰案例應用:分析輔助輔助DeepSeek輸出材料:更像個人,不是停留在語義層面的“擬人”,而是在獨立、認真思考等更深層面Prompt:在推理大模型的幫助下,沒有建立起獨立思考能力的人來說,是一種退步壹Deep Deep ResearchResearch應用概述應用概述PART ONE(一)(一)DeepSeek DeepSeek 深度思考深度思考R1R1概述及概述及主要用途主要用途 DeepSeek 深
9、度思考R1 是一款基于深度學習技術的推理模型,其核心功能在于通過強化學習提升模型的推理能力。其設計目標是通過強化學習等技術,引入了自我反思能力,使其在推理過程中能夠自我驗證和反思,從而提高推理的準確性和可靠性。性能數據:性能數據:官方數據顯示,DeepSeek R1 在數學、代碼、自然語言推理等任務上的表現已可與OpenAI的頂級模型GPT-4相當。例如,DeepSeek系列模型在美國高級中學數學競賽 AIME 2024 題目上的一次性解題正確率達到39.2%,而GPT-4僅約9.3%?,F實案例:現實案例:業內已經出現利用該模型輔助科研的例子。例如,有研究者在實驗中讓DeepSeek模型逐步求
10、解AIME(美國數學邀請賽)競賽難題,DeepSeek展現了清晰的鏈式推理過程,輸出的思路連貫且易于理解。思維鏈設計:思維鏈設計:DeepSeek 深度思考R1通過原生思維鏈設計,使模型在推理過程中能夠生成詳細的推理路徑。這種設計不僅提高了推理的準確性,還增強了模型的可解釋性。四步理解四步理解DeepSeek R1功能功能推理流程推理流程幫我畫出DeepSeek R1 的推理過程流程圖,流程圖的每個階段需標注關鍵技術。以下是推理過程文字描述:DeepSeek R1 的推理過程可以劃分為四個主要階段,每個階段都運用了特定的 AI 技術來逐步完善推理鏈條,最終得出高質量答案。這一流程采用藍色系流程
11、圖設計,結構清晰,便于在 PPT 中展示和理解。以下是各階段及其關鍵技術說明:1 1輸入階段(用戶問題解析)輸入階段(用戶問題解析)用戶輸入自然語言問題,DeepSeek R1 首先對問題進行理解與解析。在這一階段,模型運用了*自然語言處理(NLP)*技術,將用戶的自然語言提問轉換為機器可理解的內部表示,提取問題的意圖和關鍵信息。通過對輸入的預處理,模型為后續推理做好準備。2 2思維鏈生成(構建初步推理路徑)思維鏈生成(構建初步推理路徑)根據解析后的問題,DeepSeek R1 開始“思考”,生成解決問題的初步步驟鏈條(即思維鏈)。這一過程運用了*思維鏈推理(Chain-of-Thought,
12、CoT)*技術。模型被鼓勵像人類一樣逐步思考,將復雜問題拆解為一系列連貫的中間推理步驟,并在每個步驟產出過渡結論。這種鏈式推理能提升模型對復雜任務的準確性和透明度,讓觀眾看到模型解決問題的思路。3 3強化學習優化(自我反思與迭代優化)強化學習優化(自我反思與迭代優化)DeepSeek R1 對生成的初步思維鏈進行自我檢查和反思,反復迭代優化推理路徑,以提高推理的正確性。在這個階段,模型引入了強化學習(Reinforcement Learning)思想進行自我優化。具體而言,DeepSeek R1 會對先前步驟的推理結果進行評估,自主發現錯誤或不合理之處,然后通過調整思維鏈來糾正偏差。這種自我驗
13、證與錯誤校正的過程可被視為一種自監督優化:模型在沒有人工標注指導的情況下,基于試錯反饋強化正確的推理路線。通過多輪迭代,DeepSeek R1 不斷增強自身的推理能力,確保思維鏈趨于合理和可靠(相當于給模型加入了“元認知”能力,讓它會“思考自己的思考”)。4 4最終答案生成(輸出詳細推理鏈和答案)最終答案生成(輸出詳細推理鏈和答案)經過推理優化后,DeepSeek R1 輸出最終答案,并給出完整的推理過程作為支撐。在這一階段,模型基于優化后的思維鏈生成對用戶問題的解答,確保答案準確無誤。最 終 答 案 不 僅 包 含 直 接 的 回 答,還 附 帶 詳 細 的 推 理 鏈 條(例 如 以 標簽
14、形式呈現模型的思考過程)供用戶參考。這種結果輸出方式體現了 DeepSeek R1 注重可解釋性的特點:觀眾可以直觀地看到模型是如何從問題一步步推理得到答案的。DeepSeek生成內容GPTs生成思維導圖實踐:實踐:DeepSeek R1擅長做擅長做哪類研究分析?哪類研究分析?利用利用DeepSeek DeepSeek 深度思考深度思考R1R1撰寫輿論分析報告撰寫輿論分析報告利用利用DeepSeek DeepSeek 深度思考深度思考R1R1做行業做行業研究研究數據驅動的深度分析數據驅動的深度分析問題導向與目標設定問題導向與目標設定在研究起始階段,明確分析報告的核心目標與研究問題。通過精準的問
15、題設定,如“該事件輿情傳播的關鍵節點是什么?”或“公眾情感傾向如何影響事件走向?”來引導后續研究方向。這種問題導向有助于聚焦研究重點,避免在海量信息中迷失方向。利用DeepSeek深度思考R1的聯網搜索功能,廣泛收集與事件相關的多源數據。通過深度推理能力,對數據進行深度挖掘,分析輿情傳播路徑、情感傾向和關鍵節點。這種方法能夠揭示輿情事件背后的復雜關系和潛在影響因素。多維度的輿情剖析多維度的輿情剖析從傳播、情感、觀點等多個維度對輿情事件進行剖析。通過DeepSeek深度思考R1的剖析,理解公眾對事件的態度和反應。同時,結合傳播路徑分析,識別輿情擴散的關鍵節點和影響因素。專業化呈現與驗證專業化呈現
16、與驗證風險評估與策略建議風險評估與策略建議基于DeepSeek深度思考R1的結果,對輿情事件可能帶來的風險進行評估。DeepSeek深度思考R1識別潛在的負面輿情風險點,并提出針對性的應對策略。這不僅有助于緩解輿情危機,還能為相關主體提供決策支持。在報告撰寫中,DeepSeek深度思考R1需采用專業化的語言和結構,確保邏輯嚴謹、論證充分。同時,通過交叉驗證和多源數據對比,驗證分析結果的可靠性。這種嚴謹的呈現方式能夠增強報告的可信度和實用性。04040505030301010202實踐:實踐:DeepSeek R1擅長做擅長做哪類研究分析?哪類研究分析?審核重點:審核重點:1.數據準確度:核對不
17、同來源數據之間的一致性,避免數據矛盾或沖突。對于存在差異的數據,需進行合理解釋或進一步驗證。2.案例貼合度:案例應與研究主題高度相關,能夠直接支持報告的分析和結論。對于輿情事件,案例應與事件的性質、背景、傳播特點等相匹配。3.觀點合規度:確保報告中的觀點符合法律法規和政策要求,不涉及違法違規內容,如虛假信息、誹謗、侵權等。4.研判顆粒度:事件的分析應深入到關鍵問題的核心,揭示事件的本質和內在規律。避免停留在表面現象,缺乏深度剖析。實測實測DeepSeek R1分析報告:分析報告:9分分實操實操DeepSeek+Mermaid AI組合,組合,三分鐘生成思維導圖三分鐘生成思維導圖好的,感謝確認!
18、接下來,我將根據您提供的信息,生成一個適用于PPT展示的流程圖,使用藍色系設計,并標注每個階段的關鍵技術。流程圖將采用 mermaid.js 語法,您可以直接在 mermaid.live 上生成可視化圖表。以下是生成的 mermaid.js 代碼:flowchart TD A輸入階段:用戶問題解析-B思維鏈生成:構建初步推理路徑 B-C強化學習優化:自我反思與迭代優化 C-D最終答案生成:輸出詳細推理鏈和答案 A-|自然語言處理(NLP)|A1解析用戶問題 B-|思維鏈推理(CoT)|B1生成推理鏈條 C-|強化學習(RL)|C1自我優化與反饋 D-|推理鏈生成|D1輸出答案與推理過程 sty
19、le A fill:#0074D9,stroke:#003366,stroke-width:2px;style B fill:#0074D9,stroke:#003366,stroke-width:2px;style C fill:#0074D9,stroke:#003366,stroke-width:2px;style D fill:#0074D9,stroke:#003366,stroke-width:2px;classDef tech fill:#A9CCE3,stroke:#1A5276,stroke-width:2px;class A1,B1,C1,D1 tech;解釋:解釋:藍色系
20、設計:整個流程圖采用深藍色和淺藍色調,確保視覺上的一致性。階段:四個主要階段按順序排列,依次從輸入到輸出。關鍵技術:每個階段標注了對應的技術(如 NLP、CoT、RL 等),并以不同樣式展示。您可以將此代碼粘貼到 mermaid.live 進行渲染,查看和導出圖表。如果有任何修改或調整需求,請隨時告訴我!Mermaid AI Mermaid AI 是一款基于 Mermaid.js 開發的智能繪圖工具,能夠通過簡單的文本提示快速生成各種類型的圖表。1.1.文本生成圖表文本生成圖表:用戶可以通過輸入自然語言描述來生成圖表,例如輸入“創建一個包含三個步驟的流程圖”,Mermaid AI 就能生成對應
21、的流程圖代碼。2.2.多種圖表類型:多種圖表類型:支持流程圖、序列圖、甘特圖、類圖、狀態圖、實體關系圖、餅圖等多種圖表類型。3.3.可視化編輯器:可視化編輯器:除了文本生成圖表外,還提供可視化的拖拽編輯器,用戶可以在生成圖表的基礎上進行調整和修改。1.登錄Kimi賬號,點擊進入Kimi+2.選擇“PPT助手”應用3.將已經梳理好的文件發送給PPT助手4.PPT助手根據發送的文件自動生成分章節的PPT內容5.檢查內容,補充需求6.生成PPT,可在線編輯,亦可下載文件后本地編輯保存。實操實操DeepSeek+Kimi組合,組合,搞定搞定PPT實戰案例應用:課件實戰案例應用:課件PPTPPT制作制作
22、AI工具:Kimi+DeepSeek/硅基流動,基于課程配套圖書,已經獲取ppt,但每一章每一節ppt呈散狀,內容標題化、抄書化問題突出,無版式設計而言,且無最新案例。第八章 電商運營數據分析第一步:將ppt批量上傳至Kimi(PPT助手),要求將ppt合成第二步:將合成后的ppt內容發給DS,如果“服務器繁忙”,稍后上傳仍多次無效后,可發給硅基流動、秘塔AI等。要求推理大模型在此基礎上將ppt內容梳理得更加具有邏輯性,在相應部分增加最新案例,以便學生取得更好學習效果。但會出現“bug”,增加了案例,但原有內容未得以保存。將推理大模型輸出結果喂給Kimi,根據課程內容,設計課程實驗,明確實驗目
23、的、實驗要求、實驗內容和實驗成果等說明。將Kimi輸出材料喂給PPT助手,完成本章內容PPT制作。缺點是內容拆解過于詳細,導致PPT頁數徒增。有基礎材料無基礎材料將課程名稱和課程大綱發給DS,讓其構建課程各章節主要內容,要求輸出材料語言通俗易懂,舉例貼近大學生的學習與生活,結構清晰,幫助學生輕松理解并快速掌握知識點。DeepSeek+KimiKimi:教學課件制作實測:教學課件制作實測傳統通用大模型上線推理傳統通用大模型上線推理模塊模塊通義千問2.5智普清言深度推理秘塔AI-長思考R1kimi 1.5長思考文心大模型4.0(二)(二)Gemini Gemini DeepResearchDeep
24、Research概述及概述及主要用途主要用途 Gemini是Google AI最新推出的多模態大模型,Deep Deep ResearchResearch是是GeminiGemini的高級功能之一,旨在幫助用戶進行實時、的高級功能之一,旨在幫助用戶進行實時、深入的研究。深入的研究。Deep Research是Gemini網絡應用程序中的一項高級功能,允許用戶實時深入研究各種主題。這項功能特定于 Gemini 網絡應用程序。它能夠根據用戶的查詢,快速從海量數據中提取相關信息,并以簡潔易懂的方式呈現給用戶。實時信息檢索實時信息檢索:Deep Research可以幫助用戶快速獲取所需信息,無需花費大
25、量時間瀏覽網頁和篩選信息。深入主題研究深入主題研究:通過整合來自不同來源的信息,Deep Research可以幫助用戶更全面地了解某個主題。輔助決策輔助決策:Deep Research可以為用戶提供決策所需的信息和數據支持。生成可在線編輯報告:生成可在線編輯報告:可通過谷歌在線文檔查看和編輯Gemini DeepResearch生成的報告全文。Gemini Deep Research功能基本功能基本介紹介紹如何使用如何使用Gemini Deep Research?在開始任何研究之前,清晰地定義研究問題和目標至關重要清晰地定義研究問題和目標至關重要。這也有助于研究人員更有效地利用 Gemini
26、Deep Research。例如,在研究“人工智能對教育的影響”這一課題時,研究人員首先需要明確具體的研究問題:人工智能技術如何應用于教育領域?人工智能對學生的學習方式和教師的教學方法有哪些影響?人工智能在教育領域應用的倫理問題有哪些?明確研究問題后,才能更有針對性地使用 Gemini Deep Research 獲取相關信息,避免漫無目的地搜索。如何使用如何使用Gemini Deep Research?下一步是構建有效的搜索策略,以便在構建有效的搜索策略,以便在 Gemini Deep Research 中精準地中精準地找到所需信息找到所需信息。這需要研究人員掌握一些搜索技巧,例如:使用相關
27、的關鍵詞:選擇能夠準確描述研究主題的關鍵詞,例如在研究“氣候變化對農業的影響”時,可以使用“氣候變化”、“農業”、“糧食安全”、“干旱”等關鍵詞。使用布爾運算符使用布爾運算符:使用使用 AND、OR、NOT 等布爾運算符來組合關鍵詞等布爾運算符來組合關鍵詞,例如“氣候變化 AND 農業 AND 糧食安全”可以縮小搜索范圍,更精準地找到相關信息。使用過濾器使用過濾器:Gemini Deep Research 提供了多種過濾器,例如時間范圍、提供了多種過濾器,例如時間范圍、信息來源、作者等,可以幫助研究人員進一步篩選搜索結果。信息來源、作者等,可以幫助研究人員進一步篩選搜索結果。例如,假設我們要研
28、究“人工智能在醫療領域的應用”,以下是一些有效和無效的搜索策略示例:有效的搜索策略:“人工智能”AND“醫療”AND“診斷”(使用關鍵詞和布爾運算符)“人工智能醫療應用”(使用更具體的關鍵詞)設置時間范圍為“近五年”(使用時間過濾器)無效的搜索策略:“人工智能”(關鍵詞過于寬泛)“人工智能 OR 醫療”(搜索結果過于廣泛)如何使用如何使用Gemini Deep Research?Gemini Deep Research 的一大優勢在于它能夠從多個來源和角度獲取信息,從多個來源和角度獲取信息,包括學術論文、新聞報道、書籍、專利等。包括學術論文、新聞報道、書籍、專利等。研究人員應充分利用這一優勢,
29、嘗試從不同的維度探索研究問題從不同的維度探索研究問題。例如,在研究“氣候變化對農業的影響”這一課題時,可以從以下角度進行探索:跨學科研究跨學科研究:結合氣象學、農業科學、經濟學等學科的知識,分析氣候變化對農作物產量、農業生產成本、農民收入等方面的影響。不同地區的影響不同地區的影響:比較氣候變化對不同地區農業的影響,例如干旱地區、沿海地區、高寒地區等,分析其差異性和共性。不同利益相關者的觀點不同利益相關者的觀點:收集農民、農業企業、政府部門、環保組織等不同利益相關者對氣候變化的看法和應對措施,進行綜合分析。例如,研究人員可以利用該工具收集過去五年的全球氣溫數據和農業產量數據,分析氣候變化對農業生
30、產的長期影響。通過對比不同時期的氣溫和產量數據,可以發現氣候變暖對某些地區的農業生產產生了負面影響,例如導致干旱加劇、病蟲害增多等。Gemini Deep Research的實踐應用的實踐應用在使用 Gemini Deep Research 時,需要注意數據隱私、知識產權等倫理問題。確需要注意數據隱私、知識產權等倫理問題。確保獲取和使用信息的方式符合相關規定和道德準則。保獲取和使用信息的方式符合相關規定和道德準則。例如,在使用該平臺獲取個人信息時,需要遵守相關法律法規,保護個人隱私。在引用他人研究成果時,需要注明出處,避免剽竊。研究是一個不斷迭代的過程。通過 Gemini Deep Resea
31、rch 獲取的信息可以幫助研究人員不斷完善研究問題、調整研究方向、深入挖掘新的線索。迭代式研究過程可以概括為以下幾個步驟:1.提出初始研究問題:根據初步的了解和假設,提出初始的研究問題。2.收集信息:使用 Gemini Deep Research 等工具收集與研究問題相關的文獻、數據和其他信息。3.分析信息:對收集到的信息進行分析和整理,并從中提取關鍵信息和 insights。4.完善研究問題:根據信息分析的結果,重新審視和完善初始研究問題,使其更加聚焦和具體。5.調整研究方向:根據新的發現和 insights,調整研究方向,探索新的研究路徑。6.深入挖掘:對感興趣的方面進行更深入地挖掘,例如
32、查閱更多文獻、進行實證研究等。(三)三)Deep Deep ResearchResearch概述及概述及主要用途主要用途 ChatGPT的“深度研究”(Deep Research)是一種新推出的代理型功能,旨在幫助用戶完成復雜得多步驟信息檢索與研究任務。簡單來說,用戶只需提供一個提示或問題,ChatGPT就會自主在互聯網上搜索、分析并綜合數百條信息來源,最后生成一份類似研究分析師撰寫的綜合報告。OpenAI聲稱,這項功能在數十分鐘內就能完成人工需要數小時甚至數天才能完成的研究工作。OpenAI首席產品官凱文韋爾(Kevin Weil)指出,Deep Research可以在約5到30分鐘內完成一
33、些人工可能需要30分鐘到30天的復雜研究任務 Deep Research的主要用途是大幅加速和簡化各領域的知識密集型研究。它針對金融、科學、公共政策、工程等領域需要全面、精確、可靠信息的從業者,以及需要進行深入調查的商業分析場景而設計。同時,Deep Research也適用于普通用戶的高難度信息查詢,例如個性化的消費決策(購車、家電、家具等需要仔細調研的購買建議)GPT全系產品增加全系產品增加Deep Research功能功能Deep Research六項適用場景六項適用場景 數數據調研與可視化:據調研與可視化:查詢過去10年中GDP排名前十的發達國家和發展中國家的iOS與安卓普及率,并將結果
34、繪制成表格。這樣的任務涉及大量數據收集和整理,非常適合Deep Research自動完成。模糊信息檢索:模糊信息檢索:根據幾個片段的劇情描述來尋找電視劇集中對應的劇集名稱。普通聊天模型往往難以憑記憶給出準確答案,而Deep Research可以通過網絡檢索找到確切的劇集并提供細節。專業知識問答:專業知識問答:例如詢問“NFL橄欖球踢球手的平均退役年齡是多少?”,普通GPT模型可能因知識局限給出含糊的范圍猜測,而Deep Research會深入多源頭資料,給出精確的統計并解釋不同球員退役年齡的分布。消費產品調研:消費產品調研:根據用戶提供的偏好和使用場景(如滑雪板的需求),Deep Resear
35、ch可以搜集各大評測和產品規格,在幾分鐘內整理出詳細的購買建議清單,并解釋每個推薦方案的依據。專業領域研究:專業領域研究:在醫學研究、UX設計等需要查閱大量專業資料的領域,Deep Research同樣能通過搜索論文、報告等資源,快速匯總相關知識點和洞見。綜上,綜上,Deep ResearchDeep Research的用途覆蓋學術研究、市場分析、商業情報、技術調研以及復雜問答等多個場景。其目標用戶的用途覆蓋學術研究、市場分析、商業情報、技術調研以及復雜問答等多個場景。其目標用戶既包括需要高效獲取可靠資料的專業人士,也包括有深入信息需求的普通個人用戶。既包括需要高效獲取可靠資料的專業人士,也包
36、括有深入信息需求的普通個人用戶。能夠勝任從商業報告到日常疑難問題的一系列任務。能夠勝任從商業報告到日常疑難問題的一系列任務。自主的步驟執行強化學習訓練0303在具體運行時,當用戶選擇當用戶選擇“深度深度研究研究”模式并提交查詢后,模式并提交查詢后,GPT會會啟動一個后臺啟動一個后臺agent進行工作。這進行工作。這個個agent會自動執行一系列步驟:會自動執行一系列步驟:例如它可能先搜索相關關鍵詞,打開若干網頁讀取內容,再根據需要細分問題、繼續搜索下一步,乃至調用工具進行數據處理。整個過程整個過程中,中,ChatGPT會在側邊欄向用戶會在側邊欄向用戶展示其當前采取的步驟和已獲取的展示其當前采取
37、的步驟和已獲取的來源摘要,提高過程透明度來源摘要,提高過程透明度。這一。這一設計類似于設計類似于AI“做筆記做筆記”,讓用戶了解研究的進展和思路。專業定制的模型0101OpenAI使用端到端的強化學習(RL)對Deep Research模型進行訓練,讓它在各種領域的復雜瀏覽讓它在各種領域的復雜瀏覽和推理任務中學會規劃策略和推理任務中學會規劃策略。通過。通過大量訓練,模型掌握了如何計劃并大量訓練,模型掌握了如何計劃并執行多步搜索路徑,在需要時還能執行多步搜索路徑,在需要時還能回溯調整,類似人類研究者那樣根回溯調整,類似人類研究者那樣根據檢索結果動態修正方向據檢索結果動態修正方向。這使其。這使其具
38、備了長鏈推理和問題分解的能力,具備了長鏈推理和問題分解的能力,能夠逐步靠近答案。能夠逐步靠近答案。0202Deep Research由由OpenAI即將推即將推出的出的o3模型的一個變體提供支持。模型的一個變體提供支持。該模型針對網頁瀏覽和數據分析進行了優化,擁有強大的推理和多模態理解能力。模型可以讀取和理解網頁上的大量文本、圖像和PDF內容,并將不同來源的信息相關聯。據OpenAI介紹,D R能夠遞歸地能夠遞歸地進行網絡搜索:從初始查詢出發,進行網絡搜索:從初始查詢出發,不斷執行新的搜索、點擊結果、閱不斷執行新的搜索、點擊結果、閱讀資料,然后將收集的信息加以綜讀資料,然后將收集的信息加以綜合
39、合。這種遞歸搜索與推理使得它可。這種遞歸搜索與推理使得它可以在海量信息中挖掘出相關內容并以在海量信息中挖掘出相關內容并形成整體結論。形成整體結論。工具與多模態能力0404除了瀏覽網頁文字,Deep Research還能處理多種格式的資還能處理多種格式的資料。料。它可以閱讀用戶上傳的文檔或表格,將這些私有數據與在線信息相結合進行分析。此外,DR具備具備一定的工具使用能力,例如調用內一定的工具使用能力,例如調用內置的置的Python工具來繪制圖表并反工具來繪制圖表并反復改進數據可視化復改進數據可視化。據報道,未來它還能將生成的圖表或從網頁提取的圖片直接嵌入報告中,以豐富分析結果。這種多模態處理和工
40、具整合,使DR超越了純語言模型的范疇,更像一個真正的數字研究助理。Deep Research背后的技術實現體現了一個自主智能體(agent)的工作流程。與傳統聊天機器人僅根據訓練語料作答不同,Deep Research能夠主動與外部環境交互,主要通過聯網瀏覽和工具使用來完成任務。其工作機制可以分為以下幾個關鍵點:Deep Research的技術實現的技術實現路徑路徑Deep ResearchDeep Research完成任務后,會在對話界面完成任務后,會在對話界面生成一份結構化的研究報告作為最終輸出生成一份結構化的研究報告作為最終輸出。Deep Research利用了強大的預訓練大模型+強化學
41、習調教,再結合聯網檢索和工具調用,實現了高度自動化的研究流程。它相當于將搜索引擎、數據分析和報告撰寫能力融為一體:既能像人一樣上網既能像人一樣上網“找資料找資料”,又能對信息進行歸納整理,又能對信息進行歸納整理,最終拿出有理有據的結果。這種技術實現讓最終拿出有理有據的結果。這種技術實現讓ChatGPTChatGPT從一個對話助手躍升為一從一個對話助手躍升為一個可以獨立執行實質任務的自主智能體個可以獨立執行實質任務的自主智能體。報告通常包括引言、發現和結論等部分,并在內容中附有清晰的引用出處,報告通常包括引言、發現和結論等部分,并在內容中附有清晰的引用出處,標明每一論斷背后的來源標明每一論斷背后
42、的來源。這種報告式輸出旨在達到研究分析師的專業水準,方便用戶直接將其用作決策依據或進一步引用。OpenAI強調,每個輸出都經過充分文檔化,便于讀者核查引文的真實性。Deep Research=搜索引擎搜索引擎+數據分析數據分析+報告撰寫報告撰寫借助上述機制,Deep Research擅長處理復雜、多層次的問題,特別是在以下類型的研究任務中表現突出:跨領域的綜合研究:跨領域的綜合研究:對于涉及多個知識領域、需要廣泛收集資料的問題,Deep Research能夠逐一查找相關信息源,避免疏漏要點。例如政策分析、行業報告、學術綜述等,需要整合不同來源觀點和數據的任務,它都能快速勝任。傳統上,這類工作需
43、要研究員花費大量時間閱讀文獻、統計數據,而Deep Research可以大幅縮短這一過程。知識密集型問答:知識密集型問答:當用戶提出的問題難以通過單一知識庫回答時(如高度細節化或專業化的問題),Deep Research的多步搜索能力就發揮作用。例如前述NFL球員退役年齡的例子,以及“某領域近年的重要進展”等,需要查證多個來源才能得出準確答案的問題。Deep Research會針對問題的各個方面分別檢索,再整合成連貫的答復,其答案可靠性和細節完備度往往優于普通聊天模型。數據收集與對比分析:數據收集與對比分析:Deep Research擅長從網上提取定量數據并進行對比。例如市場份額統計、人口統計
44、數據、產品規格參數比較等任務,它可以自動在官方網站、報告、數據庫中提取數據,然后在報告中生成對比表格或清單。這對商業分析、科學研究中的調研階段非常有用。用戶也可以提供自己的數據文件,Deep Research會將其與網上數據結合分析,適用于需要內外部數據融合的研究。Deep Research適用的研究任務類型(一)適用的研究任務類型(一)借助上述機制,Deep Research擅長處理復雜、多層次的問題,特別是在以下類型的研究任務中表現突出:個性化決策支持:個性化決策支持:對于個人用戶需要做出決策但信息繁雜的情況,Deep Research能提供顯著幫助。例如高價值商品的購買決策(汽車、電子產
45、品等),涉及閱讀大量評測、論壇帖子和規格表。Deep Research可以根據用戶的偏好要點,匯總各候選產品的優缺點和他人經驗,從而產出量身定制的建議報告。又如旅行規劃、求職準備(調研目標公司的背景)等場景,也符合其強項。它特別擅長那些需要瀏覽多個網站才能拼湊出的零散且不直觀的信息。這類任務人工完成常常費時費力,而交給Deep Research處理可以省下大量時間。實時更新的信息:實時更新的信息:由于Deep Research可以訪問互聯網,它能夠處理那些需要最新資料的問題(取決于其聯網搜索能力)。例如了解最新法規政策動態、最近的科技新聞綜述等。相比之下,普通大模型知識截止于訓練數據,無法直接
46、提供此類實時信息。因此在時效性要求高的研究任務上,Deep Research更為適用。Deep Research適用的研究任務類型(適用的研究任務類型(二)二)研究質量與準確性有限:研究質量與準確性有限:目前,Deep Research離真正媲美人類專家還有相當距離。在一個名為“人類最后的考試”(Humanitys Last Exam)的最新綜合評估中(涵蓋100多個主題的3000多道專家級問題),Deep Research支持的模型正確率只有26.6%。雖然這已是AI模型在該測試中的新高(此前的OpenAI O3-mini模型僅約13%,競品“DeepSeek”約10%,但不足30%的得分仍
47、意味著大多數復雜問題它未能答對。因此在嚴謹場景下,它并不能保證萬無一失,需要人工對結果進行審閱。正如一位早期試用者所指出的,那些針對特定領域的多步驟查詢,Deep Research給出的結果雖經充分引用但仍可能存在遺漏或推理不當之處,尚不能完全替代領域專家的判斷。新發現能力有限:新發現能力有限:Deep Research擅長匯總已有資料,但未必能產生超出現有資料的新見解。有測試者讓Deep Research調研其熟悉的專題,結果發現AI找出的18個來源幾乎都是他早已知曉的,并沒有提供新的信息來源。這表明對于資深專家來說,Deep Research可能難以挖掘他們未知的資料,更多是充當信息整理助
48、手的角色。其生成的報告在專家看來內容“并不出乎意料”,因此對于已經深諳某領域的人,價值體現在節省時間上而非知識突破。過程不可完全復現:過程不可完全復現:另一方面,Deep Research當前僅在最終報告中引用它實際用到的資料來源,對于它過程中過目但未采信的資料并不會全部列出。這意味著用戶無法完全追蹤AI檢索過的所有路徑,可能錯過那些被AI判定不重要但人類認為有價值的參考。Deep Research的局限性(一)的局限性(一)AI生成內容,數據待核實 速度與成本代價:速度與成本代價:Deep Research運行一次可能耗時長達30分鐘。如此深入的搜索和分析在云端消耗相當多的計算資源。目前Op
49、enAI僅向ChatGPT Pro訂閱用戶開放了該功能,并且每月限制使用100次。ChatGPT Pro訂閱費用高達每月200美元左右(后續可能逐步開放給Plus套餐用戶),這使得Deep Research在初期僅對少數付費用戶可用。高昂的成本和調用限制反映出該功能的資源開銷較大,也限制了其大規模應用。在速度方面,盡管幾十分鐘對復雜研究而言已相當快速,但相較即時的普通對話,它無法做到實時回答。因此不適合緊急的即時查詢,更適合預先計劃的調研任務??赡艿膬热菥窒藓惋L險:可能的內容局限和風險:1 1)由于Deep Research自動從互聯網上抓取信息,它的表現取決于公開它的表現取決于公開資料的可獲
50、取性和質量資料的可獲取性和質量。對于互聯網中少見或缺失的信息,或者需要創見性的研究問題,Deep Research可能同樣束手無策。2 2)自動化的網絡瀏覽也帶來誤導信息整合的風險)自動化的網絡瀏覽也帶來誤導信息整合的風險如果網上存在錯誤或不可靠的信息源,AI可能將其納入報告,哪怕有引用也不意味著內容真實無誤。因此用戶仍需對結果保持審慎,核實關鍵事實。3 3)在教育領域,人們擔心學生可能借助Deep Research跳過親自研究的過程,直接使用AI生成的報告。這將帶來學術誠信和學習效果方面的隱憂這將帶來學術誠信和學習效果方面的隱憂盡管從積極面看,也有人主張教學應與時俱進,培養學生正確使用AI工
51、具的能力??傊?,如何避免對總之,如何避免對AIAI產出過度依賴、確保用產出過度依賴、確保用戶真正理解內容,是一個需要關注的方面。戶真正理解內容,是一個需要關注的方面。Deep Research的局限性(的局限性(二)二)“許多早期使用者將Deep Research視為“游戲規則改變者”級別的功能。一方面,它展示了AI從對話助手向自主智能體邁進的重要一步,令人生畏又令人興奮?!狈钦椒钦紻eep Research評測打分:良評測打分:良 某預測類研究課題完成度:60%病例報告完成度,給出診療方案“75%綜述:推理大模型的未來發展方向(綜述:推理大模型的未來發展方向(一)一)提升模型能力:提升模
52、型能力:大模型廠商無疑將會繼續優化推理框架背后的模型。隨著更多的反饋和數據積累,模型在檢索策略和推理準確性上有望進一步提高,減少錯誤和遺漏。一項潛在改進是擴大模型的上下文窗口和記憶,使其在長程研究中能夠考慮更多信息而不丟失細節,這有助于提升復雜任務的完成質量。豐富輸出形式:豐富輸出形式:正如部分廠商所預告的,深度研究板塊也將在不久內加入圖像嵌入、數據可視化和其他分析輸出。這意味著報告里將不僅有文字,還有由AI自動生成或提取的圖表、插圖等,從而使結論更加直觀。(我們已經有所進步,2月12日分享)屆時用戶在瀏覽報告時,可以直接看到相關的統計圖或示意圖,大大改進閱讀體驗和信息傳達效果。除了視覺元素,
53、輸出的格式定制也可能改進,例如允許用戶選擇報告的詳細程度(簡報 vs 深度報告)或側重方向。綜述:推理大模型的未來發展方向(二)綜述:推理大模型的未來發展方向(二)加強事實校驗與控制:加強事實校驗與控制:為了緩解AI整合錯誤信息的風險,未來推理大模型引入更多事實校驗機制。例如結合知識庫驗證引用內容,或在模型生成結果前后加入審查環節,避免明顯不可信的內容輸出。另外,對于使用者來說,提供更細粒度的控制選項也是改進方向之一 如允許用戶指定必須包含哪些來源、排除某些站點,或者在特定子問題上要求更深入的挖掘。這些都會讓輸出材料更加可控和可靠。與其他與其他AgentAgent的整合:的整合:多智能體協作的
54、愿景被多個推理大模型所提出,使得在思想層面更加擬人的大模型能夠不但調研信息,還能執行現實世界的操作(輔助勞動)。例如,AI可以先調研一項投資機會然后直接模擬執行交易,或先比較多家供應商并直接發出詢價郵件等。這種整合將把推力大模型從“信息助理”升級為“執行助理”。不過在安全與信任方面,這也需要非常謹慎地設計。歡迎關注歡迎關注視頻號視頻號清華沈少陽清華沈少陽 系列直播系列直播PART TWOPART TWO參與式觀察一個團隊的大模型應用與內化團隊簡介:全方位整合各類數據庫、互聯網實時公開數據等信息矩陣,基于專業大數據產品,提供個性化智庫服務。300余名分析師,承擔著報告撰寫和行業咨詢任務,提供深度
55、的輿論分析、政策評估、社會調研、以及危機管理咨詢服務,近三年累計交付各類研究材料、分析報告近100萬份。觀察時間:2022年12月-2025年2月貳人與AI共同進化,由GPT4o生成團隊大模型應用與內化的知行合一團隊大模型應用與內化的階段劃分2022年 12月2023年3月認知、興趣、評估期2023年12月2024年12月2025年2月采納期實驗、采納期內化期評估期內化期o1推理模型正式上線DeepSeek上線o3-mini上線DeepResearch上線AI會商上線AI熱點上線AI熱搜上線Zeelin Deep Research內測元知上線 應用盡用:應用盡用:2022年12月至2023年1
56、2月:第一個學習期和爆發期,在團隊層面推進AI的應用,不僅需要從技術層面完成培訓,還需要在制度層面啟動保障,抵消認知和心理層面對AI的非正影響。無中生有:無中生有:2024年1月至2024年10月,團隊完成了AI的第一輪內化,實現了從以生成式大模型為主的應用到場景化、行業化AI智能體產品封裝的關鍵躍升。你有我優:你有我優:2024年12月以來,在DeepSeek推理大模型的加持下,既有AI智能體封裝產品性能直追中級分析師,AI智能體封裝技術能力成熟已達商用水平。大模型應用模擬圖大模型內化模擬圖程度時間制度基石維:規范驅動制度基石維:規范驅動強調通過規章制度和考核體系構建AI輿情化應用的管理閉環
57、。設定評價體系,不定期開展技能大比拼。智能躍遷維:智能體賦能智能躍遷維:智能體賦能對輿情研究步驟進行模塊化拆解,開發AI智能體,摒棄輿情AI,開啟AI輿情時代。普及實踐維:場景滲透普及實踐維:場景滲透推動AI技術在輿情研究的日常工作中全面融入,從局部試點到全流程覆蓋?;瘜邮瘜訄鼍皩訄鼍皩赢a品層產品層工具創新維:產品驅動工具創新維:產品驅動借助AI大模型技術,迭代開發AI+輿情研究產品,實現從輔助工具到智能化平臺的躍升。躍遷層躍遷層廣度深度效度創新性工作流及工作場景拆解團隊大模型應用與內化參考首次分享于2024年11月26日AIGC數智化如何助力輿情研究AIAI會商:會商:智能決策分析系統智
58、能決策分析系統智能推理引擎:智能推理引擎:融合知識圖譜構建、因果推理模型及蒙特卡洛模擬技術,可自動識別事件關聯要素,量化評估不同發展路徑的概率分布。實時數據感知網絡:實時數據感知網絡:深度對接互聯網公開、權威數據源,動態捕捉行業動向、熱點事件、社媒討論等關鍵信息流,確保分析結論始終基于最新事實依據。專業級報告體系:專業級報告體系:嚴格遵循結構化思維框架報告,輸出內容滿足企業決策層、政策研究機構對專業文檔的合規性要求。010102020303AIAI會商:會商:智能決策分析系統智能決策分析系統事件基本情況及影響力事件簡介事件簡介判斷當前輿情發展所處階段,并研判后續趨勢發展趨勢發展趨勢總結輿情討論
59、觀點,輸出事件的輿論關切點和風險點輿論觀點輿論觀點關鍵媒體是否介入報道或評論,內容和傾向是什么媒體導向媒體導向態勢引爆點、輿論爭議點等核心要素核心要素核心要素基于已形成的內容為下一步輿情處置和引導提供建議未來建議未來建議報報告告結結構構AI會商樣例AIAI熱搜熱搜:熱搜聚合與:熱搜聚合與智能分析系統智能分析系統1.1.媒體與內容創作者:媒體與內容創作者:快速捕捉熱點話題,為內容創作提供靈感與選題方向,提升內容的時效性和關注度。2.2.品牌營銷人員:品牌營銷人員:實時掌握品牌相關熱搜動態,監測品牌輿情,及時調整營銷策略,提升品牌影響力。3.3.市場研究人員:市場研究人員:通過分析熱搜數據,洞察市
60、場趨勢與消費者需求,為市場調研與決策提供數據支持。4.4.普通用戶:普通用戶:隨時隨地獲取最新熱搜信息,緊跟熱點潮流,滿足日常信息獲取與社交需求。適配用戶多平臺數據集成:多平臺數據集成:利用爬蟲技術,結合各平臺API接口,無縫對接八大熱門平臺構建全面的熱搜數據池。實時信息推送:實時信息推送:基于用戶訂閱偏好,通過多種移動設備通知渠道,以秒級速度將最新熱搜信息推送給用戶,確保用戶第一時間掌握熱點動態。數據聚合與推送數據聚合與推送分鐘動態監測:分鐘動態監測:系統實時跟蹤熱搜上榜、熱度/排名變化、掉榜、重復上榜等關鍵事件,采用增量式數據存儲策略,高效記錄每一次動態變化,為后續分析提供翔實數據基礎。數
61、據持久化存儲:數據持久化存儲:采用分布式數據庫架構,結合數據壓縮與加密技術,保障海量熱搜數據的長期穩定存儲,支持歷史數據的快速查詢與回溯分析。數據監測與記錄數據監測與記錄數據可視化與分析數據可視化與分析變化趨勢圖繪制:變化趨勢圖繪制:運用數據可視化引擎,結合時間序列分析算法,將熱搜熱度與排名變化數據轉化為直觀的圖表,包括折線圖、柱狀圖、熱力圖等多種形式,幫助用戶清晰感知熱搜態勢演變。智能分析與洞察:智能分析與洞察:基于機器學習算法,對熱搜數據進行深度挖掘,分析熱點話題的傳播路徑、用戶關注焦點、輿論傾向等,為用戶洞察網絡生態提供有力依據,輔助用戶做出精準決策。AIAI熱搜熱搜:熱搜聚合與:熱搜聚
62、合與智能分析系統智能分析系統八平臺歷史熱搜八平臺歷史熱搜新建監測新建監測監測報告監測報告AIAI熱搜熱搜:熱搜聚合與:熱搜聚合與智能分析系統智能分析系統熱搜名稱 榜單類型上榜熱搜排名 上榜熱搜時間 上榜熱度值 最高熱搜排名最高熱搜排名時間最高熱度值 標簽類型 話題主持人 主持人類型 在榜時長粉絲數 資源位熱度概況熱度概況熱搜個數與熱度走勢熱搜個數與熱度走勢熱搜排名分布情況熱搜排名分布情況最熱熱搜傳播路徑最熱熱搜傳播路徑日熱搜個數與熱度走勢日熱搜個數與熱度走勢分階段熱搜時段走勢分階段熱搜時段走勢階段熱搜類型特征階段熱搜類型特征熱搜主持貢獻熱搜主持貢獻TOPTOP賬號賬號官方熱搜資源機制官方熱搜資
63、源機制數據源標簽數據源標簽數據分析報告維度數據分析報告維度自動采集全網數據,大模型一鍵生成專業報告;八大維度覆蓋事件分析重要視角;一事一議,精準把握風險和對策;大模型分析邏輯清晰,觀點深入;自動化生成分析圖表,可在線校對。大模型智能報告大模型智能報告“傳統”自動報告事件分析深度不足,數據統計表面化缺乏個性化描述,往往通用文字模版缺乏對事件的風險評估缺乏事件后應對建議事件分析媲美專業分析師事件分析媲美專業分析師透過數據總結規律特征透過數據總結規律特征依據具體細節研判風險點依據具體細節研判風險點針對研判風險給出對應建議針對研判風險給出對應建議民生熱點互聯網服務汽車制造信息技術金融食品制造行業分類A
64、IAI熱點熱點:行業熱點事件智能分析與定制化報告系統:行業熱點事件智能分析與定制化報告系統AIAI熱點是一款基于先進人工智能技術的行業熱點事件分析系統,專注于為用戶提供全面、深入且結構化的熱點事件分析熱點是一款基于先進人工智能技術的行業熱點事件分析系統,專注于為用戶提供全面、深入且結構化的熱點事件分析報告。系統通過智能數據抓取、自然語言處理和機器學習技術,實時監測不同行業的熱點事件,并生成涵蓋事件概況、報告。系統通過智能數據抓取、自然語言處理和機器學習技術,實時監測不同行業的熱點事件,并生成涵蓋事件概況、傳播走勢、情感分析、平臺分布、媒體報道、網民評論、風險研判與輿情應對等多維度的分析報告。傳
65、播走勢、情感分析、平臺分布、媒體報道、網民評論、風險研判與輿情應對等多維度的分析報告。A AI I熱點:行業熱點事件智能分析與定制化報告系統熱點:行業熱點事件智能分析與定制化報告系統市場研究人員可以借助AI熱點的數據分析功能,深入了解消費者需求和市場趨勢。企業可以利用AI熱點監測行業動態,及時調整市場策略,提升競爭力。通過輿情分析和風險研判,提前應對潛在危機,保障企業聲譽。普通用戶可以快速了解感興趣的熱點事件,滿足日常信息獲取需求企業決策支持企業決策支持市場研究市場研究分析分析媒體與內容創作,媒體機構可以快速獲取熱點事件信息,為內容創作提供靈感和素材。利用情感分析和傳播走勢數據,優化內容傳播效
66、果。普通用戶普通用戶媒體與內容媒體與內容創作創作1.1.熱點事件監測與記錄熱點事件監測與記錄 多行業覆蓋多行業覆蓋:系統支持對多個行業的熱點事件進行監測,涵蓋民生、互聯網服務、汽車制造、信息技術、金融、食品制造等領域。實時數據抓取實時數據抓?。豪弥悄芘老x技術,實時抓取全網數據,確保熱點事件的及時發現和記錄。2.2.結構化分析報告生成結構化分析報告生成 多維度分析多維度分析:系統自動生成的報告涵蓋事件概況、傳播走勢、情感分析、平臺分布、媒體報道、網民評論、風險研判與輿情應對等八大模塊。數據可視化數據可視化:通過圖表、曲線等形式直觀展示熱點事件的傳播走勢和情感傾向,幫助用戶快速理解事件動態。3.
67、3.用戶定制化功能用戶定制化功能 專屬案例庫構建專屬案例庫構建:用戶可以根據自身需求輸入特定案例,系統將為其生成專屬的案例庫,方便用戶管理和復用。模塊自選模塊自選:用戶可以根據實際需求選擇報告中的模塊組合,靈活定制報告內容核心功能AIAI熱點熱點:看案例與自建案例庫:看案例與自建案例庫看案例自建案例管理案例AIAI熱點:熱點:DIYDIY事件智能分析事件智能分析模塊自選:8個一級維度13個二級維度支持用戶根據自身需求定制報告內容和模塊組合,滿足不同行業、不同企業的多樣化需求,AI熱點分析-數據型AIAI熱點:熱點:DIYDIY事件智能分析(事件智能分析(內測)內測)事件概述:事件概述:2025
68、年春節期間,*街道為了營造古城夜間氛圍,倡議沿街商戶夜間亮燈。不料2月3日晚,因一商戶未按要求徹夜開燈,數名身著制服的工作人員深夜撬鎖進入店鋪強制開燈,并更換門鎖。店主曝光監控視頻后,此事在網上引發強烈關注和批評。網民和媒體普遍認為,基層執法人員手段粗暴、逾越法律紅線,僅為追求“亮化”政績不惜侵犯商戶權益。事件迅速登上熱議話題,當地街道辦于2月7日凌晨發布致歉信,承認工作方法失當,反思急于求成和簡單粗暴的問題,并表示將規范管理,確保不再發生類似事件??傮w來看,輿論對這種“倡議變強制、執法變違法”的現象反響強烈,要求嚴肅追責整改,以維護法治與營商環境。倡議下發倡議下發(1 1月下旬)月下旬)事件
69、曝光與初步回應事件曝光與初步回應(2 2月月4 4日日-5-5日)日)官方致歉及處理官方致歉及處理(2 2月月6 6日日-7-7日)日)事件脈絡:事件脈絡:強化法治培訓,規范執法行為對于政府倡議類事項,應明確其非強制性質,不得層層下達硬性指標。上級部門在發出倡議時要同步強調執行紅線,防止基層將倡議異化為命令。建立監督機制,嚴格禁止以完成任務為由對倡議事項強制執行。一旦發現“倡議變強制”苗頭,應及時糾偏,確保倡議始終遵循自愿參與原則。各級執法和基層工作人員需加強法律法規和執法規范培訓。牢固樹立“依法行政、依法執法”觀念,杜絕以行政命令替代法律程序的行為。本事件暴露出一些人員法律常識欠缺、底線意識
70、不足,應開展針對性的警示教育,讓“不經授權不得入內”“保護私有財產”等成為不可逾越的紅線。同時完善執法流程,明確任何進店檢查都須依法依規、征得同意或持合法手續,杜絕私自撬鎖等現象。對擅自違規執法者嚴肅處理,以儆效尤?;鶎诱畱饤壖庇诔稣兊男膽B,切實轉變作風。從此次事件汲取教訓,在推進夜間經濟等工作時,多站在商戶和群眾立場考慮可行性,避免“一刀切”式要求。杜絕“數字出政績”和表面工程,評估措施的實際效果和負擔。對于亮燈工程這類旨在營造氛圍的舉措,可采用激勵而非壓迫的方式,例如通過補貼、電費減免或評優表彰來鼓勵商家參與,而非簡單下令。上級主管部門也應反思考核導向,避免給基層下達不切實際的任務指
71、標。相關部門應歡迎社會各界監督,如街道辦在致歉信中承諾的那樣,積極傾聽商戶和市民的意見。12345熱線等渠道對涉及自身的投訴也應及時介入處理,不能因為牽涉公權力就敷衍了事對超越職責、濫用職權者依法依規問責處理,并將結果向社會公布,以重建公眾信任。AIAI熱點:熱點:DIYDIY事件智能分析(事件智能分析(內測)內測)輿論觀點:輿論觀點:倡議演變倡議演變強制,基強制,基層形式主層形式主義作祟義作祟強制執法強制執法涉嫌違法,涉嫌違法,侵害商戶侵害商戶權益權益粗暴執法粗暴執法破壞營商破壞營商環境,公環境,公眾信心受眾信心受損損政績沖動政績沖動與與“面子面子工程工程”遭遭炮轟炮轟該事件中執法人員公然破
72、門而入、剪鎖開燈,被普遍視為逾越法律底線的行為。法律界人士指出輿論聚焦于“倡議為何淪為命令”的現象,批評基的現象,批評基層工作中的形式主義和層層加碼作風。在官方文件層工作中的形式主義和層層加碼作風。在官方文件上,夜間亮燈本是倡議性質,并無強制效力。然而上,夜間亮燈本是倡議性質,并無強制效力。然而從實際執行看,基層部門往往將上級倡議當作硬性從實際執行看,基層部門往往將上級倡議當作硬性命令,不容違背命令,不容違背許多評論從營商環境和政府形象角度,批評“撬鎖亮燈”給當地帶來的負面影響。商戶本是城市經濟活動的主體,卻在節日里遭遇如此對待,引發企業群體對當地營商環境的擔憂。有輿論指出,被強制打開的燈光照
73、亮的不是繁華,而是破壞營商環破壞營商環境的陰影境的陰影,如果不徹底糾正問責,必然讓投資者和經營者對當地“敬而遠之”在更深層次上,很多媒體將矛頭指向事件背后的政績觀扭曲與面子工程心態。風險研判:風險研判:公信力與形象風險:公信力與形象風險:事件已在網絡引發廣泛負面關注,暴露出基層治理亂象。如果相關部門處理不當、避重就輕,可能導致公眾對政府公信力的進一步下降。官方致歉雖及時,但其措辭被部分輿論批評避實就虛(僅稱“工作方式失當”而未提法律責任)。若后續問責和整改不徹底,網民的不滿情緒可能累積,引發新一輪輿情。對設市而言,城市形象已受沖擊,需防范輿論持續發酵影響當地旅游和投資意愿。正如評論所警示,破壞
74、營商環境的行為不糾正,將使企業對當地“敬而遠之”,長遠看將削弱地區經濟活力。啟示建議:啟示建議:01030204明確倡議邊界,嚴禁強制加碼轉變工作作風,杜絕形式主義健全監督問責機制Zeelin Deep ResearchZeelin Deep Research:提供高效、深度的信息解決方案提供高效、深度的信息解決方案Zeelin Deep ResearchZeelin Deep Research旨在幫助用戶高效完成復雜得多步驟分析任務。用戶只需輸入一個查詢問題(一個指令),系統就會自動先從知識庫中檢索與問題相關的內容塊,然后通過標簽器和標注器篩選出有用信息,并由過濾器生成新的查詢,指導后續檢索
75、;進行多輪檢索、分析并整合信息來源,直到獲取足夠信息生成最終答案;最終,會生成一份詳盡的報告,類似于專業分析師撰寫的深度分析報告,為用戶提供全面且精準的信息支持。Zeelin Deep ResearchZeelin Deep Research:提供高效、深度的信息解決方案提供高效、深度的信息解決方案“有趣的是,盡管這些“TikTok難民”逃離的是中國背景的TikTok,卻將大量用戶轉移到了另一個中國應用小紅書(RedNote)。這一現象引發了有關“數字悖論”的討論。然而,當美國用戶涌入小紅書等中國社交平臺時,這種“逃離一款中國應用卻投奔另一款中國應用”的現象,反映了數字世界錯綜復雜的全球化特質
76、。這一悖論不僅揭示了平臺的地域文化和內容生態的差異,還反映了跨國數字平臺競爭中的復雜動態。TikTok難民的選擇并非簡單的逃離與投靠,而是在面臨政治、文化和技術多重約束下的“無奈選擇”。因此,在分析TikTok難民現象時,不能僅僅從平臺的歸屬國來進行二元對立的簡單推論,而應該從全球數字生態、文化認同、技術依賴等多角度出發,深入剖析其背后的深層次因素?!盳eelin Deep ResearchZeelin Deep Research:提供高效、深度的信息解決方案提供高效、深度的信息解決方案 政府監管與數字主權的再定義政府監管與數字主權的再定義隨著“TikTok難民”的遷移,平臺的跨境運營和全球化
77、發展對政府監管能力提出了巨大挑戰。在傳統的國家主權框架下,政府往往能夠控制本土的數字平臺,但隨著社交平臺的全球化擴展,尤其是像RedNote這樣的跨國平臺,它們在全球范圍內的內容傳播和數據流動使得國家監管邊界變得模糊。這種變化促使各國政府重新審視如何在全球數字化進程中保持對數字平臺的監管權,如何平衡數字自由與國家安全的需求。數字主權數字主權成為了全球化數字平臺面臨的重要議題之一。國家如何在保障數字經濟和數據安全的同時,防止外部平臺對本國信息流和文化傳播的過度干預,成為了各國政府的一個重要考量。以美國為例,其政府在TikTok的監管政策中就展現了對數字主權的擔憂,尤其是在數據流動和平臺內容的控制
78、方面。未來,隨著全球數字平臺間競爭的加劇,如何建立更加公平、透明的全球數字治理機制,避免數據壟斷與文化霸權,成為了全球互聯網治理中的一個核心問題。ZeelinZeelinDeepResearchDeepResearch商用服務商用服務Zeelin Deep Research是服務,在DeepSeek推理大模型基礎上,它將是為你開發專屬、私有“AI應用”推理大模型與智能體應用的技術伙伴。馬文明斯基設想“Agents心智社會”,即“智能”是由多個Agents協作產生的,它們會符合進化論和博弈論的潛在規則。要構成了一個“Agents的推理社會”,仍然需要在強化學習多多投入?!拔覀冸xAI自主做出重大發
79、現的時間,不會超過幾年了?!碧崾菊Z管理與自動化調用提示語管理與自動化調用多模態大模型集成與封裝多模態大模型集成與封裝用戶通過簡單操作(如輸入關鍵詞、選擇任務類型等)觸發生成流程。系統自動將用戶指令轉化為模型可理解的格式,并調用封裝好的提示語模塊,驅動大模型完成目標材料的生成。生成結果通過實時反饋機制進行優化,用戶可以根據需要調整生成參數或重新生成,以獲得更符合需求的內容。ZeelinZeelin DeepResearchDeepResearch服務:智能體封裝搭建服務:智能體封裝搭建邏輯邏輯通過構建一個集成框架,將多個大語言模型、推理模型進行按需封裝,形成一個統一的接口。每個模型針對特定任務(
80、如文本生成、圖像描述、代碼生成等)進行優化,并通過模塊化設計,將不同功能模塊(如文本理解、內容生成、風格調整等)封裝為獨立的提示語(Prompts)單元。這些提示語單元通過參數化配置,能夠根據輸入需求動態調整模型的生成邏輯。開發一個提示語管理系統,用于存儲、管理和調用封裝好的提示語。該系統通過自然語言處理(NLP)技術解析用戶輸入的簡單指令,自動匹配并調用對應的提示語模塊。同時,利用上下文感知算法,根據用戶需求的復雜性和具體場景,動態組合多個提示語模塊,以實現復雜任務的自動化生成。自動化生成與交互優化自動化生成與交互優化系統架構與技術實現系統架構與技術實現整個系統采用分層架構設計,底層為多模態
81、大模型集成層,中層為提示語管理與自動化調用層,上層為用戶交互層。技術實現上,利用微服務架構將各功能模塊解耦,通過API接口實現模塊間通信。同時,引入機器學習算法對用戶反饋進行分析,持續優化提示語的準確性和生成效果。通過這種智能體封裝和自動化設計,系統能夠高效地將復雜的多模態大模型能力轉化為用戶友好的簡單操作,大幅提升內容生成的效率和可擴展性。ZeelinZeelin DeepResearchDeepResearch服務:智能體封裝搭建服務:智能體封裝搭建路徑路徑模塊化優勢:將行業研究拆解為結構化子任務(子產品),通過路由智能體動態調度,符合復雜問題分解的工程學邏輯。類似AlphaFold2中注
82、意力路由的設計思想。領域適配性:不同行業(如醫藥vs制造業)的研究范式差異較大,專用智能體比通用模型更能捕獲行業特有的分析框架和知識圖譜。路由智能體的設計需要突破傳統決策樹的局限:融合元學習能力,動態感知問題復雜度、數據完備性、時效性要求。引入強化學習機制,通過歷史任務反饋優化路由策略知識封裝標準化:需建立統一的行業本體論框架(Ontology Framework);結構化報告應包含可機器解析的元數據標簽(如分析維度、數據來源、置信度)認知一致性難題:各智能體底層認知基模(Schema)需對齊;設計跨模塊的一致性校驗層,類似分布式系統中的共識機制動態演進機制:行業研究范式會隨政策/技術變遷而改
83、變;需要構建智能體版本的灰度發布和A/B測試能力多智能體協作架構的合理性多智能體協作架構的合理性關鍵技術實現考量關鍵技術實現考量潛在潛在挑戰與優化方向挑戰與優化方向由GPTs-Flowchart Generator梳理文本生成代碼,Mermaid AI生成思維導圖推理大模型推理大模型十條十條使用心得使用心得如果傳統生成式大模型是兼職助理,那推理大模型應該是“正式員工”,且是一位對工作可以“兜底”的員工,包括理解需求、推測使用場景、尋找生產資料、組織生產資料并可輸出一份完整的結構化內容?;跀祿壬a資料的復雜、推理任務,可以試試推理大模型,包括預測型任務,輸出結果最高八成滿足研究目標。簡單任務
84、仍交給傳統生成式大模型,以免陷入自尋煩惱畫蛇添足陷進,所謂“簡單任務”,好比傳統搜索引擎式任務。模板類任務需要結合生成式大模型和推理大模型,各取所長,前者避免“華而不實”,圍繞中心內容打轉;后者避免“自作主張”,脫離模板太遙遠。提示語如果研究不明白,可以考慮放棄研究,強大的推理大模型是一個“善解人意”的好助手,如果理解不對,再糾正不遲。在推力大模型面前,會出現對提示語“視而不見”情況,畢竟太“聰明”,所以會自作主張,自由發揮。大膽啟用推理大模型,但仍需謹慎驗證,幻覺問題依然存在,尤其數據源本源性錯誤在所難免,且容易以AI的方式“舉證”。優先使用DeepSeek本推,實在“系統繁忙”那就試試秘塔、硅基流動、Sider、MAXai等訪問路徑?,F階段還需保持耐心,隨時接受推理大模型“罷工”。推理大模型也需要“調教”,當他不出結果時,多試試兵法。摩爾定律18個月迭代一次,某大模型每12個月就實現了10倍增長,所以永遠保持“在場”很重要,不斷實驗,不斷采納,不斷“碰南墻”,等待下一輪實驗、采納如果談人與AI共同進化太過宏大,AI內化著實不可逆,所以是否要做AI創新與擴散的創新者(約占2.5%)、早期采用者(約占13.5%)以及早期大眾(約占34%),還是通常在社會壓力下才采納創新的晚期大眾(約占34%)甚至落后者(約占16%)?