《搜搜薯:生成式搜索在小紅書的應用.pdf》由會員分享,可在線閱讀,更多相關《搜搜薯:生成式搜索在小紅書的應用.pdf(25頁珍藏版)》請在三個皮匠報告上搜索。
1、分享人:陳博-小紅書高級算法工程師搜搜薯:生成式搜索在小紅書的應用Overviews 快速了解小紅書 RAG介紹 搜搜薯 Q&A2013.062013.06小紅書在上海成立小紅書在上海成立2013.122013.12小紅書小紅書APPAPP發布發布2017.062017.06用戶突破用戶突破50005000萬萬2020.062020.06月活用戶突破月活用戶突破1 1億億2021.102021.10月活用戶突破月活用戶突破2 2億億20242024月活用戶突破月活用戶突破3 3億億20192019產品加入直播產品加入直播20152015擁抱算法分發擁抱算法分發20132013選擇雙列與選擇雙列
2、與UGCUGC20172017產品加入視頻產品加入視頻社區內容涵蓋時尚、美妝、社區內容涵蓋時尚、美妝、個護、旅行、科技等場景個護、旅行、科技等場景真誠分享、真誠分享、友好互動友好互動發展歷程小紅書搜索-遇事不決小紅書Overviews 快速了解小紅書 RAG 搜搜薯 Q&A搜索引擎早期(1990s)現代(2020s)主要缺陷:1.依賴需求澄清:今天datafun的主要議題2.搜索引擎語言:datafun 會議 2025 議題3.非對稱(相關性和召回供給損失):imax第四排觀影體驗怎么樣-imax3-8排較好4.信息冗余(SEO)和復雜決策:難哄哪集最甜、盒馬必買清單5.解決路徑長:搜索-閱讀
3、-判斷(-閱讀-判斷)生成式搜索(RAG)是萬用靈藥嗎?推薦式搜索需求:美甲、加菲貓 時效性、幻覺、信任感 問答類搜索需求:上迪開門時間 創作類搜索需求:孩子pyq生日文案 主觀跨文檔信息聚合類需求:平價藍牙耳機推薦兩種特點:搜索結果-解決方案gap大 用戶需求明確且答案通過有限篇幅文本有較好呈現業界現狀AI-NATIVESRP(search result page)Onebox(主被動結合主被動結合)面向解決方案面向通用查詢(自然語言+搜索)等待時間較長等待時間較短豆包、通義、chatgpt.小紅書、夸克、百度、微信問一問.deepseek r11.復雜查詢的時間等待預期被廣泛驗證2.推理模
4、型的強大能力受到廣泛認知23-24年早期24年晚期-25年summary的人類偏好對齊-反思和規劃下的搜索行為人類對齊泛場景下智能解決方案:Deep research:研報(深度搜索+代碼)Manus:29種工具Jina ai:邊思考邊搜索(search-o1)summary:意圖需求對齊生成結果對齊Overviews 快速了解小紅書 RAG介紹 搜搜薯 Q&A搜搜薯RAG優勢場景-人類搜索行為對齊 推薦式搜索需求 問答類搜索需求 創作類搜索需求 主觀跨文檔信息聚合類需求.找到優勢場景優勢場景-做優勢場景下的人類搜索行為對齊人類搜索行為對齊 -模擬人類是如何使用搜索工具 -用戶如何通過搜索解決
5、這幾類問題用戶如何通過搜索解決這幾類問題?用戶的搜索行為的人類對齊搜搜薯-鏈路生成式搜索-技術大圖意圖理解需求理解小紅書特有語境+預期結果主被動觸發判斷:何時主動出卡動態退場:卡片線上投放效果不好的退場內容理解-基于llm/mllm的深度內容理解PLM or LLM(Bart/T5/LLaMa)Note TextsGenerated QueriesRelevance RankingCLSQuerySEPNote TextsScorediscard irrelevant queries生成能力先后驗結合的人類對齊先驗SFT產生基模,決定模型下限后驗RLHF產生最終模型武漢拍照出片的地方switc
6、h游戲推薦求解范式-Red Search Agent求解范式-search workflow難哄哪集最甜、盒馬必買清單、百億補貼靠譜嗎(沒有客觀答案,依賴主觀意見整合)-跨文檔的信息整合-準確、全面、細節完整傳統RAG -local Accurate but global useless(局部準確而全局無用)求解范式search workflow開放域觀點聚合2000k 文本的結構化理解枚舉是否對比求解范式-search workflow1.什么是答案?上海住哪里方便:黃浦區(區域)、外灘w酒店(酒店)2.權威性、去重計數、營銷感3.20k內容如何濃縮成0.1k,什么內容是好的?總結1.純文本形式的RAG不是搜索的萬用靈藥,應該專注于RAG對傳統搜索列表的場景化優勢2.從2024年到2025年,r1的爆發式增長,RAG展現形式逐漸向AI-native、多輪演進3.整個業界迭代模式逐漸從搜索結果的人類偏好對齊轉向人類的搜索行為對齊4.基于RAG的場景化優勢,小紅書建立了一整套從LLM預訓練微調到RAG 3大求解范式的搜索大模型能力矩陣,核心是人類搜索行為對齊THANK YOU!歡迎加入小紅書搜索!Q&A