《張世鳴_GraphRAG在CVTE多業務場景下的探索與應用.pdf》由會員分享,可在線閱讀,更多相關《張世鳴_GraphRAG在CVTE多業務場景下的探索與應用.pdf(25頁珍藏版)》請在三個皮匠報告上搜索。
1、演講人:張世鳴 視源股份(CVTE)中央研究院數據挖掘 研究員 Apache HugeGraph PMC MemberGraphRAG GraphRAG 在在 CVTE CVTE 多業務場景下多業務場景下的的探索與應用探索與應用GraphRAG 簡介及框架GraphRAG and HugeGraph-AI01Education02智能教育場景Customer Service03智能客服場景Work Plan For Next Quarter04目 錄CONTENTS未來工作GraphRAG 簡介W o r k S u m m a r y A n d R e v i e wRAG-GraphRA
2、GRetrieval-Augmented Generation with Graphs(GraphRAG)https:/arxiv.org/pdf/2501.00309外部可靠知識庫來增強上下文知識 圖結構、多樣化的基于圖的算法和相關的技術GraphRAG Introduction Retrieval-Augmented Generation with Graphs(GraphRAG)https:/arxiv.org/pdf/2501.00309Query Processor:命名實體識別、關系提??;查詢結構化 Text2GQL、復雜查詢多步分解、查詢擴展語義增強。Retriever:1)基于
3、啟發式 2)基于學習 3)神經+符號Organizer:去除無關信息、優化信息結構,保證質量。Generator:LLM-basedApache HugeGraph 圖智能生態框架Apache HugeGraph-AI知識抽取與融合社區發現與摘要圖路徑遍歷圖神經網絡Text2GQLhttps:/ ConstructionExplicit Relation&Implicit RelationExplicit Relation Construction 題目涉及知識點題目涉及知識點解析解析已知函數 求其在區間 2,2 上的最大值和最小值。知識點摘要知識點摘要:二次函數的性質概念關鍵詞概念關鍵詞:最
4、大值、最小值 認知診斷:知識狀態、知識點的掌握度知識追蹤:分析行為記錄、動態建模知識狀態變化、預測未來表現錯誤也有增益、多次錯掌握度下降、間隔長會導致遺忘Implicit Relation Construction 認知診斷&知識追蹤學習模塊:建模學習增益,學習單元,知識吸收遺忘模塊:消除遺忘影響,更新學生完成第 t 次學習交互后的知識狀態預測模塊:預測題目準確率(q 知識點向量、e 習題向量)因果推理:識別變量間因果關系并量化其效應的分析方法(是否掌握知識點 A 對知識點 B 的影響效應)混淆變量識別:后門準則集合 Z 中沒有 X 的后代節點。集合 Z 阻斷了 X 與 Y 之間的每條含有指向
5、 X 的路徑。因果效應估計:基于傾向得分:基于匹配、加權、分層,平衡處理組和對照組的特征分布,減少選擇偏差,估計處理組和對照組之間的平均因果效應?;陔p重機器學習:消除混淆變量 X 對結果變量和干預變量 的影響分別使用混淆變量 X 預測結果變量和干預變量,實際-預測得到殘差(未被干擾的A和B)對殘差進行線性回歸,回歸系數即為A 對 B 的因果效應估計量。Implicit Relation Construction 因果推斷因果結構學情報告學生 A 對章節 B 涉及知識點的掌握情況信息過載:確定遍歷的方向,有選擇地探索1)實體&關系鏈接2)shortest path班級對章節 B 涉及知識點的整
6、體掌握情況(based on hugegraph-computer)1.找到章節 A 包含的所有知識點進行遍歷,2.遍歷這些知識點,找到班級中所有學生對這些知識點的掌握情況。3.按知識點分組,計算每個知識點的平均掌握分數。4.返回知識點名稱和平均掌握分數。Graph Augmentation:歷史學生報告子圖補充上下文Retrieval Graph Traversal探索圖的結構,尋找路徑、檢測循環、遍歷圖決策變量:約束:路徑長度約束:(如每天學習5個知識點)。依賴約束:若影響效應大于域值(如0.6),則 必須在 之前。重復約束:同一知識點最多出現 N 次。目標函數:Retrieval Heu
7、ristic based個性化復習路徑規劃個性化復習路徑規劃 優勢在于搜索效率,通過利用啟發式信息,可以減少搜索空間,避免盲目搜索,快速達到搜索目標。搜索收益最大的復習路徑Retrieval Learning based Heterogeneous Graph Neural Networks節點特征+圖的拓撲結構:特征傳遞、聚合、更新場景:題目涉及知識點解析、題目推薦、關系挖掘、標簽預測https:/arxiv.org/pdf/2405.20139Generate1生成學生知識掌握情況的報告,幫助教師調整教學策略學情診斷報告2通過知識追蹤結果,刻畫學生的學習特征,提供學習建議學生學習報告354
8、題目、試卷等學習資源學習資源生成基于學生知識狀態和知識的因果影響效應,給學生定制收益最大的學習路徑個性化學習路徑規劃學習資源推薦為學生推薦適合其當前水平的學習資源智能客服場景W o r k S u m m a r y A n d R e v i e w智能客服場景意圖模糊、故障推理外部知識的選擇和時機圖片信息回復準確率要求與LLM幻覺黑屏指示燈狀態無法開機重啟復位背光狀態貝葉斯網絡:通過 DAG 表示一組隨機變量以及變量之間的因果關系或條件依賴關系貝葉斯網構建確定變量和值:歷史對話-標準操作流程確定依賴關系條件概率表參數估計:基于歷史故障排查的觀測數據,最大似然估計貝葉斯網推理前/后向推理:基
9、于已知變量概率,計算所有未知變量的概率(多變量、剪枝)概率更新:隨著排查的進行,不斷更新變量的概率分布Graph Construction Bayesian NetworkRetrieval1.Node MappingLLM based Semantic Enhancement2.Bayesian InferencePrior&PosteriorProbabilistic Reasoning3.歷史對話摘要&FAQSOP summaryKnowledge Graph4.Query RewriteQuery OptimizationSemantic FragmentationRedundancy
10、 Removal智能客服整體架構Retrieval&Generatehttps:/arxiv.org/pdf/2405.17935智能客服整體架構Tool learning:Dataset、CALLAPI、Params、Regenerate置信度圖像和文本的特征對齊:構建圖文對、對比學習未來工作Agentic GraphRAGAgentic GraphRAG hugegraph-aihugegraph-ai強調多輪交互、動態決策和自適應推理,包括狀態、決策、行動、反饋等模塊狀態、決策、行動、反饋等模塊。多模態圖譜豐富知識的表示形式,提升任務性能、支持復雜跨模態檢索和推理知識/模型自動化更新的同時,如何保證泛化能力和準確率更多落地場景的探索多模態故障診斷、反向輔助優化產品設計等等未來工作知識更新與自我知識更新與自我迭代迭代感謝大家用心觀看謝謝謝謝觀看觀看https:/