當前位置:首頁 > 報告詳情

下一代 RAG 引擎的技術挑戰與實現-張穎峰.pdf

上傳人: 張** 編號:175729 2024-09-09 35頁 2.14MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

下一代RAG引擎的演講主要內容包括:RAG架構模式、技術挑戰與實現、數據抽取模型、混合搜索、高級RAG、文檔結構識別模型、表格識別模型、向量召回、查詢改寫模型、圖索引、多模態模型、各類圖表識別、索引、排序模型、RAG數據庫選型對比、ColBERT的收益、Agentic RAG等。 關鍵點如下: 1. RAG架構模式:Extraction Indexing Retrieval Generation,包括Chunks、Embeddings、VectorDB、Embeddings Question Answer Chunking、Relevant chunks、Embedding model、Embedding model Search、Recommender、Conversational AI prompts等。 2. 技術挑戰與實現:包括文檔結構復雜、數據亂、向量召回無法滿足要求、問題和答案所在文檔關聯不大等。 3. 數據抽取模型:包括Documents文檔結構識別模型、頁眉頁腳、段落、圖片、表格掃描、OCR文字換行檢測、Chunking結果、標題補全、圖片截取、表格結構識別模型等。 4. 混合搜索:包括Indexing Database、多路召回、結構化數據查詢融合排序、Tensor Sparse Vector Dense Vector Full Text Search、Columnar Store Secondary Index、Numeric/String Dense Vector Text Vector Index等。 5. 高級RAG:包括Agentic RAG、復雜問答、查詢意圖識別、知識圖譜、文檔解析算法、文檔聚類和摘要等。 6. 文檔結構識別模型和表格識別模型:包括單元格邊界判定、表頭信息判定、單元格合并判定、表格跨頁判定等。 7. RAG數據庫選型對比:包括全文搜索+向量幾路召回、nDCG@10、MLDR long-document retrieval benchmark、Dense Sparse BM25+、Dense+RRF、BM25+Dense+Sparse+RRF、Dense+Sparse+RRF BM25+Dense+Sparse+ ColBERTReranker等。 8. ColBERT的收益:包括nDCG@10、40、60、80、MLDR long-document retrieval benchmark、Dense Sparse BM25+、Dense+RRF、BM25+Dense+Sparse+RRF、Dense+Sparse+RRF BM25+Dense+Sparse+ ColBERTEmbedding Model等。 9. Agentic RAG:包括復雜問答、查詢意圖識別、知識圖譜、文檔解析算法、文檔聚類和摘要等。
"下一代RAG引擎將如何改變搜索技術?" "如何通過數據抽取模型提高信息檢索的準確性?" "混合搜索在下一代RAG引擎中扮演什么角色?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站