《面向大規模向量數據的云原生存儲解決方案 Milvus 向量數據庫的經驗.pdf》由會員分享,可在線閱讀,更多相關《面向大規模向量數據的云原生存儲解決方案 Milvus 向量數據庫的經驗.pdf(23頁珍藏版)》請在三個皮匠報告上搜索。
1、DataFunCon#2024向規模向量數據的云原存儲解決案徐冬-Zilliz個介紹 Zilliz 席程師 數據系統程師,Apache Hive Hadoop 貢獻者 前阿級專家關于 Zilliz 全球第款向量數據庫 性能和吞吐 線性擴展 模型編排 模型緩存 向量數據庫云服務 超性能 全托管 度可定制Contents錄向量數據庫存儲解決案典型例向量數據庫為 AI 打造的結構化數據解決案嵌 數據的向量表達 監督特征抽取 語義相似性度量ANN Search向量存儲向量存儲是AI系統的核組件為什么不使向量索引庫?向量索引庫沒有完備的數據庫功能 數據更新 條件查詢和分組查詢 數據類型持和函數持 向量索
2、引庫使檻 部署 管理:監控、備份 向量索引庫法多機擴展為什么不使傳統數據庫?向量索引能 復雜向量操作 多向量查詢 混合查詢 結構化存儲挑戰向量數據庫的關鍵指標 查詢性能-延遲、吞吐和召回率 成本-存儲密度、壓縮編碼 功能-混合查詢、分組、多模態 擴展性-存儲計算分離的彈性伸縮 穩定性Zilliz 向量數據庫產品典型例Code assist-Vanna AI問答系統-OSSChat存儲解決案Milvus 如何持百億數據規模性能存取向量存儲的挑戰 索引 為規模數據構建 成本 索引更新能 向量和標量數據的異構特性 壓縮率和編碼效率 存儲空間差異 訪問模式 標量過濾 向量搜索讀寫分離的設計 平衡連續索引的時效和成本 區分計算密集型和IO密集型作業 靈活擴縮容數據分 Shard:并發操作單元 Segment:索引單元 File:對象存儲的并發讀寫單元分層存儲件格式 列式存儲 vs 式存儲 向量的編碼和數據類型 壓縮效率總結 專的向量數據庫在索引性能和查詢功能上有決定性優勢,是 AI-Infra 的必備組件 Milvus 是開源的向量數據庫,為云原、分布式和性能設計 Milvus 向云原的存儲的關鍵技術包括讀寫分離、數據分、分層存儲和件格式優化謝謝milvusiolinktr.ee/Milvusiomilvus-ioZilliz