《大模型賦能的數據資產平臺構建實踐-徐流明.pdf》由會員分享,可在線閱讀,更多相關《大模型賦能的數據資產平臺構建實踐-徐流明.pdf(42頁珍藏版)》請在三個皮匠報告上搜索。
1、“多模態+大模型”,賦能企業數據資產平臺建設與實踐徐流明/星環科技 系統架構師數據價值高峰論壇目錄政策背景分析企業數據資產運營平臺架構思路“統一多?!奔夹g賦能企業數據底座建設大模型助力數據資產管理降本增效典型案例分享數據要素改革是我國改革開放的又一重要里程碑 隨著新一輪科技革命和產業變革深入發展,數據作為關鍵生產要素的價值日益凸顯。近年來,我國數據要素市場發展進入快車道。善用數據生產要素,促進數據要素市場化,正在成為驅動我國數字經濟創新發展的重要抓手。2019年10月十九屆四中全會首次將”數據”增列為生產要素2022年12月“數據二十條”為推動數據要素發展筑牢了政策基礎2023年10月國家數據
2、局正式掛牌負責協調推進數據基礎制度建設,統籌數據資源整合共享和開發利用,統籌推進數字中國、數字經濟、數字社會規劃和建設等。2023年12月“數據要素”三年行動計劃明確十二大試點產業企業數據資產入表正式落地,數據要素價值顯性化2023 年8 月21 日,財政部會計司正式發布了企業數據資源相關會計處理暫行規定 其針對諸如數據資源是否可作為資產入賬、數據資源及相關交易如何進行會計處理,如何在財務報表中列示以及需要做出何種程度的披露等業界關切問題進行了規范。此規定擬于2024 年1 月1 日起施行。企業方經濟效益有效提升數據資產市場的運作效率及公允性;通過鑒證性財務報告對企業的資產和業務價值進行背書,
3、可消除資本對于企業核心競爭力的理解焦慮,提升市場估值效率。企業方社會效益改善企業資產負債結構及整體估值;提升企業數據全鏈條管理能力;在法律允許的范圍內,以數據資產為新設企業出資,數據資產評估的結果為參考作價入股;利用數據資產開展相關金融服務。顯化企業數據價值顯化企業數據價值、改善企業財務報表改善企業財務報表、促進企業數據投資促進企業數據投資目錄政策背景分析企業數據資產運營平臺架構思路“統一多?!奔夹g賦能企業數據底座建設大模型助力數據資產管理降本增效典型案例分享對內運營助力企業數字化轉型對外流通促進產業鏈協同數據資本數據資源數據資產數據治理數據編目數據資產入表數據交易流通 通過資產盤點,摸清企業
4、數據資產家底,提升數據資產管理水平 通過數據治理,改善數據質量,更好的為業務賦能,提升數字化競爭力 通過數據入表,增加企業資產規模,優化財務報表,為數據交易流通提供定價參考 通過數據交易流通,增加營收 通過產業數據融合,促進產業協同,提升產業效能價值體現數據資產數據要素數據資產運營管理思路平臺建設思路:梳理一個目錄、打造一個市場、建設兩套平臺(1+1+2)業務系統ERPCRM外部數據數據源數據采集同步對內:建設數據資產管理平臺,支撐數據資產的盤點、治理、入表等統一管理對外:建設數據要素流通平臺,支撐與產業鏈上下游企業的數據共享流通交易數據資產管理平臺數據要素流通平臺多模態數據底座數據開發治理平
5、臺數據安全合規平臺數據服務平臺業務應用流通數據存儲區數據產品加工平臺數據產品管理平臺企業數據產品市場數據交付系統API調用數據沙箱隱私計算數據流通一體機數據產品化企業內網區DMZ/外網區企業數據資產目錄企業數據中心目錄政策背景分析企業數據資產運營平臺架構思路“統一多?!奔夹g賦能企業數據底座建設大模型助力數據資產管理降本增效典型案例分享企業數據平臺現狀業務日趨復雜化 離線業務 在線業務 分析型業務 檢索型業務 知識圖譜 機器學習 大模型 結構化數據 半結構化數據 非結構化數據離線數據加工清洗/自助報表查詢/在線文本數據檢索/日志監控/實時數據分析企業數據平臺現狀IT架構復雜報表集市關系型數據庫數
6、據湖數據倉庫大數據平臺圖檢索圖數據庫全文搜索搜索引擎跨平臺數據流轉應用技術棧 跨平臺開發成本高 運維難度上升成本高 易形成數據孤島 數據流轉復雜,一致性無法保障 數據存儲冗余 資源競爭企業數據平臺現狀跨模型開發復雜找出30歲人群一度關系圖數據庫人群關系代碼:match(a)-(b)where a.age=30 with b.id as uid關系型數據庫消費記錄搜索引擎商品評價找出人群的消費記錄代碼:SELECT uid,pid FROM purchase_history hwhere h.uid in(1111,2222,3333 .);找出包含定特商品評價關鍵詞的消費記錄代碼:curl-X
7、GET ip:port/indexname/_search-d“bool”:“must”:“term”:“content”:“超值”,“term”:“pid”:“p111,”p222,term:”uid:1111,2222多模型數據庫多模型數據庫多模型數據庫(Multi-model database),是下一代新型數據庫,與傳統的數據庫系統只支持單一數據模型不同,多模型數據庫是一種在統一、統一、綜合的平臺綜合的平臺下同時支持多種不同的數據模型多種不同的數據模型的數據庫1,這些數據模型可包括傳統的關系模型和NoSQL數據模型(文檔模型,鍵值模型,圖模型),一個重要的特性是,多模型數據庫擁有自己的
8、一種或多種查詢語一種或多種查詢語言言,可以非常靈活的方式訪問多種不同數據模型訪問多種不同數據模型,甚至是跨模型的跨模型的JOIN操作操作,這使得數據組織,存儲,操作較以往更加靈活,便捷。-wikipedia多模型架構設計聯合型 vs 原生型業務A關系型數據庫A業務B關系型數據庫B業務CNoSQL數據庫C業務EMPP數據庫業務F大數據平臺統一接口層聯合型上層增加平臺總體調度與接口層,為用戶提供統一操作與運維業務A原生型多模型數據庫業務B業務C業務E業務F原生型一個系統原生支持多種模型數據,統一數據管理,統一計算引擎沒有解決底層多個數據庫的運維和數據管理問題一體化統一架構多模型架構設計模塊分層拆解
9、統一的接口層統一的計算引擎層統一的分布式存儲管理層資源調度層接口計算引擎存儲格式接口計算引擎存儲格式接口計算引擎存儲格式存儲格式存儲格式存儲格式存儲介質存儲介質存儲介質數據庫A數據庫B數據庫B.多模型數據平臺架構設計模塊分層拆解存儲引擎層TP引擎AP引擎全文引擎KV引擎向量引擎存儲管理層災備負載均衡一致性協議數據分布彈性伸縮計算引擎層通用算子執行優化向量化CodeGen資源調度計算接口層Oracle語法Mysql語法Cypher編譯優化.資源管理層CPU內存網絡磁盤容器編排多模型數據平臺架構設計資源管理層TranswarpTranswarp Cloud Operating System Clo
10、ud Operating System云原生操作系統云原生操作系統基于基于ContainerContainer容器技術與容器技術與KubernetesKubernetes容器編排容器編排 容器資源管理與隔離 Overlay容器網絡 保證安全、可控的集群內外網絡訪問權限控制 可擴展:模塊化、插件化、可掛載、可組合 自修復:自動部署、自動重啟、自動復制、自動伸縮 支持異構操作系統和硬件架構服務器的混合部署多模型數據平臺架構設計存儲管理層TDDMSTDDMS:TranswarpTranswarp Distributed Data Management System Distributed Data
11、Management System分布式數據管理系統TDFSTDFS:TranswarpTranswarp Distributed File System Distributed File System分布式文件系統通用文件分布式存儲兼容 Hadoop生態通信協議上兼容 HDFS 協議海量存儲十億及以上數據量級文件讀寫能力PB級海量文件存儲無單點瓶頸分布式數據管理多模型支持支持不同數據引擎接入分布式數據管理分布管理元信息管理分布式事務分布式一致性多模型數據平臺架構設計分布式文件系統高性能、分區容錯、高魯棒的分布式文件系統高性能、分區容錯、高魯棒的分布式文件系統DNDNDNDNDNDN存儲層Ra
12、ft分布式一致性元數據管理NameName ManagerManager海量小文件存儲海量小文件存儲+對象存儲對象存儲基于基于 Raft 分布式強一致性分布式強一致性元數據讀寫性能俱佳元數據讀寫性能俱佳 同時支持文件存儲與對象存儲 統一文件&對象數據管理 一套存儲平臺運維成本低 無需多namesapce拆分 保障元數據多副本分區容錯性下的數據寫性能 支持動態擴容縮容,集群自動同步副本數據 支持 10 億以上文件數,遠超開源HDFS 5 倍 4億文件規模下,服務啟動時間比開源HDFS快 16 倍,元數據QPS比開源HDFS快 1.7 倍NameName ManagerManagerNameNam
13、e ManagerManagerBlockBlock ManagerManagerBlockBlock ManagerManagerBlockBlock ManagerManagerObjectObject ManagerManagerObjectObject ManagerManagerObjectObject ManagerManager分布式文件系統分布式文件系統TDFSTDFSHDFS API對象存儲對象存儲HDFSHDFSS3 API傳統解決方案TDFS 統一文件&對象存儲HDFS APIS3 API海量文件存儲影像平臺大文件小對象混合存儲兼容兼容 Hadoop 生態生態&S3協議協
14、議 支持 Hadoop 上層生態組件 支持HDFS原地升級,不影響原有數據,無需數據搬遷 兼容S3接口多模型數據平臺架構設計分布式數據管理系統數據管理系統元數據分布式管理 分片 副本 分布式一致性 并發控制 鎖管理BinLog關系型存儲引擎時序數據引擎鍵值存儲引擎支持多模型存儲引擎的統一分布式數據管理系統存儲能力提升 基于 Raft 一致性協議的分布式存儲管理 支持單節點穩定存儲百萬數據分片 支持橫向動態線性擴展 具備自動故障遷移、自動數據修復能力多模數據同步 不同存儲模型引擎共享binlog,實現數據在不同存儲模型間自動轉化 一次數據寫入,多種數據模型存儲分布式數據管理系統 TDDMS Cl
15、ient時序數據寫入關系型數據Binlog同步查詢多模型數據平臺架構設計存儲引擎層多模型數據平臺架構設計計算引擎層TranswarpTranswarp Nucleon Nucleon:Distributed Execution Engine Distributed Execution Engine 分布式計算引擎(在線計算、離線計算、實時計算)分布式計算引擎(在線計算、離線計算、實時計算)關系型數據寬表數據全文數據圖數據統一多模型計算引擎離線批處理在線分析任務復雜分析檢索流處理任務外部第三方數據(Oracle、MySQL、Hadoop)多模型數據統一計算多模型數據統一計算跨模型數據關聯跨模型數
16、據關聯與與轉換轉換跨平臺聯邦計算跨平臺聯邦計算Insert into wide_column_table select a,b,c from relation_table;Select*from Local_table joinRemote_tableoracleOn.多模型數據平臺架構設計計算接口層TranswarpTranswarp Nucleon Nucleon:Distributed Execution Engine Distributed Execution Engine 星環分布式計算引擎(在線計算、離線計算、實時計算)星環分布式計算引擎(在線計算、離線計算、實時計算)Transw
17、arp Quark:SQL Query Engine統一SQL編譯器事件存儲統一SQL編譯器兼容多數據模型的統一兼容多數據模型的統一SQL編譯器編譯器圖存儲全文存儲流式SQL圖查詢全文檢索SQL編譯引擎編譯引擎SQL支持:支持ANSI 99/2003;兼容Teradata、Oracle、Db2等多種數據庫方言;兼容多種SQL存儲過程:Oracle PL/SQL,Db2 PL/SQL,Teradata宏語法事務支持(ACID):具備完整的事務支持能力(全事務隔離級別支持,包括讀未提交、讀已提交、可重復讀、串行化)數據類型數值類型:字符類型、日期類型、布爾類型、大對象類型(Blob)等操作符:數值
18、運算、邏輯運算、比較運算、字串拼接(類型強轉)等函數:數值函數、字符函數、日期函數、類型轉換、條件表達式、正則表達式、安全函數、聚合函數、窗口分析函數等支持表空間/臨時表/索引/視圖/序列/游標“統一多?!奔夹g架構優勢“三低一高三低一高”架構復雜度低架構復雜度低 開發成本低開發成本低 運維成本低運維成本低 數據處理效率高數據處理效率高統一多模方案統一多模方案“三高一低三高一低”傳統解決方案傳統解決方案 架構復雜度高架構復雜度高 開發成本高開發成本高 運維成本高運維成本高 數據處理效率低數據處理效率低存儲層計算引擎層接口層存儲層計算引擎層接口層統一分布式存儲管理系統統一分布式存儲管理系統事件存儲
19、統一的計算引擎層統一的計算引擎層多模型數據融合計算統一接口層統一接口層標準 SQL+openCypher語法寬表存儲關系型存儲搜索引擎地理空間存儲圖存儲鍵值存儲時序數據存儲HDFSorc/parquetMapReduce/SparkHiveSQLImpalaSQLImpala自有引擎HDFSparquetHbase 自有引擎HDFSHfileHbase API本地存儲ES 自有引擎ES API離線批處理離線批處理Hive/SparkSQLHive/SparkSQL多表關聯即席分析多表關聯即席分析ImpalaImpala高并發精確查詢高并發精確查詢HbaseHbase全文檢索全文檢索Elasti
20、c SearchElastic SearchClickhouse SQLClickhouse自有引擎本地存儲單表統計分析單表統計分析ClickhouseClickhouse本地存儲TG自有引擎Gsql圖查詢分析圖查詢分析TigerGraphTigerGraph技術技術優勢:優勢:有效管理有效管理多模態數據多模態數據,實現實現多源數據的統一處理多源數據的統一處理“統一多?!奔夹g架構優勢場景舉例傳統跨模型分析方案統一多模聯合分析方案VS3次連接 VS 1次連接3個平臺 VS 1個平臺3次語法 VS 1次語法3次適配 VS 1次適配 圖數據庫:人群關系查找所有年齡在30到35歲之間的用戶有關聯(如轉
21、賬關系)的用戶ID代碼:match(a)-(b)where a.age 30 and a.age(b)where a.age=30 with b.uid as uid)as userSELECT*FROM user uJOIN purchase_history h ON u.uid=h.uidJOIN comments c ON h.uid=c.uid AND c.pid=h.pidWHERE c.content contains(超值);分析某商品在特定年齡層社交關系網絡中的消費評價。目錄政策背景分析企業數據資產運營平臺架構思路“統一多?!奔夹g賦能企業數據底座建設大模型助力數據資產管理降本增
22、效典型案例分享如何利用當下AI的能力來提升敏捷、協同、多樣的要求?業務訴求業務訴求環境挑戰環境挑戰01企業戰略層面管理思維和意識轉變02企業戰術層面數據資產運營化轉變03數據開發、治理、服務體系協同04資產多樣激增、數據環境變化應對需要依賴數據做決策,就需要各種管理視角上的數據有依據、有來源、有標準,且要用數方便,數出同源,人人可以用數。這不是單一的系統工程,而是一個聯邦式的端到端協作過程,需要整條數據流,到人工管理都具備提供數據資源的能力,通過數據資產化為資產運營打下基座。只有讓數據開發、數據管理、運營服務閉環正向循環起來;數據開發者、管理者、使用者協同起來,才能讓數據驅動業務變得更精準、更
23、高效。資產類型和范圍激增,庫表、報表、大屏、接口、算法、標簽、自服務 等,帶來大量適配工作;局部數據越來越重、合規要求導致搬遷成本越來越高,數據環境向分布式、網格化的融合數據云模式演進。企業數字化轉型進入縱深階段、日趨復雜的融合數據云分析環境,都對企業數據資產管理能力提出了更高要求場景敏捷協同多樣思考:如何利用當下AI的能力來提升敏捷、協同、多樣的要求,利用AI+Data賦能業務場景數據采集階段:數據資源智能盤點與編目按系統歸類、部門權屬、業務實 體、安全特性等維度生成目錄功能舉例:識別空表、臨時表、備份表等無 效表,并補充有效表的業務含義一鍵式、多視角、可配置智能化識別與標注種類多,自動化數
24、據開發階段:NLP2SQL29Business Analyst 業務分析師Data Engineer 數據工程師SQLNL Copilot AI助理(大模型)大數據平臺/數據庫非專業用戶在無需掌握數據庫編程語言的前提下,通過自然語言自由地按需查詢數據行業積累:大數據分析領域十年一劍;性能優秀:基于 LLMOps 精調,性能領先;迭代提升:自有 SQL 資產,驅動模型性能持續提升;支持多模:多模查詢語法,非結構化一切可查。0.00%25.00%50.00%75.00%100.00%OverallEasyMediumHardExtraHardBLOOM/BELLEChatGLMSoLAR 求索大模
25、型*SQL任務難度等級描述:Easy只涉及單表;Medium在Easy基礎上,增加一個Join或GroupBy語句;Hard包含超過兩個GroupBy、OrderBy、Join等;Extra Hard:Hard基礎上,SQL還包含嵌套子查詢、Limit等;當前Benchmark共包含63條Easy、123條Medium、53條Hard與60條Extra Hard的測試用例。大模型 SQL任務執行準確率場景場景熟人網絡交叉銷售數據分析支持生成 cypher+sql 的多模聯邦查詢語句提問提問待分析用戶滿足下列兩個條件:1、是12個月內注冊的新用戶2、超過3個朋友買過A基金現在查詢這些用戶的用戶I
26、D,以及其在最近3個月內貸款總額。數據開發階段:NLP2SQL庫表信息查詢歷史業務知識圖譜庫表關聯關系查詢 QA數據獲取(SQL生成)數據分析(數據洞察)預測建模(規劃目標)(分析全鏈路)庫表知識庫問題輸入召回庫表SQL生成大數據分析大模型提示工程SQL輸出庫表召回輸出Finetune微調訓練數據治理階段:數據分類分級大模型海量敏感數據的批量準確識別是數據分級分類工作的前提,也是瓶頸和難點人工識別,效率低投入大規則識別,難以窮舉,識別能力弱傳統AI識別,標注要求高,誤報率高例如:2個業務專家個業務專家+1個數據安全治理個數據安全治理實施人員一個月2萬個字段的人工標注識別為例,完成80萬字段識別
27、,需要40人月人月例如:業務知識點太多,靠規則難以覆蓋;錯別字、同義詞、縮寫等難以通過規則區分和識別例如:首先就要求對訓練集進行標注(人工或規則),因此痛點與前兩個一樣需要更為有效的方式解決數據分類分級落地的痛點數據分類分級落地的痛點數據治理階段:數據分類分級大模型引入AI大模型,實現智能化、自動化的敏感數據識別,并進行數據分類分級特點:只需少量樣本數據標注,語義理解能力強,識別效率高識別效率高HiveInceptorMySQLOracle數據庫/數倉待分級分類數據待分級分類數據1.抽取少量樣本元數據抽取少量樣本元數據2.業務專家組織標注業務專家組織標注3.大模型調試大模型調試Defensor
28、安全中心LLMops大模型服務業務知識庫4.大模型發布大模型發布1.抽取元數據抽取元數據2.分級分類大模型識別分級分類大模型識別3.個人個人/重要數據目錄重要數據目錄3.衍生個人衍生個人/重要數據目錄重要數據目錄模型訓練模型訓練模型使用模型使用4.分級分類結果清單分級分類結果清單5.訪問策略配置訪問策略配置Defensor安全中心數據治理階段:數據分類分級大模型100.00%90.00%100.00%30.00%60.00%30.00%6.00%90.00%1.00%0.00%20.00%40.00%60.00%80.00%100.00%樣本標注時間準確率人力成本人工傳統機器學習大模型耗時下降
29、94%準確率提升30%人力成本下降99%時間、準確率、時間、準確率、人力人力成本對比(歸一化)成本對比(歸一化)模型預測準確率(對比傳統算法)模型預測準確率(對比傳統算法)對比人工識別和傳統機器學習識別,對比人工識別和傳統機器學習識別,AI大模型大模型數據分級分類在數據分級分類在耗時和人力成本顯著下降耗時和人力成本顯著下降,準確率提升顯著準確率提升顯著20.00%30.00%90.00%0.00%20.00%40.00%60.00%80.00%100.00%word2vecSVM大模型訓練集:1000+張表,字段數 3萬驗證集:700+張表,字段數 1.2萬準確率:達到90%(與人工識別相當)
30、人力投入:2人周(對比人工需1.5人月)數據治理階段:自動化注釋生成基于模型/規則的分類分級都依賴數據注釋,注釋缺失依賴數據注釋,注釋缺失是企業數據治理普遍存在的問題:某銀行業務系統,注釋率只有56%某地產公司某系統注釋率只有20%沒有注釋,規則匹配與知識庫模型匹配都少了一個重要的信息輸入,導致識別率下降識別率下降數據治理階段:自動化注釋生成35元數據(技術)業務語義基于大預言模型的語義理解能力,結合企業內部數據字典等來推測業務語義,以某銀行的數據為驗證,目前語義生成大約60%的準確率Prompt示例語義生成的技術流程數據治理階段:基于血緣的敏感傳播鏈路發現36數據安全合規監測與防護平臺分類分
31、級血緣分析引擎敏感資產盤點實時動態血緣解析離線靜態血緣解析數據源數據庫數據表字段敏感類型安全分級隱私類型DB1TB1guideemail郵箱G3個人DB1TB2userpid身份證G4個人敏感資產與分類分級結果敏感資產與分類分級結果字段級庫表血緣字段級庫表血緣基于血緣的敏感傳播鏈路發現基于血緣的敏感傳播鏈路發現敏感表敏感表關聯規則第三方數據庫大數據平臺在數據加工過程中,往往會造成敏感資產的特征發生變化敏感資產的特征發生變化,無法通過規則或者算法識別。但是相關數據安全規定明確指出,加工過程中的衍生敏感資產也需要識別并定級數據使用階段:智能推薦用戶不了解企業是否有數、數在哪、口徑如何數據的解釋與數
32、據使用本身脫節使用數據過程中缺少借鑒和主動指導作為數據使用檢索的統一門戶,需要便捷的搜索及瀏覽展現,搭建統一的搜索引擎,可以支持數據資產、數據標準、元數據等集中搜索利用分詞技術和詞根匹配算法,提升搜索引擎的準確率;瀏覽可以基于數據資產目錄逐類別、逐層次的展開檢索數據資產并建立訂單購物車機制,跟蹤數據資產使用以推薦同類使用列表展現頁面呈現搜索結果,可以快速點贊、收藏詳情頁面展現資產要素及與標準、質量、安全、數據分布等的相關詳情可以在資產結果中便捷添加到需求訂單中點擊切換至外部數據搜索頁面。點擊給基礎數據資產評級。點擊將基礎數據資產收藏進個性化目錄。點擊切換至指標數據資產。點擊跳轉至基礎數據資產詳
33、情頁面。目錄政策背景分析企業數據資產運營平臺架構思路“統一多?!奔夹g賦能企業數據底座建設大模型助力數據資產管理降本增效典型案例分享某頭部運營商B域經分大數據平臺案例數據集市(DM)BSS數據處理集群數據倉庫層應用層數據集市層源數據層報表KPI指標多維分析省分應用CBSS數據處理集群一體化集群廣東山西山東 B域經分集群DWDDWACUBE數據質量管理元數據管理.源系統源系統.用戶系統接口臺賬系統接口.環境搭建數據接入流程處理數據導出價值輸出 134臺 完成10節點測試環境搭建 完成134節點的生產環境搭建 一期:重點產品攻堅行動、移動業務計費收入專題、移動和寬帶產品分析專題;二期:運營總覽、移動
34、業務、數據查詢-網絡口徑、報表 DWD層處理 DWA層處理 CUBE處理 DWA層數據導出 CUBE層數據導出 經營分析系統 其他業務系統客戶需求 老經分Oracle+Hive架構性能遇到瓶頸,資源不堪重負、I/O吞吐量飽和,同時應用能力欠缺、內容單一,已無法滿足當前生產經營需要,新經分基于“新平臺”、“新技術”、“新功能”,構建經分“新體系”,實現“新定位”,自下而上、由內而外的變革建設方案 經營分析大數據平臺是基于“統一多?!奔夹g搭建的平臺,滿足PB級別以上的數據存儲要求,具有很好的橫向擴展能力,支持批量數據處理、交互式查詢、復雜查詢、高并發查詢等多種場景應用。目前已完成經營分析系統數據遷
35、移,實現原經分系統的全部業務處理。建設效果 五新:“新平臺”、“新技術”、“新功能”,構建經分“新體系”,實現“新定位”云化:通過去Oracle云化技術架構升級,助力數據生產提質增效,日報發布時間提升3小時;深化人工智能應用,實現智能搜素、智能推薦,提升服務感知;強化自助服務、在線分析能力,推進互聯網化轉型。某頭部金融客戶大數據平臺案例背景:背景:某證券公司使用neo4j存儲圖譜數據,隨著數據量增長和應用復雜度的提高,單機版的neo4j無法滿足復雜查詢的性能需求,同時也不支持高細粒度的權限和資源隔離,使得公司在知識圖譜方面的研究和發展收到限制。同時也不支持和關系型數據進行聯合查詢分析?;旌喜樵兣蝿?,需要基于圖數據,在關系型數據中查詢相應的公司10層股權信息,需要支持圖數據與關系型數據的跨模型關聯能力。解決方案:解決方案:使用多模型大數據平臺替代原有的neo4j數據庫,使用配套的生態工具完成圖數據導入。通過統一的計算引擎配置不同的資源池,通過統一的安全管控組件配置不同圖數據權限,來對接不同業務部門和應用的復雜使用需求。通過統一的SQL編譯器和計算引擎,完成跨模型任務在一個SQL內完成計算,避免應用層編寫額外復雜的邏輯。效果:效果:多模型大數據平臺提供強大的多模型數據存儲和查詢能力,在復雜查詢場景下性能遠遠優于neo4j,滿足客戶的多應用混合查詢需求,同時也降低了開發運維成本。