《4.AliGraph(24頁).pdf》由會員分享,可在線閱讀,更多相關《4.AliGraph(24頁).pdf(24頁珍藏版)》請在三個皮匠報告上搜索。
1、AliGraphAliGraph:大規模圖神經網絡平臺李永(九豐)阿里巴巴資深技術專家計算平臺事業部PAIPAI機器學習平臺介紹https:/ G=(V,(V,E)E)同構圖異構圖有向圖無向圖V=VertexE=Edge常見的圖計算離線圖處理Pregel,PowerGraph,Spark GraphX圖數據庫Neo4J,Titan實時圖分析查詢Aliyun GraphCompute,Amazon Neptune圖+深度學習=圖神經網絡非規則化的數據Graph Embedding圖神經網絡的應用領域社交領域推薦領域知識圖譜生命科學反作弊線上支付GNNGNN的應用 分類GNNGNN的應用 關系預測
2、GNNGNN大規模應用的四大挑戰規模龐大點邊異構屬性豐富動態變化數百億甚至數千億點,數千億甚至數萬億的邊同構、異構、多邊、多屬性點屬性,邊屬性節點、邊的增刪更新AliGraphAliGraph:大規模GNNGNN平臺采樣&建模&訓練一體化的GNNGNN平臺AliGraphAliGraph系統架構AliGraphAliGraph編程范式AliGraphAliGraph編程范式samplesampleaggregateaggregatecombinecombineAliGraphAliGraph五大特點大規模圖存儲分布式采樣稀疏內核優化自創SGCN線性擴展基于內存的圖存儲分布式的圖存儲支持百億點的規模,可伸縮基于Vertex Cut的分片Worker基于出入度的緩存優化緩存效果緩存加速:比隨機方法快40%-50%,比LRU方法快50%-60%緩存加速:比隨機方法快40%-50%,比LRU方法快50%-60%分布式采樣支持豐富的采樣策略支持多跳的采樣功能毫秒級的采樣性能模塊化的采樣設計本地/全局的負采樣稀疏內核優化加速原始版本GCN達3x!自創SGCNSGCN分布式擴展去中心化Distribute Negative Sampling多機異步訓練AliGraphAliGraph APIAPI以點為中心邊表混合采樣&建模&訓練一體