劉巖- Apache Atlas遇上Apache Flink.pdf

報告預覽

劉巖- Apache Atlas遇上Apache Flink.pdf

編號：101860

PDF 27頁 5.49MB 下載積分：VIP專享

下載報告請您先登錄！

劉巖- Apache Atlas遇上Apache Flink.pdf

1、劉巖/Cloudera Solution EngApacheApache AtlasAtlas MeetsMeets ApacheApache FlinkFlink為什么 Flink 需要對接血緣系統#1#1什么是 Apache Atlas#2#2對接技術實現及未來#3#3目錄為什么 Flink 需要對接血緣系統#1#1Flink的三大應用場景Data PipelineAnalyticEvent Driven ApplicationClickstreamApplication DBService LogSTGODSDWDMReportAD-HocService Log離線數倉的基本流程和問題最

2、大延遲=T+N 天 where N=1數倉的實時加工鏈路 STG-ODSFLINK實時源修訂源晚到數據異常數據？修訂任務FLINKFLINK正常數據正常修訂數據？修訂任務？補數修復任務目標表數倉的實時加工鏈路 ODS-DWFLINK實時源修訂源晚到數據異常數據？修訂任務FLINKFLINK正常數據正常修訂數據？修訂任務？補數修復任務目標表UpsertKafkaFLINKDim Update TopicTransactionTopicDimHive TableDim Upsert TopicEnrichedTransWindow Sum1Window Sum2Window Sum3FlinkSQ

3、L 1FlinkSQL 2FlinkSQL 3FlinkSQL 4FlinkSQL 5FlinkSQL 6Batch Source 實時分析/事件驅動為什么需要血緣管理和檢索無法追蹤Source/Sink的上游或下游全景鏈路什么是 Apache Atlas#2#2Apache Atlas 核心功能#1 元數據檢索Atlas 提供了對元數據進行了全量的收集，并支持多種元數據查詢或檢索方式Apache Atlas 核心功能#2 元數據標簽Atlas 提供了對元數據進行打標簽的功能，并且可以通過標簽進行反向查找反向查找Apache Atlas 核心功能#3 血緣管理Atlas 提供了對納管的數據資產

4、進行交互式血緣分析交互式血緣分析和管理的能力Apache Atlas 技術架構#1 元數據捕獲Atlas 通過插件（Hook）的方式在服務段注入捕獲代碼，并將元數據提交至KafkaApache Atlas 技術架構#2 元數據寫入Atlas服務從Kafka中消費元數據信息，并將元數據寫入到JanusGraph(on HBase)和 Solr兩個系統Apache Atlas 技術架構#3 元數據查詢Atlas 通過其他應用通過RestAPI方式向其他第三方服務提供元數據查詢和檢索的服務對接技術實現及未來#3#3如何將兩個系統打通ATLAS-3812-Add Apache Flink entity

5、 definitionFLINK-6757-Collect flink application metadata with Atlas 如何將兩個系統打通1.在Atlas中定義Flink的相關類型2.在Flink中定義相關的Hook3.抓取Flink Connector的元數據1.在Atlas中定義Flink的相關類型Category:TypeCategorycreateTime:numbercreatedBy:stringdateFormatter:DateFormatDescription:string.subTypes:array of stringsuperTypes:array of

6、 stringcategory:TypeCategorycreateTime:numbercreatedBy:stringdateFormatter:DateFormatdescription:stringguid:stringname:stringclassificationDefsenumDefscategory:TypeCategorycreateTime:numbercreatedBy:stringdateFormatter:DateFormatdescription:stringguid:stringname:stringoptions:map of string.structDef

7、sName：flink_applicationsuperTypes:ProcessserviceType:flinktypeVersion:1.0“name:id,typeName:string,cardinality:SINGLE,isIndexable:true,isOptional:false,isUnique:trueentityDefsendDef1:AtlasRelationshipEndDeendDef2:AtlasRelationshipEndDefpropagateTags:PropagateTagrelationshipLabel:stringrelationshipDef

8、sattributeDefs2.在Flink中定義相關的Hook修改ClusterClientJobClientAdapter修改AbstractJobClusterExecutor修改AbstractSessionClusterExecutor修改LocalExecutor修改FlinkKafkaConsumerBase修改FlinkKafkaConsumer修改FlinkKafkaProducerExpose Kafka connector propertiesExpose Pipeline Class for Executor新建 JobListenerFactory修改StreamEx

9、ecutionEnvironmentMake JobListeners configurable in through flink conf修改StreamingFileSink修改ContinuousFileMonitoringFunctionExpose File source and sink properties3.抓取Flink Connector的元數據List sources=streamGraph.getSourceIDs().stream().map(streamGraph:getStreamNode).collect(Collectors.toList();Get Sour

10、ce List sinks=streamGraph.getSinkIDs().stream().map(streamGraph:getStreamNode).collect(Collectors.toList();Get Sink 最終的效果#1 單個Flink任務單任務的上下游全景鏈路最終的效果#2 多個Flink任務多任務血緣關系和全景鏈路傳輸鏈路的安全控制FlinkAtlasHook的數據會發送至ATLAS_HOOK 的Topic，這個Topic需要1.1 啟用Kerberos1.2 TLS1.3 Apache Ranger授權當前實現的不足之處和后續改進1.Hook段代碼獲取元數據的侵入性太大2.支持的Flink Source/Sink 不完整

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后，可能會被瀏覽器默認打開，此種情況可以點擊瀏覽器菜單，保存網頁到桌面，就可以正常下載了。
3、本站不支持迅雷下載，請使用電腦自帶的IE瀏覽器，或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮，下載后原文更清晰。

本文（劉巖- Apache Atlas遇上Apache Flink.pdf）為本站（云閑）主動上傳，三個皮匠報告文庫僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對上載內容本身不做任何修改或編輯。若此文所含內容侵犯了您的版權或隱私，請立即通知三個皮匠報告文庫（點擊聯系客服），我們立即給予刪除！

溫馨提示：如果因為網速或其他原因下載失敗請重新下載，重復下載不扣分。

相關報告

聯系我們

0731-84720580
sgpjbg002
工作日 9:30 - 18:00

關于我們

侵權處理

關于我們

出版物經營許可證
工信部備案號：湘ICP備17000430號-2
公安備案號：湘公網安備43010402001071號

三個皮匠報告專業的行業報告下載站，每日更新，歡迎大家關注！

copyright@2008-2013 長沙景略智創信息技術有限公司版權所有
網站備案/許可證號：湘B2-20190120

客服

小程序

服務號

折疊

午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站