《2020Flink峰會報告:5、付典 - PyFlink 核心技術剖析及應用-ZH.pdf》由會員分享,可在線閱讀,更多相關《2020Flink峰會報告:5、付典 - PyFlink 核心技術剖析及應用-ZH.pdf(42頁珍藏版)》請在三個皮匠報告上搜索。
1、PyFlink 核心技術剖析及應用 付典阿里巴巴阿里巴巴 ApacheApache FlinkFlink PMCPMC | | 阿里巴巴技術專家阿里巴巴技術專家 PyFlinkPyFlink 核心技術核心技術 #2 PyFlinkPyFlink 簡介簡介 #1 PyFlinkPyFlink 應用場景應用場景 #3 PyFlinkPyFlink 未來規劃未來規劃 #4 AboutAbout Me Me Flink CEP PyFlink Flink Committer Hadoop, HDFS, Hadoop Security, Sqoop Sqoop Committer Apache Comm
2、ons Committer Flink SQL 2017.52017.102019.42020.12013.62016.12016.3 2020.8 Flink PMC PyFlinkPyFlink 簡介簡介#1 PyFlinkPyFlink 項目的目標項目的目標 Why Why FlinkFlink https:/blogs.apache.org/foundati on/entry/apache-in-2019-by-the 純流架構的流批統一 的計算引擎 2019年度Apache最 活躍的開源項目之一 經歷了大量的大數據生 產環境的歷練 Why PythonWhy Python https
3、:/ 使命愿景 Flink能力輸出給Python用戶 Python生態功能分布式化 Python生態 分布化 Flink能力 Python化 PyFlinkPyFlink 項目的目標項目的目標 PyFlinkPyFlink 項目的發展歷程項目的發展歷程 PythonTableAPI JavaUDF Flink 1.9 PythonUDF Python依賴管理 Flink 1.10 向量化Python UDF Python UDTF UDF metrics支持 Python ML pipeline API Cython優化支持 純SQL 作業以及Java Table API作業中 使用Python UDF Flink 1.11 2019-4 啟動 2020-22020-7 向量化UDAF 及普通Python UDAF支持 Python DataStream API Expression DS