Apache Flink:Stream and Batch Processing in a Single Engine
论文主要内容: 这篇论文主要介绍了Apache Flink,一个开源系统,用于处理流数据和批量数据。主要内容包括: Flink的软件架构由四层组成:部署层、核心层、API层和库层。核心层是一个分布式数据流引擎,执行数据流程序。API层包括批处理API DataSet和流处理API DataStream。库层包括机器学习库FlinkML、图处理库Gelly等。 Flink将流处理作为统一的数据处理模