Flink 学习笔记(一)
一、基本介绍
Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。
- 有界流:批量数据 — 批量计算
- 无界流:流式数据 — 流计算
有状态:Flink 默认有状态,状态存在本地内存中,可以减少计算时间,通过 checkpoint可以存在外部存储引擎中
二、Flink 特点优势
特点:
- 高吞吐、低延时、高性能
- 支持事件时间概念
- 支持有状态计算
- 支持高度灵活的窗口计算
- Checkpoint 容错
与其他流式框架相比都有明显优势
- 本文作者: Kelly Liu
- 本文链接: http://tiantianliu2018.github.io/2020/03/24/Flink-学习笔记(一)/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!