流数据(Streaming Data)是指以连续、实时、动态的方式生成和传输的数据流。这类数据通常具有高速度、无界性(理论上无限持续)和时序性的特点,广泛应用于实时分析、监控、物联网、金融交易等场景。
流数据的核心特点
- 实时性
- 数据持续生成并需要即时处理(如传感器数据、社交媒体动态、交易记录)。
-
处理延迟通常在毫秒到秒级。
-
无界性
-
数据流理论上没有终点,需按时间窗口或事件触发处理(如每分钟统计点击量)。
-
高吞吐量
-
数据生成速率快(如IoT设备每秒上万条数据),要求系统具备高并发处理能力。
-
时序性
- 数据按时间顺序到达,处理时需考虑事件时间(Eve...