基于出租车上下客数据流与分布式多阶段网格聚类的城市热点区域实时探测方法 |
| |
引用本文: | 王浩成,向隆刚,关雪峰,张叶廷.基于出租车上下客数据流与分布式多阶段网格聚类的城市热点区域实时探测方法[J].地球信息科学,2023(7):1514-1530. |
| |
作者姓名: | 王浩成 向隆刚 关雪峰 张叶廷 |
| |
作者单位: | 武汉大学测绘遥感信息工程国家重点实验室 |
| |
摘 要: | 城市热点区域的实时探测能够提高管理者对突发事件的响应能力。随着物联网、通信技术的发展,出租车运单的起讫信息实时上传至数据中心,形成了持续的上下客数据流。考虑到出租车具有全天候运营、全区域覆盖、数据时空分辨率高等特点,其上下客数据流可作为城市热点区域实时探测的有效信息源。目前,面向静态上下客数据集的热点区域探测方法不支持流式数据的处理,难以直接应用于实时的热点区域探测,而现有流式聚类算法难以同时满足低聚合成本、任意形状类簇识别、灵活扩展性等要求。面对以上挑战,本文基于分布式流计算技术,设计了适用于出租车上下客数据流的城市热点区域探测算法,基本思想为将上下客数据流映射至网格状监控单元,并以时间窗口为单位统计各监控单元热度,在此基础上进行热点单元的分布式识别,最终将热点单元汇聚为热点区域。为了避免分布式算法中聚合算子的性能瓶颈,本文进一步设计了由冗余分区、链接识别、修正规则构建、区域ID修正、区域生成等步骤组成的多阶段分布式区域合并算法。最后,本文基于分布式流计算框架Flink实现了上述算法,并使用武汉市出租车数据集、纽约市出租车上下客数据集模拟数据流开展实验,结果表明本算法可以高效挖掘城市...
|
关 键 词: | 出租车上下客 数据流 热点区域探测 分布式计算 网格聚类 实时 武汉市 纽约市 |
|
| 点击此处可从《地球信息科学》浏览原始摘要信息 |
| 点击此处可从《地球信息科学》下载免费的PDF全文 |
|