排序方式: 共有1条查询结果,搜索用时 3 毫秒
1
1.
城市热点区域的实时探测能够提高管理者对突发事件的响应能力。随着物联网、通信技术的发展,出租车运单的起讫信息实时上传至数据中心,形成了持续的上下客数据流。考虑到出租车具有全天候运营、全区域覆盖、数据时空分辨率高等特点,其上下客数据流可作为城市热点区域实时探测的有效信息源。目前,面向静态上下客数据集的热点区域探测方法不支持流式数据的处理,难以直接应用于实时的热点区域探测,而现有流式聚类算法难以同时满足低聚合成本、任意形状类簇识别、灵活扩展性等要求。面对以上挑战,本文基于分布式流计算技术,设计了适用于出租车上下客数据流的城市热点区域探测算法,基本思想为将上下客数据流映射至网格状监控单元,并以时间窗口为单位统计各监控单元热度,在此基础上进行热点单元的分布式识别,最终将热点单元汇聚为热点区域。为了避免分布式算法中聚合算子的性能瓶颈,本文进一步设计了由冗余分区、链接识别、修正规则构建、区域ID修正、区域生成等步骤组成的多阶段分布式区域合并算法。最后,本文基于分布式流计算框架Flink实现了上述算法,并使用武汉市出租车数据集、纽约市出租车上下客数据集模拟数据流开展实验,结果表明本算法可以高效挖掘城市... 相似文献
1