JUST技术:当我停留时我在干什么

       随着定位技术的不断普及,嵌入在手机和PDA设备内的GPS、北斗等位置传感器周期性地记录移动对象的位置,从而产生了海量的轨迹数据。用户为分享行程可能主动记录自己的轨迹,物流派送车、出租车、共享私家车等由于运营监管的需要可能被动地记录轨迹位置信息。

这些轨迹数据背后的想象空间极大。利用轨迹数据,我们可以用来估计全城的车流量、通行时间、补全现有地图等等。而为实现这些应用,我们通常会对轨迹数据进行预处理,剔除掉一些时间连续且空间上非常临近的点(下文简称驻留点),因为驻留点会影响上述应用的精确度。

然而,这些被丢掉的驻留点也隐含了丰富的信息。利用检测得到的驻留点,如图1所示,我们可以进行事件分析、地点发现、序列挖掘等等。本文,我们将带大家探索驻留点背后的故事,以及介绍一些经典的驻留点检测算法。

图1 轨迹驻留点的检测及应用


一、 驻留点应用

1.事件分析

移动对象往往会因为某些事件而停留,比如车辆会因为加油而停留、快递员因为配送而停留等等。通过分析移动对象在特定POI(兴趣点)驻留的时长和时间,我们可以分析POI的特性,助力决策。

在[1-2]中,作者将出租车轨迹中的驻留点(图2)与加油站POI进行关联,利用提出的方法,能够估计每个加油站每个时间片的平均加油等待时间,用于推荐加油地点,以及推测每个加油站每个时间片的访问车辆数,从而推测出全城实时的油耗。

图2 汽车加油事件 [1-2].

在[3]中,作者将配送员轨迹中的驻留点与客户的妥投地点做关联(图3),利用提出的方法能够自动推测出每个运单的妥投时间。该种方法不仅减轻了配送员的负担,而且结果比手工记录更为可靠。准确的妥投时间能够用于挖掘用户可收货的时间窗口,提高妥投成功率等等。

图3 配送员轨迹数据及运单收货地址 [3].

2. 地点发现

驻留点在空间上反映为一个GPS点密度较高的区域,这些区域可能是一些POI数据库中没有记录的但是又非常有意义的地点。我们可以通过DBSCAN、OPTICS等聚类算法对检测得到的驻留点进行聚类,生成一系列地点,再通过其与多源数据关联,筛选得到真正感兴趣的地点。

在[4-5]中,作者基于行人的出行轨迹数据,发现了城市内一些兴趣地点(图4),可以推荐给外地游客游玩。

图4 兴趣地点 [4-5].

在[6-7]中,作者从出租车轨迹中检测得到驻留点,将其聚类后得到一系列可以停车接客的地点。这些地点后续可被推荐给空车司机,让其前往接客,也可以推荐给用户,使其更容易打到车。

在[8]中,数据挖掘人员基于危化品运输车辆轨迹中的驻留地点以及周围路网、POI特征,寻找异常地点,工作人员到现场核查发现多起非法生产、存储等现象。

在[9]中,数据挖掘人员基于货车轨迹中的驻留点及卫星图像等信息,发现未记录在案的仓库。这些本地仓库通常由当地人搭建用于临时存储货物。知晓这些仓库的存在,对于后续物流地产的选址,具有指导意义。 

3.序列挖掘

通过分析驻留点与驻留点之间的转移关系,我们可以得到移动对象的位置访问序列。通过累计历史上的访问序列数据,我们可以得到一系列频繁序列。这些序列隐藏着人们关于出行的知识。

在[10]中,作者挖掘了个人的序列生活模式,用于做好友推荐。

在[4-5]中,作者通过挖掘行人的驻留点访问序列,得到了一个指定地理范围内多条典型的出行序列,使我们对周围环境有了更好的了解。这些访问序列还能够赋能出行推荐。

图5. 经典访问序列 [4-5]

二、 常用驻留点检测算法

通过了解上面这些应用,我们知道驻留点是轨迹中的一类重要知识,但是从轨迹中检测出驻留点其实并不困难。在对轨迹进行初步的去噪后,我们就可以进行驻留点检测了。下面我们将介绍一种简单易实现的驻留点检测算法[11]。这种驻留点检测算法首先检查一个锚点以及它后继轨迹点的距离是否大于一个给定的距离阈值以图6为例,当前的锚点是p3,p4到p6是在Dmax以内的后续轨迹点。然后,检测算法计算锚点p2到Dmax以内最后一个后继轨迹点p6之间的时间跨度。如果时间跨度大于一个指定的时间阈值Tmin,我们即检测得到一个驻留点(p3到p6),然后锚点移动到当前驻留点后的下一个点,即p7。否则,锚点向前移动一步p4。这个过程不断重复,直到锚点移动到轨迹序列末尾,我们即检测得到整条轨迹中的所有驻留点。

图6 驻留点检测示意图

目前,这种简单有效的驻留点检测算法已经集成在京东时空数据引擎JUST [12]中,封装成DAL的形式,用户只需要编写简单类SQL语句,如图7所示,就可以从轨迹数据集中方便高效地检测得到驻留点。

图7. 驻留点检测类SQL语句

    在一些研究[1-3][6-7]中,为了保证检测结果(加油事件、停车等客事件、妥投事件)的质量,基于监督学习的模型可以被进一步使用在检测得到的驻留点上。通过提取驻留点中的一些特征,可以过滤得到只属于某一类特定事件的驻留点,让后续分析变得更为准确。

三、 总结

以上就是本次驻留点应用及经典算法的分享。通过本文,我们了解了驻留点的一些重要应用。通过其与路网、POI、卫星图像等的关联分析,我们可以发现很多有趣的知识。未来,JUST将集成更多关联筛选的功能,快速从数据中得到洞察。


参考文献:

[1] Zhang, Fuzheng, et al. "Sensing the pulse of urban refueling behavior." Proceedings of the 2013 ACM international joint conference on Pervasive and ubiquitous computing. 2013.

[2] Zhang, Fuzheng, et al. "Sensing the pulse of urban refueling behavior: A perspective from taxi mobility." ACM Transactions on Intelligent Systems and Technology (TIST) 6.3 (2015): 1-23.

[3] Ruan, Sijie, et al. "Doing in One Go: Delivery Time Inference Based on Couriers' Trajectories." Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020.

[4] Zheng, Yu, et al. "Mining interesting locations and travel sequences from GPS trajectories." Proceedings of the 18th international conference on World wide web. 2009.

[5] Zheng, Yu, and Xing Xie. "Learning travel recommendations from user-generated GPS traces." ACM Transactions on Intelligent Systems and Technology (TIST) 2.1 (2011): 1-29.

[6] Yuan, Jing, et al. "Where to find my next passenger." Proceedings of the 13th international conference on Ubiquitous computing. 2011.

[7] Yuan, Jing, et al. "T-finder: A recommender system for finding passengers and vacant taxis." IEEE Transactions on knowledge and data engineering 25.10 (2012): 2390-2403.

[8] “京东城市”微信公众号. “一屏联动64个部门,京东城市助力南通建成全国首个市域治理现代化指挥中心”, 2020.

[9] 麻志鹏,等. “查找仓库的方法和装置” 中国专利(已授权), 2019.

[10] Ye, Yang, et al. "Mining individual life pattern based on location history." 2009 tenth international conference on mobile data management: Systems, services and middleware. IEEE, 2009.

[11] Zheng, Yu. "Trajectory data mining: an overview." ACM Transactions on Intelligent Systems and Technology (TIST) 6.3 (2015): 1-41.

[12] https://just.urban-computing.cn/

相关文章:

JUST技术:分布式时序相似查询初探

JUST技术:基于深度学习Seq2Seq框架的技术总结

JUST技术:JUST高效时空索引揭秘及使用指南

JUST技术:基于轨迹数据的人口流向分析技术

JUST技术:基于轨迹的新冠易感人群查询方案

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容