城市人群的移动与交互

“从物理学角度看,生命这种物质运动形式,与其他的物质运动相比并没有更高的含义,从生命中你找不到新的物理规律,所以从我的角度看,一个人的死与一块冰的消融并没有本质的区别。”


刘慈欣《地球往事》

目录

  1. 前言
  2. 局域移动
  3. 聚集倾向
  4. 交通效率
  5. 跨区流动
  6. 相互影响

1. 前言

通过与某运营商合作,我们获得了北京十万用户的三十天内的移动和上网记录数据。下文对一天内的数据做若干简单分析。可以做的事情有很多,有待更多人加入研究团队,一起把这个线发展成长期研究的方向。

2. 局域移动

每个点是一个基站,信息流量越大的基站颜色越红
每个点是一个基站,信息流量越大的基站颜色越红

数据中一共有一万多基站。显然,基站更多地会被安放在人口密度较大的地区。因此从基站的分布也能看出北京人口的聚集情况。

根据用户移动对基站进行聚类
根据用户移动对基站进行聚类

人口的聚集不仅仅是居住地的聚集。大多数的日常移动轨迹都在一个小范围内[1]。以基站为节点,以用户流动为链边构建网络,对这个网络的最大联通集团进行k clique communities聚类[2]可以得到两百多个小的社区,其中最大的10个社区如图所示。聚集得到的社区反映了北京居民日常移动的局域性。

3. 聚集倾向

基站流距离的分布及其与流量的关系
基站流距离的分布及其与流量的关系

我们将从“源”到基站的平均加权步长称为“流长度”,使用这个指标来刻画移动网络。我们发现除了一大批流长度为1的基站外,流距离基本上呈正态分布。同时基站的流距离与流量正相关(Pearson r = 0.23, p-value < 0.01),说明人群在聚集而不是耗散。从“源”到“汇”的“流长度”是5.7,意味着平均来说一天之内用户要经过六个基站。

基站流距离
基站流距离

从上图中也能看出用户从四面八方聚集到城中心。

4. 交通效率

北京最大的四个交通障碍区:军博,奥体中心,亦庄,北理工
北京最大的四个交通障碍区:军博,奥体中心,亦庄,北理工

除了流长度外,我们也可以在移动网络上计算任意一对节点之间的流距离。而后我们对于每一个节点i,只保留outbound流距离最大的节点j,这样我们就构建了一个最大生成树。这个树中入度比较高的点就是当地交通最有待改善的点:大量用户从不同的地方来到这里,但却又需要经过多次换乘。类似的方法还可用于分析交通最有效率的地区。

基站流距离与实际地理距离的关系
基站流距离与实际地理距离的关系

我们发现,基站之间流距离与地理距离正相关(Pearson r = 0.02, p-value < 0.01)。如果交通网络是一个球面上均匀分布的二维网格,那么流距离与地理距离之间应该是系数为1的线性关系。因此实际交通系统是一个比均匀分布的交通系统更高效的系统。然而即使对于这样一个高效系统,如上文分析,仍然有许多改善的余地。

5. 跨区流动

移动速度
移动速度
移动速度及在信息传递中的位置
移动速度及在信息传递中的位置

我们发现,用户的移动速度是对数正态分布。大多数人移动比较慢,少数人移动较快。人与人之间的移动速度差别是几何级的。从地图上可以看出,区域之间的移动比较快,区域内的移动比较慢。

6. 相互影响

移动速度及在信息传递中的位置
移动速度及在信息传递中的位置

通过用户的上网行为,我们可以构建用户网络。如果用户i和用户j先后上了同一个网站,我们计算i上传的信息流量和j下载的信息流量,将两者加总作为链边权重,视为用户之间的互动强度。在这个网络上,对用户计算流长度,可以看出用户在信息交流中是主动还是被动的,是影响别人还是被别人影响。

我们发现,用户的移动速度与在信息传递链中的位置负相关(Pearson r = -0.01, p-value = 0.02)。这可能是由于移动速度较快的用户社会经济地位较高,在社会交往中也更加主动。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,898评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,401评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,058评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,539评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,382评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,319评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,706评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,370评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,664评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,715评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,476评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,326评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,730评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,003评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,275评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,683评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,877评论 2 335

推荐阅读更多精彩内容

  • 社交红利阅读笔记 书名:社交红利(修订升级版) 作者:徐志斌 出版社:中信出版社 正文前笔记: 推荐序1摘要 社交...
    凫水阅读 8,864评论 4 26
  • 日常生活中,图片处理也称修图是每个人频繁遇到的事情。但在专业图片处理领域,Photoshop软件庞大的体积和复杂的...
    7点智库阅读 652评论 0 2
  • 一百年之后,我会在哪里?我早已化为一把灰烬,被埋藏在地下,或者安静地摆放在一个角落,或者早已化为泥土再也找不到。 ...
    风原山鹰阅读 439评论 3 3
  • 有目标才知道哪里是起点,改从哪里着手努力。 当然有时候我们需要走一些看起来是“弯路”的路,就像去筹...
    支小珠阅读 248评论 0 1