Research_新闻在注意力场中的逃逸



图1. 延时摄影获得的森林中的萤火虫图像。

新闻的传播过程,是科学界与工业界都关注的重要问题。传统研究多关注新闻在社交网络上的传递。但是以人为节点,以人们彼此间的交互为连边的社交网络,是很容易变化的。在这个不断变化的背景上研究新闻的复制和扩散,显然不是一个非常聪明的策略。

从物理学的经典思路出发,一般来说我们希望研究对象在一个相对稳定的空间里运动,然后我们试图刻画其运动的规律性。所以,要研究新闻的传播,我们需要假设:

  1. 有一个相对固定的背景空间;
  2. 有许多新闻,这些新闻在这个背景空间里不断运动,但所有新闻遵相同的运动方程;

那么,怎么在实际新闻系统中搜集和分析满足这两个条件的数据呢?图1关于运动中的萤火虫的照片给了我们一个启发:我们可以通过拍“快照”的方式追踪一个有多个新闻的系统。具体来说,就是给每个新闻做个标记,记录其在一个空间里的位置和时间,观察其位置如何随时间变化,再把所有的新闻运动轨迹合并到一起求出普适方程。

作为背景空间的注意力场

为了得到这个不可见的背景空间,我们把新闻作为探测器(snesor),以推测背景空间的结构。

首先,我们以新闻为节点,以用户在新闻之间的跳转为连边构造注意力流网络。与普通的带权有向网络不同,我们添加了两个人工节点,源和汇,来平衡所有其他节点上的注意力流的进出关系。源的出流和汇的入流等于全网流的总输入或者总耗散。在这个网络上做统计,我们可以研究其嵌入的背景空间结构。

图2. 一个注意力流网络的示意图。

在这个网络上,我们可以计算从源到所有节点i的流距离Li。其物理意义是,一个用户从源出发随机游走,平均抵达i所需步数。这个Li虽然是从离散的网络上统计得到,我们却将之视为一个连续空间上的统计,把网络看作是对背景空间的抽样观测。

接下来让我们看看位于背景空间不同位置上的新闻sensor的年龄,点击量,和新闻类型,看看是否能发现什么规律。

图3. 根据2009年6月10日Digg社区注意力流动构造的信息空间。节点是新闻,连边是用户在新闻之间的移动,连边越粗流量越大。根节点是源,代表外部世界的注意力总输入。我们比较了两种基于RT算法的树结构展示方式(上行以流距离为纵轴,下行以流距离为半径)和两类新闻属性的上色方式(左列颜色代表年龄,右列颜色代表类别)。

从图3可以看出,背景空间与新闻的年龄有着密切关系,而与新闻的类别没有太多关系。我们发现,年龄比较大的新闻在外围,年龄比较小的新闻在圆心。接下来,让我们看一下在不同时间拍的“快照”,以观察新闻的运动情况。

图4. 注意力网络在一个月内随时间变化。2009-06-10图对应图3,上色仍然依据年龄,但与图3略有不同。

图4向我们展示了一个清晰的物理图景:

随着时间过去,新的新闻不断从靠近源的地方“生长”出来,把所有旧新闻往外推。而由于注意力场的覆盖范围和密度不随时间变化,因此造成了随时间过去单个新闻获得注意力先增后减的固定兴衰周期。

图5. 以地球重力场来类比注意力场,一颗试图逃逸的卫星在不同位置上受到的重力不同。新闻在“逃逸”离开注意力源的过程中,受到的点击也不断变化,但都遵循由场强给定的普适规律。

新闻的逃逸和注意力衰减速度

接下来的任务就是精确描述新闻在逃逸过程中的动力学,这个动力学,就像重力本身一样,其实也是一个几何背景结构的后果。

我们追踪数据集中三千多个新闻的三个变量随时间的变化:年龄,位置(距离源的距离),点击量。具体操作方法是,我们对数据集中的36天数据,每天构造一个当日点击流网络,记录上述三个统计指标,而后添加到每个新闻的时间序列里去。

这个过程,就像是给新闻在注意力场中的逃逸过程拍一系列的“快照”,然后从快照中推测新闻动力学方程,进而得到注意力的场方程。

新闻的逃逸速度
图5. 新闻流距离与年龄的关系。绿点数据点是在相同的天上合并L的结果,也是实际拟合中使用的数据。

我们发现,新闻的逃逸分为三个阶段:

1.快速逃逸:在被用户分享的当天(t=0),新闻流距离就到了4;第二天(t=1),新闻的流距离就到了8,第三天(t=2)流距离上升到11;

2.缓慢逃逸:比起第一个阶段,这个阶段新闻与源的距离基本不动,在三十天内缓慢从11增加到15;

3.超速逃逸:等到新闻的年龄接近一个月后,流距离突然猛涨至接近无穷大

新闻年龄和流距离的关系可以用Gompertz函数拟合:

![Eq. 1][1]
[1]: http://latex.codecogs.com/svg.latex?t=t_{max}G(L)=t_{max}e{-{\alpha_1}e{-{\beta_1}L}}

其中

![Eq. 2][2]
[2]: http://latex.codecogs.com/svg.latex?{\alpha_1}=67,,,,{\beta_1}=0.33,,,,t_{max}=33

拟合曲线如图5中红线所示。

注意力的流量场密度

前一节的分析告诉我们,每个新闻随时间过去,在新一天的网络里出现时(如果出现的话),流距离基本都在不断增加。又因为我们知道,用户集体注意力以源为圆心,有一个覆盖范围,用户不会去点击太“远”的新闻。因此,我们就可以

把新闻随年龄增加获得点击量的下降看做是其在注意力场中不断运动,远离源头的自然后果。

那么,接下来的任务就是把这个场的密度勾勒出来。我们这里假设这个场的密度是不随时间变化的。

图6. 流距离与点击量之间的关系

我们对于每一个新闻,把它在移动中不同位置上获得的点击量除以其“一生”获得的总点击量进行归一化,然后再用它作为sensor,观察点击和流距离的关系,如图6绿色直方图所示。我们发现,随着流距离的增加,新闻获得的点击先上升后下降,在流距离约等于5处,点击量达到峰值。

在拟合流距离与点击量的关系时,我们使用Gompertz函数的一阶微分形式。为提高拟合精度,我们先拟合所有新闻总点击量在流距离上的累积数据(图6粉红色曲线),然后再给出Gompertz函数对自变量的一阶微分(图6蓝色曲线),用以描述Ct与Lt的实证关系(图6绿色直方图)。

得到点击量C和流距离L之间关系如下:

![Eq. 3][3]
[3]: http://latex.codecogs.com/svg.latex?\frac{C}{C_{sum}}=\alpha_2{\beta_2}\frac{G(L)}{e^{\beta_2{L}}}

其中

![Eq. 4][4]
[4]: http://latex.codecogs.com/svg.latex?{\alpha_2}=10.34,,,,{\beta_2}=0.42

需要注意的是,这里的C_sum与之前的t_max不同。t_max是对所有新闻都一样的,即33天。C_sum是每个新闻自己获得的总点击量,不同新闻之间是不一样的。

新闻随年龄增加获得的点击变化

我们前面既然知道了新闻的漂移速度,又知道了用户注意力的场密度,就应该可以推测出在漂移过程中新闻获得注意力的变化。我们根据Eq.1与Eq.3预测新闻的年龄与点击存在如下关系

![Eq. 5][5]
[5]: http://latex.codecogs.com/svg.latex?C'=\beta_2k[ln(\frac{1}{t'})]be{-k[ln(\frac{1}{t'})]^b}
其中

![Eq. 6][6]
[6]: http://latex.codecogs.com/svg.latex?t'=\frac{t}{t_{max}},,,,C'=\frac{C}{C_{sum}},,,,b=\frac{\beta_2}{\beta_1},,,,k=\frac{\alpha_2}{\alpha_1^{\frac{\beta_2}{\beta_1}}}

2009-09-28注:

本论文已经在Scientific Reports上发表,点击下列网址阅读:

The Collective Direction of Attention Diffusion

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容

  • 废弃的手稿--供存档用 目录 前言 所有世界中最可能的世界 可以储存知识的人造小宇宙 词与物 我想和这个世界谈谈 ...
    计算士阅读 747评论 4 3
  • 前言 梯度下降算法现在变的越来越流行,但是对于使用者来说,它的优化过程变的越来越黑盒。本文我们介绍下不通梯度下降算...
    wendaJ阅读 1,522评论 0 1
  • JSong @2016.06.13 本系列文章不适合入门,是作者综合各方资源和个人理解而得. 另外最好有数学基础,...
    JSong1122阅读 1,596评论 0 3
  • 声明!!!! 此文章的代码部分在简书中皆不能正常显示, 请去我的个人网站观看效果, 如果访问不了, 请翻墙试试! ...
    kagenZhao阅读 2,531评论 0 0
  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 5,050评论 1 3