第二章 垃圾识别术入门:如何找到 需要的信息及如何辨别信息真伪
YahooPipes
是RSS混合器,帮助合并和重组各种各样不同来源的数据。
好信息探测仪
集合了技术和人际交往的优势, 能够增强人的信息力。
WikiTrust
一个针对维基百科作者及加州大学圣克鲁斯分校所有信息的信誉评估系统。用户安装了WikiTrust插件之后,维基百科的页面就会以多种颜色显示,不同 的颜色代表文字的不同信誉度。比之那些从未被修订过的文本,经历过 一两次修订的文本信誉度要更高。同样的,如果经过某些作者的编辑之后,相关词条很长时间都没有重新修订的必要,那么这些作者的信誉度就会提升。(下图为例子)
Wiki-Watch
通过研究引用信息源的数量、作者的数量和剩余以及相关链接的数量来评估维基百科词条的可靠性。(下图为Wiki-Watch评级一篇维基百科文章。 橙色的文本段落由WikiTrust评为“不可信”。)
算法权威
一种认为自动的信息提取过程具有权 威性的看法,这种过程通常是从广泛的、不一定值得信任的信息源中获取信息。这个过程完全自动化,没有任何人支持信息提取的结果,也没 有任何人声称‘因为你相信我,所以你得相信这些信息。
Truthy
它能追踪 Twitter的谣言产生和传播的过程。Truthy能够探测到流言,并且用流行病学模型来追溯流言的模型, 它还提供了一个“Truthy按钮”,网民只要点击这个按钮,就能举报相关的网站。
维基现实
在维基百科上发布虚假消息,这样就能 用维基百科创造出虚假的真实。
Flickr
雅虎旗下图片分享网站。由加拿大Ludicorp公司所开发设计。
书摘
1.信息力的三个元素:注意力技能、有效的技术以及社会化互动。
2.使用这些工具,学生能够调试自己的注意力,迅速地找到最新、最可靠的信息流,不论他们感兴趣的话题是什么......还是其他跟特定行业有关的事件。这个过程的关键是“调试”和“信息流”。
3.RSS推送,订阅了某个网站RSS 的用户,将实时接收到网站的最新消息。Google Reader、Bloglines、 Netvibes以及苹果的邮件应用等RSS阅读器允许用户通过RSS订阅博客或 者其他信息。
4.在Netvibes阅读器中,我......有一个面板专为我不断变动的个人兴趣而设。在每个面板下,我都能便捷地为不同的主题创建页面。比如说, 我有一个关于数字化新闻的Netvibes的面板,这个面板包含新工具、新方法......等不同的页面。我可以将这些页面拖动到不同的位置上,让它们以适合我注意力习惯的方式呈现出 来。
5.互联网出现之前的信息发布模式是“先筛选后发布”, 编辑和出版商会先审核文本,然后再发布合格的信息;而如今,“先发 布后筛选”大行其道。
6.谷歌的 PageRank算法以用户观点的加权总和为基础生成网页排序,这种排序可能挺好,但不一定可靠。易趣、Digg和Facebook等虚拟社区出于不同的原因也会收集用户的看法。Digg是一个新闻网站,但用户......只是点击“Dig”和“Bury”按钮为网站上的新闻报道和视频投票。Digg社区非常庞大,一篇......的反馈可能让一个小型服务器崩溃。这种基于受欢迎程度的排名很容易受人操纵.
7.权威实际上有双重功能。求助于权威,一方面能够增加获 得正确信息的概率,另一方面能减少犯错的惩罚。权威的信息源不仅仅 是你所信任的信息源;它还是你和你的‘参照系’中的人共同信任的信 息源。
8.有了谷歌,你的参照系变成了所有在网页上引用链接的人;有了 Digg,Digg社区就是你的参照系。必须将垃圾识别的技能应用到对所谓 的权威性社区的评估上。同时,这些社区本身也提供了利用集体智慧判 断信息真伪的机会。垃圾识别和知识查找如今成为了社会化的活动。
9.让人们定制信息筛选器的信息力工具方兴未艾。DataSift.net每天 筛选7000万条推文,也就是每秒钟800条,它使用的是基于规则的筛选机制(比如,“在个人简介中不包含‘社会化媒体’字样并且拥有500 名以上粉丝的用户所发的推文中筛选出包含‘谷歌’字样的推文,或 者“从我个人的Twitter小组‘科技品牌’中筛选出被转发过100次以上 的推文。”)PARC则推出了实验性的信息推荐系 统“zerozero88”,它“使用户避免错过深埋在信息大山中的重要的信 息,从而解决信息过载的问题”.