前边
科技的发展总是超乎我们的想象,总是给我们惊喜。如果可以的话,将这些惊喜和改变记录下来,也会是一笔财富。接下来,我想通过讲述我观察到的微软,谷歌,evernote(印象笔记)在图像识别领域中的发展,来做这样一件事情。
微软
今年五月份,微软推出了 http://how-old.net/ 这个网站,这个网站的一大特点是只要上传一张带有头像的相片,网站系统就可以给出一个该人的年龄和性别,并将之标记出来。比如:
这样的一个网站凭借着它本身的趣味性,很快地在社交网络上走红。走红的过程也大体是facebook,twitter,instagram等国外应用到微博,微信朋友圈等国内应用。由于我至今保持着比较频繁地刷推特的习惯,所以我算是比较早接触到这个网站的用户,坦白讲,它的确给了我一些惊喜,在上传了几张图片进行测试之后,可以发现,大体上差异并不会太大,还算比较准确。这让我觉得很神奇,当然由于那几天这网站的火红,也出现了一些恶搞,总之是热闹非凡。如果说它大体准确的话,我们其实甚至能够用纯计算机的方式来判断一个人的衰老程度,就像是将林志玲,赵雅芝现在的照片贴上去一定会得出一个较实际年龄更小的数值。当然,这一切,前提自然是在光线,亮度等基本适度的情况下。
谷歌
谷歌在它15年的I/0上发布了最新版本的google photos,这个app可以在web端以及android,ios平台上使用。最值得一提的功能是,它将搜索这个谷歌最擅长的领域,应用到了图像的领域。在不进行搜索的情况下,google photos中会默认给出一些标签,如下图所示:
就像我前面所说,google photos真正强大之处在于它的搜索功能。搜索的关键词,并不限于上面给出的那些标签。举例来说,前几天,我写了列出小事 这篇小文,在其中我想要配一张图片,我很快想到了可以直接配自己曾经用手机拍过的图片。如果按照以往的情况,这个时候,就需要不停地翻手机上的云相册了。但是,现在,我只需要在google photos 上面搜索train
找到了第一拍第二张图比较符合我自己的要求,于是就将之下载下来,又上传到图床上面。(如果谷歌能够在大陆正常使用,我甚至只需要将该图片公开分享,获取图片地址。)
这个app突然让我意识到一个问题:过去,我们经常在说,如果能够使用文字就尽量使用文字。因为文字的可见索性强。一个很明显的例子是说,微博的长微博图片被很多人嗤之以鼻,其原因就在于储存在图片上的信息不能够通过搜索引擎检索出来,信息也因此不能得到更好地传播和利用。但是,这一次,我对此观点持怀疑态度了。
Evernote(印象笔记)
我最早使用的云笔记服务是网易云笔记,后来换成了印象笔记(Evernote的国内版本),之前也只是简单地记录,最近半年开始通过IFTTT将博客的RSS输出到印象笔记,开始将Kindle的剪贴导入印象笔记,开始在用kindle读书时边看书边记在印象笔记上记笔记或者将该页面拍照,这样时间久了,偶尔使用印象笔记的搜索功能,比如搜索一个关键词「文化」,令我颇感意外的是,在我的笔记中,竟然搜索到了含有「文化」这个词的图片。这样,我同样可以实现强大的检索!
我始终都觉得,搜索是一个很好的功能,尤其是对于像我这种不善于分类,不善于使用标签的人来说。当我们在使用搜索的时候,以往我们认为只有文字才能实现搜索,现在,这样的观点需要改变了!
结语
当然,我此文中所列的几项服务,是我真心感到‘Amazing’的服务。几年前,我也看到过QQ空间上的头像识别,给头像标记姓名的功能,去年我也看到了Google推出的Google Translate 拍照翻译的功能,这两项功能因为对于我个人而言没有使用场景,而没有兴趣,但却不能不坦诚说它们正在改变着我们的生活。
所以,现在问题来了,图像识别到底可以有多强大?