昨天,我被《暮光之城》女主角克里斯汀-斯图尔特发布AI论文的新闻炸懵了!国内外媒体纷纷对克里斯汀的学霸行为表达了各种形式的膜拜。暮光女真有那么学霸?还是只是炒作?我这就来一探究竟,同时简单解读下这个事件中的涉及的理论和技术。
这篇论文于美国时间2017年1月19日发表在了学术网站ArXiv上,论文题是《如何在电影“Come Swim”中用神经风格迁移(Neural Style Transfer)技术将电影画面改造成印象派风格》。论文的主要内容呢,顾名思义。另外,克里斯汀只是论文创作者之一,共同创作者还有电影《Come Swim》制片人Starlight Studios和Adobe的一名员工 Bhautik J Joshi。没错,就是那个发明Photoshop的Adobe,近几年Adobe在用人工智能处理图片方面有不小的进展。
什么原理?
就好比你是一位绘画大师,有一天收了个天分不错的徒弟(人工神经网络),于是想把他培养成一个能集各家所长的新派画家,于是找来了印象派的莫奈的画、立体派的毕加索的画、野兽派的马蒂斯的画,并教徒弟学会这些大师在线条、色彩使用上的特点,以及如何画出这样的画,让他形成自己的融合性的绘画手法,从此以后,把任何画交给他,他都能用自己的风格改造这些画。比如这样:
回过头来看,我们就知道克里斯汀电影里面的画面是怎么改造出来的了--下图第三张,是将第二张图印象派的画风迁移融合至第一张现实的图片场景中的结果。
那么这个原理和技术是克里斯汀团队提出或是克里斯汀团队对它们进行了改进、演绎吗?当然不是,克里斯汀团队只是把神经风格迁移技术应用在了电影上。仅仅是看最近,神经网络和计算机视觉领域的大牛李飞飞所带领的团队在2016年就开源了快速神经网络风格迁移代码,而2015年风靡美国人朋友圈的谷歌应用Deepdream算是该类项目娱乐化推广的典范。
虽然克里斯汀团队改造的是电影,听起来和之前李飞飞、Deepdream等所改造的图片存在区别,但细读克里斯汀团队的论文会发现,其实两者根本没有差别。克里斯汀团队对电影的处理是通过对每一帧(电影胶片上的每一格镜头)的画面的处理来实现的,所以还是处理图片。
而且克里斯汀团队给出的数据显示,每帧处理需要40分钟的运算时长。这个效率并不算高。要知道,风靡一时的人工智能修图软件 Prisma,处理每张照片时间只有 20 秒,整个过程包含从用户上传照片,到 Prisma的服务器,再经过算法处理,最后返回至用户手里。而且在2016年10月时,Prisma就已经能够将艺术风格化迁移至 15 秒的短视频。
鉴定完毕!暮光女真的没有你们想象的那么牛。但值得肯定的是,正是像暮光女这种,喜欢在旧事物上尝试新技术,极尽所能让电影画面还原作品想要表达的意境的人推动了电影的发展。