数据新闻只是新闻报道中的一种形式,弥补传统新闻或叙事性新闻无法呈现的效果。数据新闻采用可视化的方法将单调的数据用一种直观、便于理解和更具说服力的方法呈献给读者。数据,特别是大量的数据比采访几十个对象获取的抽样信息做出的结论更客观、更容易阐明观点。从数据新闻制作的人才需求开始介绍,阐明技术要求和制作流程。
人才需求
数据新闻团队一般包含四种角色:记者和编辑、数据分析师、美术设计师和程序设计师。根据数据新闻项目工作量的大小,一个团队可能有2~3个人,也可能更多。很多时候一个人需要分饰两个或多个角色,如一个人既是数据分析师,也是程序设计师,或者一个记者,同时也是数据分析师。记者和编辑的主要工作是采访、写稿、编稿,以及整理相关资源,如与新闻相关的背景资料、图片、视频、音频和文字等。数据分析师的主要工作是收集和分析数据。
美术设计师的主要工作是设计图案,包括手绘图案、3D制作、图片设计和排版等。使用的主要工具是Photoshop和Illustrator等。程序设计师的主要工作是编写代码,实现数据获取和分析、数据可视化等。常见的编程工具有HTML、Python、R、SQL和D3.js等。实际上,除了数据新闻团队四个主要角色的工作外,还有视频剪辑、音频剪辑等辅助工作需要完成。
技术需要
1.数据新闻制作入门级工具
图片、音频和视频编辑工具。 数据新闻中往往包含多媒体信息,对新闻图片处理的常用操作包括裁剪照片;加光和减光,即将照片的局部加黑或增亮;修掉照片上由于洗印、扫描、打印而产生的污点;改变照片的反差;对照片的局部进行漂白、清除刮花痕迹等。图片编辑最常用的工具是Photoshop。对新闻音频的常用操作包括修改采样率、增强与减弱音量、制作淡入和淡出效果、降噪、录音、从视频中提取音频素材、声音特效、声音合成和导出等。音频编辑最常用的工具是audacity和Audition,前者免费而且更容易上手。新闻视频的常用操作包括素材的采集与导入、编辑素材、制作简单特效、添加字幕、混合音频、输出与生成等。视频编辑最常用的工具是Premiere和Final Cut Pro。
数据分析工具Excel。Excel是所有数据新闻工作者必须掌握的一个入门级数据分析工具。它用于对数据做简单的清理,如使用函数、分类汇总清理重复记录(案例参见本书3.6.1小节“查找重复记录”) ,使用函数删除多余空格、转换数据类型等,使用分类汇总、排序、数据透视表等完成初步数据分析。
可视化工具Tableau。Tableau是一个数据发现、数据分析和数据叙事的数据可视化平台,是数据新闻工作者的入门可视化工具。Tableau将数据运算与美观的图表完美地结合在一起。它方便地实现了数据连接,无需编程就可以创建地图、条形图、散点图和其他图形,还可以制作数据地图等。
可视化工具Datawrapper。Datawrapper是一个在线工具,它可以帮助用户创建交互式数据可视化。这是一个开源工具,能在几分钟内创建可嵌入的图标。因为它是开源的,任何人都可以贡献代码,软件会不断改进。它还包含一个非常棒的图表库,可以查看其他人使用Datawrapper完成的作品。
2.数据新闻制作高级工具
爬虫编写工具Python。Python是一种面向对象、语法简洁、大小写敏感的解释型计算机程序设计语言。它完全免费,简单易学。如果完成同一个任务,假设用C语言要编写1000行代码,用Java可能只需要编写100行,而用Python可能只需要编写20行。读者可以到官方网站1下载程序并安装,有很多文档资源也可以在官方网站上找到。制作数据新闻时经常使用Python语言编写爬虫程序,从其他网站抓取数据。
数据分析工具SPSS。SPSS(Statistical Product and Service Solutions)是世界上最早的统计分析软件之一,它是一个专业级的统计分析、数据挖掘、预测分析和决策支持任务的软件产品。数据新闻制作中经常使用SPSS实现专业级统计分析和统计图标。有时候获取的数据存在乱码,导入SPSS中再导出即可完美解决该问题。例如,本书2.5.4小节“结构化信息表格化”中使用import.io下载抓取CSV的文件有乱码,就可以用上述方法解决。
数据分析工具R语言。R语言是用于统计分析、绘图的语言和操作环境。R语言属于GNU系统,是完全免费而且源代码开放的软件,数据新闻制作时经常使用R语言进行统计计算、数据分析和统计制图。
数据可视化工具D3.js。JavaScript是一种直译式脚本语言,而D3.js是一个JavaScript库,可以通过数据来操作文档。D3.js通过使用HTML、SVG和CSS把数据鲜活、形象地展现出来。D3.js严格遵循Web标准,所以其开发的程序兼容主流浏览器。数据新闻制作时经常使用D3.js编写代码,实现在网络上呈现数据的可视化效果,如使用D3.js制作动态图表和漂亮的动态网页地图等。学习D3.js对非IT人士的确是个挑战,但ECharts2完美地解决了这个问题。ECharts开源来自百度商业前端数据可视化团队,基于HTML5 Canvas,是一个纯JavaScript图表库,提供直观、生动、可交互、可个性化定制的数据可视化图表。
制作流程
传统新闻制作中更多地体现了记者和编辑、数据分析师、美术设计师和程序设计师的上下游关系,常见的制作流程是:记者首先采访写稿,然后编辑编稿,美术设计师排版配图,最后程序设计师将作品发布到网站上。整个制作过程中美术设计师和程序设计师的参与感相对较差,没有参与开始的选题阶段的工作,导致对作品的了解不是非常全面,理解不到位,从某种角度上来说,可能影响了作品的最后呈现效果。
目前各大媒体也都致力于组建自己的数字新闻团队。每个团队制作数据新闻的具体流程也各有不同,但基本流程是一致的。
在数据新闻制作中,记者和编辑、数据分析师、美术设计师和程序设计师从选题阶段开始就组成了一个团队, 共同从各自的专长探讨一个新闻点是否适合做数据新闻、 时间或经济成本是否可行。
记者和编辑重点考虑新闻价值。数据分析师重点考虑数据是否可以获取;采用何种工具爬取数据,用Python还是import.io;数据分析采用何种工具;数据分析的时间成本等。美术设计师重点考虑如何手绘图稿及如何排版等。程序设计师重点考虑如何可视化呈现。这种反复的讨论,使团队中的全体成员参与感强,有成就感。
大多数情况下,数据新闻制作时采用“项目”的方式,即一个数据新闻制作团队包含多个项目组,并不是每位成员专属于某一个项目组。很多时候,多个数据新闻项目同时工作,很可能一位成员既属于A项目组,又属于B项目组。目前,我国的数据新闻制作团队往往不会包含太多的成员,以财新数据可视化实验室1为例,团队成员不足20人。数据新闻在近几年成为行业的研究热点,单个记者通过再学习,掌握相应的技能后,也可以成为个人数据新闻团队,即通过个人力量收集数据、分析整理数据,可视化呈现,完成数据新闻作品。但从时间成本考虑,多人组成的团队在数据新闻制作中更有竞争力。
数据新闻团队中的四种角色都非常重要,缺一不可。例如,数据新闻的选题也不一定都是记者和编辑提出的,有时候数据分析师在对感兴趣的数据进行分析时,也会发现值得做的新闻点。数据新闻的选题也不一定均出自团队内部,有时候是根据其他记者和编辑提出的外包要求,通过已有的资料实现数据可视化。
数据的获取可能来自于记者和编辑,特别是条线记者,也可能来源于程序设计师编写的代码,如用Python编写的爬虫程序,还可能来自于数据分析师的经验(数据分析师更容易了解数据获取的网站) ,团队里的每个角色都可能从不同的平台、角度获取到合适的数据。
数据分析工作也不一定完全由数据分析师完成,程序设计师、记者和编辑也可能会帮忙。
美术设计工作需要有一定的美学基础,其工作具有一定的特殊性,但记者和编辑更容易从受众的角度给出中肯的设计建议。数据分析师也可以从数据量的角度提出一些设计要求,如图片显示大小等。
数据新闻制作团队的合作精神是非常重要的,现在也提倡在团队中一人分饰多个角色,降低沟通成本。
(本文节选于《数据新闻实战》)