09/07/13

数据新闻:如何找到故事的数字

data-journalism-pract guide-wellcome
版权:巴勃罗·罗哈斯,Wellcome图像

阅读速度

  • 新闻意味着找到故事的数据处理大型数据集
  • 免费在线工具现在可以很容易操纵,解释和现在的数字信息
  • 似乎令人生畏,但数据新闻已成定局

发送给朋友

您提供的细节在这个页面将不会用于发送不请自来的电子邮件,,不会卖给第三方。看到隐私政策。

同事们经常问我什么是数据新闻。他们感到困惑为什么它需要自己的名字——所有记者不用数据?

这个术语缩写“新闻数据库”或“数据驱动的新闻”,记者发现故事,或角的故事,在大量数据。

它与新闻调查在需要大量的研究中,有时违背人民意愿。与数据可视化也可以重叠,因为它需要记者之间的密切合作和数字专家来找到最佳的方式呈现数据。

为什么参与电子表格和可视化工具吗?在最基本的,添加数据可以给一个故事一个新的事实维度。但深入研究数据集也可以揭示新的故事,或新的方面,,否则可能没有浮出水面。

数据新闻有时也能告诉复杂的故事更容易或明显比单独依赖文字,所以是特别有用的科学记者。

它似乎是件很难的事如果你训练在印刷或广播媒体。但我将向您介绍一些新的技能,并向您展示一些优秀的数码工具,所以你也能很快找到你的脚作为数据记者。

从哪里开始

像所有的新闻,故事的核心思想可以来自许多来源。统计可能听起来不太对,诱惑你看其背后的数据。或者你可能有一个问题回答在英国科学资助有什么变化吗?为例。

数据新闻不同于其他形式的一种方法是,你可能没有察觉后的故事,直到你开始调查。这并不意味着任何旧的数据,希望找到一个故事,而这个故事就是告诉你的数据。这个演讲《卫报》的挑选数据给出了一个工作流的新闻。

那么如何选择深入研究什么?很高兴熟悉数据类型和来源的“节拍”,当数据可能被释放,就像知道会议或期刊出版日期。

最好从小事做起,你的第一个数据新闻项目,尤其是当你习惯了数据处理和使用所有可用的工具。你的主要的挑战可能会处理数据所需的时间。彼得·Aldhous《新科学家》旧金山局长,已经产生了教程如何处理科学数据新闻项目,新闻的数据手册也有建议从哪里开始。

发现和访问数据

数据新闻专家说记者的角色正在改变从狩猎和采集稀缺的信息来处理信息的一个丰富的时代。

“证据表明数据新闻是新闻的未来”

桑德拉Crucianelli

数据可能是丰富的,但某些类型的数据比其他人更容易得到。政府开始认识到发布数据的重要性——包括研究成果——但这不同国家,甚至一个相信开放的政府,可能缺乏足够的系统进行数据访问。

一些国家,比如肯尼亚主动提供数据,而在其他你要问——有时是通过系统,如印度的信息权利法案。

国际组织等世界银行发布数据,等项目Gapminder谷歌公共数据浏览器整理数据从不同的组织。科学/健康记者,clinicaltrials.gov是一个注册临床试验数据。环境和地beplay足球体育的微博球科学记者可以访问的信息美国地质调查局为例。

你甚至可以找到一些准备打包的数据处理。数据挖泥船,Internews之间的协作和肯尼亚的开放政府数据倡议,提供链接到肯尼亚卫生报告和图表对健康主题你可以下载和使用的故事。

和网络的数据,发现它只是需要磨练你的搜索引擎技巧。有时你可以搜索一个词+的数据,或者使用专门的学术搜索引擎等谷歌学术搜索Scirus。语义web资源,如Wolfram | Alpha不仅通过额外的数据搜索,关键字在页面中,也有用。

谷歌高级搜索域扩展允许你缩小你的结果,帮助你寻找学术或政府数据,和文件格式,如Excel文件,你最有可能找到表的数据或统计数据。表和图形经常上传图片,所以数据搜寻应该包括Flickr和谷歌图片。

你甚至可以检索数据,从网络中删除,但“缓存”或保存截图。试互联网档案馆及其机器Wayback恢复旧文件或破碎的url。

社交媒体也可以一个数据源。工具,如SocialMention,48人,——Addictomatic,BoardreaderWhostalkin让你搜索的名字,主题,时间和已然采用。社交网络揭示新闻的一个有趣的例子是关注救助项目ProPublica新闻调查组织,利用社交媒体提到提醒记者新数据在2008年发生了什么美国银行救助资金。

记住——良好的实践链接,或者国家的来源,您的数据。

数据处理

你已经找到了数据,但是你能使用它吗?你需要将其导入Excel电子表格之类的或者Google Drive,所以下载数据在一个逗号分隔值,或CSV格式如果可能的话。

你可能有一个表在一个PDF文件,或者作为JPEG图像文件。尝试一个文件转换器Zamzar让这些电子表格。光学字符识别软件也可以是一个很大的帮助:一个简单的、自由的人免费的Ocr。作为最后的手段你可能需要手动输入数据,这是耗时且容易出错。

无论你的数据来源,它可能需要“清洗”使它有用。这可能意味着从重组和删除你不需要的数据,使用工具等OpenRefine(原谷歌改进)使数据更加一致(观看视频教程指导这个清洁可以是什么意思)。科学记者至少应该严守科学数据的访问,需要更少的清洁。

你还需要开始做一些基本的处理。你可能数据从最小到最大或位置。你可能会寻找平均,或加入或比较两个数据集。

将数据视为“源”:你的听众可能会问它问题。,问很多问题,答案可能不是你第一次是怎么想的。例如,一个电子表格的期刊论文可能建议欺诈检测,但你也要问是否还有其他的解释。

仔细思考你的结果——他们听起来可信吗?最好是检查和复核计算。不要为一个基本的错误毁了你的声誉。

你可以增强你的结论或确定新的问题和简单的统计分析。例如,您可能发现更灾难性的风暴在你们国家每年20年。但这是一个重要的结果或可能是自然变异的机会吗?工具,如r项目RStudio可以帮助你判断。您可能还想要检查你的结论与专家或其他有经验的数据记者,尤其是当你开始。

展示的数据

你的演讲将取决于故事。可能会有很少的礼物;你可以控制一个但是重要人物在一块传统新闻报道,你的政府花了一半承诺在科学,例如。

或者你可以使用数据可视化作为故事的一个组成部分。这调查从《西雅图时报》在美国将书面特性与支持图表,地图和源文件。一个是一个交互式的地图;这样的元素可以在更大的故事和项目使用,或者可以自给自足的,喜欢这种可视化的死因由英国报纸《卫报》

在线工具,如表公开许多眼睛可以想象数据以不同的方式,而谷歌表融合器,GeocommonsIndiemapper产生好的地图使用经度/纬度数据或更复杂的GIS数据。许多这些工具还允许您添加一个动画层显示时间尺度,例如。

有时不仅仅是展示数据,但是让你的观众看到对他们意味着什么。这ProPublica项目显示用户是否他们的医生接受制药公司的钱,虽然这德克萨斯论坛努力展示了如何美国公共资金。

更进一步,这《卫报》项目要求读者帮助分析英国公共支出数据。这种类型的项目,称为“新闻应用程序”,需要记者和程序员之间的协作设计和构建应用程序处理和分析中许多变量大数据库或跨多个数据集。

我一直参与新闻应用程序在阿根廷的La Nacion报纸作为我的一部分骑士国际新闻奖学金。它使用从2001年和2010年全国人口普查信息,让人们探讨人口已经改变了在他们的地区。

网站信息是美丽的例子创造性的数据可视化,并展示了如何使用出版的数字或图形团队可以生产。

你需要说服你的编辑新闻腾出时间数据。这变得更加简单,当你看到结果,这个报告(我合著)集成数据新闻编辑部也会有所帮助。

看起来像一个大问,但证据表明数据新闻是新闻的未来。如果你能花时间,你不仅得到更好的故事,你会更好地为你的听众和公众利益。

动画链接关于数据新闻在阿根廷

桑德拉Crucianelli是一个骑士国际新闻的。她是一位调查记者和教练,专门从事数字资源和数据的新闻。她的创始人和编辑Sololocal.info,一个在线杂志提供地方性新闻从布兰卡港城市,阿根廷。看到更多:www.visualcv.com/sandracrucianelli