出品| 外言社

翻译| kewell 编辑| 王茸

2018年,全世界数据记者在创新与大规模合作上颇有收获,机器学习、传感技术、自动化、新数据源越来越流行。近期国际记者网邀请了多位业内专家,让他们一起探讨过去一年中数据新闻的成绩单和未来发展趋势。

数据新闻没过时,春天刚来到

谷歌数据编辑Simon Rogers表示,数据新闻走到今天并不容易。“以前大家总在那些无关紧的项目里才加上数据,但现在完全不同了,我相信数据新闻正在成为主流。”

2018年最重要的创新莫过于,机器学习在许多国家媒体行业的应用和普及。另外,自动写作程序、智能机器人参与大型报道项目也在改变媒体讲故事的方式。哥伦比亚大学数据新闻教授Giannina Segnini就表示,自动化和新数据源的确越来越受媒体欢迎。

比如德国巴伐利亚广播和《明镜周刊》联合推出的专题报道《“外”无可依》,讲的就是外国人在德国的日常生活中所收到的方方面面的歧视。

打开网易新闻 查看更多图片

(《“外”无可依》No Place for Foreigners)

他们利用数据找到7000多家房屋中介广告,提交了超过2万份申请,并对结果进行评估,这一切都是依靠数据和自动化完成的。

大规模协作数据项目涌现

媒体之间的大规模协作项目越来越多,不仅仅是在西方国家,亚洲、南美和非洲国家媒体也是如此。

比如国际调查记者联盟(ICIJ)的“植入文件”项目,共有来自36个国家的252位记者协同参与,一起调查了医疗设备未通过严格测试所造成的安全事故。(点击蓝色字可阅读 →252名记者揭秘医疗行业丑闻:“保证安全”却致百万伤亡)

打开网易新闻 查看更多图片

再如“西非泄密”系列报道,调查的是非洲权贵阶层通过离岸方式大量敛财的丑闻。

此外,有组织犯罪和腐败报告项目(OCCRP)的调查工作仍在欧洲、非洲、亚洲、中东、拉美和美国有条不紊地开展,ProPublica也定期发布与其他新闻机构合作的调查报道。

在美国,“大本地新闻”(Big Local News)项目也前景正好。这一项目由斯坦福大学新闻学院和Democracy Initiative牵头,目的在于收集、处理和分享那些较难获得和分析的政府数据。这可以说是数据新闻项目合作的典范,在推进过程中,他们与多家本地和全国媒体合作,为媒体在司法、住房、医疗、教育等问题上的报道提供了极大帮助。

数据记者在2019年的挑战

2019年,数据记者面临的三大挑战是什么?

1. 将无结构信息转化为结构化数据

媒体能获取的数据越来越多,但信息的有序性和结构性逐渐成为问题。像电子表格、传感器数据等用基本算法就能进行搜索,但无结构数据更像人类语言,很难被套用进现成的关系数据库,用古老算法进行搜索更是不可能任务。

所以对媒体来说,收集无结构信息并将其转化为结构性数据,仍然是很大的挑战。“因为媒体并不具备成熟的技术和工具,”斯坦福大学教授Cheryl Phillips表示。他鼓励各国媒体继续努力,把异构数据常规化,尽量多跟专业团队合作。

打开网易新闻 查看更多图片

2. 政府数据仍然较难获取

不少国家的记者都面临这个问题。马来西亚数据新闻奖评审官Kuek Ser Kuang Keng表示:“一些东南亚国家的记者日子不好过,特别是在菲律宾和缅甸,想要获取来自政府的真实信息仍然十分艰难。但在马来西亚,新的政府班子正在起草法规,让信息数据政策更开放,因此这里的数据新闻是有机会好好发展的。”

在中国,记者的数据来源往往是科技公司。Kuek Ser Kuang Keng说:“一些科技巨头公司会相对愿意分享数据。”

3. 本地数据新闻实力不均

中国的本地数据新闻很强,Kuek Ser Kuang Keng表示:“比起全国性数据,本地数据在这里可能更容易获得。”

但在像古巴这样的地方,要获取地方数据就很难了。Postdata.club的Yudivian Almeida Cruz说,“记者拿到全国政府数据可能没什么问题,但要想从本地政府手里拿数据挺难的,本地数据新闻不好做。”

2019年值得看好的新技术

最近,谷歌宣布关闭了数据管理服务Fusion Tables,接下来媒体也得继续寻找新技术来处理数据。

Simon Rogers推荐了他看好的三个方向:人工智能、超声处理(Sonification)、自动生成艺术(Generative art)。