打开网易新闻 查看更多图片

这是2019年8月31日通过投稿平台投给某顶刊的一篇商榷文章。当年期末清理过往学术期刊时,意外读到该顶刊发于2017年12月的一篇关于数据新闻的论文。读毕,觉得论文将数据新闻过于玄化,脱离了当时国内外媒体方兴未艾的数据新闻实践,不利于推动数据新闻的普及运用。仔细再读,又发现论文引以为重要论据的几段来自境外文献的内容,被严重误译误读了,顿起撰文与作者讨论的冲动。

但此前并未见该刊发表过商榷文章,其似乎并无《国际新闻界》那样的学术讨论传统,便询问编辑部是否也接受商榷文章。答曰“也欢迎”。当时觉得“也欢迎”是真诚的,开展学术讨论和学术批评,本是学术期刊题中应有之意,何况这类讨论不仅可活跃学术气氛,也会为刊物本身带来阅读量。便撑起胆子利用暑假撰写了1.6万多字的文章,向该刊“作者投稿管理平台”投出。

一年后的2020年8月10日,编辑部转来盲审修改意见。意见首先肯定了文章的价值,说论文对某教授“的数据新闻研究成果提出了诸多质疑,同时也围绕新闻目标、新闻属性等问题,给出了自己的阐释,整体来看,作者对数据新闻具有深入研究,国际视野开阔,能够在学理层面把握不断变动的数据新闻实践,并对其规律进行学理化的概括和提炼,的确指出了‘曾文’中存在的部分问题,其中关于数据新闻属性、新闻叙事的观点具有一定的说服力”。然后也指出3点问题,大意是:第一,被商榷文章刊发两年多来,C刊他引不超过5次,“很难说这是一篇产生了重大影响或广泛讨论的论文”,似乎为此写商榷文章意义不大;第二是提出一些修改意见;第三是用两行字指出本文之不足。

虽然我并不认同学术期刊商榷文章的对象必须是“产生重大影响或广泛讨论”的文章的观点(这也不符合迄今各刊已经发表的商榷文章的大致情况),但还是心存感激,在认真领会退修意见之后,立即放下一切事务,对文章进行了较大幅度的修改,甚至更换了标题,于当年8月13日发还平台。

此后就再无音讯了。本以为被毙了,但迄未收到退稿通知,几次查看平台,稿件的“最新状态”仍在等待中,“退稿”一栏里没有信息。直到2021年10月17日(投稿两年多之后、第一次修改一年多之后),突然又收到编辑部转来的新的修改意见,要我进行“修改和补充”,令我对编辑部不离不弃的态度竟心生一丝感动。意见寥寥数行,一共两点,不妨原文粘贴如下:

“1.因为本文是一篇商榷论文,商榷文章是2017年的,似乎中间间隔的时间太长了。首先建议作者修改稿中增加一些关于数据新闻的更新研究,而且要能论证本文提出的商榷问题在今日仍然有价值。2.坦率说,这篇论文讲的道理比较浅。事实上,曾文也比较浅。争议这个问题,似乎本身没有什么学术性。但鉴于曾文也在本刊发表,商榷文章是否也可在本刊发表,请编辑部再斟酌。建议作者增加一些对数据新闻的文体定位的意义的阐述。”

打开网易新闻 查看更多图片

目前还保存在投稿平台的稿件状态及二修意见(辜晓进 截图)

该意见说得很坦率,还把“吵架”双方都贬了一下,却并无多少实质性修改意见。尽管“中间间隔的时间太长”责任不在我,但我仍按“意见”做了一定程度的修改和更新。当时正好全球数据新闻做得最早也最好的英国《卫报》数据新闻博客新任主编有一段讲话,间接佐证了我文中的一些观点。文章修改后,于2021年11月16日再次发往编辑部平台。此后便再如石沉大海无消息。

2022年5月26日,眼看又过了半年多,我难忍这不死不活状态,便首次给该顶刊新任主编发微信询问,希望能了解一下给个回音,且特别注明“实在不能用,也请说明原因作退稿处理。”回复很客气:“谢谢晓进老师告知!我问问情况!”还附上3个拱手emoji。但也再无回音。我理解兼任所长的顶刊主编之日理万机,完全有可能忘了我这琐事,便在7个多月后的2023年1月4日发微信提醒,竟“恨无消息到今朝”。我百思不得其解,究竟是啥原因,竟让如此位高权重的学术大咖,置学人间起码的书信礼仪于不顾?有学界朋友替我分析,说对方“一作”背景如何如何,编辑部有难处。我是宁肯信其无的。

其实对我而言,早已过了“功利性发表”阶段。至少这十几年来,我每发一篇文章,每出一本书,或每申请一项课题,都与评职称或任何形式的升迁无丝毫关系。之所以还写,一是出于学术兴趣,就像这篇商榷文章一样,纯属没事找事;二是如记者发表揭示真相的调查报道那样享受“告知的快感”,就像前年和我的博士生合写并发于“四大刊”之一的关于“对内国际假新闻”的论文一样;第三也很重要,即作为新闻学科带头人,要为我所在学院的学术GDP作贡献;还有就是期刊约稿,我一直对一些期刊主编锲而不舍的敬业精神抱有敬意。

我也自知学术水平有限,毕竟半路出家,稿件被顶刊拒绝是再正常不过的事,不会有“芙蓉生在秋江上,不向东风怨未开”之憾。只是别这样不拒不迎地长期挂在那儿、或过两年就让你“修”一下、还要作者自己解决因间隔过久的时效问题好吗?记得多年前某国字号核心期刊向我约稿,让写从媒体转型到学界的“成功经验”。我顿觉汗颜,婉拒了,说媒体和学术是两个完全不同的江湖,我还在努力适应中,还在新江湖学游泳,远谈不上“成功”。这是实话。

休再絮叨,将第二次修改后的商榷文奉上,欢迎讨论和拍砖。由于腾讯微信的格式规定,无法完整呈现包括文献注释等信息,我第一尝试采用腾讯新产品“微附件”小程序上传PDF文本。有兴趣者请扫码打开阅读。但自己体验后,也觉得这种阅读并不方便,且在手机上的PDF文件字太小,看了吃力。所以又将删去所有35条文献注释的全文附后。

属性之辩:关于数据新闻几个概念

——与《数据新闻:一种社会科学研究的新闻论证》作者商榷

辜晓进

An Argument Over Some Concepts of Data Journalism

A discussion with authors of Data Journalism: Concept Explication and Exploration

Gu Xiaojin

内容提要 数据新闻是当前新闻学研究和媒体实践都较关注的样式之一。对其主要功能与属性等概念的认知与辨析,事关媒体实践与理论引导。论文《数据新闻:一种社会科学研究的新闻论证》涉及上述概念的研究,但其主要观点的立论和论证尚值得商榷。本文认为,数据新闻既非社科研究,也不是新闻论证。即便包含大数据的数据新闻,数据新闻本质上仍是一种由媒体组织实施的新闻实践,是在现代信息技术武装下的新型报道样式,与新闻史上先后出现的诸多新闻样式是一脉相承的,其追逐事实真相的根本目的并不因数据或大数据的引入而改变;数据新闻在宏观或微观层面发现新事实的过程也非“新闻论证”。本文并对该论文关于数据新闻去叙事化等主要观点的核心论据加以分析,证实这些论据因存在错误引用和误读等瑕疵而并不能为论文的结论提供支撑。

Abstract

Data journalism is currently one of the most concerned styles both in journalism research and media practice. The understanding and discussion of its functions and attributes will be beneficial to news communication and theoretical guidance. The article of Data Journalism: Concept Explication and Exploration helpfully involves the research of some key concepts, but its conclusions remain arguable. This paper holds that data journalism is neither social science research nor journalism demonstration. The data journalism, including big data journalism, is essentially a news practice implemented by media organizations. It is a new reporting style armed with modern information technology, as some other news styles continuously appeared in the history of press. Its main purpose of chasing truth is not changed by data or big data involved; The process of data journalism discovering new facts at the macro or micro level is also not "journalism demonstration". This paper also found that some core evidences for main viewpoints of the article were misused so that the conclusions regarding non-storytelling data journalism remain unsupportable.

关键词 数据新闻 新闻叙事 新闻论证 新闻目的

Key words:data journalism, news storytelling, journalism demonstration, purpose of journalism

《新闻与传播研究》2017年第12期刊登了一篇视角独特、颇具新意的论文:《数据新闻:一种社会科学研究的新闻论证》(以下简称“曾文”),作者为曾庆香教授和陆佳怡、吴晓虹。文章认为,“数据新闻并非新闻叙事,而更近似于社会调查报告,它可能有一些叙事成分,但其主旨并非讲述故事而在于推导出事实性结论,是一种新闻论证。”文章并从数据新闻生产的目的、方式、模式三方面,确认其从属于社会科学研究,“是应用性较强的社会调查研究报告”,“是一种社会科学研究的论证”。文章在结论部分进一步相信,数据新闻呈现社会科学研究的“科学环”特征。

但通读全文后,笔者对“曾文”上述核心观点,特别是文中将数据新闻从新闻叙事中剥离、并将其归入社科研究范畴、确认其属于科研性质的论证、同时又延伸至本属新闻评论范畴的“新闻论证”等主要内容,未敢苟同。这些观点涉及对数据新闻功能和属性等方面的定性,模糊了新闻报道与科学研究中一些概念的分野,对当下正火热推进的数据新闻实践有可能产生纷扰乃至误导作用,因此有必要进行学术讨论。而“曾文”用于支撑其主要观点的一些重要论据(大都来自国外文献),则出现错引或误读等问题,导致其立论依据明显不足。作为在顶级期刊发表的重要论文,这也同样值得商榷。

笔者认为,数据新闻作为一种基于数据分析或由数据“驱动”的新闻样式,已至少存续了半个多世纪。其虽然在当前的数字时代有了新的演变,但其新闻属性并未因大数据的普遍引入而有任何改变;其叙事功能并未因数据驱动的深度介入而有所丧失;其发现最终事实的过程与本属新闻评论概念的“新闻论证”并无关联;其生产目的也并非获得研究性发现,而仍在于对事实真相的孜孜以求。厘清有关数据新闻的功能和属性等基本概念,有利于更好地认知当前传播环境下的数据新闻,推动相关研究,引导新闻实践。

需要说明的是,对上述关键概念的讨论虽因本文尚未发表而又过了几年,但讨论的意义仍然存在。从学术层面看,虽然经过前些年的大发展,“2018-2019年,数据新闻论文增速放缓”,但“学者们开始对数据新闻进行更为精细化的研究,如一些学者关注数据新闻叙事范式、算法对数据新闻的影响等”(许向东、王怡溪,2021)。本文涉及的数据新闻范式等概念,正是这类研究的关注点之一,其在数据新闻的理论探讨中仍有展开的空间。从实践层面看,当前在数据新闻的应用过程中,中外媒体都呈现出一种数据新闻向新闻传播自身逻辑回归的趋势。英国《卫报》的“数据博客”是全球数据新闻实践的典范。其现任主编Pamela Duncan (2021)在总结该报数据新闻十多年的历史时说:做数据新闻,“你不必成为数学家,你只要当好一位新闻叙事者”。数据“已不再是做新闻的‘新’途径,数据本身作为新闻而存在”。“我们(指数据团队)处于新闻和调查报道之间的位置”。武汉大学数据新闻研究中心等机构2020年发布的《中国数据新闻发展报告(2018-2019)》也指出:“从业者开始思考怎样将数据新闻作为整个新闻团队有机体中的一部分来发展其功能,回归理性,不再追求表象、花哨、猎奇的内容,而是更加重视新闻的核心价值。”

业界的实践,似乎正与本文商榷对象的观点拉开更远的距离。

一、数据新闻的目的仍是获取真相

“曾文”第二部分重点讨论的是数据新闻的“目的、方法、模式”。这部分第一个小标题就是“数据新闻的类型:社会科学研究目的与功能”。文内将数据新闻分为四个类别,称“这4种数据新闻正好应了社会研究的3种目的与功能”,分别解决“是什么”“为什么”“怎么办”的问题。在另一个小标题段落里,则再次强调“数据新闻的大小标题、生产目的、框架结构本身显示了它是应用性较强的社会调查研究报告,具有较强的研究与论证特色”。

这些观点的核心在于,数据新闻的出现,改变了新闻生产的目的,即将获取事实和真相这唯一目的变成社会科学研究的“3种目的”;数据新闻已经由对事实和真相的追求演变为“一种从属于社会科学研究的论证”。虽然上述三种目的(是什么、为什么、怎么办)看上去与新闻报道的诸要素类似,但从其上下语境不难看出,这三种目的都是社科研究里的概念,与目前公认的新闻报道的目的关联不大。这就产生了第一个需要辨析的概念:数据新闻的目的究竟是什么?

众所周知,“数据新闻”(data journalism)的概念来自菲利普·迈耶的“精确新闻”(precision journalism)。在发生于1967年7月下旬的“底特律暴乱”(黑人居民抗议警方执法而演变成的大规模血腥骚乱)中,迈耶作为俄亥俄州一家报纸的驻华盛顿记者,接受底特律最大报纸《底特律自由报》(The Detroit Free Press)的“临时委派”前往报道。他调查了参与暴乱的高校学生和高中辍学者的数量和比例等信息,并将这些信息输入一台大型计算机进行分析,得出一些传统报道难以发现的事实(这正是迈耶此举的目的)。他和《底特律自由报》的同事们因这起骚乱的系列报道于第二年共同获得普利策“地方新闻/现场报道奖”。颁奖词中提到了“迅速而精确的调查报道”(swift and accurate investigation)。

迈耶基于多年的数据报道经验于1973年出版《精确新闻学》(Precision Journalism,到2002年已出到第4版),促进了这一方法的推广。随着个人电脑的普及以及其后数字时代的到来,“计算机辅助报道”(computer assisted reporting,简称CAR)渐渐多见。1989年,美国《大西洋宪章日报》(The Atlantic Journal and Constitution)记者比尔·戴德曼(Bill Dedman)因上年关于种族歧视的报道《金钱的肤色》(The Color of Money)而获得普利策“调查报道奖”。颁奖词称该报道“导致了重大的政策改革”。该报道也因较多采用CAR技术而被公认为早期典型的CAR新闻。随后不久,密苏里新闻学院便发起组建“CAR全国研究院”(National Institute for Computer Assisted Reporting,简称NICAR),并设立了以迈耶名字命名的CAR新闻奖。至2009年《卫报》上线数据新闻博客,“数据新闻”或“数据驱动新闻”(data-driven journalism,简称DDJ)已被普遍用来替代“精确新闻”或CAR。这种新闻样式也渐渐变得随处可见。谷歌新闻实验室2017年做的一项调查发现,42%的记者在日常报道中常规性地用数据讲述新闻,美国和欧洲所有新闻机构中的51%设有专职的数据记者。

回顾以上数据新闻的演变轨迹不难发现,虽然数据正越来越多地介入新闻叙事,进而对新闻事实的发掘发挥了“辅助”甚至“驱动”作用,但新闻的本质或基本目标并未因此而改变,即展现事实和揭示真相。或如前《芝加哥论坛报》发行人兼美国第二大报业集团论坛传媒集团总裁杰克·富勒所说,“新闻工作的核心目标是说出真相。”出版《新闻的十大基本原则》的两位美国著名新闻学者科瓦齐和罗森斯蒂尔也认为,“尽管新闻的传播速度、技术及新闻传递手段已经发生变化,并还将以更快的速度变化,但是新闻的社会功能中,始终存在着一个关于新闻工作的清晰的理论与哲学”,“事实上‘新闻’这一概念在三百多年前第一次出现开始,其目标一直明显保持不变”(科瓦齐、罗森斯蒂尔,2001)。

世界第一次“数据新闻圆桌会议”(2010年8月24日在荷兰阿姆斯特丹举行)的发起者之一、DDJ负责人、欧洲新闻中心(European Journalism Centre)和创新项目成员、著名“信息建构师”(information architect)米尔科·洛伦兹(Mirko Lorenz)认为,“新闻记者其实总是在与数据和技术打交道,只是自己习以为常而已。很多情况下,事实就是数据,而事实是任何具有新闻属性的新闻故事的本源。……今天的数据新闻可以被定义为一种工作流程(workflow)。在这个流程中,数据是进行分析、可视化以及最重要的一点——新闻叙事——的基础。”

洛伦兹的观点已经被大量数据新闻实践所证实。就在这次圆桌会议提供的文件中,主办方列举了来自《卫报》《华盛顿邮报》《纽约时报》、BBC等欧美主流媒体的21个数据新闻的经典案例,其中大多数案例配有一句话的概括性描述。限于篇幅,这里无法展开这些案例,但从一句话描述中出现的字眼,诸如“uncover the truth”(揭示真相)、“opening up formerly hidden information for everyone to see”(披露以往深藏不露的信息为众人所见)、Providing a better overview through combination of different media(通过不同媒介的组合呈现<关于阿富汗战争>更完整的景象)等,均不难发现这些数据新闻都有一个共同的目标:发现和揭示事实真相。

新闻报道是通过各种方法(包括数据挖掘)获取事实和寻找真相的过程,而社会科学研究是通过论证得出结论的过程。虽然某种情况下最终的发现可能相似,例如,记者20世纪90年代通过采访调查发现,深圳由于产业结构和人口流动等原因,某些地区的男女职工比例严重失调,女员工数倍于男员工。同时期的人口学家经过研究,也得出类似的发现。但两者的行动目的、发现过程以及对最终意义的解读,都不太一样。而且,记者可以将人口学家的研究成果写入报道,人口学家通常却不会以记者的报道作为科研依据。这就是新闻与科研之不同。

二、数据新闻仍在叙事,数据只是叙事的辅助手段

第二个需要厘清的概念是新闻叙事,这也是“曾文”所涉最核心的概念,即认为数据新闻是脱离新闻叙事而存在的新闻样式。其第一部分的标题即为“数据新闻:意在论证而非叙事”。文中说:“数据新闻基本是依靠归纳与演绎等逻辑思维把不显而易见的、人们普遍关注的事实论证、推导出来”;“数据新闻不是叙述故事”;“数据新闻的事件叙述基本是作为证据,使论证充分,结论可靠”。文中还错误转引外国专家观点称,“实际上未有用数据成功讲述故事的数据新闻”,以支撑自己去叙事化的观点。(关于“曾文”中对一些重要证据性文献的误读,详见本文第三部分的分析)

中文的“新闻叙事”,在西方媒体语境中有一个精准、贴切而不易产生异议的对应词:journalism storytelling。只不过新闻业界和学界为讲述方便,常常省略了其中的“journalism”。当新闻界提到storytelling时,所指的就是新闻叙事,这是大家心照不宣的。正是这个storytelling,在当今西方媒体的数字化转型、媒介融合、数据新闻等语境中正在成为一个高频词,其并未因传播生态的巨变和报道技术的迭代而被消解或弃用。

《华盛顿邮报》是近年因数据新闻获得普利策奖的西方主流报纸之一。其前任总编辑马丁·巴伦(Martin Barron)认为,该报编辑部运作的根本改变之一,就是“我们尝试用与以往不同的方式讲述故事”。根据笔者2016年对该报的调研及与其总编辑巴伦和主管数字传播的执行总编辑艾米里欧·加西亚-瑞兹(Emilio Garcia-Ruiz)长达约两小时的深度访谈,该报的所有采编部门都介入了大数据报道,其47个媒体工程师也进入一线与各部门编制,与记者共同完成新闻生产,而他们的数据应用、分析、可视化等都是为新闻叙事服务的。该报的实践也印证了前述洛伦兹关于“数据是新闻叙事的基础”的观点。

虽然国内关于“新闻叙事”的概念主要源自本世纪初对梵·迪克《作为话语的新闻》(曾庆香译)等研究成果的引进,但这一概念在西方媒体已经存续了大半个世纪。西方的新闻业以1833年纽约《太阳报》的创刊为标志,进入大众化传媒时代。报纸上的新闻也从此前的重视政论、主要为精英阶层服务转向对普通民众喜闻乐见的事实的追逐。19世纪60年代美联社提出新闻五要素(五个W)以及随后电报进入新闻业后推动倒金字塔框架的形成,符合该框架的“硬新闻”(hard news)或对事实的简单线性描述一直是新闻的主流范式,直至20世纪60年代“新新闻”(new journalism)的出现。

“新新闻”作为“诞生于美国1960和1970年代的文学运动”,“消除了传统新闻与非虚构写作之间的边界”,“将新闻调查与文学技法相结合以报道真实的新闻事件”(Fakazis,2013)。其主要特征是不满足于以往表面化和模式化的事实描述,而引入文学创作中的结构、主题、场景、细节、情感等手法,以明显扩大的篇幅试图揭示事物的本质,把对“真相”(truth)的追求置于一般性“事实”(facts)之上。与之相对应的行文范式,便是“讲述新闻”(narrative journalism),也即后来的“新闻叙事”(journalism storytelling)。“这种样式的新闻,不同于直接新闻(direct news story),后者只提供who、what、where、when 和why这类基本信息的新闻。讲述新闻的篇幅更长,要求记者挖掘更多的元素用于写作。”它大量应用于调查报道、解释性报道以及“特稿”(feature)等各类新新闻作品中,延续至今。

问题的关键在于,数据新闻作为被媒体越来越广泛采用的新闻样式,其叙事内核是否如“曾文”所判断的已经不复存在?

从后工业化时代到当前这个数字时代,人们的活动半径大大拓展,资讯范畴也明显扩大。现在民众所处的环境与100年前李普曼的时代已经天差地别:一方面,民众对很多简单事实的了解已不再依赖新闻媒体,因为人人都在发布或传播这类信息;另一方面,民众所无法感知的“外部世界”,新闻媒体依靠传统手段也常常无能为力,而必须借助新的科技手段,例如大数据。与此同时,对一些现在民众更加关心却难以获取、用传统手法无法客观而全面揭示的复杂事实,特别是社会或自然界的复杂现象(它们通常由无数大中小事实经一段时间甚至是漫长岁月积累而形成),已经可以用大数据等技术和新的视觉方式(如无人机、VR、AR等)加以揭示和呈现。这些新技术和新方式,无疑都是为更好地完成新闻叙事服务的,是为新闻本要达到的目的服务的。

所谓复杂现象,不妨引用波兹曼的一段描述为例:“一条被逐渐污染的河流会突然变得有毒,大多数鱼类都灭绝了,游泳成为一种危险。但即使是这样,这条河看上去还是正常的,人们还可以在上面划船。换句话说,即使河里的生命都已经死亡,这条河还是存在的,他的用途也还没有消失,但它的价值大大降低了。”波兹曼的这段话虽然是用来比喻符号环境,却道出了较为普遍的社会或自然现象的某些特征。这种现象是长期积累形成的,媒体很难用某一两个事实来描述它或通过一两天的观察展示其本质的变化(除非某日河上突然出现大量死鱼,那就是突发事件了)。通过采访当地渔民或环保部门官员,也难得到完整的事实。但运用大数据方式,这类报道便变得更加可行且更有说服力了。

于是,当路透社想向受众揭示海平面上升对美国海岸线的侵蚀和对沿海居民的影响时,便采用了大数据技术和大量可视化图表,于2014年推出系列报道《水的边缘——海平面上升危机》(Water’s Edge/The Crisis of Rising Sea Levels),向受众讲述在短短20年间,美国全部海岸线发生的触目惊心的变化,包括很多地方的海岸土地和植被已经消失,一些沿海地区的人口急剧减少,政府耗巨资在17个沿海州修建阻挡海砂侵蚀的堤坝的面积(包括精确到立方英尺的建筑量和耗资总量)等。该系列报道从标题到内容(如第一篇标题为《海面上升时,灾难像慢动画似地正在侵蚀美国的海岸》 ),都是在叙事,只不过大数据或全数据替代手工调查成为了新闻叙事的主要依据。

同样,在以往美国警察枪击致死事件中,黑人似乎更易成为牺牲者。但从一些个案得出的这一判断并不足以服众。于是《华盛顿邮报》2015年以大数据方式,用10个月的时间连续推出包含当年全部警方枪击致死事件的大型系列报道,总标题为《致命枪击》(Fatal Shootings)。记者们从全国各地警署、相关公共服务机构和事发附近的监控录像等资源获取了大量数据,经计算机分析辅以人工调查核实,还原了当年全年总共965起针对美国公民的警察致命枪击案的现场及发生原因,包括枪击案的方位,警方与被枪击者的距离,被击毙者的种族、职业、教育、家庭等背景,被击者是否持有武器等十几种数据,得出一系列出人意料的结论,除了黑人和有色人种明显比白人多之外,还有诸如965位被枪击致死的公民中只有564人持有枪械、90人手无寸铁等数据。这一叙事特征明显的大数据新闻获得2016年普利策奖,也成为数据新闻的新经典。

西方学者将英国《卫报》2009年创办的“数据博客”(Data Blog)视为常态化大数据新闻报道的先驱(Stray,2010)。该博客最经典的大数据新闻也是被国际数据新闻首次圆桌会议列为典型案例的《议员账单》(MP’s Expenses),是利用大数据技术对社会或人文现象进行深度叙事的标志性案例。这个被引用率甚高却被“曾文”忽略的案例,是指在2009年4月英国爆出多名(后查出有9名)内阁大臣用公款报销私人消费账单的丑闻后,《卫报》进行的大规模基于数据分析的系列报道。该报通过特殊软件将议会迫于信息自由要求而提供的逾百万相关文件上线公布,并用众筹方式让包括议员自己在内的注册网民在网上审核。截至2010年6月,总共46万与报销单据相关的文件有约半数被26774位注册读者审核。很多议员在报道尚在进行中便主动补交费用,多位议员因此放弃竞选连任。

关于这组影响深远的数据新闻,国外已有较多论文发表,笔者读过的几篇都提到了数据对新闻叙事或新闻调查的支撑作用:如“这(指该报道中数据技术的应用)强化了新闻的功能:编辑决策;事实核查;新闻伦理;以及新闻叙事,这仍然是基本要素,只不过记者所采用的核心技术将会改变。”(Grose, 2009) “计算新闻(这里与数据新闻同义)是指利用工具进入、处理、呈现数据并报道新闻。借助能处理大量数据的新兴软件,记者得以确认导致原始调查报道的新闻线索并提高报道质量。”(Daniel,2010)

三、去叙事化的三大“强有力证据”难以立足

当然,“曾文”的去叙事化观点也非空穴来风,文章在第一部分“数据新闻:意在论证而非叙事”中主要列举了三大证据,还称其中一个是“数据新闻不是‘讲述故事’的一个强有力的证据”。这些证据是:

(1)“数据新闻不是‘讲述故事’的一个强有力的证据,可见于自2012年以来每年召开的全球编辑网络年度峰会的数据新闻奖的主要奖项设置……,2014年,该奖项中原有的‘讲述故事’(storytelling)和‘数据故事讲述’(data storytelling)两个奖项被取消。”

(2)“美国统计学家、数据新闻网站‘538’(Five Thirty Eight)创办者奈特·希尔(Nate Silver)指出,他的团队所生产的数据新闻是没有叙述体的新闻,甚至是与叙事体新闻完全对立的新闻。”

(3)“‘数据新闻’理念的提出者、EveryBlock创始人阿德里安·哈罗瓦提(Adrian Holovaty)在2006年发表的网络文章《报纸网站所需要的根本变革》中指出,报纸需要抛开以叙述故事为核心的世界观。”

由于上述证据已经成为“曾文”数据新闻去叙事化的立论基础,有必要对其进行分析。但笔者在细读以上三大“证据”后却发现,这些“证据”不仅牵强,甚至对“证据”本身存在误读或误引,因而很难对其去叙事化观点产生如“曾文”所期待的支撑作用。其据此得出的结论也就很难立足。

现对这三大(其实是四条)“强有力证据”分析如下:

(一)“数据新闻奖”名称之变并非放弃新闻叙事

该奖项的设置和评选是“全球主编网络组织”(The Global Editors Network,简称GEN,其中的editors应译为“主编”,笔者曾有幸获邀参加其2011年在香港举行的首届峰会)的三大主要任务之一(另两项是“主编实验室”和“新闻创新”)。该组织由《华盛顿邮报》《卫报》《世界报》(法国)、BBC、《晚邮报》(挪威最大报纸)、《国家报》(西班牙最大报纸)、《号角报》(阿根廷最大报纸)七家传统媒体总编辑发起并担任创会成员,后来陆续有ProPublica等著名原生数字新闻媒体高管加入,目前已有6000多名成员。其成立之初就在“宣言”中确定了三大目标:“推动新闻创新,培育新闻叙事的新方法(foster new storytelling methods),定义未来新闻业。”后来该组织将这些目标细化为更多的“We will”,新闻叙事仍包含在内。

“数据新闻奖”的设立,体现的是对该组织“推动新闻创新”和“培育新闻叙事的新方法”两大目标的推进和落实。故2012年第一次评选该奖便设立了3个类别,分别是“调查性数据新闻”(Data-driven investigative journalism),“数据可视化和数据叙事”(Data visualization & storytelling),“数据驱动应用”。其中的第二个类别于2013年直接改为“数据叙事”(Data storytelling)。但确如“曾文”所说,2014年起又做了调整,其中2014年第二类别改为“新闻数据可视化”(Journalistic data visualization);2015年起三个类别全部改为“年度奖”,分别为“年度调查新闻”(Investigation of the Year),“年度数据可视化”(Data Visualization of the Year),“年度数据新闻应用”(News Data App of the Year)。

由此看来,2014年之后各类别中确实未再出现storytelling,但是否这就意味着GEN的评奖不再重视新闻叙事甚至完全去叙事化?显然不是。

新闻奖项名称的设立大都有一个由不成熟走向成熟和更加向业界实际靠拢的过程,其中一个重要特征就是从早期过于重视细节表现到后来更加重视整体素质。以普利策新闻奖为例,在其100多年的评奖史上,名称和类别的设置一直在变化。其创立之初只设2个奖项,后来逐渐增多,但有些奖项因过于注重具体形式而实行多年后又被放弃,如二战期间增设的国际、国内两个“电讯报道奖”(Telegraphic Reporting)于1948年被取消;“特别报道奖”(Special Reporting)实行近30年后也被取消;1991年增设的“专题报道奖”(Beat Reporting)也于2007年被取消。近年虽然有多个数据新闻获奖,但普利策评委会接受过去教训,并未因此而设立数据报道奖。“曾文”所引用的GEN“数据新闻奖”名称的变化也符合这一逻辑。该奖从2015年起将早期“数据驱动”“数据叙事”等冗余字眼逐一去除,改为“调查报道”“数据可视化”“数据新闻应用”三个“年度奖”,但这并不能证明该奖项不再提倡“讲述故事”了(应用软件类别除外)。就像更名后的“年度调查报道奖”中不再含有“data”,并不意味着这个类别不是数据新闻一样。何况,调查报道哪怕是数据新闻,离开新闻叙事的案例迄今并未见过。即便是“可视化”类别,这方面的视觉叙事研究也已有很多论文发表,恕不赘述。事实上,GEN“数据新闻奖”的奖项设置仍在变化中,2019年笔者就发现增加了“突发新闻(首36小时内)最佳数据运用奖”(Best use of data in a breaking news story, within first 36 hours),并且列在第二项,仅次于“年度调查报道奖”。

“曾文”紧接上文又提到GEN“有一条”“值得参考”的“解释”,称“实际上未有用数据成功讲述故事的数据新闻”,以此作为去叙事化的进一步论据。笔者根据文末链接查到了这条上传于2015年6月29日的寥寥仅6行字的贴文(不是什么官方解释),并未发现“曾文”所引内容。再点击贴文后的“Read more here”,链接到一篇题为《他们如此做数据》(They do data viz-Kiln.it)的文章,发表于2015年6月9日的“视觉圈” 网站(visualoop.com)。文章较长,中间一段引语果然有相关字眼,可惜“曾文”把意思弄错了,原意恰恰是相反的:其一,该文以及链接前的贴文,并不是“针对这一取消”做的解释,全文无一字提到数据新闻奖项的设置及其改变。坚称其是对奖项名称变化的解释,不知根据何来?其二,引文所在段落表达的意思恰好与“曾文”的引述目的相反,其强调的是:即便是数据新闻的可视化方面,也应重视新闻叙事。换句话说,这一“证据”恰恰对“曾文”的观点起到了反证或证伪的作用。

这篇文章是为一个关于数据设计的新栏目(klin.it)而写的,文中提到某数据新闻工作室的两位创始人邓肯·克拉克(Duncan Clarke,曾在《卫报》做过数据新闻)和罗宾·休斯敦(Robin Houston)。“曾文”引用的那句话就出现在该文对克拉克关于该专栏的介绍文字中的第一个段落。原文及翻译如下(划线部分是主要误读之处):

“Kiln got up and running a few years ago as a partnership between myself (with a storytelling background in data journalism and books) and Robin Houston (with a technical background in web development and computer science). Our thinking at the time was that lots of people were doing good data journalism and lots were making fancy interactives, but few were making engaging interactive content that succeeded in actually telling a story with data.”

“Kiln(指工作室创办的数据新闻网站——译注)是数年前我(具有数据新闻和著述的叙事背景)和罗宾·休斯敦(具有网络开发和计算科学的技术背景)合作创办并成长起来的。我们当时考虑的是,有很多人在做非常好的数据新闻,也有很多人在制作有趣的互动,但却很少有人通过成功地进行真正的数据新闻叙事来制作能产生黏性的互动内容。”

上文划线部分就是“曾文”所引部分,只不过文章有意或无意略去了转折词“but”,从而将其变成一句脱离上下语境的独立确认句,进而改变了原文的本意。从上下文语境不难看出,克拉克作为擅长数据新闻叙事的专家与擅长技术的休斯敦合作创办这个网站的目的,就是想令当时疏于真正用数据叙事生产互动内容的状态有所改变。根据该文,Kiln是数据设计网站,其使命是“推介优质信息图(infographic)设计及其背后的设计师们”。因此,克拉克并未在“叙事”方面多着笔墨,但在后面总结句中提到:“我们总是起始于令数据更加清晰和挖掘其中的有趣内涵,而非只制作看上去花哨而对受众来说毫无意义的图表。”挖掘数据的意义并进行可视化呈现,正是诸多关于视觉叙事的论文都一再确认的关键点。

(二)希尔的言论引用不确且与被引文献作者的观点相悖

这是“曾文”就去叙事化给出的第二大证据,文末注释给的链接是2014年4月28日《中国社会科学报》的一篇刊于国际资讯版的新闻,题为《仅靠“数字”能否讲好新闻故事?》。笔者从中国社会科学网发现,这篇标注来源为《中国社会科学报》的文章发表于4月25日而非28日,而全国哲学社会科学工作办公室官网转发的时间才是4月28日。比对后,多渠道文章内容完全一致,只是哲社办网站有些差错。细阅1700字全文,并未见到“曾文”所引的“数据新闻网站‘358’(FiveThirtyEight)创办者奈特·希尔(Nate Silver)指出,他的团队所生产的数据新闻是没有叙述体的新闻,甚至是与叙事体新闻完全对立的新闻”。

《中国社会科学报》文章与“曾文”所引相关的内容有两处:一是第三自然段末句“希尔和他的团队试图‘生产’没有叙述体的纯粹数字新闻”(请注意“试图生产”与“所生产的”两者区别);二是第六自然段中“希尔坚持他的数字新闻因客观而不存在偏见,不需要叙述也可以讲故事。他认为,且不论叙述新闻是否揭开了很多真相,它的确能够让读者增进知识、提升阅读享受,有一定的内在价值。但是,叙述新闻作者如果不将逸闻趣事改成数字,必然很难客观地概括和描述最重要的细节”。“曾文”中“甚至是与叙事体新闻完全对立的新闻”,不知来自何方?

《中国社会科学报》这篇新闻报道有个主要来源,即《哥伦比亚新闻评论》一篇题为《数字新闻陷阱》(The pitfalls of data journalism)(可惜笔者按此英文未能查找到原文)。文章称,“他(希尔)充满信心地指出,‘538’的目标之一就是在不牺牲严谨性和准确性的前提下,让数字新闻生动且平易近人,更加吸引读者。”而原文作者及文中多位专家对希尔的去叙事化观点并不赞同,称“无论数字的功能多么强大,它(数据)也仅仅是一种工具,是新闻叙述的一部分,而非故事本身”。

由上可知,“曾文”的第二大证据与原文也有很大出入,且原文主要观点是赞成数据新闻的叙事功能的,并不足以支撑去叙事化观点。

(三)哈罗瓦提不是数据新闻概念创始人,所引观点也不确

“曾文”这一“证据”转引自陈昌凤教授《数据新闻及其结构化:构建图式信息》一文,文中确实引述了EveryBlock创办人阿德里安·哈罗瓦提的一句话(非直接引语):报纸需要抛开以故事为中心的观念。从陈昌凤文后的注释查到哈罗瓦提的原文,是关于报纸网站改进的一篇推文,题为《报纸网站所需要的根本变革》(A fundamental way newspaper sites need to change,这里借用陈文翻译)。对此也需要加以分析。

首先,“曾文”之所以将这句话作为重要证据,是因为其认定哈罗瓦提是“‘数据新闻’理念的提出者”,但这与事实不符。如本文前面所述,数据新闻经历了精确新闻、计算机辅助新闻(CAR)、数据驱动新闻(DDJ)、计算新闻(CJ)、数据新闻(DJ)等多个概念的过渡,且迄今“数据新闻”“数据驱动新闻”“计算新闻”这三个概念还仍然并存共用,指向的都是同一个意思,如美国哥伦比亚大学新闻学院等高校已开设计算新闻学(Computational Journalism)(注意不是计算传播学)多年。但上述概念以及这一学科的名称无一来自哈罗瓦提,尽管1981年出生的他在新闻创新上有所建树,其因将谷歌地图与芝加哥警方数据结合于2005年创立芝加哥刑事网站chicagocrime.org而崭露头角,2007年创办提供“微局部”(microlocal)新闻的网站EveryBlock。因此,说他是“‘数据新闻’理念的提出者”是缺乏依据的。

其次,哈罗瓦提在这篇推文中所反对的是传统报纸“以故事为中心”的写作习惯,而主张的是在这个数字时代要重视新闻事件的“结构化信息”(structured information)。他解释说,所谓“结构化信息”就是可以通过计算机用一种自动的方式,将信息切块、分层,以便“再利用”(repurpose)的信息。他不厌其烦地列举从火灾、讣闻、婚礼到大学毕业典礼、国会议程等新闻,证明其中的信息都可以结构化。显然,哈罗瓦提反对“以故事为中心”是为了倡导新的信息处理方式,而并不否认最终通过叙事完成新闻报道。所以他在文末特别强调:“需要重点说明的是,我并没有从一个极端走向另一个极端(making an all-or nothing proposition);我也没有说报纸应当完全放弃新闻文章的形式(format of a news article)。新闻文章在讲述故事、分析复杂议题以及其他诸多事务中‘居功至伟’(great,原文特别用了斜体字)。……当我说‘报纸需要抛开以故事为中心的世界观’时,我并不是指‘报纸应当废除故事’。两种形式的信息传播是可以共存和互补的。”

由此可见,将哈罗瓦提的话作为证据也是十分勉强的,有对陈昌凤论文所引内容望文生义之嫌,哈罗瓦提的原意并不反对新闻叙事。

四、对事实的调查认定不等于“科研论证”或科研“结论”

“曾文”第二部分,从数据新闻的“目的与功能”、“方式与方法”、“写作模式”三个方面,论证数据新闻的科研属性,认为数据新闻“是应用性较强的社会调查研究报告”;“数据新闻作为一种新闻论证,是一种社会科学研究的论证”。这就涉及到数据新闻的报道属性,即数据新闻获取事实、寻求真相并给予描述和解释的过程,是否已经脱离了新闻报道的既有逻辑而演变成为一种“科研论证”?从文章所给的大多数论据和相应的逻辑推理,似并不能得出肯定性回答,也难以推导出上述结论。

“曾文”首先用举例法,将数据新闻划分为四种类型,以证明其具有“社会科学研究目的与功能”。如第一类是“整体-呈现型,即对某个事件或问题、某个方面在某个时间段的整体情况进行社会调查与数据搜集、整理,并图表化呈现”。文章说:“有些数据新闻,它们的标题便显示其目的是为了呈现整体状况。”在简单列举《解读骚乱》《美国各州工资梯度》《每条道路上的每例死亡》等例子(未对例子进行解释或分析)后,文章即总结说,“在整体呈现的基础上,这一类型的数据新闻或直接告知有关整体的事实性结论,或结论尽在不言中。”但笔者很难看出,为何对事件进行整体呈现,新闻的目的和功能就变性为社会科学研究呢?很多新闻报道难道不都是对事件进行“整体呈现”吗?

第二类是“问题-分析型”。文章将此分为“两小类”,即“问题-调查-分析-结论型”和“质疑观点-调查-分析-证实/证否看法-结论型”,并列举了《阿根廷的公车补贴》《被夺走的家园》《骚乱谣言》等例子。这里同样看不出其与一般的调查报道的类型有何区别,只不过将调查报道最后的真相揭示更换为学术话语——“结论”罢了。第三类是“已然-预测型”,“即在调查研究的基础上,归纳过去和现在的情况与规律,运用科学方法去推测事物将来或在别处的发展趋势”。文章列举了《二氧化碳的过去、现在和未来》《如果叙利亚内战发生在你的国家会怎样?》两个例子。这与引入计算机方法的各类解释性报道并无区别,难以和科学研究挂钩。第四类是“模型-定制型”,其实说的是数据新闻最引人入胜的一个特点:与受众互动。如文中列举的《你最适合哪种运动?》《英国阶层计算器:你属于哪个阶层?》两例,这就更难与科研论证挂钩了。而且,以上四例有些不是严格意义上的新闻,如《二氧化碳的过去、现在和未来》《你最适合哪种运动?》都应归入科普文章。

因此,上述类型的划分并不能证明数据新闻具有“曾文”所说的“社会科学研究的描述、解释、应用三大目的与功能”。其中,描述和解释是深度报道普遍采用的手段,其并不以获得科研结论为目的;“曾文”所指的“应用”则是指与受众互动或受众参与新闻,这和科研成果的应用也是两码事。

关于“方式与方法”,“曾文”认为,“数据新闻为追寻事实性结论,主要采用了调查研究、实地研究和文献研究等3种方式”,因而这属于“社会科学研究方式与方法”。这大体上是不错的,因为20世纪“西方新闻报道方式”的“重大变革”之一,就是“精确新闻学的发展与壮大”及迈耶提出的“新闻应运用社会和人文科学的方法和手段来采集和加工新闻信息,……以提高新闻报道的准确性与客观性”(吴飞,1999)。如今包括抽样、问卷、数据分析在内的社科方法已广泛应用于各类深度报道,当然也包括数据新闻。但这些都是辅助手段,是为获取事实和真相服务的。不能因为套用了“调查研究”“实地研究”“文献研究”“事实性结论”等“研究” 字眼,就改变了数据新闻的报道逻辑和功能属性。同样,新闻报道中沿用已久的采访、观察等手段,也无需如“曾文”那样去套用“观察法”“访问法”等学术概念。

关于“写作模式”,“曾文”认为:数据新闻“事实上是一种基于社会调查的应用性而非学术性的研究报告”。文中列举《埃博拉比其他疾病传播更慢,但杀死了更多人》《全球药品获取情况》《解读骚乱》三例,并从中挑出一些学术性话语以证明数据新闻的属性是“研究报告”。第一例未标出处,也无英文标题,经按主题词查询,应是《华盛顿邮报》发表于2014年10月14日的Ebola spreads slower, kills more than other diseases。通读全文,这就是一篇典型的数据新闻调查报道,有大量文字叙述,并插有图表等可视化数据图,原始数据主要来自世界卫生组织(WHO)和一些被采访的计算流行病学专家(mathematical epidemiologists)。文中也没有什么学术性话语,所谓的“结论”都是记者采访专家而非自己研究得来,其“写作模式”就是通常的新闻报道,而非“研究报告”。这个案例显然不能对“曾文”的观点提供任何支持。

再看第二例,这虽是国际健康机构CIVEO的一个开放性健康传播项目(机构为该项目专门设立了一个网站),却是按照新闻的方式来发布的。该项目的主标题很笼统,只是关于“医药”的一个主题词:MEDICAMENTALIA。副标题才是实题:《关于全球健康服务鸿沟的新闻调查》(Journalistic investigation on the gap in global access to health),这就从体裁上确定了这是一篇新闻而非研究报告。文章篇幅庞大,共分五大部分(不是曾文所说的三大部分),每部分都由不同作者完成(因而在体裁上略有差异)。其中,第一部分是对世界各地妇女(来自11个国家)关于避孕药使用壁垒、副作用等的视频采访,让她们讲述自己这方面的经历和故事,和普通视频新闻无异;其余部分既有大量图表,也有大量叙事性文字,包括故事性叙述。每部分结束时,都出现Did you like this story?(下有说明文字,如果喜欢可以Join us), 然后是NEXT STORY。Story的一再出现,也表明这个写作模式是新闻而非研究报告。

第三例《解读骚乱》才勉强算得上是“研究报告”,因为由《卫报》和伦敦经济学院(London School of Economics)在一些基金会资助下合作完成的这一关于2011年8月英国大骚乱的项目,尽管副标题是“英格兰乱夏调查”(Investigation England’s summer of disorder),但确实在绪言中被冠以study字样,且申明内容由“报道、调查和数据分析”(Reporting, research and data analysis)三部分融合而成。但这种“研究报告”并不能被视为典型的数据新闻,因为从目前所见大多数数据新闻,包括所有普利策获奖或提名的数据新闻,都未采用“研究报告”的“写作模式”。何况《解读骚乱》在导言中称该项目“受到1967年底特律骚乱报道的启发”(即迈耶参与报道并获普利策奖的那组新闻),而那次时效性很强的系列报道显然不能算是研究报告。

可见上述三个例证也不能说明数据新闻的“写作模式”已经演化为研究报告。

五、是“事实呈现”而非“新闻论证”

“新闻论证”是“曾文”从标题到内文各部分反复出现的重要概念。例如第一部分的标题“数据新闻:意在论证而非叙事”,第二部分说“精确新闻诞生之初就非新闻叙事,而是新闻论证”,第三部分标题“数据新闻的扫描特征:新闻论证的科学性保障”等。可见,“新闻论证”是“曾文”对数据新闻进行去叙事化和“研究报告”属性确认的基础。

从事新闻工作的编辑记者或研究、讲授新闻实务的老师大都知道,“新闻论证”本是新闻评论里的一个简约说法,指的是“新闻评论的论证”,其本身并不是一个公认的概念。而新闻评论里的论证,是指主要以新闻事实为论据,通过演绎、归纳、类比等逻辑方法证明意见或观点的过程。新闻评论有时也对新闻事实本身(通常是较为复杂的事实)进行分析,“最终得出一个关于这个新闻事实的具体的判断”。近年也有人将“新闻论证”的概念引入新闻报道过程,但目的是强化新闻报道、特别是较为复杂的长篇深度报道的行文逻辑,或者说是强化“用事实说话”的逻辑,不能等同于社科研究中的论证。

而“曾文”认为:“新闻论证是针对公众关心的社会问题、现象、事件,在事实材料的基础上进行归纳、演绎等逻辑推理而得出事实性的新结论。”这一判断未交代出处,看来是作者自己的观点,但与业界实际和新闻教学中的概念相去甚远。新闻报道毕竟以呈现事实、揭示真相为目的,而真相永远只能是新闻事实,这些事实是不能通过逻辑论证的方式推导出来的。就像马航MH370航班失踪多年后,有行家用各种方法(包括计算机技术)详细梳理所有已知事实和信息,推导出飞机可能一直向南飞,直至燃油耗尽坠入大海一样,虽显得有根有据,看似合情合理,但没有人相信这就是最后的事实真相。

诚如“曾文”所言,新闻中的事实有“显性”与“隐性”之分。对于难以唾手可得的隐性事实,有些需要记者通过深入挖掘、艰苦调查、长期观察去还原和获取。这一过程会用到包括统计学在内的某些社会科学研究方法,但这些方法是为追寻真相服务的,不是论证。进入数字时代,报道方法得到了拓展,隶属于自然科学的信息技术、计算科学技术、遥感技术等也被引入,但本质上并未改变新闻报道追寻事实真相的运作逻辑。例如,好莱坞影片《廊桥遗梦》1995年被引进中国后不久,《北京青年报》针对首都电影院4场电影约2000名观众做过问卷调查,发放问卷800份,回收有效问卷465份,随后发表《<廊桥遗梦>,北京人看到了什么?》,这后来被作为“精确新闻”的案例加以总结。如果是现在,则完全可以用大数据的方式,通过抓取社交媒体等网上观影评论对北京全市乃至全国观众对这部影片的感受进行统计分析,相信会得出比北青报更加客观和真实的事实。但这样完成的新闻也不能算是“新闻论证”。反过来,“曾文”在这部分列举《拒绝伤害》为例,说作者“通过分析超过29万条医院记录得出结论:不少损伤、传染和手术医疗事故是完全可避免的”,这在本质上与数字时代之前记者通过局部调查寻求类似结论的逻辑并无区别。

所以,“曾文”虽然在这部分用了“扫描式采集”“扫描式分析”“扫描式呈现”“扫描式解读”四个有点学术化的概念,仍无法改变绝大多数数据新闻的新闻属性,更难以证明数据新闻是“新闻论证”而非新闻报道。

六、结语

数据新闻本质上是一种由媒体组织实施的新闻实践,是在现代信息技术武装下的新型报道方式。数据新闻又是一个较大的概念,其包含了一般数据新闻(央视新闻联播含有H5制作的经济变化数据的新闻以及各报“读数”等数据新闻版上的新闻,可归入此类)、互动式数据新闻和大数据新闻。它们既可以线上呈现,也可以线下发表。大数据新闻自10年前《卫报》开展常规化运作以来,随着信息技术的不断更迭和媒体经验的积累,呈现出更加丰富、更加深入、更加抽象、更易接近真相、更具预测性等趋势。大数据作为《连线》主编克里斯·安德森(Chris Anderson)所说的一种“认识世界的全新方法”,也“颠覆了传统的新闻调查模式”,甚至“大数据本身正在成为新闻”。但是,数据新闻的新闻属性没有改变,其报道逻辑也没有因此变身为一种“新闻论证”。

新闻体裁中有一种样式叫“新闻调查”,是深度调查报道的一种说法,常作为副标题出现,有时也被视为一种“调查报告”。这种样式在大数据新闻出现之前就早已有之,中国将之归类为通讯。如6年前笔者组织一组毕业班学生完成的大型专题新闻《深圳涉外婚姻三十年》(已由人大出版社出版),其作为有4.3万字篇幅、含有大量图片和图表、运用了一定的社科研究方法的新闻毕设作品,也有人称之为“调查报告”。但这和“曾文”所说的“从属于社会科学研究的”“研究报告”显然不是一回事。采用数据技术和信息技术完成的新闻调查,会令记者发现传统方式难以获得的更隐性、更宏观、更抽象、也可能是更接近真相的事实。这种数据新闻,哪怕类同调查报告,仍从属于新闻报道,而非“应用性”“社会科学研究”。

数据新闻与其他新闻品种一样,负有对可疑事实、社会传言、主观判断进行验证的职责。但验证的手段,只能用更可靠的事实(包括专家的研究结论)去证实或证伪。验证的过程,也是通过各种可行方法对可靠事实或新事实的挖掘和追寻的过程。前述《华盛顿邮报》获普利策奖的《致命枪击》就是一例,其用大数据获得的全面事实,证实了长期以来人们对美国有色人种比白人更容易成为警察枪击牺牲品的判断。曾6次获得普利策奖、以大数据新闻著称的美国原创数字新闻媒体ProPublica的数据新闻《有色的债务》(The Color of Debt)也是一例。

以大数据为特征的新型数据新闻,是数字时代新闻报道方式的最大进步之一,值得认真研究。“曾文”从崭新的视角切入,强化了对其社科方法和学术特色等方面的研究,这无疑有助于我们更好地认知数据新闻。但如果淡化甚至抹杀数据新闻的新闻属性和新闻特征,将其从新闻叙事的一般概念中剥离,定性为“一种社会科学研究的论证”,将“新闻论证”引入数据新闻实践,赞成用逻辑推导的方式获取事实真相,则有可能对数据新闻的媒体实践、未来发展和新闻教学产生误导。这是笔者不厌其烦、不揣浅陋提出讨论的主要原因。谬误之处,还望曾庆香教授等作者及同行们批评指正!