打开网易新闻 查看更多图片

今日大舆:本末倒置的论文查重:枷锁之下,乱象丛生

船长观舆:论文查重的种种乱象,源于其目的与手段的本末倒置。

事件词云图

每年临近毕业的时候,对高校学生们来说,最迫在眉睫的问题可能既不是“毕业季分手季”的情感困惑,也不是“毕业即失业”的求职难题,而是毕业论文查重能否通过的问题。不仅学生们焦虑,媒体们往往也将论文查重作为毕业季的一个热门话题:

打开网易新闻 查看更多图片

近年媒体有关“论文查重”部分报道截图

十来年前,国内高校就已经陆续使用“学术不端文献检测系统”(查重系统),这早就不是什么新鲜事。尤其自2019年某翟姓明星论文造假事件曝光后,各大高校对论文查重率的要求日趋严格。让人诧异的是,即便这样,论文抄袭等等学术不端行为也未曾消失:

中国青年网报道截图

不仅如此,据今年3月的一份调研报告显示,由于查重系统存在,有70%的学生自述花在本科毕业论文“降重”上的时间占完成整篇论文总耗时的一半;花时间不说,金钱上也是一大笔支出——在不同系统上查重,价格可能从几百到几千不等,论文查重、降重成了暴利产业

上海热线报道截图

船长认为,种种乱象意味着,作为预防和制裁学术不端行为的重要辅助手段之一的“查重”,越来越呈现出本末倒置的情况,并且导致论文写作已陷入怪圈之中。

01 本末

说“查重”是“本末倒置”,船长觉得首先面对的问题就是什么是“本”,什么是“末”。查重的首要目的是为了反学术不端行为,尤其是反抄袭,这是查重登上历史舞台的“本”之所在。

学位论文、学术论文的抄袭不是什么秘密现象,《中国青年报》2013年曾报道,据武汉大学副教授沈阳披露,用反剽窃软件查询2007年的论文样本数据中,72%的文章是全文抄袭,24%的论文为部分抄袭,只有4%的文章不存在抄袭

故此,正是为了遏制学术不端的行为,查重承担起了相应的检测任务并取得了相当成效。2009年Z大副教授贺某某被曝剽窃论文9篇;同年,XN交大副校长黄某涉嫌论文抄袭被取消博士学位;2010年,J大学教师刘某、钟某因论文抄袭被大量撤稿;2018年,N大教授梁某被调离教学科研岗位……这些学术不端行为的曝光离不开查重系统的应用。

打开网易新闻 查看更多图片

但查重本身只是手段而不是目的。其标准和结论只提供了度量学术不端行为的参考权值,且由于数据库的有限性、文字对比的机械性、信息的滞后性等种种问题,查重不能作为判断论文抄袭的绝对唯一依据,因而这种手段是“末”,仅能作为评判学术不端行为的辅助之一。

这是一个老生常谈的道理:论文的重复率和其原创性、创新性不是强相关关系。一篇论文重复率高,不代表它就没有原创性的观点;反过来,论文重复率低,也不意味着它就达到了多么创新的程度。

然而随着查重系统在学术领域的普及,其作用变得越来越绝对化。许多高校过度依赖查重结果来判定是否存在抄袭,开始唯查重率是从,划条线一刀切,从30%到15%,甚至有学校要求查重率不超过10%,比某些权威、核心期刊还要严苛。船长认为,这就是把手段误认为目的,明显的本末倒置。

02 枷锁

如果说查重是悬于学术不端者头上的一柄利剑,一旦被斩中就会产生道德性后果,被断定为学术诚信和学术道德有问题,那它同样也是给论文写作者套上的枷锁,甚至于干涉影响到了正常的论文写作。

“查重”查的是其他文献内容在全文中所占比例的大小,而不是抄袭比例的多少。但仅考虑占比的问题,不能体现不同学科、不同研究、不同层次的论文特点。按照托马斯·库恩(ThomasKuhn)的说法,科学进步一是通过常规科学,二是通过范式革命。能做出后者的终归是少数,大多数学者的研究都属于前者。

常规科学是在以往知识大量累积的基础上,再进行的探索尝试。因此一篇论文中必然有部分内容是对前人研究的引用、述评与综合。像人文社科类的论文多以规范研究为主,依赖各种资料文献;而对自然科学类论文来讲,引用实验数据同样是常态。调研结果也佐证了这一点:在查重时,学位论文中“文献综述”往往是被检测出重复率最高的部分

某博士学位论文部分参考文献

要是将正常的引用也纳入总相似比的范围内,那必然导致写作者在引用时束手束脚。为了降低重复率,学生要么对“资料文本句”进行篡改,要么尽量减少引文,或者干脆用自己的话直接改写,但其能力又不足以支撑用学术性语言完整准确地表述观点,再加之对检出的重复部分随意删改,造成了论文连贯性和逻辑性的缺失,直接影响论文质量。

03 道魔

一般说来,通过查重,论文与比对文献的总相似比越高,存在学术不端的嫌疑就越大。假设在系统中总相似比在20%以下的论文为通过,那在30%以上的论文有抄袭的嫌疑,50%以上的论文则有全篇抄袭的嫌疑。

于是,在手段与目的本末倒置下,在查重率成为红线的枷锁下,怎么使查重率降低,从而获得了更大的通过率,成为了长久不衰的话题。在某知名问答社区中搜索“论文降重”,就会出现热度极高的讨论:

由于技术限制,查重系统大多采取对文字进行机械识别,无法辨明文字承载的思想观点,更不可能断定创新之处;能识别文字,却不能识别图片表格;能查询数据库中文献,却对本身数据库之外的信息无能为力,因而种种应对方案应运而生:

拆分原有段落格式,逐字逐句同义改写,插入空格切断词语,翻译删改外文文献,插入转写图片表格,抄袭引用未录入文献……这都是在网络上广为流传的“论文降重秘籍”,同时也成为了别有用心者可以利用的攻略:既然掌握了查重系统的缺陷,那么对存在抄袭行为的论文进行针对性调整就成为了可能。学术不端者固然通过这些方法来规避查重检测的风险;而认真写作者,囿于大量的必要文献引用,也不得不花费时间对论文进行“改造”。

这不能不说是一种悲哀:学生们不在专业知识和论文构思上下功夫,反而与重复率“斗智斗勇”,让查重与降重演化为了“道高一尺,魔高一丈”的相争游戏。

04 怪圈

很多学生论文因为查重率的原因而被怀疑学术不端,但其未必从一开始就抱有抄袭的目的。更主要的是由于能力所限,学业不精。

一方面,从本科阶段起,许多学生没有经过专业的论文写作训练指导,缺乏论文写作能力和素质,甚至习惯用已有文献随便拼凑文章,以应付作业蒙混过关;另一方面,学习基础不扎实,对本学科的文献阅读以及理论认识不足,没什么创新性或独立思考的内容,只能千篇一律地重复。

也就是说,想从根本上解决论文重复率高的问题,首先要重视的是专业教学质量与学术规范训练。无论学校还是教师对学生都应提供系统的指导训练,让学生独立发现问题,采取合适方法分析问题,通过前人成果和自身所学解决问题。在完成论文的整个过程中,学生巩固了专业知识,促进知识内化,提升自身能力才是关键所在。

但随着查重率被看作是毕业论文能否进入论文答辩的重要门槛,论文写作就此陷入怪圈:

学校将考察重点放在查重率上,过度依赖查重系统的检测结果,忽略了论文写作本身对学生思维逻辑的训练和对学术习惯的培养;

教师为了让学生通过查重,在论文选题、资料查询、研究方法和对象选择等各个环节中把查重率作为首要考虑因素,把论文写作训练变成了查重应对技巧;

学生费尽心思在降重上下功夫,通过各种方法玩弄文字游戏,以通过查重而沾沾自喜,而忘记了对论文本身质量的追求;

这种本末倒置的情况不改变,我们就不难理解为何年年各大媒体都在报道“论文查重乱象”,却未见得这些乱象年年减少。船长觉得,也许若干年后,这些问题会得到解决,但一定有一句话最适合为此时的乱象做注脚:

“那一天,学生们终于回想起了,曾经一度被论文查重支配的恐怖,还有那被囚禁于查重率中的那份耻辱”。