恕我直言,现在的论文查重让人很不爽

最近,李兆申院士大概是国内学界最红的名字了。

上月底,一位自称是医疗工作者的网友在多个网络平台爆料中国工程院院士李兆申教授涉嫌论文抄袭。

这位网友所给出的证据是知网的查重报告:李院士的两篇文章总文字复制比分别达58.4%和62.9%,被其定性为「剽窃观点」和「疑似剽窃文字表述」。

图片来源:新华网

这已经不是查重系统第一次「C位出道」了,更早的5月份,因为今年难到近乎变态的毕业论文查重规则,众多毕业生把翟博士骂上热搜也是轰动一时。

天下苦查重久矣。此次李院士事件,有很多人不约而同地表示了对查重系统的质疑,仅仅一个查重真的有资格定性抄袭吗?

论文查重的原理

要弄明白这个问题,我们有必要先了解论文查重如何查。

以目前国内高校和学术杂志出版社应用最多的知网检测为例。

图片来源:cnki

首先需要有一个检测数据库支撑,知网的检测数据库基于其收录数据库。由于知网掌握的论文和期刊收录数据库在国内属于一家独大的局面,收录范围涵盖国内绝大多数中文期刊和几乎所有硕博论文,对优秀本科毕业论文也进行收录。所以,相比于其他数据库而言,知网的检测数据库更大,更新也更及时。

从重复判定的标准来看,知网的查重是以连续十三个字符是否重复为指标,并且判定时以句子为单位。也就是说,如果一句话中有超过连续十三个字符重复的句子,则整句话都被判定为重复。

很多人都知道,知网论文查重有很多种,包括本专科、硕博、小分解、大分解和期刊论文查重系统等。不同的系统,调用的检测数据库不同。但相同的是,这些检测一般都以文章章节为单位进行查重。如果是对期刊论文查重,由于论文篇幅较小,则不分章节,整篇查重。

图片来源:cnki

总之,重复率的计算方式很简单,就是涉及到重复的句子的总字数除以文章总字数。

低查重率=优质论文?

在了解完论文查重的原理后,我们会发现,整套检测,还是有非常多的空子可钻。

这些空子,在多数时候也是降低重复率的方法。比如原文中说「我肚子疼」,而另一个人写「我的左上腹部有痛感」,两种表达意思区别不大,但几乎所有查重检测都不会判定为重复。

还有,知网判定标准为13字符以上重复,那是不是理论上来说,如果一个人的论文全都用少于13字符的短句写成,重复率就是零了。

可见,重复率本身是个可操作的指标。正因如此,也衍生出一系列论文降重的灰色产业。所以,重复率低,不代表论文为原创。

图片来源:淘宝截图

抛开钻查重检测的空子降低重复率不谈,即使是正常学术研究,也会出现重复率很高的现象。伦理学研究中喜欢讨论虚拟案例,在今天有关抄袭或者作假的学术伦理讨论中,咱们也不妨假设这样一个虚拟案例:

一个学者通过50步的合成,搞定了一个化合物。前40步,都与某论文中的报道一致,只不过那篇论文做到第40步之后就再也做不下去。虽然往下只做10步反应,但成功合成了该化合物,是发表论文的关键工作。

如果只看工作量的原创比例,这篇论文肯定不会太高。但这篇论文,在第40步的起点上,完成了前作者无法完成的工作。水平之高是毋容置疑的。

当然了,作者可以直接以第40步产物为起点,而不必表述前面的工作,仅给出参考文献即可。目前学界主流的做法也确实如此,这样操作确实可以有效地降低重复率。

但并不是所有时候都有好的降重方法。

今年笔者参与推优的一篇本科论文,实验扎实,数据翔实,结论可信。然而在最终定稿的版本中,实验仪器和材料的部分竟然弄成图片,打印出来非常难看。一问之下,学生说是为了降低重复率。最后也只能继续用图片。

可见,重复率低,也未必代表论文质量高。

令人怨声载道的重复系统有意义吗?

面对越来越多的抱怨和尴尬,很多人不禁要问:到底查重还有意义吗?

客观的说,意义肯定是有的,而且很重大。其实,现在接二连三不断爆出的论文涉嫌抄袭的新闻,恰是从一个侧面验证了论文查重的意义。查重提高了论文抄袭的成本,从一定程度上有效遏制了这类行为的大规模发生,为学术界带来一点希望。

而且,有量化指标,总比没有量化指标好。最起码的,围绕毕业论文的重复率要求,高校学风建设得到了加强,学生对学术规范的认识也有了具体的提高,导师们也普遍更重视学术道德——不然,抄袭的是学生,丢人的可是导师啊。

但是凡事过犹不及。过分强调重复率不可取,不分专业地一刀切划定重复率标准更不可取。这是高校在应对量化指标时候的一种懒政表现,粗暴的将压力转嫁到学生和老师身上。

图片来源:turnitin中文







































盖百霖遮盖液
治白癜风天津哪家医院好


转载请注明:http://www.shijichaoguyj.com/wxjq/5242.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: