别让“学术不端”成“学术不公”_论文查重动态_早检测论文检测平台

别让“学术不端”成“学术不公”

2014-03-21
编辑整理：早检测网
标签： paperpass paperpass论文检测万方检测万方论文检测论文查重论文检测论文检测系统论文检测网站

学术不端事件近些年越来越多地出现在学术期刊的出版中，如何杜绝和防止这种现象的不断出现，成为学术期刊编辑需要重视的问题。本文结合期刊界近些年使用比较普遍的学术不端检测系统——知网检测系统的使用情况，对其中常常出现的失真情况进行了一一分析和探讨，以期对我们在实际应用中，更好地把握和判断学术不端起到一个很好的提示和促进作用。

学术不端（学术抄袭和学术造假）是一个相当复杂的社会问题。近年来，从职称评选材料之小论文大到国家基金课题，从普通学生到高端的科研者，学术不端的事例也层出不穷，参与者越来越多，涉及领域越来越广。反对学术不端的呼声也越来越高，学术不端已严重影响到一个国家的学术信誉和学术发展。

针对学术不端现象，国家和各有关单位也在积极开展反学术不端行动，研制出多种学术不端检测软件。这其中，最主要的是武汉大学的ROST反剽窃系统（文档相似性检测）、中国知网学术不端行为检测系统、万方数据库检测系统、PaperPass论文通行证等等。其中，使用最为广泛的是中国知网学术不端检测系统。该系统分TMLC（学位论文学术不端行为检测系统）、AMLC（科技期刊学术不端检测系统）、SMLC（社科期刊学术不端检测系统）、学术不端文献检测系统VIP、英文检测系统、中英文对照检测系统、PMLC（大学生论文抄袭检测系统）和中学生作文检测系统等等。

知网检测系统使用的相关概念主要有：对比范围、重合字数、文字复制比、单源复制、多源复制、前部重合度、后部重合度、段落抄袭、整体抄袭等。该系统对被检测文章有如下检测结果：没有问题的，就显示为“绿色”；整个文章引用别的文章的原文内容“大于1000字或小于全部字数的40%”，整个文档被诊断为“黄色”，即“轻度抄袭”；如果比对的文字重合大于5000字或占总字数的40% ～ 50%，就会被标为“橙色”；重合大于10000字或在50%以上，就会被标为“红色”，那就属于“重度抄袭”了。这些标准也被各大期刊社所采用。

尽管学术不端检测软件在防止学术不端方面发挥了良好的作用，也取得了不俗的效果，但是，检测毕竟是通过机器完成，而且，这款检测软件是建立在中国知网的数据库上（其数据主要来自收录的期刊、报纸、会议、工具书、年鉴、专利标准和博硕论文），笔者在多年使用该软件的过程中，就发现有如下问题会导致检测失真，影响了检测者的使用效果。现对这些问题进行讨论，以期能引起共识，帮助使用者更好、更有效地运用检测软件。

1. 课题成员内部互抄

一般来说，每一个科研课题组有很多成员参与同一个课题，结题时要求成果发表，就会在其论文中出现对课题内容的重复书写和表述。这样，当各子课题负责人通过不同途径、不同时间发表其成果时，不同期刊对投稿论文进行系统检测时，会出现互抄的现象。对于此类情况，不能简单地鉴定其为“学术不端”，编辑须认真对待，仔细甄别。

2. 数据库数据的有限性

众所周知，知网数据库数据主要来自收录的期刊、报纸、会议、工具书等，检测系统数据库以外的文献或网络文献并没有被收录完整。笔者作为学术期刊编辑，经常碰到检测文章一路绿灯，然而，通过百度或者其他搜索引擎搜索时，会发现网络上出现雷同文章，而此文章常见于博客、空间或者其他网络终端。另外，很多核心期刊和优秀期刊也是各大期刊网争夺的资源，而期刊网也希望这些期刊对其唯一授权入库，导致知网不能收录齐全这些核心期刊和优秀期刊，而这些文献却是争相抄袭的对象，所以知网的检测系统依然无法查询出此类文献。数据库的有限性和完善的滞后性使得部分抄袭的文章钻了检测系统的“空子”。

3. 数据库的时效性欠缺

为确保论文能及时发表，很多作者喜欢一稿多投（当然各大期刊都反对一稿多投），如果被抄袭的文献没有及时公开发表却在“准出版公开”状态，及时刊登的而没有及时被知网数据库收录，抄袭往往就不能被系统检测发现。知网数据收录工作量非常之大，很多文献都是在公开发表后两个月内在数据库才能查询到，或者更长时间。另外，很多“文抄公”也很“聪明”地利用这一点，打个时间差，投稿成功。

4. 数据库的语言限制

目前，知网数据库主要针对中文，在所有数据库的数据来源上，文字体现都是中文。如果一些作者抄袭知网数据库的中文论文来完成自己的文章，那么很容易被检测到有抄袭行为，但如果只是把外文的文章翻译过来，投稿期刊，往往可以经过系统的检测，导致期刊编辑难以得到准确的信息，造成学术不公。

5. 智力性因素限制

检测的指标主要数据依据是文字复制比，主要描述文献重合文字所占比例的大小程度，从客观来讲，并不能指该文献的抄袭严重程度，必须人机结合才能做出精确的判断。有时，我们编辑部经常发现，有些文章经过专家审定，虽然检测的文章为橙色，但是由专家全文认真审核后发现，两篇文章指示工具和引文上虽然重复，而研究方法和结果是不同的。有时，工科类文章，是一个作者的同一系列文章，只是用同一样本进行不同的研究或者研究有交叉、重复的内容仅仅是对象和方法，而得出的结果是不相同的。这种情况下，并不能视为真正意义上的抄袭。

6. 收录期刊标准化问题

在参考知网检测系统评价标准的基础上，对于引用、复制、抄袭的界定，不同期刊均会设计不同的标准，有一套自己严格的规定。笔者所在的期刊编辑部对录用稿件的引用标准限定在15%以内。据笔者所知，各大期刊设定标准差异悬殊，有些期刊引用标准设定可以超越30%，有些期刊却仅低于5%。这就致使投稿不同的期刊，收录情况不一，导致作者投稿困惑。

7. 转抄数据失真问题

当前网络信息的迅速发展，使得利用检测系统查学术不端行为受到了一定的限制。检测系统只能查被收录的已经发表过的数据，对于未发表过的文章与数据，其不具备检测性。这就致使一部分通过转载与抄袭他人博客、空间与其他网络终端的文章抢先窃取了发表权。当这些博客、空间与其他网络终端的作者再想发表其文章时，检测系统查询结果会显示最先发表抄袭此文的数据，致使转抄数据出现失真的问题。

8. 故意抄袭和临摹仿效的界定问题

检测系统对于涉及相同的部分，都会用红色标注，而对于其抄袭的性质，却无法体现。这其中涉及故意抄袭与临摹仿效，这两种性质的抄袭是需要明确界定的。因为按《中华人民共和国著作权法》的规定，少量的临摹仿效是允许的，引用名言名句、国家政策、法律法规、时事新闻等，只要标注其引用且范围在限定的标准内都是可以的，而故意抄袭属于剽窃，是严重侵犯他人著作权与学术不端的行为，是需要严格限制的。所以在检测系统查出抄袭部分后，我们期刊编辑需要对其标注的部分进行界定，区别其属于故意抄袭还是临摹仿效，针对具体情况提出修改意见。

9. 人机结合问题，专业性和相关创新性成果须专家审核

完全依赖检测系统查抄袭与学术不端，显然其力量是非常单薄的。期刊社须考虑邀请相关的专家，对学术的专业性和相关创新性成果进行审核，达到人机相结合，人脑互用。一是可避免因检测系统的单一性而致使抄袭的文章通过审稿程序被录用，造成学术不端；二是可增加期刊的权威性，使具有专业性与创新性成果的文章得到相关修改意见，得以完善。

10. 检测软件的稳定性和专有性

检测系统似乎不够稳定。很多杂志社编辑反映，检测同一篇文章，在开头加个空格和不加空格，检测出来的数据居然不一样。这就需要检测系统设计人员对软件进一步升级和完善，而使用人员要更加熟练掌握使用技能，使检测软件真正达到使用效果。另外，检测软件要提高性能，防止反检测规避抄袭软件的肆虐。如今，在网络上，反检测规避抄袭风气在传播，网上甚至开始热卖“论文检测系统”，相关人员只要花上几十元至几百元，就可以提前获得检测报告，并得到一定的修改意见，只要按要求进行修改，即使是抄袭的文章也能通过检测。此行为助长了不良学风，值得重视。

归根结底，检测软件不是万能的，它只能起到警示、告诫学术人员遵守学术规范，尽可能地消除论文抄袭，是防止学术不端的一个辅助手段。目前学术界对学术不端行为约束力几乎为零，在其缺乏一个强有力的制度来规范和保障学术的情况下，需要靠传统的道德自律，从思想觉悟与道德境界上规范学术人员，以防止“学术不端”变成“学术不公”。

刘认军

早检测网

菜单导航