基于“内容重合率”的论文抄袭现象分析
The phenomenon of high coincidence rate and paper plagiarism were illustrated from the author and content, combined with the academic research for professional titles evaluation materials in universities. The mysteries of coincidence rate were unraveled, which provided a reference to avoid high content coincidence rate for the reader.【结合高校职称评审材料学术检索工作,从作者和内容两方面说明了论文高内容重合率的种种现象以及判定为抄袭的各种情况,为读者解开内容重合率神秘的面纱,并为读者在论文写作中避免高内容重合率提供借鉴作用。】
论文抄袭现象已经成为学术界的一个热点话题,受到全世界的关注和重视[1~4], 学术打假活动日渐活跃。作为论文抄袭的检测工具—学术不端文献检测系统(以下简称检测系统), 已经被广泛用于期刊审稿[5~8]、学位论文提交、成果鉴定和职称评审等工作中。2011年, 山东省首次开展了高校职称评审材料学术检索工作[9], 其中的“内容重合率” 指标作为论文抄袭现象的判断依据, 令职称评审工作更显客观和公正。本研究基于本次检索工作的实践, 说明了高内容重合率和论文抄袭的各种情况, 以指导读者在以后的论文研究和写作中避免高内容重合率和论文抄袭现象的发生, 也提出一些难以准确判断是否属于论文抄袭的情况, 供业界继续深入讨论。
论文检测系统介绍
本系统由CNKI 科研诚信管理系统研究中心研发,以《中国学术文献网络出版总库》为全文比对数据库, 可检测抄袭、剽窃、伪造和篡改等学术不端文献。系统检测结果(即内容重合率) 作为论文是否抄袭(即) 的判定依据, 一般来说, 内容重合率高说明存在论文抄袭现象。
高内容重合率现象介绍
论文抄袭是指将他人作品或作品的片段窃为己有发表[10]。因此论文是否属于抄袭, 一般要从论文内容和作者两方面进行综合分析, 以下就从这两方面进行高内容重合率说明。
内容方面
内容方面的高重合率表现为: ①论文直接复制粘贴了其他期刊论文的内容。常常是单篇论文的内容重合率不高, 但多篇论文累加在一起, 内容重合率就很高。甚至有少数论文的大部分内容都能找到与之相匹配的文献, 很少有自己的语言描述, 这属于明显的东抄西凑的现象[11]。②论文被其他刊物转摘, 造成100%的内容重合率。③论文一稿多发现象。常常是首先发表在低质量刊物上, 然后发表在高质量刊物上。这是作者一稿多投、高质量刊物审稿期长或者作者认为论文不能被录用, 就转投低质量刊物的结果。其实这是作者与编辑部博弈的结果, 因此建议核心刊缩短审稿期。④论文主要与作者本人发表的论文内容重合, 这属于论文作者的自我抄袭。有的作者的论文, 直接复制粘贴了自己已发表论文的大部分内容。有的作者竟然整篇论文从题目至全文, 只换了课程名称, 其他的内容几乎没有任何变化, 内容重合率高达90%多。⑤综述性论文, 由于要阐述他人的一些研究结论, 就不可避免要引用他人论文的部分内容, 而且很多作者喜欢直接引用, 造成了高内容重合率。⑥人文社科类论文, 基于对一些理论的阐述, 或者对经典文献的分析与欣赏, 引用了理论或者经典文献中的部分内容, 造成高内容重合率。⑦论文内容主要与硕、博士学位论文内容重合。有的论文与学位论文的内容重合率高达70%, 甚至更高。
作者方面
在职称评审中, 多数作者在提交的论文中署名为第一作者、独立作者、通信作者或者同等贡献作者,因此本研究基于此来进行说明和分析。对于其他类型的作者, 不在讨论范围之内。①作为第一作者或独立作者与其他作者的论文重合。②作为第一作者或独立作者与自己发表的学位论文重合。③作为第一作者主要与论文中的其他作者的论文重合。④作为通信作者主要与论文中第一作者的学位论文重合。⑤作为同等贡献作者与论文中第一作者的论文重合。
论文抄袭现象判断
在职称评审工作中, 对内容重合率主要有以下两种观点和处理办法: ①主张尊重检测系统出具的原始报告, 不作任何处理。至于论文的内容重合率实际有多少, 是否属于论文抄袭, 由职称评审委员会来决定。②主张对系统检测结果进行正确的判断与处理,删除不属于论文抄袭的部分, 出具能合理地反映论文真实内容重合率的最终报告给评审委员会, 这可以让评委们直接把内容重合率作为文章评审的一个指标。后一种观点和处理办法相对较好, 原因有两方面: ①每篇论文内容重合的实际情况均不同, 处理后的论文内容重合率有的与原始结果相同, 有的相差不大, 有的却差异非常大。如果不处理, 采用原始报告单的数据对于作者来说有失公允, 在职称评审工作中也失去了其自身的参考价值。②相当部分原始报告单的进一步处理要经过原始数据的比较和分析, 甚至还要进行讨论, 耗费时间长。在时间有限、评审论文数量众多的情况下, 出具原始报告单给评委, 由评委们根据纸质的原始报告单再进一步处理和判断增加了难度和不可行性。
主要分析如下: ①作为第一作者或独立作者与其他作者的论文重合率高, 一般应属于论文抄袭现象,但实际情况很复杂。例如检测到一篇论文, 作为第一作者, 其在论文中注明了该论文是其博士论文的精华部分, 但该论文与其他作者的一篇期刊论文的重合率极高。这种情况, 即使能获取该作者的学位论文和重合论文的全文, 也很难准确判断。网络中曾报道过作
者自己的硕士论文的被他人发表、作者早期的一篇论文被他人的博士论文引用, 而作者在后续的研究中又引用了该篇文章的内容, 结果被告知抄袭了该博士论文, 这些情况的发生对作者都造成了极大的负面影响[12]。②作为第一作者或者独立作者与自己发表的论文重合率高, 一般情况下应该视为论文抄袭。一稿多发、重复发表均属此现象。③作为第一作者或者独立作者, 与自己的学位论文重, 个人认为不应该属于论文抄袭, 应做删除处理。因为学位论文作为非正式出版物, 不视为作者的研究成果, 但由于具有很高的参考价值, 被制作成电子资源提供检索和全文下载等服务。目前学位论文的核心内容被整理成期刊论文发表, 利于提高研究成果的宣传和影响力, 是学术界非常普遍和认可的做法。④作为通信作者与论文中第一作者发表的学位论文重合率高, 如果通信作者与第一作者是导师与学生的关系, 个人认为不应该属于论文抄袭, 应做删除处理。否则的话, 应该视为论文抄袭。实际上, 目前通信作者的署名非常混乱, 基于利益考虑, 许多通讯作者根本就不是导师的身份。⑤作为同等贡献作者, 与第一作者的学位论文或期刊论文重合率高, 是否属于论文抄袭, 由于检索人员与作者信息的不对称, 很难正确判断。一种情况确实是同等贡献, 不属于论文抄袭。但也常出现挂名现象, 同等
贡献作者很少参与研究, 或者根本没有参, 只是与第一作者的关系非同一般, 出于某种目的而挂名。⑥作为转载文章, 不应该视为论文抄袭。但在实际检索过程中, 除非检索人员下载打开被转载的原始文献全文时才能发现转载字样, 否则一般会被误判为一稿多发现象。
结论与建议
检测系统发挥着越来越重要的作用
在检索工作中, 很容易通过检测发现一稿多发、自我抄袭、东抄西凑现象。如2011 年山东农业大学图书馆在山东省职称材料学术检索工作中共检索了850 篇学术论文, 其中内容重合率高于10%的有545篇, 占总篇数64%; 内容重合率30%以上的有345篇, 占总篇数的40%, 这说明论文抄袭现象比较普遍。而检测系统是检测论文是否抄袭的得力助手, 也是端正学风的一把利剑。
检测系统自身存在着功能缺陷
论文中的一些经典文献和理论内容的引用不应该视为内容重合, 检索人员经过分析后, 应做部分删除处理, 以真实反映论文的内容重合率。由于系统没有设置部分删除功能(删除功能仅限于整篇论文), 导致检索人员无法进行正确的删除处理, 这对论文实际的内容重合率有一定影响, 甚至影响非常大。因此系统如果增加对论文内部每一相似部分的删除功能, 将会令结果更准确。
作者应尽量避免高内容重合率的发生
学术检索工作时间紧迫、工作量大, 因此检索人员很难做到细致地处理每一篇论文, 这就需要读者从自身出发, 采取多种措施降低或杜绝高内容重合率。如对于同一概念、事物或者结论, 尽量避免直接引用, 最好变成自己的语言进行阐述; 对自己发表的一系列论文, 尽量避免大段摘抄, 重复发表, 更不要一稿多发; 对于论文转载, 尽量拒绝。提交交论文检测表时, 要对自己发表的文章有所了解, 而且尽可能注明转载等一些特殊现象的信息, 以引起检索人员的重视, 减少误判现象的发生。
正确看待内容重合率
内容重合率实际就是文字复制比, 内容重合率高不能说明论文就没有创新性, 而内容重合率低也不能说明论文的学术价值很高。因此内容重合率与论文抄袭之间虽然关系密切, 却不是绝对的。而且, 论文重合率指标作文论文抄袭的判定依据, 确实会影响着评委的决定。
检索人员的高素质要求
检测系统的初始检索结果必须经过检索人员的分析、判断与处理, 才能获得真正的内容重合率, 并出具检测报告。处理过程对检索人员的素质提出了很高要求, 检索人员不仅要具有文献检索的知识与技能,熟悉论文发表的流程和常识, 更要具有高度的责任心和敏锐的观察力。如对发表时间的处理, 在检测结果中, 有的结果与被测论文的发表几乎同时, 这时, 就要打开全文来看文章的收稿日期或修回日期。如果修回(或者收稿) 日期在前, 则应做删除处理。而对于高内容重合率论文, 一定要下载打开相似的原始文献全文进行比对, 以发现并排除转载等现象。
崔云1,赛汉格日勒2
(1.山东农业大学图书馆,山东泰安271018;2.内蒙古工业大学图书馆,内蒙古呼和浩特010051)