学术不端文献检测系统的功能和作用
学术不端文献检测系统资源丰富,技术先进,具有检测 对比分析管理和自动生成等功能;系统在学术期刊编辑实践中具有预防和打击学术不端行为提高编辑的工作效率,以及提高学术期刊的学术影响力等重要作用。
学术不端行为近年来引起学术界的高度关注,截至2010年11月,CNKI数据库中以学术不端行为为主题的文献已经高达279篇之所以有如此高的关注率,其原因在于学术不端行为已经在某种程度上制约了中国学术的发展因此,学术不端行为成学术编辑审稿的一项重要内容2008年清华同方知网CNKI推出了中国学术不端文献检测系统,其中科技期刊学术不端文献检测系统(AMLC)和社科期刊学术不端文献检测系统(SMLC)迅速在全国范围的学术编辑部广泛使用系统检测功能强大,在预防和打击学术不端行为方面发挥了重要作用,在一定程度上阻止了学术不端行为的泛滥。
一学术不端文献检测系统的功能
学术不端检测系统主要的功能是检测,同时还包括对比分析 管理和自动生成等功能。
1.检测功能
检测功能包括对已发表文献和论文的检测已发表文献检测主要是对编辑部收录于CNKI数据库的发表文献进行检测,各编辑部可在权限范围内查看检测结果。编辑部可以选择具体某一年的论文进行查阅检测,也可以通过页面提供的检索功能,检索某个作者的论文或者按照论文篇名检索具体的某篇文献 论文检测可提供对论文的实时在线检测。系统将待检测文献通过互联网提交到检测系统服务器,系统根据论文长度,在数秒内返回检测结果。论文检测功能是系统的核心所在,系统具有强大的技术支持。以CNKI数据库为比对库,CNKI收录了1994年以来的期刊、学位论文、会议论文、报纸、年鉴、工具书、专利外文文献、学术文献引文等与科学研究、学习相关的主要资源。同时,编辑部还可根据需要建立自己的比对库,以句子为最小指纹粒度,具有较高的检准率和检全率。原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。自动识别包括DOC、DOCX、PDF、CAJ、KDH、NH、TXT、RTF、EML等格式的文档。系统提供单篇论文上传、批量论文以压缩文件方式上传和手工直接录入等多种论文提交方式 检测结果快速易于浏览,一篇6000字的论文检测时间不足3秒钟,结果以绿、黄、橙、红四色图例标出,让人一目了然。
2.对比分析功能
对比分析功能对有问题的检测文献与来源文献进行多维度对比和多层次分析。
多维度对比体现在系统将检测文献与来源文献在正文文字、参考文献、表格、英文四个方面进行对比。文字对比又从文字复制比、重合字数、小段落数(连续重合字数大于100字但小于200字)、大段落数(连续重合字数大于200字)前部重合度、后部重合度等多角度进行对比。
多层次分析体现在检测结果呈现方式的多层次性,包括检测文献的数字分析结果、重合文字来源索引列表、检测文献中标记 (用红色标出)重合文字3种呈现方式.。检测文献的数字分析结果为第一部分,主要是用数字和图例来说明检测文献存在的问题,其中最主要的判断依据就是文字复制比一项,当重合字数大于1000字或重合百分比小于40%时图例为黄色,重合字数大于5000字或重合百分比在40%~50% 之间图例为橙色,重合字数大于10000字或重合百分比大于50%时图例为红色,当无问题记录时图像为绿色,此时没有各项的对比分析记录。
对比分析功能帮助编辑部全面掌握有问题文献的具体信息,如哪些内容属于抄袭、抄袭了哪些文献、抄袭所占比例、哪些是多源抄袭等。
3.管理功能
管理功能具体包括编辑部信息管理、检测资源管理、学术不端文献库管理。
编辑部信息管理可实现编辑部信息的维护与
管理功能,如编辑部可修改注册资料、用户密码和比对库等。比对库主要是编辑部根据需要建立的自有资源库,检测文献也可以加入比对资源库。
检测资源管理包括资源上传和结果查询。编辑部可根据不同需求创建多个文件夹用于保存管理上传稿件,设定该文件夹下稿件的检测范围检测比对库与检测时间。检测范围是指从学科范围来限定,包括理工、农业、医药卫生、文史哲政治军事与法律、教育与社会科学综合、电子技术与信息科学、经济与管理学科;检测比对库包括 CNKI库、个人对比库、中国学术期刊网络出版总库、中国博士学位论文全文数据库中国优秀硕士学位论文全文数据库/中国重要会议论文全文数据库、中国重要报纸全文数据库、英文数据库和其他比对库;检测时间从1979年到2010年。检测范围、检测比对库和检测时间3项编辑部都可根据需要选择和设定。编辑部还可以通过组合多个条件对已检测结果进行查询,检索条件包括篇名、作者、上传时间、文字重合度;可以删除检索结果记录。
学术不端文献库管理是根据编辑部确定的学术不端文献的各种问题分门别类进行汇总,帮助管理人员及时发现并总结分析期刊出版过程的不规范问题,为期刊出版诚信管理制度的制定提供参考。
4.自动生成功能
系统可自动生成黑名单、文献报告单和批量报告单。当编辑部用户将存在学术不端行为的检测文献加入问题库文献后,作者的名字就会自动录入到“黑名单”一栏;同时,检测系统也会自动生成该文献的检测报告单,详细列出文献的学术不端行为检测情况,编辑部可以对该报告单进行修改,生成终审报告;批量文献的检测情况,系统会自动生成EXCEL表格,重点列出各检测文献与比对文献的文字复制比和重合字数。
二学术不端检测系统的作用
学术不端检测系统从2008年研制之初的试用到2010年系统Ⅱ的成功升级,以强大的技术优势和资源优势,不仅成为一种工具,帮助编辑判断稿件的学术不端情况,也成为一种手段,有效预防和打击学术不端行为。在编辑的实际使用过程中,它提高了编辑的工作效率,成为学术期刊编辑工作不可或缺的助手。从更深远的意义而言,系统在一定程度上也将有助于提高学术期刊整体质量,引导期刊健康发展,对于学术道德建设也产生了一定的积极影响。
1.预防和打击学术不端行为
这是系统最重要的作用,这种作用的发挥源于其强大的检测功能。
“预防”的机制是指在出版环节上的预防。及时发现、准确判断是预防实现的技术前提。CNKI收录的各类资源为期刊学术不端行为监测系统提供了资源支持。在收录资源种类上,CNKI在国内具有明显优势,收录了期刊、学位论文、会议论文、报纸、年鉴、工具书、专利、外文文献、学术文献引文等与科学研究、学习相关的主要资源。在资源收录数量上,CNKI明显优于同类产品,各个资源库收录年限长,期刊等主要资源库回溯到创刊。在资源更新速度上,CNKI产品除了第三方合作的外文文献以外,其他资源都做到了日日更新,单日更新数量大。这些都保证了文献检测的准确性和有效性。
另外,中国知网是中国各高校、研究所等学术机构和个人进行学术研究的重要资源库。 一些作者也是企图借助中国知网丰富的资源来达到不劳而获的目的。但不论作者的手段如何高明,材料如何篡改,都是在中国知网数据库资源范围的操作。检测系统主要是以自有的资源为比对库进行检测,检测以句子为最小指纹,原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。
编辑初审时,只要将稿件上传到系统,就可以快速直接地判断出稿件的是否存在学术不端情况。也就是说,编辑在初审时就可以成功拦截学术不端稿件,防止它们进入发表的范围。
如果说,预防是编辑部面对学术不端行为不得不为之的一种被动行为,而打击学术不端行为则是学术编辑部的一种主动出击。系统的一些功能为编辑部的主动出击提供了武器。
当编辑部把已经确定的问题文献加入问题文献库后,文献的作者姓名会自动录入到黑名单中。编辑部可以利用这种功能,建立作者诚信档案和黑名单问责制。“凡是录入黑名单的作者,编辑部可发电子邮件告知:因您学术态度不端正,编辑部将不再接收您的任何稿件及推荐稿件”。这种拒稿的声明是编辑部对学术不端作者的惩罚,也是向社会表明刊物的学术态度。编辑部还可以利用系统的“已发表文献检测”的功能实行编辑部自检,同样将问题文献纳入问题文献库,将作者自动纳入黑名单,这部分作者,编辑部可以实行警告约稿制度,即发送电子邮件告知:“发现您曾经存在不端的学术行为,希望您能够端正学术态度,期待您能以另一篇高质量稿件来弥补您和我刊的学术声望。”针对个别作者学术不端行为的打击,其范围和力度都不足以影响整个社会,但是编辑部还是要预防与打击并举,让越来越多的作者认识到,不端的学术行为没有生存的空间,那样,预防也就变得不再重要了。因而,从这个意义上说,系统不仅本身能够预防和打击学术不端行为,也为编辑提供了平台,让编辑面对学术腐败有更多可为之举。
2.提高编辑的工作效率
编辑的工作效率要从两个方面衡量,即速度和质量。系统检测让编辑在最少的时间里完成了最困难的工作。学术不端行为的审查并不是在系统出现之后才进行的,屡屡发生的学术不端行为,使审查稿件的学术不端行为成为初审的重要内容但是这种审查在操作层面难度较大。责任编辑要么通过经验判断,要么利用百度、谷歌等大众搜索引擎和维普、CNKI等期刊数据库的检索来判断。后者作为较为常用的办法,根据笔者的经验,核查一篇文章一般要选择和浏览主题相关的10篇左右的文章,这需要10~15分钟。如果存在抄袭现象,编辑就要仔细浏览文献,再把两文细细比对,这又要约5分钟。并且,浏览10篇文章也很难证明稿件无学术不端行为或者能够发现学术不端行为,但更大的浏览量无疑对编辑的身心都是巨大的考验。学术不端检测系统的研发与使用,让编辑成为了数字时代的受益者。编辑现在利用系统可批量上传文稿。如一期审理20篇稿件,按一篇6000字的文章耗时3秒钟来计算,一期文章检测也不过1分钟,并且系统在检测过程中是分篇检测,编辑只要等上3秒钟就可以查看第一篇,这大大节省了编辑的时间,并且,强大的对比库也增加了准确性。无论是从速度还是质量上,系统检测都要优于人工审查。应该说,系统把编辑从铺天盖地的资料堆中解脱了出来,让编辑可以体验数字时代工作的快乐。
除了检测外,检测报告单的自动生成也帮助编辑提高了退稿的工作效率。
系统对有问题的文献自动生成检测报告单,
详细地标明检测文献与比对文献的重合情况,编辑可以对系统检测报告单进行修改,对文献的检测结果重新选择学术不端类型,并写下自己的审查意见,生成最终的终审报告单。利用系统的页面的打印功能,作为退稿信寄给作者,或者交与编务存档。与以往的退稿信相比,数据翔实,有说服力,同时又节约时间和精力,编辑不必再摘抄文献逐一说明抄袭的根据。
两两比对的功能帮助编辑快速浏览和比较稿件的修改程度,提高编辑审查修改稿的效率。编辑可以上传原稿和修改稿,系统就会将两稿相同的部分用蓝色字体显示。编辑就可以忽略蓝色字体,而直接对比黑色字体,这为编辑审查稿件的修改程度提供了一种新工具。
系统还有针对参考文献的检测功能,这对编辑来说,非常实用。编辑只要把参考文献复制到引文核对中,系统就会检索,并给出检测结果。结果状态以绿、红、黄色球标注,绿色球表示篇名、作者、刊名均相同,也即作者标明的参考文献没有错误;红色球表示篇名不同 作者相同刊名相同,提示所引的参考文献篇名有误;黄色球表示篇名相同 作者相同 刊名不同,提示所引参考文献的刊名有误。编辑只要按照提示去核实个别参考文献即可,大大减少了编辑的工作量。
这些功能虽然都是检测的一部分,但是即使单独使用这些小工具,也可以大大提高编辑的工作效率。
3.提升期刊的学术影响力
检测系统能够在一定程度上打击抄袭、剽窃等学术不端行为,让期刊出版能够朝着“崇尚学术价值和创新精神”的方向努力。当然,笔者并不认为,通过了系统检测的文章,就具有学术价值,就可以刊发。但当下,学术不端已经成为一种普遍的现象,它严重地削弱了期刊的学术影响力。系统检测虽然无法判断文章的学术价值,却
可以发现、剔除不端文献,营造一种公正、平等的学术空间,这对于学术期刊发展和学术发展都有着重要的意义。诚如前面所言,编辑部对于学术不端文献的作者给予一定的打击措施,这能够向作者向社会表明编辑部的学术态度和打击决心,同样,这种行为如果在所有的学术期刊编辑部得到推广,那么学术不端行为将无处藏身。系统检测也从客观上要求作者树立规范的学术意识,自觉放弃抄袭剽窃等不端学术行为。
系统经过实践的检测,在编辑工作中的确发挥了重要的作用,但我们也要清醒地看到,它只是编辑工作初审的一种工具,切不可夸大其作用,甚至把它作为稿件录用的主要指标,这是编辑要在工作中警惕的。
作者:赵国惠