论文中剽窃与反剽窃行为的持续斗争
- 2014-10-08
- 编辑整理:早检测网
- 标签: Turnitin uk turnitin国际版 turnitin论文检测 反剽窃抄袭检测 学术不端 论文检测
信息技术的发展,使得学习者寻求知识信息的方式逐渐由原来的人际交流转变为人机交流,这一转变加剧了获取者剽窃行为的发生,由此拉开了。
剽窃产生的“双IS”原因
剽窃行为为何频频发生,屡禁不止呢?笔者将其归类于“双IS”原因。
I——Interest,学生对此学科缺乏兴趣,没有兴趣就很难有认真学习的动力。学生对专业缺乏兴趣的根源在于招生时服从学校调剂的专业招生制度。大部分学生为了进好的大学放弃了自己有兴趣的专业。笔者最近调查的某专业班级39人中竟有36人是服从调剂而不得不学习这个专业的,他们剽窃论文的原因和缺乏兴趣有一定相关性。
S——Shortage,学生对论文所需的专业知识和能力的缺乏。教师以论文的方式作为考核,主要是希望学生通过自己的学习对专业知识进行评述和应用。但实际情况却很令人担忧,对专业知识和能力的缺乏,使他们根本无法找到合理的系统结构,更不能分模块进行论文写作,只能铤而走险通过剽窃以应付考核。
I——Illegibility,学生对于剽窃的评判标准不清楚。如:连续多少个字或者词语相同就可认定为剽窃呢,或者某个代码结构相似到何种程度就可以判定为剽窃。有些学生整合多篇文章形成自己的论文,造成了结构和主要学术观点的剽窃。在这个方面,学术界未能出台准确的操作标准明确划分剽窃与参考,这也给学生区别两者造成难度。
S——Supervisal,学生对论文从选题到完成的整个过程的时间管理较差。多数大学生没有合理的管理、规范和分配自己的时间。如教师布置需要一个月才可以完成的作业,几乎所有的学生都是在临近要交作业的时候才开始准备,但是当其真正的投入时才发现作业的工作量很大,短短几天的时间根本无法完成,于是采用剽窃的方式完成。与此同时,教师由于自身科研和教学计划繁重,不可能对每位学生的论文过程实时追踪,对学生的管理并不强。
剽窃主要方式
由于剽窃行为表现形式的复杂性导致剽窃方式的多样性,根据不同的分类标准可以分为以下两类。
第一类:根据内容的隐蔽性,可以分为“直接剽窃”和“语义性结构剽窃”。“直接剽窃”是指搜索网上现成的论文再进行原文拷贝。利用搜索引擎搜索到自己需要的文档进行原文或段落拷贝,机械式组合。“语义性结构剽窃”是指通过对搜集的论文进行综合式整合形成自己的论文。这种方式是在前一种方式的基础上,为了增加隐蔽性对剽窃论文进行了深加工。采用调整文章的体系,变换句式结构,更改部分关键词,表现为语义相似,结构相近。
第二种:根据手段的技术性,可以分为“传统剽窃”和“网络剽窃”。“传统剽窃”包括两种方式:一是对纸质书籍和文献的抄袭;二是“学伴抄袭”,通过本人的人际关系网络进行剽窃。如同班同学交作业时的相互抄袭。传统剽窃方式工作量较大,并且对人际关系要求较高,不易大规模、简易式剽窃。“网络剽窃”是指通过网络和软件技术进行剽窃,确切是指通过搜索引擎、文献资源库查询或者简单翻译和软件自动生成。这种方式借助两种载体:一是互联网众多的搜索引擎、文献资源库、翻译网站和翻译软件,又分为本土剽窃和汉化剽窃。本土剽窃是对中文文献进行剽窃,汉化剽窃是通过翻译网站和软件对国外学者的成果进行剽窃。如:Google推出了几十种语言的互译以及金山快译软件。二是自动作文生成软件。通过这类软件,只需输入一个关键字,它会自动生成你需要的作文。如作文快手软件,只需要选择作文类型和主题,即可快速生成一篇作文。这些网络技术手段都极大地提高了剽窃的质量和效率,促使了学生作业和论文剽窃现象的泛滥。
国内外反剽窃研究
针对剽窃行为猖獗的现状,国外进行了反剽窃的试验和研究并取得了一定的成果。英国制定并实施了JISC工程,建立网站www.jisc.ac.uk,研发了一款用于反剽窃的软件SafeAssignments,可直接与ProQuest数据库连接,功能较强。法国研发了一款反剽窃的软件Plagiatsoftware Konzepte。加拿大实行了UBC Policy计划,可以查询加拿大本土作品的被剽窃行为。
www.turnitin.com和www.plagiarism.org分别是美国反剽窃的实行者和组织者,尤其在教育领域其反剽窃处于领导地位。成立于1997年的turnitin有其优势:第一,它是一个服务于教育领域的网站,反剽窃服务遍及90 多个国家,用户超过650 万,其中包括美国哈佛大学、加州大学、英国牛津大学、伦敦大学等数千所英语语种国家的大学。第二,它支持世界最大的四家电子教学平台BlackBoard、WebCT、Moodle 和Angel,检索网页数量超过66亿,除了自身网页库和试卷库外,还与英国的JISC合作并且直接与ProQuest 数据库连接,支持PDF、WORD、HTML 等可以被剽窃者利用的文件格式。
国内在反剽窃领域的研究十分欠缺,中文反剽窃系统还处于初级发展阶段。主要原因有:第一,由于语言的差异,中文信息处理有其特点和难点。第二,国内对国外技术和资源利用的政策,使得国外一些成熟技术和研究成果不能直接利用。第三,国内教育界没有形成统一的学术组织,而且在当前的竞争环境下无法形成大容量的文献库、语料库、反剽窃标准、评测平台。因此目前通过技术手段进行反剽窃的意识没有形成,主要依靠人工发现来揭发抄袭剽窃文章,如新语丝网站就有许多揭露学术腐败、文章剽窃的文献。但这种方式效率低下,罚一漏万,不能适应目前全面端正学术风气的现实需要。因此在剽窃猖獗的环境下迫切需要对其根源进行研究,并通过技术的提高来解决教育领域的剽窃问题。
反剽窃工作进展
在反剽窃的工作中,我们根据国内情况,结合教学改革,借鉴国外理论,研发自有技术,从而达到降低学生剽窃率的目的。学生剽窃的原因分析我们对现有的教学法进行改革,提出了基于网络的开放性实时追踪教学法,其中过程论文和学生自主寻找兴趣点的教学模式主要是针对日益严重的剽窃行为而展开的。
过程论文不是现在广泛采用的提交论文完成稿的模式,而是实时追踪学生从论文选题、资料搜集、论文修改到论文定稿的整个过程。过程论文的方式不仅有利于防止虚假论文的出现,而且有利于教师实时追踪学生的学习动态,从而及时为学生提供帮助。这种方式可以解决“双IS”理论中的“Shortage”和“Supervisal”,学生可以通过合理的自我管理调整专业知识结构。学生寻找自我兴趣点的教学模式,可以有效解决“Interest”的问题。学生可以在本学科的范围内,寻找自己的兴趣点,从而减少学生的被迫剽窃。
反剽窃系统设计与实现
反剽窃系统模型如图1所示,根据反剽窃模型,开发了网盗克星测试版,并做了此次剽窃抄袭的实证调查。该软件主要功能是批量提交作品,进行全文判断是否有抄袭部分,支持文档格式包括D O C 、HTML、TXT 等。该软件对于10 页以下文档检查速度较为良好,但文档篇幅过大,速度下降较为明显。与国外相比,尚处原型测试阶段,如要大规模使用,还需要进一步进行研发。
在设计原型和开发软件过程中,笔者申请了两项国家发明专利,基于计算机网络的防转载和反剽窃监控方法(专利申请号:200610019074.5)和能加快反剽窃或转载文档检测速度的方法(专利申请号200610166577.5)。前者主要解决反剽窃的系统框架问题,实现对互联网和文献库中剽窃信息提取并不定期发布给用户。第二项专利主要依据在反剽窃研究中发现的格式遗留现象,改进字符串匹配算法,提高文档格式的反剽窃查找速度。
实证调查
近年笔者所授计算机学科的相关课程的开放式命题和教师培训课程论文电子邮件附件及正文,共783 篇,含301 篇Word文档,401篇网页邮件,81篇PDF文档,含所有文档的OutLook.pst文档大小约355MB。通过软件分析,结论参见表1:
通过上表可以看出,在未告知会有剽窃行为检查的情况下,有剽窃行为的学生超过了半数,可见学生的剽窃行为十分严重。在2007年下半年,我们告知学生会有反剽窃检查的情况下,剽窃情况降至16% 左右。在我们做的如何评价学生论文和作业反剽窃的技术保证问卷调查中,有47% 的学生表示确实起到了硬性督促自己的作用,对论文的写作也更加用心;有30% 表示形成了与其不断拼凑论文的体力劳动,还不如进行创新型的脑力劳动的意识;有23%的学生表示很客观,对认真的学生很公平。
建议与结论
笔者认为,解决学生剽窃问题是一个系统的工程,靠任何的单方努力都不可能完成。在此问题上,我们应该社会、教师、学生三方努力。
第一,充分发挥社会的力量。首先中国教育界和学术界正视学生剽窃泛滥现象,高度重视反剽窃技术的研发和反剽窃系统的实施,参考西方学术界的一些做法,成立专门的学术道德技术委员会;借鉴国外较为成熟的反剽窃体制,逐步实现反剽窃工作的常态化,以达到反剽窃工作的彻底性和普遍性。其次,资源提供商可以在资源文件数据库中增加反剽窃模块,从技术上逐步实现剽窃行为检测的自动化。再次,各学术研究结构应增强反剽窃意识,人事部门以及人才培养单位对于毕业和科研论文的剽窃情况应增强检测意识和措施,以达到杀一儆百的效果。
第二,教师应吸收国外新的教学模式,结合学生的现状,及时变革教学法,培养学生对学科的兴趣,提高学生的创新力,降低学生的剽窃可能性。
第三,学生自身应该增强对剽窃的认知,不能利用剽窃与参考的模糊性作为剽窃的借口,选择自己的兴趣点以及深化对学科的认识,从而避免剽窃。最后,针对现阶段的研究,我们将进一步推进软件原型的开发,增强软件的实用性和有效性。其次对软件进行大范围的测试,在时机成熟时,发布免费版本,以便更多需求者进行反剽窃的检测。再者对学生剽窃行为进行更深入的研究,总结剽窃行为的规律,并应用到软件设计和开发中,实现反剽窃研究与软件开发的良性循环,从而使软件迈向更高的层次,逐步缩小同国外的差距。