中文期刊全文数据库的评价研究--以清华同方和重庆维普为例

本文介绍了国内对数据库评价指标体系的研究情况,选取普遍使用的数据库内容、检索系统及其功能、数据库使用情况和服务等指标,对两大中文期刊数据库:清华同方的5中文期刊全文数据库6和重庆维普的5中文科技期刊数据库6进行比较研究。

作为学术信息资源宝库,中文电子期刊数据库是科研人员获取学术信息的重要渠道,也成为国内各类图书馆的重要馆藏内容。尽管起步较晚,但自20世纪80年代出现中文电子期刊数据库以来,一直保持较快的发展速度,经过20多年的建设已经初具规模,基本形成了三大全文数据库鼎立,其他各类中小型数据库百花齐放的市场格局。全文数据库越来越受到广大科研工作者和信息工作人员青睐的同时,其种类繁多、内容广泛、分布状况复杂、质量良莠不齐等问题,使得全文数据库的选择面临新的挑战,给用户获取和利用信息带来极大困难。因此,科学合理地评价全文数据库的质量,有助于高校图书馆和科研机构的数据库资源的优化,帮助他们筛选出对其学科发展和研究有利的全文数据库,节省经费,同时,还能提供良好的信息环境,为用户提供了丰富的学术资源,了解和满足用户需求,提高全文数据库的利用率。

文献数据库评价指标体系

1.1 国内相关研究

目前国内对数字资源评价的研究很多,其中肖珑和张宇红对评价指标体系的内容做了详细的论述,从电子资源内容、检索系统及功能、使用情况、价值与成本核算、出版商或数据库商的服务、存档等六个方面评价电子资源;王乐制定了收录内容、检索功能、连结方式、试用情况、学科权衡、其他图书馆购买情况、其他同类资源性能价格比较等评价指标;张李义给出了数据库内容、检索系统、使用情况、数据库的性能价格比、数据库服务5个一级指标和若干个二级指标。徐革采用数学方法筛选出评价指标中的重要部分,舍弃不重要的部分,以达到简化评价的过程而不影响评价结果的目的。

1.2评价指标的选择与制定

本文中重点选择了普遍适用的几个主要评价指标来进行CNKI、维普数据库的比较分析。(1)数据库的内容,是指数据库所收录数据的基本内容情况,用于评估数据库收录是否全面、准确、权威、规范、重复率低和时效性强。是否符合本校专业设置和学科发展的需要。具体包括文献收录数量、收录范围、收录内容的权威性、收录年限、内容更新频率等;(2)检索系统及其功能,主要是指与数据库相关的检索平台的基本信息及使用情况,用于评价检索系统的各方面的使用功能。包括检索界面、检索系统的功能、检索技术、检索结果、用户服务、检索效率等;(3)数据库的使用情况,数据库的有效、充分的使用是购买数据库资源的根本原因。具体包括登录次数、检索次数、全文(文摘)下载数量、读者满意度等;(4)服务,数据库生产商所提供的服务是一个数据库资源的重要辅助内容,它同样影响着数据库资源的质量和用户的使用,因此也是评价数据库资源的一个指标。该指标主要包括数据传递方式、数据库访问方式、个性化服务方式3个部分。

2 CNKI、维普数据库的基本情况介绍

清华同方的5中国期刊全文数据库61995年正式立项,由清华大学光盘国家工程研究中心(OMNERC)、中国学术期刊(光盘版)电子杂志社(CAJEPH)、清华同方光盘股份有限公司(TTOD)、清华同方教育技术研究院(TTETI)等单位联合建设。

重庆维普的5中文科技期刊数据库6,源于重庆维普资讯有限公司1989年创建的5中文科技期刊篇名数据库6,由重庆维普资讯有限公司建设。

数据库内容分析评价

3.1 全文收录数量

截至20092月底,清华同方收录期刊全文文献30181549,其中核心期刊文献6920353,占总文献量的2219%。维普收录期刊文献21363993,其中核心期刊文献4993936,占总文献量的2314%。清华同方已经超越了维普,成为收录期刊全文文献最多的数据库。

3.2 收录范围

清华同方的5中国期刊全文数据库6中的文献按照5中国图书资料分类法6进行分类,所有文献被分为十大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、政治军事与法律、教育与社会科学综合、电子技术与信息科学、经济与管理。十大专辑下分为168个专题和近3600个子栏目。维普的5中文科技期刊数据库6中的文献按照5中国图书馆分类法6进行分类,所有文献被分为8个专辑:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。8大专辑又细分为35个专题。

3.3 收录内容的权威性

截至20092月底清华同方收录期刊为9264多种,其中核心期刊1822;维普收录12000多种(1989年以来的现刊和过刊,其中现刊9800),核心期刊1810种。维普收录期刊总数较多,其中包括了具有一定影响且连续性的非正式发行刊物。从两大数据库对核心期刊收录量分别占期刊总数的百分比来看,清华同方占1917%、维普占1815%

3.4 收录年限

清华同方期刊收录年限为1994年至今,也有回溯数据可供购买,文献最早回溯到1915;维普收录年限为1989年至今。维普中1989-1993年收录的文献1359290,也只占其全部的8%,大部分还是1994年至今的。

3.5 内容更新频率

清华同方CNKI中心网站及数据库交换服务中心每日更新5000~7000,各镜像站点通过互联网或卫星传送数据可实现每日更新,专辑光盘每月更新,专题光盘年度更新。维普主网站是每周更新,镜像的数据库是每一个半月按批更新

检索系统及其功能分析评价

4.1检索界面

清华同方有简体中文、繁体中文、英文3;维普只有简体中文。同方库有初级检索、高级检索、专业检索、跨库检索等检索界面,并有期刊导航、基金导航、作者单位导航、内容分类导航等数据库导航。维普库检索界面相对简单,有快速检索、传统检索、分类检索、高级检索等检索界面,但仅提供了期刊导航。清华同方还可以进行版面风格切换。

4.2检索方式

4.2.1简单检索的比较分析

从检索框看,清华同方的初级检索可以根据需要选择1或多个检索词输人框和逻辑关系,每个输人框可以只输入1个检索词或1个包含有逻辑与、或、非和小括号等运算符号的检索表达式。维普的传统检索只提供1个检索词输人框,可以输人检索词或检索表达式,支持布尔逻辑检索和字段检索。

从检索字段看,清华同方比较特别的字段有主题、参考文献、全文、年、期、ISSN和统一刊号;维普相对特别的字段有作者简介和栏目信息。维普相对特别的字段有作者简介和栏目信息。

从检索范围看,清华同方可在全部期刊、EI来源刊、SCI来源刊、核心期刊几项中进行选择,而维普全部期刊、重要期刊、核心期刊、EI来源期刊、SCI来源期刊、CA来源期刊、CSCD来源期刊、CSSCI来源期刊中选择。从数据更新看,维普较同方多一项/最近半月0的选择。

此外,两库检索功能还有所区别,清华同方可以输人词频,限制检索词在检索结果里出现的次数。可以使用扩展按钮查找与检索词相关的交叉相关词。可以选择检索的年代、检索的匹配方式以及检索结果的排序方式,如果检索结果过多,可以选择/在结果中搜索0来进行二次检索。维普库可以使用/同义词0功能查找检索词的同义词,使用/同名作者0查找同名作者的单位。有二次检索功能,并且提供/0/0/0三种匹配方式。选择的检索范围是全部期刊、核心期刊和重要期刊。

4.2.2高级检索的比较分析

清华同方的高级检索界面相比初级检索界面增加了几个检索词输人框,其他功能不变。维普库的高级检索界面有两种检索方式,一种与同方库类似,但比同方库增加了/查看同义词0/同名合著作者0/查看分类表0/查看相关机构0/期刊导航0等功能。另一种与同方库的专业检索界面类似,是由用户制定检索式进行检索,可以使用/*0/+0/-0/()0等符号连接检索词。

4.2.3期刊导航的比较分析

两库在期刊导航方面的类似之处是都可以按字顺或按学科分类浏览刊物,也可以用刊名或刊号来检索刊物,都提供刊物的彩色封面、有关刊物的出版、联系方式、获奖情况、是否是核心刊物等信息,都可按照刊物的出版地浏览刊物。不同的是,同方库还可以从数据库刊源、主办单位,发行系统等途径浏览刊物,尤其是利用数据库刊源浏览,可以很方便地查出被CASASCIEICBSTAJCSCD等著名的检索系统所收录的刊物,方便统计和投稿。并且,同方较维普库在/本刊内检索0功能项中可提供逻辑符组配功能,但维普比同方多了一项概要显示、文摘显示、全记录显示的显示方式选择功能。综合来看,同方库提供的浏览途径多于维普库,期刊导航同方库优于维普库。

4.2.4其他检索功能的比较

(1)    维普库有分类检索界面,供用户从中图法中找出中图分类号,进而从分类途径查找所需文献。而同方库只是在简单检索和高级检索的界面提供了中图分类号这一检索途径。从操作的方便程度上讲,维普库优于同方库。

(2)清华同方库比维普库多了一项查看检索历史的功能,可以自动保存每次检索操作的检索历史,包括检索条件、检索结果等,方便查找历史检索结果。

(3)清华同方实现了对CNKI各源数据库统一分类导航,新的导航统一为10大专辑,168个专题数据库,期刊、学位论文、会议论文、报纸4种载体在统一导航的机制下,进行事实上的整合,实现跨库检索功能。图书馆还可以向清华同方公司申请到漫游用户,使用漫游账号,读者可不受IP地址限制,在网外同样可以检索学校订购该数据库资源和下载文章。这样更方便了出差外地或回家办公的用户同样也能使用CNKI数据库资源,真正体会到无距离感。这个网上漫游功能是其它数据库还没有的。

(4)清华同方的5中国期刊全文数据库6支持对英文检索词的检索,文章中的篇名、作者、关键词、机构、中文摘要、引文、基金、全文、中文刊名、主题词、篇名、关键词、摘要、第一作者等均可用相应的英文进行检索。维普的5中文科技期刊数据库6对英文检索词的处理能力

比较弱。当我们用英文检索词进行检索时,检中的结果约有90%为国内期刊英文版中的英文文章,只有当相应的检索入口中含有英文检索词的原词时中文文章才能被检中,其余绝大部分中文文章均被漏检。

4.4检索结果

4.4.1检索结果的数量

通过大量的检索可以看到,在相同的检索条件下,清华同方检索出的结果多数情况下较维普要多,但由于每个数据库都有部分检索结果在另一个数据库中没有被检索出来,因此有条件的话,两个数据库同时使用可以提高查全率。

4.4.2检索结果的显示

清华同方库的检索结果可以按照时间或相关度排序,可以选择每页显示的记录数,每页最多可以显示50条记录。点击篇名可以显示中英文对照的该篇文章的篇名、作者、刊名、关键词和摘要,还可以获得文献的扩展信息,如参考文献、共引文献、相似文献、作者推荐文献、相关研究机构、相关文献作者、中图法文献分类导航、相关期刊等相关知识信息的链接。可以选择1篇或多篇文献按照简单、详细、引文或者自定义格式下载题录信息。提供CAJPDF两种格式的全文下载。

维普库的检索结果是按照时间排列的,使用快速检索、高级检索和分类检索检出的结果可以选择概要显示、文摘显示和全记录显示3种方式,可以选择1篇或多篇文献进行下载、打印或发送E-mail、可以选择每页显示的记录数,每页最多可以显示50条记录。使用传统检索检得文献的显示和同方库类似,点击文献篇名可以看到该文献的题录信息,且其页面风格与纸本刊物类似,符合大多数人的阅读习惯。提供PDF格式的全文下载。

4.4.3检索结果的处理

两个数据库的数据采集原理均是通过扫描仪采用光学的方式将每一页文章扫描成图像并输入到计算机,所有的文章均以图像的方式存在。为了方便用户进一步编辑、处理文字,两个数据库的全文浏览器均带有OCR文字识别功能,可将文字图像转化为文本后进一步编辑处理。通过对比大量检索结果可以看出,清华同方的5中国期刊全文数据库6的文章扫描的清晰度高,文字基本无倾斜,图片上多余的斑点很少,文字光滑圆润,OCR文字识别率也相对较高。维普的5中文科技期刊数据库6的文章扫描的清晰度较差,部分图像上的文字倾斜,个别文章文字倾斜严重,并有勾画,图片上斑点较多,OCR文字识别率较低。因此当用户要对检索结果进行大量的编辑处理工作时,建议使用清华同方的5中国期刊全文数据库6

数据库的使用情况

清华同方库的服务模式分包库模式、镜像模式和机构卡模式。我馆同方库的购置时间不长,是以包库的方式开通的,因此访问速度受到一定限制,一些高峰时间段会出现服务器忙,请稍候登陆的提示,并且由于受并发用户的限制,20分钟不在线重新登陆的设置,在长时间检索时会造成一些不便。但其便捷的应用功能、新颖的知网节浏览服务和丰富的文献资源,受到很多科研人员的拥护和喜爱,目前文献下载量较大。

维普库的服务模式主要分网上包库模式、建立镜像站服务模式、流量计费模式和阅读卡模式。我馆目前购置的维普库是镜像库,检索速度较快,系统较稳定。由于维普库引进时间较长,因此用户已经习惯了其操作方式和展现形式,利用率一直很高,用户反映良好。2008年中文期刊下载量达92294,全院人均下载量达13118篇。

个性化服务的分析评价

维普库提供个性化服务,用户可注册登陆到/我的数据库0,每次检索结果页面上会有/保存检索式0/加入电子书架0的按钮,用户可以自己选择是否保存、保存哪些检索式和检索结果。用户还可以使用期刊定制、关键词定制、分类定制把自己感兴趣的刊名、关键词和分类号保存在/我的数据库0,方便以后的检索,使用定题推送服务定制自己感兴趣的主题,系统会按照要求将相关文献发送到用户的信箱里。

同方库为用户提供了RSS订阅的个性化服务,可以对期刊、杂志、关键词进行定制,获取所需文献的题录信息推送。清华同方近几年在个性化服务开发上投入很大,推出了个人馆、机构馆、专业馆等服务,不仅可以自动推送定制的文献和信息,掌握学科前沿动态,还可以对个人的科研成果进行评价、对学科文献进行不同分类的排名、热点词汇的推荐等等,这些都可以在进入总库平台后得以实现。




上一篇:我国两大中文期刊全文数据库之比较研究
下一篇:大学生诚实态度和创新精神的缺乏-浅析大学生论文抄袭现象
扫描二维码