我国两大中文期刊全文数据库之比较研究
文章通过对目前国内使用最广泛的两个中文期刊全文数据库———中国期刊全文数据库、中文科技期刊数据库的基本情况、检索功能、检索效果以及输出功能等方面进行比较,指出了各自的优势与不足,并提出了改进的建议。
目前国内影响最大、使用最广泛的综合性中文期刊全文数据库主要有两大类:一是由重庆维普资讯公司推出的中文科技期刊数据库;二是由清华同方光盘股份有限公司研制开发的中国期刊全文数据库。这两个数据库有许多共同之处,但在收录范围和检索功能上各有特点和优势。本文拟从用户的角度对这两个综合性中文期刊全文数据库的基本情况、数据库检索功能、检索结果以及输出功能等方面进行比较研究,为用户在选择、利用数据库时提供参考。
1 基本情况比较
中文科技期刊数据库(以下简称维普全文库)由重庆维普资讯公司于1989年研制开发,其前身是《中文科技期刊篇名数据库》,经过十余年的不断完善,已从最初的Dos版、Windows单机版、局域网络版,发展到今天的Web版。目前该数据库收录国内出版发行的期刊8000余种,学科范围覆盖社会科学和自然科学领域,分为7个专辑大类,27个专题分类,累积文献量660余万篇,并以每年100万篇的速度递增,是目前国内收录时间跨度最长、收录期刊种类最多的数据库。
中国期刊全文数据库(以下简称清华全文库)由中国学术期刊(光盘版)电子杂志社、光盘国家工程研究中心和清华同方光盘股份有限公司共同研制开发,配备先进的CNKI-KNS全文检索管理系统,自1999年推出KNS1.0以来,历经KNS1.0、2.0、3.0版本,至2002年5月推出KNS3.5版本,检索系统逐步完善。目前该数据库收录1994年以来的6100种国内正式出版发行的自然科学、社会科学和人文科学类核心期刊和具有专业特色的期刊全文,分为9个专辑,126个专题文献数据库,累积全文文献880多万篇,是目前国内最大的连续动态更新的期刊全文数据库。两个数据库的基本情况见表1。
从表1可见,两个全文数据库各有所长。从收录期刊范围看,维普全文库以全为特点,几乎涵盖了国内出版的社会科学和自然科学领域的中文出版物,特别是地方性期刊的收录,是维普全文库的一大特色,可以满足某些用户对地方性文献的检索需求;而清华全文库的定位主要面向学术交流和知识传播,着重收录各学科领域的核心期刊和重要期刊,比较注重文章的品味和学术价值,它收录的期刊论文具有一定的质量保证。从收录文献年代看,维普全文库的时间跨度长于清华全文库,这也是维普全文库的一大优势。但从全文数据的收录量看,维普全文库的“全文数据”尚未完备,还在不断补充和完善之中,部分检出文献还不能看到全文;而清华全文库已经完成了1994年以来6100种期刊880多万篇全文数据的上网工作,形成了较完备的全文数据保障,这是清华全文库的优势之一。对于少数因出版者或作者不同意转让著作权而造成“原文禁止上网”的文献,系统提供电子邮件的方式索取原文,弥补了用户对这部分文献无法索取的遗憾和失望。从全文数据的发布时间看,维普全文数据的网上发布时间比期刊出版滞后3个月以上;而清华全文库则可实现网上数据的每日更新,这是清华全文库的最大优势。网上全文数据的发布几乎可以做到与期刊发行同步,具有较强的时效性,用户通过检索能够获得较新的科研信息,满足了广大用户求新求快的阅读要求。因此,维普全文库比较适合于进行回溯性检索,如果用户要查询关于某一事物发展脉络,追溯某一学科研究发展历程的文献,或以收集资料的丰富性和完整性为检索目标,可考虑选择维普全文库。清华全文库则比较适合于进行新课题或具有新内容课题的文献检索,课题跟踪或定题服务性质的文献检索,或以直接索取一次文献为目标的文献检索。两者各有所长和特色,可以互相补充,取长补短。
从使用方便上看,两个数据库分别提供了在线帮助,维普全文库的帮助信息简明实用,对检索系统的功能、检索界面布局、检索步骤等均有简要说明,若需要更形象直观的帮助信息,还可到重庆维普公司的主页上观看“简明用户指南flash动画演示”;清华全文库的帮助信息系统全面,对系统导航区设置、初级检索、高级检索、检索结果处理以及检索实例等内容都有详尽介绍,但不是交互式的,缺少动态性。
在数据库的学科分类上,维普全文库以《中国图书资料分类法》进行分类,较易选择;而清华全文库按专辑划分,特别是理工A、B、C专辑的内容,对于初次使用该数据库而又没有阅读过帮助信息的用户来说,是不直观和麻烦的,比如检索有关“生物科学”方面的文献,用户很难想象检索系统会将其划归在理工A辑当中。当然也可采用全选的方式进行检索,但检索结果会有很大的冗余。
2 系统功能比较
2.1 用户检索界面的设置
两个数据库的检索界面均采用框架式分区结构:分为导航区、检索区、概览区、细阅区和功能限定及下载区等区域,这种界面布局紧凑,功能集中,符合大多数用户的检索习惯,使用起来也容易上手。特别是检索结果的分级查看功能,有利于用户在选择和查看文献的详细款项信息时,更具有目的性和主动性,同时检索结果的选择性分级查看方式,既节省了屏幕显示空间,也提高了用户的浏览效率。
2.2 检索功能比较
笔者对两个数据库的检索入口、检索方式、逻辑检索、限定检索、匹配方式等方面进行了比较,比较结果见表2
从表2可见,在检索方式上,两个数据库均可实现导航检索、简单检索、二次检索和复合检索;具备布尔逻辑检索方式,可以实现多个检索途径的逻辑组合;具有截词检索功能,但不支持位置检索。两个数据库的导航检索系统,同时具有学科导航检索功能,用户不需要输入任何检索词,只要选择自己关心的学科主题,就能直接查找到所需专业期刊收录的文献。简单检索均具有题名、作者、机构、关键词、刊名、摘要等常规检索入口,并且能够进行逐次检索、逻辑组配检索。复合检索都具有多字段组合的检索功能,但在检索方式上各有不同,清华全文库的复合检索在高级检索界面中完成,高级检索的4个组合检索框可同时设置4个检索条件并可使用所有的布尔逻辑运算符,可根据需要输入多个检索词同时检索。维普全文库的复合检索既可在基本检索界面中实现,也可在高级检索界面中完成。在基本检索界面的检索框中输入用布尔逻辑算符组配起来的带有字段代码的多字段检索词,就可以方便地完成不同字段之间的复合检索。比如在检索框中一次性输入“C=S667.7*K=芒果*K=保鲜”,即可查出分类号为S667.7芒果保鲜方面的文献记录。选择“任意字段”检索途径进行复合检索,可直接按布尔逻辑运算的规则写入复合检索式而不需输入字段代码。高级检索界面的检索功能与清华全文库的类似。
在检索匹配方式上,清华全文库使用模糊匹配;维普全文库则对特定字段(关键词、刊名、作者、第一作者、分类号)的检索提供模糊匹配和精确匹配两种方式。在实现对优质核心期刊文献的检索方面,清华全文库主要通过“基金”这一检索途径,检索具有科研基金资助项目的文献;维普全文库则专设了对全部期刊、重要期刊、核心期刊的选择性检索,对于那些比较注重检出文献质量的用户来说,这种检索方式为他们提供了极大的方便。值得一提的是,清华全文库还提供了引文和全文两种检索入口,引文检索功能可用于个人、机构、论文、期刊方面的计量与评价,该功能为我国学术界的引文评价和期刊计量提供了新的便利工具。全文检索是在全文数据库的基础上进行的,检索功能的实现不仅取决于数据库的结构,而且取决于检索软件的设计水平。全文检索可在全文范围内进行检索词的匹配,它对提高查全率,特别是对前沿性课题文献的检索极为有用;维普全文库尚不能提供引文和全文检索功能,但它所特有的同义词库和同名作者库检索功能可实现同义词、近义词及同名作者检索的智能分析,能有效提高检索系统的查全率和查准率。用户在检索时,往往忽略一词多义、多词一义的现象,容易造成漏检。该功能将同义词和近义词用逻辑或相连形成后控制词表,即使用户仅采用同义词中的1个词进行检索,系统仍然可以检出与该词语义相同或接近的相关文献。这样就把检索中挖掘同义词的负担交给了检索系统,大大方便了用户,提高了检索系统的查全率。具体操作方法是:选择关键词为检索入口,打开同义词库,输入关键词检索,如果同义词库中有该关键词的同义词,系统就会显示出来,让用户决定是否也用这些同义词检索,如输入关键词“土豆”检索时,系统会提示“马铃薯、洋芋”等是否同时选中作为检索条件,这时用户可以按照需要进行标记选择。同名作者库功能与之类似,默认为关闭,选中即打开。输入作者姓名检索,系统会提示同名作者的机构列表,标记选择某一机构,即可检出指定机构该姓名作者的文献。
3 检索结果比较
为了直观地比较两个全文数据库的检索效果,笔者以检索“芒果保鲜”文献为例,在数据库全选的情况下,采用篇名、关键词、摘要等字段进行了检索,检索结果见表3。
从表3可见,使用不同的数据库,检索结果是不同的。用“芒果*保鲜”在篇名字段检索,清华全文库检出文献32篇,维普全文库检出文献42篇。扣除1989~1993年间发表的文献15篇,两个数据库完全相同的文献有22篇,清华全文库独有的文献10篇,维普全文库独有的文献4篇,其余字段也存在同样现象。从检索结果看,维普全文库检出的文献数多于清华全文库,多出部分主要是1994年以前发表的文献。但清华全文库可检出2003年的最新文献,而维普全文库则没有检出2003年的文献。
其次,选择不同的检索入口,检索结果也不尽相同。从表3可见,清华全文库选择关键词字段、维普全文库选择任意字段作为检索入口,可以获得较高的查全率。从清华全文库关键词字段检出的文献,实际上涵盖了在篇名、关键词以及中文摘要3个字段中出现该检索词的所有文献,检索结果分别是篇名、关键词以及中文摘要字段检索结果的累加,其作用相当于维普全文库任意字段的检索。
再者,使用不同的检索策略,检索结果也不相同。从表3可见,使用“芒果*(保鲜+贮藏+贮存)”检索式进行检索,检出的文献量远比使用“芒果*保鲜”的多。因此,为了减少漏检现象,确保检出文献的查全率,检索时必须仔细分析课题,充分提出与课题相关的检索词及其同义词、近义词,并用逻辑或连成一个检索式,这样才能获得较高的查全率。这个例子还提出了主题标引不一致的问题。主题标引的不一致,首先表现为同义词未受控制,比如“芒果保鲜”,被分别标引为“芒果保鲜”、“芒果贮藏”、“芒果贮存”等多种形式。其次,“芒果保鲜”究竟应该标引成1个词还是拆分成2个词,没有统一标准,标引时具有很大的随意性,同一主题的标引,先组式与后组式同时存在。比如“芒果保鲜”在清华全文库的篇名字段查出文献8篇、“芒果*保鲜”查出文献32篇;维普全文库也存在类似情况。对主题标引的不一致,将给用户的利用带来不便,极易造成文献信息的漏检而最终影响检索效果。当然这个例子只是说明了1个学科1次检索的情况,并不能完全准确地反映各数据库对各学科文献收录的完整性和各数据库的综合检索功能。
4输出功能比较
笔者对两个检索系统的输出功能进行了比较,比较结果见表4。
两个数据库分别提供了检索结果的分页显示、记录总数与当前页面显示、页面快速定位、排序方式设置等功能,并可选择显示和下载命中记录的题录、文摘和全文信息,可以标记筛选需要下载的文献记录。但清华全文库的标记下载每次不能超过10条记录,若要标记下载多条记录,则不得不反复进行标记———下载———清除———标记的操作,给用户带来一定的麻烦和不便;维普全文库输出题录时可选择当前记录、标记记录和所有记录3种方式,且每次标记可达100条记录,大大提高了标记记录的下载效率。此外在指定下载记录的输出格式上,清华全文库的输出格式是固定不变的,只有全格式输出方式;而维普全文库则能根据用户的需求指定输出项目,不一定要全格式输出。因此维普全文库的指定记录输出格式更为实用,更受用户的欢迎。
在全文数据的阅读效果方面,清华全文库使用先进的软件对文章进行数字化处理,保留了原刊样式,画面清晰整洁,阅读效果较好,但有时存在检出的篇名与下载后打开的原文篇名与内容不相符合的现象,影响了用户的使用;维普全文数据采用扫描原文的方式加工,虽保持了期刊全文原貌,但阅读时清晰度不够好,加之维普公司的情报人员直接在原文上进行标引,导致文献首页不够美观,影响了用户的阅读效果。
在全文数据编辑方面,两个数据库均支持全文数据的全文、分页打印和编辑剪贴等功能。在实现全文数据的编辑剪贴功能上,二者略有不同,清华全文浏览器通过“栏选”或“图像选择”及“复制”功能键即可实现对文本文件或图像文件的全文编辑功能;维普全文浏览器利用OCR文字识别技术,把图像文件转换成文本格式,从而实现全文数据的编辑剪贴功能。使用的功能键包括“选择区域”和“识别选定区域”;对无法转换成文字的(下转第7页)
信息服务实现创品牌的重要策略,也是实现高校图书馆信息服务品牌战略的重要内容。
4.1 提供优质的服务是实施品牌战略的关键
图书馆的工作实质就是服务工作,因此提供最优质的服务是高校图书馆信息服务实施品牌战略的关键。这就要求高校图书馆员树立品牌服务的意识和全方位的服务理念, 遵循服务至上的原则,服务质量要好,服务水平要高。
4.1.1 端正服务态度,树立良好的服务形象
诚恳、热情的服务态度是服务工作的基础,高校图书馆信息服务实施品牌战略,就要端正服务态度,要热情、亲切的对待每一位读者用户。服务语言要美,语调要柔和, 让语言成为一股暖流,滋润读者用户的心田。服务要及时、新颖、准确,让所有读者用户感到不同程度的满意。要及时反馈读者用户的投诉和各种要求,解除他们的后顾之忧。良好形象的树立,必然会赢得很好的信誉和口碑,而信誉和口碑都是建立品牌服务的重要途径。
4.1.2 提高技术水平,突出服务特色
随着计算机技术和网络技术的高速发展,信息资源急剧增长,人类的信息需求日趋多样化,高校图书馆信息服务必须迎接挑战,提高服务技术,建立电子化、网络化的信息服务方式。要尽快掌握先进的科技手段,为读者用户提供快捷、新颖、方便、高质量的智能信息服务。要在服务创新上下工夫,要根据本馆的实际情况,开展一系列有特色的服务项目和服务形式,突出本馆信息服务的特色。技术水平的提高,服务特色的建立,必然推动高校图书馆信息服务品牌战略的实施。
4.2 拓宽服务领域是实施品牌战略的必由之路
拓宽服务领域,以规模创品牌是实施品牌战略的必由之路。高校图书馆信息服务实施品牌战略一方面必须扩大服务对象的范围,在满足本校师生需求的同时,积极为其他院校教学科研服务,为企业服务,为政府决策服务,扩大图书馆信息服务的影响范围,树立品牌效应。另一方面在专题服务、定题跟踪、信息咨询、用户培训等服务内容上,勇于开拓新的服务内容。开展深层次信息评估服务, 架起科研和生产沟通的桥梁,一方面了解企业的技术需求, 把现有的技术反馈给企业,另一方面,为科研人员提供信息反馈,为科研项目提供产前、产中、产后服务。开展引资融资中介服务,高校图书馆利用所拥有的丰富信息资源和人力资源,对需要引进资金的项目的先进性、新颖性作出判断,淘汰那些技术含量不高的项目,把那些先进的技术项目向有资金的投资公司或个人推荐,促成双方合作。开展竞争情报服务,高校图书馆信息服务加强竞争情报的研究,为企业提供竞争策略的建议;加强有关的科技情报研究,为企业实施科技创新提供有关产品和工艺方面的科技信息;加强对市场的调查研究,为企业提供产品和服务营销方面的策略性建议。服务对象的扩大,服务内容的多样化,拓宽了服务领域,给高校图书馆信息服务带来了生机和活力,确保了高校图书馆信息服务品牌战略的发展。
图形、表格、公式等部分,则通过“选择区域”和“复制选定区域”功能键,把图像粘贴到word或其它文档。此外维普全文库在检索结果细阅区的文献出处项还提供了文献的具体起止页码,增强了系统功能的完备性。
5 改进的建议
5.1 完善数据库建设,充实全文检索数据资源
从以上比较可以看出,两个数据库在数据资源建设上各有千秋,清华全文库试图以专为方向,维普全文库则以全为发展目标。在数据源的准确性与完整性上双方还要继续努力。维普全文库应加快回溯性全文数据的建设步伐,充分发挥其收录文献时间跨度长、收录期刊种类多的优势。清华全文库则需进一步扩大入编期刊范围,尽可能收齐相关刊物,以提高文献的查全率。
5.2提高数据标引质量,确保检索功能发挥作用
两个数据库在数据标引方面均存在数据著录不全的问题,很多项目存在空缺,有的缺关键词,有的缺文摘,有的缺机构,这就使得从这些途径查找文献时的漏检率较高,直接影响了全文数据库的检索效果,并为用户带来诸多不便。因此,双方都应进一步提高数据标引质量,一方面对遗漏或缺少的项目尽量补充齐全,使每篇文献都有全面准确的关键词和摘要等信息,确保检索途径能充分发挥作用。另一方面还需提高标引深度,做到规范标引。
5.3 完善检索技术,增加检索功能
在检索技术方面,检索功能还可增加。维普全文库应增加全文检索功能。全文检索可在全文范围内进行检索词的匹配,具有较高的查全率,特别适合于前沿性课题的文献检索是全文检索系统发展和完善的方向之一。清华全文库一方面可考虑增加对核心期刊的限制选择功能。因为用户检索时不仅关心检索的查全率和查准率,更关心检出文献的质量保障,虽然系统提供的“基金”检索途径也可检索具有科研基金资助项目的文献,但能够获得科研基金资助的项目毕竟不多,使得该检索途径不能真正满足用户对优质文献的检索要求,如能增加对核心期刊的限制选择功能,便可满足用户对检出文献质量的必要控制。另一方面还可考虑增加同义词库和同名作者库智能选词功能,以便提高系统的查全率和查准率。