图书馆中文图书书目数据质量问题及成因

进入电脑版    时间:2017-02-05 19:01:29

张虹

(辽宁省图书馆,辽宁沈阳110015)

[摘要]以辽宁省图书馆中文图书书目数据为例,对书目数据著录中各字段常见错误、产生原因以及避免错误、提高质量的方法作了比较细致的分析。

[关键词]书目数据库图书馆辽宁省

[分类号]G254.36

辽宁省图书馆是国家图书馆联合编目中心(以下简称国图)、(深圳)地方版文献联合编目协作网(以下简称深图)和上海图书馆联合编目中心(以下简称上图)3家全国公共图书馆系统联合编目中心的主要成员馆之一,多年来向编目中心上传了大量中文图书书目数据,深受编目中心好评,并多次荣获各编目中心的上载数据质量奖及其他各种奖项。该馆在文献编目实践中所反映出的一些影响书目数据质量的问题,具有一定的代表性,认真归纳和总结分析,有助于图书馆编目人员的参考和书目数据库建设的规范发展。在此,笔者结合实践梳理编目实践中发现的问题,并就其成因进行解析,以期为进一步提高图书馆数据质量提供助益。

1题名与责任者项存在的问题

题名与责任者项存在的问题主要涉及200、5--、7--字段。

1.1200字段正题名的选取问题

题名是一条数据中最重要的项目之一,作为主要检索点,同时也反映图书的主题。规则上规定得十分明确:“一般在出版物上出现的,用以命名出版物(或一组单独著作中的一种)的一个单词、短语或一组字符”,题名的规定信息源为题名页或代题名页。但就现在出版物的情况来看,印刷设计五花八门,图书的题名构成也趋于复杂,这就给我们著录时正题名的选取增加了一定的难度。在实际工作中经常出现的错误包括:

①题名选取不完整

例1:2001#@a二战德国战利品

正确做法是:2001#@a二战风云@h6@i二战德国战利品

由于印刷时正题名的字体较小,没有在题名页的主要位置上,导致多卷书著录错误。

例2:2001#@a轻松管家实用生活窍门

正确做法是:2001#@a轻松管家实用生活窍门精选

由于在题名页上构成题名的这12个字分为4行,又配有一些图案,因此就有人把后面的“精选”两个字给忽略了。

②题名选取不准确

例:2001#@a婴幼儿baby营养全书

正确做法是:2001#@a婴幼儿营养全书

看一下版权页和书脊就不难发现,这里题名页上的“baby”只是“婴儿”的英文,而不是题名的组成部分。

③题名中附加成分的著录不准确

如题名后有年代的,要具体分析。有的图书是按年代连续出版的,例:2001#@a特高压交流输电技术研究成果专辑(2010年),这是一套多卷书,以前出版的还有2005-2009年的,因此这里的“2010年”应著录为@h,直接用(),或著@e是不准确的;而有的题名后面的年代则是限定性质的,用@e即可,例:2001#@a铁岭工笔画@e2006-2011

④题名中的“硬伤”较多

这里“硬伤”是指不涉及规则的字面错误,包括汉字输入的错误,汉语拼音生成的错误,以及数字和字母的错误等。经常发现一些用拼音输入法导致的同音别字,例:执业/职业;传播/船舶;市场/时常……,以及其他输入法导致的错字、漏字、多字,都值得注意。题名中的错误之所以值得重点关注,是因为题名是一本书的主要检索点,题名著录不准确,会在很大程度上影响一本书的检索,同时也会导致编目库中数据的重复。汉语拼音生成的错误主要是题名中出现多音字的时,不能为多音字选择正确的读音。

例:2001#@a墓室里的秘密@9mushilidebimi

正确的做法是:2001#@a墓室里的秘密@9mushilidemimi

这个问题同样出现在需要生成拼音的其他字段。

例1:5171#@a网络时代的品牌建设策略@9wanglaoshidaidepinpaijianshecelue

正确的做法是:5171#@a网络时代的品牌建设策略@9wangluoshidaidepinpaijianshecelue

例2:701#0@a米芾@9mifei

正确的做法是:701#0@a米芾@9mifu

在这里值得一提的是,先进的编目系统是编目数据高质量的前提和保障,落后的编目系统如不及时更新,必然会随着时间的推移暴露出越来越多的问题,从而影响编目数据的质量。辽宁省图书馆所使用的ILASⅡ系统便是这样。单从字库一个方面来讲,就存在比较严重的问题。

首先是收录字的读音不全,如“禅”在《现代汉语词典(第5版)》中有“chan”、“shan”两个读音,而在ILAS字库中只有一个读音“chan”;“朴”在《现代汉语词典(第5版)》中有“pu”、“piao”、“po(一声和四声)”共计4个读音,而在ILAS字库中也是只有一个读音“pu”。

 1/4    下一页 尾页

上一篇:以文献共享为核心的数字图书馆构建策略
下一篇:公共图书馆文献采访质量控制探究

相关信息