辽宁地区公共图书馆中文图书联合目录数据库建设刍议

进入电脑版    时间:2017-02-05 11:06:59

刘语涵

(辽宁省图书馆,辽宁 沈阳 110015)

[摘 要]介绍了“辽宁地区公共图书馆中文图书联合目录”数据库收录范围、构建过程,对构建过程中出现的问题提出解决策略,对数据库的作用、挖掘地方文献、成员馆上传权限以及拓展收录范围等方面展开讨论。

[关键词]联合目录 编目中心 资源共享

[分类号]G250.74

中国国家图书馆自1998年建立全国图书馆联合编目中心(OLCC)以来,开展了全国性的联机联合编目工作,实现了全国范围内的书目资源共享。辽宁省图书馆(以下简称本馆)已加入OLCC,成为其成员馆,并已获准成立辽宁地区联合编目分中心(以下简称中心)。中心自成立以来已建立了地区性的联合目录服务网络,通过定期召开全省编目工作会议、建立网络工作群等形式服务于地方成员馆,为地区性联合目录建设和资源共建共享发挥了不容忽视的作用。联合目录是揭示报道多个文献收藏单位所藏文献的目录,是实现书目共建共享的基础。中心于2009年全省编目工作会议上提出建立“辽宁地区公共图书馆中文图书联合目录”数据库的构想,得到与会成员馆代表的积极响应。经过收集数据、整合数据两个阶段,历时两年多该数据库已基本建成,现已进入日常维护补充阶段。笔者全程参与数据库建设,现结合实践就构建过程中出现的问题、解决策略以及如何发挥数据库的作用等问题展开讨论。

1 数据库的收录范围

“辽宁地区公共图书馆中文图书联合目录”数据库以辽宁地区公共图书馆普通中文图书书目数据为收录对象。目前该数据库包括国家图书馆书目数据、本馆全部馆藏书目数据,以及辽宁省内11家市级馆、15家县区馆的馆藏书目数据,共计200余万条,全部注明馆藏信息,馆藏信息以代码形式出现在数据的馆藏项上,并在本馆联合目录系统中发布。

2 数据库的构建过程

2.1 系统准备

此次建库使用的是由深圳图书馆开发的UACN_UC联合编目系统,此系统由中心管理部分(Central)与成员馆部分 (User)组成。中心管理部分能够实现对成员馆的管理、数据质量控制、中心数据库维护等功能。

2.2 馆代码设置

系统设置成员馆代码为6位数字。第1~3位为地区码,参照《中华人民共和国省、自治区、直辖市及地区代码表》,辽宁地区设置为021。第4位为馆类别代码,0代表市级公共馆、1代表县区级公共馆、2代表高校馆。第5~6位是流水号。国家图书馆的馆代码为011001。表1为辽宁地区市级公共馆联合目录数据库馆代码表。

2.3 数据收集

建库过程中数据收集分为两个阶段,第一次数据收集阶段接收省内9家市级公共馆的书目数据共684907条;第二次数据收集时接收11家市级公共馆2009年以后的书目数据共764797条及15家县区馆的书目数据725903条。

2.4 数据整合

本次建库全部数据采用中国机读目录格式著录,著录内容有详有简,均使用《中国图书馆分类法》进行分类标引。

2.4.1 数据整合前,先对数据进行抽查,一方面检查各馆数据质量,依据质量情况确认接收顺序;另一方面检查相同数据之间的差异,希望通过前期工作为数据整合提供依据。通过抽查,数据差异主要表现在如下几个方面:①ISBN录入不全;②正题名的选取不一致;③同一责任者检索点形式不规范;④出版发行年著录不一致。这些因素导致重复数据的产生。第①、②、③类问题产生的偶然性大,中心在数据接收时没有对这部分数据进行处理。

2.4.2 数据整合时,首先通过系统设置的基本字段进行比对,导入数据的同时核查登记库,在相同的书目数据下添加馆藏信息。这样做的目的是使相同的数据只被接收一次,同时添加相应馆藏注记。UACN系统设置的基本查重字段为ISBN、题名项、出版项,系统把3个基本字段作为整体进行比对,通过基本字段确认书目的唯一性,任何一个子字段有差异都被认为是不同数据。经抽查发现基本字段ISBN、题名项相同,而出版项中的出版时间著录不一致的数据量很大。系统自动判重时对整个出版发行项进行比对,虽然是同一种书,但出版时间著录不同就被认定是不同种图书,不能被去重。产生重复的原因主要集中存在于出版发行项210字段的@d子字段上。这部分重复数据数量较大,中心对这部分数据进行了重点整合处理。

3 存在问题与解决策略

 1/3    下一页 尾页

上一篇:基于图书馆2.0的数字阅读形态衍生思考
下一篇:辽宁地区图书馆微博现状调查分析

相关信息