基于数据挖掘技术的现代图书馆系统设计

进入电脑版    时间:2017-02-05 20:34:30     来源: 《图书馆学刊(辽宁)》2013002期

吴 灿

(重庆图书馆,重庆 400037)

[摘 要]以数据聚类挖掘技术为依托,为图书馆设计了数据聚类挖掘数学模型,并阐述了如何将其应用于图书馆资源、读者、服务方面,以期有效提升图书馆现代化管理水平。

[关键词]数据挖掘技术 图书馆 数学模型 管理

[分类号]G250.7

随着图书馆信息化、数字化程度的提高,其职能也发生了较大的改变。数字化、信息化的图书馆除了具有传统图书馆的职能外,还是馆领导做决策的重要依据,成为图书馆发展数据库和知识库的重要组成部分。如何有针对性地为读者在纷繁复杂的信息中选取有效的参考信息,以及对图书馆的各种资源进行科学化管理是现今图书馆工作面临的重要任务。而数据挖掘技术的应用为图书馆的系统升级提供了重要的技术支撑。

著名的图书馆管理博士W·J·Frawley对数据挖掘是这样定义的:数据挖掘就是从大量的、复杂的、不完整的应用数据中提取被人们忽视的但又有很大利用潜能的数据的过程。数据挖掘技术是随着数据库和自动化技能发展而出现的新的信息技术,与数据分析的差别就在于,数据分析是通过分析数据来验证人们已知的假设,而数据挖掘则是从大量人们已知的数据中挖掘出人们未知的信息。

1 数据挖掘对图书馆管理提出新需求

网络信息服务是指专门提供信息服务的机构运用计算机、通讯网络等设备、设施,提供因特网信息服务。信息服务主要有两种,即传统信息服务和现代信息服务。传统信息服务主要包括利用报纸杂志、影视作品、电台广播等提供的服务;而现代信息服务是以计算机提供的网络为核心,以数字化的形式为客户提供信息服务,包括电子书、网页新闻、网络搜索和查询、信息传递等。

信息技术和数字化的发展为图书馆体系的升级提供了重要的前提和条件,数字图书馆便是信息化和数字化的产物。数字图书馆是图书馆提高网络信息服务的重要途径和条件,网络信息服务是数字图书馆建设的根本目标,也是联系数字图书馆和读者之间的重要纽带。

随着图书馆信息化、数字化的发展,图书馆体系的具体任务转变成如何让使用者更加有效地利用图书馆资源,以及如何更好地针对读者需要从纷繁复杂的信息中找出关键的可靠信息。数据挖掘技术的最大优势就在于“意外”性,这便为图书馆的管理工作和服务质量的提升提供了更多可能。

数据挖掘技术可以从杂乱无章的数据中提取出最符合要求的参考信息,而在数据挖掘技术的实现研究中,笔者所要研究的数据主要来源于工作中的现有数据。通过选取读者借阅信息进行聚类分析,了解图书馆的使用率和图书的借阅率,挖掘出隐性的图书馆运行规律,总结出数据挖掘技术在图书馆系统中的应用模型,然后用此模型来指导图书馆的管理和服务工作,进而提高图书馆服务和管理工作的效率。

2 信息化数据挖掘技术

2.1 图书馆信息化聚类

现阶段,信息化数据挖掘技术发展迅速,理论研究不断创新,已经成功研发了各种数据挖掘软件,被广泛应用到不同领域并逐渐得到认可,正是这些领域的成功引起了图书馆的极大关注。在图书馆现代管理系统中能够产生大量不同种类的数据,自动化系统本身也包含很多数据。可以依据这类数据的特点,定向研究适合图书馆应用的数据挖掘软件,并通过运用这类软件挖掘出对图书馆有意义的部分信息,进而了解读者访问图书馆的目的及整体趋势。根据读者的兴趣需求,采取适当措施及时完善服务质量,以优质的服务提高读者的满意度。

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。人类通过聚类研究事物内部规律,由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。聚类分析为进一步分析处理数据提供前提。作为数据挖掘功能,进行聚类分析后,可以整体了解数据分布情况,了解数据所存在的特征,并对其特定部分进行深入分析,识别出数据密集区和稀疏区,纵观全局数据分布模式及其属性关系等。由于大部分现实存在的大量数据库中不可避免地要涉及空缺、孤立点、未知错误数据等,那么只是单纯地按照聚类分析数据可能会直接影响聚类分析结论的准确性。

2.2 图书馆信息化聚类模型建设

事物之间都有自己的特有属性,我们可以假设对象A= {ω1,ω2, ω3,…,ωn},其中ω为其特有的属性,对象B={ζ1,ζ2,ζ3,…,ζm},如若A与B之间存在某种相关性K,我们可以认为在该相关性上对象A与B属于同一类,而K为A,B对象在K关系上的函数,可记为K(A,B)。显然关系K是建立在A对象与B对象属性的某一非空子集之上。

 1/3    下一页 尾页

上一篇:移动图书馆构建与发展取向研究
下一篇:手机二维码在图书馆的应用研究

相关信息