基于数据挖掘技术的图书馆个性化信息服务探讨

进入电脑版    时间:2017-02-05 22:27:26

郭菁菁

(枣庄市图书馆,山东枣庄277100)

关键词:图书馆;个性化信息服务;数据挖掘技术;关联规则

摘要:文章从数据挖掘技术的相关原理出发,构建了图书馆个性化信息服务系统,并对数据挖掘的实施过程进行了简要论述,并从关联规则的角度介绍了基于数据挖掘技术的图书馆个性化信息服务的实现途径。

中图分类号:G250.7文献标识码:A 文章编号:1003-1588(2016)02-0127-03

收稿日期:2016-01-02

作者简介:郭菁菁(1985—),枣庄市图书馆馆员。

文献信息的检索与传播是图书馆的基础职能,随着图书馆数字化、智能化、自动化程度的不断提升,很多图书馆引入了中外文全文数据库。一方面满足了读者多样化的文献信息需求,另一方面也增加了读者在短时间内获取有效信息资源的难度[1]。个性化信息服务是图书馆“以人为本”价值理念的直接体现,是一种最大限度满足读者需求的主动性或智能推送性的服务模式,即通过对用户的借阅习惯和个性特点进行分析,进而主动地向用户提供其可能感兴趣的信息。这一服务模式涉及庞大的数据采集、处理、分析和归类,需要强有力的数据集成分析工具来支撑。数据挖掘又称知识发现过程,即利用关联规则从大量的、模糊的、不完全的信息数据库中提取潜在的、对读者而言有价值的信息。数据挖掘技术最先应用于商业领域,近几年已经开始引入图书馆管理与服务之中,其在图书馆个性化信息服务中的应用仍有较大的开发空间。

1基于数据挖掘的图书馆个性化信息服务系统设计

1.1整体结构模型

图书馆个性化信息服务涵盖了用户从网站注册到接受系统提供服务的全过程。这一系统首先对图书馆用户信息进行收集,而后关联技术对用户需求行为进行模型构建,继而用已存在的图书馆资源知识库与用户模型进行对照,提取出用户需求的具体信息服务(见图1)。

图书馆个性化信息服务系统分为两大基本模块,即在线推荐模块和离线挖掘模块,图中上半部分为在线推荐模块,下半部分为离线挖掘模块。知识资源库又细分为信息采集层、信息存储层、信息加工处理层、信息服务层等部分内容。其中,信息采集层、存储层和加工处理层满足了图书馆个性化信息服务中的强大数据需求,是数据挖掘的必要条件。系统数据采集通过搜集读者使用图书馆的信息而实现,如读者刷卡保留的借阅信息、个人身份信息等。待采集环节完成之后,由资源处理层对采集信息进行分类加工,更新知识数据库信息,确保数据资源的即时性(见图2)。

从图2可以看出,资源采集层实现信息采集有两种方式,即自动采集和人工采集。所谓自动采集指的是系统根据用户在图书馆中借书、还书、业务办理等刷卡记录自动提取并存储读者信息。人工采集是一种必要的辅助采集手段,某些情形下,因为系统的原因导致用户个人信息无法收录或收录不完全,如系统因功能故障未记录部分用户的身份信息,此时就需要依靠管理人员根据系统提示对用户信息进行完善补充。资源处理层除具备清理和分类信息功能之外,还具有把不规则数据转换为可识别数字信息的作用,最后经数据挖掘工具将其转化为统一识别的知识规则集,以实现个性化信息资源推送服务。

1.2工作流程

系统总体工作流程从用户和图书馆后台数据两方同时开展。首先,用户在图书馆个性化界面中注册信息并申请登录账号,实现与后台数据系统的实时交互。其次,用户通过登录认证查阅各类文献信息,同时点击接受图书馆个性化信息服务操作指令。个性化信息系统后台则根据已录入的用户信息,建立用户使用模型。最后,信息系统后台利用数据挖掘技术获取图书馆资源库中的关联资源,并向用户进行推荐(见图3)。

1.3系统模块构成

在线推荐模块为离线挖掘模块运行提供了数据支撑,而离线挖掘模块辅助在线推荐模块实现信息推送服务,两者共同组成了个性化信息服务模块,都不可缺少[2]。在线推荐模块在完成用户信息采集后,对信息进行整理归类,而后与系统知识库进行比对,最后根据关联规则生成用户所需要的信息。离线挖掘模块通过对用户进行的聚类细分找出相似用户群体,继而构建用户模型,完成个性化信息推送服务。

 1/3    下一页 尾页

上一篇:传播学视角下网络导读体系的构建
下一篇:透辟精审之作

相关信息