预测模型对多校区图书馆典藏规划的启示

进入电脑版    时间:2017-02-06 23:43:51

聂飞霞

(西北大学图书馆,陕西西安710127)

关键词:预测;多校区图书馆;典藏规划

摘要:随着高校图书馆的多校区发展,图书馆典藏工作迎来了新的挑战。文章提出了运用预测技术对图书借阅量进行预测分析,从而使多校区图书馆的典藏工作更加科学有效的方法。

中图分类号:G250.78文献标识码:A文章编号:1003-1588(2014)03-0118-03

收稿日期:2014-01-05

作者简介:聂飞霞(1979-),西北大学图书馆馆员。

进入2012年,“大数据”这个专有名词开始出现在人们的视野中,各行各业的专家学者开始提出“大数据时代”所带来的挑战。那么,何谓“大数据”?目前业内对“大数据”一词仍没有统一的定义,但笔者认为,大数据(Big Data)就是指随着某一行业的发展而不断增长的数据量,它并不是一种技术,而是人们对庞大繁杂数据的一个称谓。由于其量的庞大,使得我们经常所用到的统计分析功能已经无从下手。所以,在“大数据”时代,一种技术再一次得到升温,那就是数据挖掘技术。

数据挖掘(Data Mining)技术在1998年作为一种数据处理技术概念被提出,并在上世纪末开始活跃于各个领域[1]。其在图书馆领域的应用晚于诸如通信、银行等其他行业,但数据挖掘技术在其他领域的广泛应用,给其在图书馆的应用打下了良好基础。作为图书馆工作的重中之重,随着RFID (Radio Frequency Identification)射频识别技术在图书馆的应用,使得典藏工作更加科学系统化。然而,由于国内很多大学图书馆都实行了多校区办馆,在适应了高校现有的多校区办学的现状的同时,却给典藏工作带来了前所未有的挑战[2]。面对因为多校区办馆而激增的流通数据,如何从这些庞大的数据源中发现真正有利于多校区典藏规划的信息呢?如何使得多校区典藏工作更加科学有效呢?数据挖掘的分析方法主要有分类、预测、关联规则、聚类分析、回归、顺序规则、时间序列和决策树。这些分析方法都可以用来建立一些模型,这些模型可以用来描述数据之间的联系以及模式[3]。笔者主要介绍如何将数据挖掘技术之一的预测技术应用于多校区典藏规划中。

1如何建立多校区典藏预测模型

预测,即Forecast。预测技术是通过已知数据来了解事物今后发展情况和走势的技术。建立预测模型的方法有很多,常用的方法有回归分析预测、趋势外推预测、基于神经网络的预测和时间序列预测等。

1.1分析预测目标以及确定预测时间

多校区办馆导致了图书馆典藏机制面临重大的挑战——一类图书放到哪个学区才能使其被充分利用。因此,笔者的分析目标就是图书需要的科学摆放区域,而预测时间选择为十二年。

1.2预测前期的资料采集与调研

图书馆典藏工作中的图书摆放模式有两种,一种是按照内容的摆放,例如分类排架;另一种是按照图书的形式摆放,例如装订方式排架等[4]。目前,高校图书馆运用较多的是按照索取号排架的方法。由于索取号是由分类号和著者编号组合而成,因此在进行数据挖掘的前期可以对图书进行分类号的特征采集,这有利于我们下一步预测方法的选择。以西北大学图书馆的借阅数据为例,由于西北大学图书馆有南区图书馆和北区图书馆两个分馆,需要预测某一特征的图书某一年在南北分馆的借阅量,以此来确定典藏地点的分配(见表1)。如表1所示,北校区图书馆借阅量为Nyi,南校区图书馆借阅量为Syj,表1为某类特征值图书两校区借阅数量统计。

1.3选择一种适用方法

如表1所示,特征采集过程中两个校区的借阅量是我们要预测的对象。预测建模的诸多方法中,回归分析预测建模中的一元线性回归预测方法可以应用到多校区借阅量预测中。

1.4对预测结果的分析与评估

通过一元线性回归预测方法,我们可以预测到一个分类号在两校区的借阅趋势。这里应该对预测的结果进行分析与评估,确定结果是否符合预测的要求,并运用预测模型进行检验,以此来比较本次预测的精确度。

2一元线性回归预测模型的应用

一元线性回归分析是处理两个变量x(自变量)和y(因变量)之间关系的最简单的模型,研究的是这两个变量之间的线性相关关系[3]。一元回归的公式为:

yi=a+bxi+ui(i=1,2,…n)

 1/2    下一页 尾页

上一篇:公共图书馆总分馆服务体系下的儿童阅读品牌活动建设
下一篇:公共图书馆少儿阅读推广服务探索*

相关信息