美国高校图书馆大数据服务实践研究及启示

进入电脑版    时间:2017-02-05 23:07:48

吴晓静

(永安市水利电力职业技术学院图书馆,福建永安366000)

关键词:大数据;高校图书馆;服务转型

摘要:文章根据大数据背景下,美国高校图书馆尝试服务转型,并以雪城大学、斯坦福大学为例,雪城大学应用大数据技术收集社交媒体信息,预测2016年总统大选;斯坦福大学参与社会互联网信息与电子邮件保存、整合与管理的实践,体现了在大数据时代美国高校图书馆服务的转型新趋势,为国内高校图书馆的服务创新及转型发展提供了经验。

中图分类号:G250. 74

文献标识码:A

文章编号:1003 -1588(2016)07 -0122 -03

随着信息技术的快速发展,现实物质世界不断被数据化,当物质世界完成数据化的构建及解读,人类即迈入智能时代。大数据时代催生了新的知识需求模式及管理模式,对图书馆行业产生了深刻影响。一方面,图书馆界加快了基于互联网、大数据技术的融合转型,开始运用互联网思维变革、创新服务,在合作、支持、外向发展的思维指导下,图书馆员开始日益关注如何更加有效地与研究人员开展合作,如何满足教师及社会大众的多元需求。另一方面,图书馆开始充分依托大数据技术,推动数字资源整合,提供深度服务。其服务模式包括:①通过馆藏资料的数字化和网络化加大馆藏资源的揭示力度,提供一站式服务,通过异构数字资源的融合、聚类和重组使资源从数据层的揭示与展现转向信息层、知识层的深度服务。②加强用户数据分析,实现个性服务。如:通过大数据分析精准预测单个用户信息需求模式及行为模式,推送服务。③参与互联网信息的采集、保存和服务。如:整理社交媒体信息,帮助社区理解主要的数据和信息资源,并利用数据构建智能社区。近日,美国图书馆协会主席萨莉·菲尔德曼在接受《高等教育纪事报》采访时以雪城大学图书馆的STACK(堆栈)项目等为例,展示了美国大学图书馆在大数据利用方面的示范作用。对国外大数据创新服务实践经验的研究能够为国内图书馆的服务转型提供参考和借鉴。

l 美国高校图书馆大数据服务实证研究

1.1雪城大学图书馆STACK项目

大数据产业链与数据的生命周期密切相关,数据从产生、整合、处理、智能分析,最后与创新服务的结合应用,构成了大数据完整的产业链,而完整的大数据技术堆栈则相当于涵盖数据生命周期的大数据平台。通常的数据堆栈包括:①作为堆栈底层和基础的数据层。②发生数据准备、数据处理、数据转换和数据整合的整合层。③存储数据、对数据进行可视化、分析数据的分析层。④使用数据(包括历史数据、外部数据和实时数据)、业务规则和机器学习来进行预测及获取大数据价值的预测及规范分析层。从底部数据存储、操作、转换、基本分析发展到高级分析的预测,是大数据技术应用发展的必然。在数据堆栈技术的应用上,美国雪城大学iSchool走在了图书馆界的前列。

STACK项目是雪城大学iSchool新开设BITSLab( Behavior,lnformation,Technology and Society行为、信息、技术、社会实验室)的第一个项目。作为雪城大学iSchool跨学科数字政治项目的分支,STACK项目具体运作如下:①开发STACK软件与Twitter、Facebook数据流、搜索工具的应用程序接口。②围绕36位竞选州长,展开大数据采集,这些信息包括在Twitter中被推送、加标签、关注、谈论的相关信息,在Facebook中被发布、喜欢、分享、追随的频次以及在Instragram、YouTube上的相关照片、视频等。③以Python格式语言将这些非结构化、半结构化数据存储在MongoDB NoSQL数据库中。④分析选民对各候选人的谈论及态度,各候选人的选举策略及选举圈内的信息传递、转移模式等。在开始运行的数周内,STACK项目就已经收集了超过70万条推特信息及大量脸书评论信息,每周项目组均会就大数据调研结果编写基本的定性分析报告,预测大选发展趋势及可能出现的新信息、新选情。在大选结束后,项目组还将围绕数据基础管理、大规模数据集处理、情感分析总结出一套协调化、多管齐下的大数据分析方案。

1.2斯坦福大学图书馆ePADD项目

ePADD项目是斯坦福大学图书馆联合伊利诺伊大学香槟分校、哈佛大学、加利福尼亚大学图书馆及纽约城市图书馆委员会,通过合作开发支持电子邮件档案检索、采集、处理、评估、传递的开源软件,参与互联网信息的整合与管理,促进统一性国家数字平台的形成,这也是IMLS国家数字平台项目二阶段的子项目之一。2014年,斯坦福大学图书馆正式启动ePADD项目,一阶段的任务包括:针对资助者、档案工作者及研究人员所面临的电子邮件访问、管理等日常问题开发ePADD工具,利用自然语言处理、自动元数据处理及其他批处理技术,形成基于工作流的电子邮件档案管理,提升电子邮件中隐藏性文化遗产资源的能见度及可获取性。二阶段的任务包括:①发展ePADD评估、处理、搜索、传递关键功能模块,形成支持电子邮件存取的生态处理与T作流程系统,促进跨馆藏、跨机构的电子邮件发现与检索及对公众的可见性。②创建培育融合ePADD用户、开发者及充满活力的持久型社区,促进在eP-ADD使用基础上,整个社区的广泛参与与充分合作。ePADD项目是斯坦福大学图书馆以外向发展思维为指导,在充分合作基础上,参与互联网档案管理、挖掘电子邮件大数据价值的有益尝试。

 1/3    下一页 尾页

上一篇:我国医学院校图书馆逾期催还制度调查与研究
下一篇:国外高校图书馆电子教学参考信息服务研究

相关信息