虚拟图书馆的信息采集和组织管理

进入电脑版    时间:2017-02-07 19:45:30

2.2从网站、网页上采集和收录

2.2.1收集方式

目前虚拟图书馆常用的收集方式有以下三种:(1)利用搜索引擎:搜索引擎俗称“网络门户”,是搜集网络信息资源最方便的人手工具。据统计,至少85%的网上用户使用搜索引擎来查找信息。目前在因特网上已有数千个搜索引擎,中文搜索引擎也有100多种。按照基本的技术原理可以将搜索引擎分为基于Robot的搜索引擎、基于目录的搜索引擎和建立在独立搜索引擎之上的多元搜索引擎(Meta -SearchEngine)。三种类型搜索引擎的工作原理各不相同,检索效果也各有差异。(2)手工采集:尽管搜索引擎是目前因特网上查询信息的首要途径,但是由于因特网上信息量庞大.任何搜索引擎都无法全面涵盖所有的信息。实际上,目前最出色的搜索引擎也仅仅覆盖了因特网信息量的16%。如果片面地只依靠搜索引擎来检索网上的信息资源,将会产生重大遗漏,因而必须广泛借助其他途径和手段来查询网上信息。对于数量巨大、纷繁复杂的网络信息资源,手工搜集看似大海捞针,但在自动搜集走向智能化之前,手工搜集仍然是必不可少的一个环节。(3)自动搜集:自动搜集就是指被称为机器人(ROBORT)、蜘蛛(SPIDER)等的计算机程序定期或不定期拷贝所访问的互联网主机.绝大多数是万维网的服务器的部份或是全部内容然后由提供检索服务的公司或单位对之标引和组织,虚拟图书馆要根据本学科、本专题的特点编制适合于本学科专业信息收集的自动搜集软件。具备自动搜集功能是一个优秀的虚拟图书馆必须具备的基本条件,否则就难以对互联网上的日益增长的信息进行追踪。

2.2.2收集内容

与其他网络二次信息系统相比.虚拟图书馆所收录的网页网站都具有学科专业及专题性的特点。从内容上讲.虽然不同的虚拟图书馆收录的网页网站存在着较大差异.但除了与所选学科专业专题相关的特殊问题的信息资源外,一个虚拟图书馆,无论是什么专题,如果有网络信息资源保障的话,都应该收录下述类型的网页网站:(1)网络图书:它是因特网上一种常见的信息资源,具有出版发行周期短、“修订”及时、内容相对系统全面、成熟可靠等特点。网络图书的来源有三种:现有图书数字化后上网、原有的封装型电子图书(如软盘图书、CD-ROM图书等)上网和直接在网上出版发行的图书。(2)网络期刊:大致可分为两类:其一是传统期刊的网络版,其二是纯网络型期刊。前者大多为商业性的,而后者目前基本是免费的。网络期刊及其预印本出版周期短,报道速度快,刊载的多是一些学术性较强的论文,因而成为虚拟图书馆重点收录的对象。(3)会议论文:它的学术性较强,内容新颖,往往反映了某一学术领域国内外的最新发展状态,利用价值较高。(4)组织机构:包括从事虚拟图书馆所选领域的研究机构、实验室、教育机构、学术团体(学会、协会等)及产品的推广机构等。实际上每一个学科领域或专题都有相应的研究机构,绝大多数领域或专题都有相应的教育机构和学术团体。这些组织机构在进行教学、科学研究、组织学术交流以及其他日常活动中,产生了大量的原始信息。通过访问它们的网站,可以得到大量的技术报告、学位论文及教育教学信息等。

3虚拟图书馆的组织管理

3.1 虚拟图书馆的组织原则

由于数字化信息易于生成、复制与传播,信息的质量与价值参差不齐,这就要求虚拟图书馆在采集和组织信息资源时进行有效地评价和筛选,只有有价值的信息才可能被有效组织。因此,信息的选择是虚拟图书馆信息资源组织的重要内容。

3.1.1针对性原则

网络信息资源浩如烟海,任何用户和信息机构都不可能.也没有必要对网络上的所有信息进行开发利用。图书馆web站点信息资源的组织应始终以“用户为中心”,针对图书馆用户的信息需求,有目的、有重点、有选择地组织利用价值大、适合主要用户群的信息,准确定位上网信息的范围,做到有的放矢。“让用户以最小的代价.最短的时间,获得最满意的结果”。同时.在设计页面时也应站在用户的角度,对自建的数据库.在设计检索功能时,提供尽量多的检索方式和途径.多角度地揭示文献信息,如全文检索、联库检索、渐近检索、策略式检索等,从而提高信息检索与信息利用的效率。同时为了进一步完善网站功能和方便用户,还应提供交互工具,如站内检索、网上书店、留言板、读者论坛等,为网上用户提供一个集订阅、交流、信息反馈于一体的综合的、动态的交互环境,帮助用户更好的针对个人需求发掘和获取站内信息资源。

 2/3   首页 上一页 下一页 尾页

上一篇:基于资源整合的随书光盘网络管理模式
下一篇:全面质量管理视野下图书分类质量反馈体系的建立

相关信息