关于档案数字化的编制及其保存方法

进入电脑版    时间:2017-02-07 18:51:42     来源: 《河南图书馆学刊》2010006期

秦海萍

(江苏省苏微微生物研究有限公司,江苏 无锡214063)

关键词:档案数字化;编制;保存

摘要:基于电子信息技术,本文结合现代档案数字化系统的建设现状,围绕档案数字化的分类、存储栽体、存储方式及档案备份.提出了档案数字化的保存方法和维护档案保存系统的措施。

中图分类号:G250.7 文献标识码:A 文章编号:1003-1588(2010)06-0068-02

1 档案数字化的编制

1.1档案整理

纸质档案数字化的流程:(1)目录数据准备。按照《档案著录规则》等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。对错误或不规范进行修改。(2)拆除装订。(3)区分扫描件和非扫描件:无关和重份的文件要剔除,有正式件的文件不扫描原稿。(4)页面修整。破损严重、无法直接扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件先进行相应处理(压平或熨平等)。(5)档案整理登记。制作并填写数字化加工过程交接登记表单.详细记录档案整理后每份文件的起始页号和页数。(6)装订——扫描后的工序。扫描完成后恢复装订,应注意保持档案的排列顺序不变,做到准确、无遗漏。

1.2档案扫描

(1)确定扫描方式。根据档案幅面大小选择相应规格的扫描仪。纸张状况较差,纸张间粘贴较紧,不易分开,过薄、过软或超厚的档案,不宜使用自动进纸扫描,必须改用平板扫描方式。大幅面档案可采用大幅面扫描仪扫描、数码平台拍摄,也可以采用小幅面扫描后的图像拼接方式处理。(2)扫描色彩模式。扫描色彩模式一般有黑白二值、灰度、彩色三种。页面为黑白两色,并且字迹清晰、不带插图的档案,采用黑白模式扫描:页面为黑白两色,但字迹清晰度差或带有插图的档案.以及页面为多色文字的档案,可采用灰度模式扫描:页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式扫描。(3)扫描分辨率。扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。采用黑白二值、灰度、彩色模式对档案进行扫描时,其分辨率一般均建议选择大于或等于lOOdpi,特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。需要进行OCR汉字识别的档案,扫描分辨率建议选择大于或等于200dpi。(4)扫描登记。登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致.不一致时应注明具体原因和处理方法。

1.3 图像处理

(1)图像数据质量检查。对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,重新进行图像的处理。由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。发现文件漏扫时,及时补扫并正确插入图像。发现扫描图像的排列顺序与档案原件不一致时,及时进行调整。(2)纠偏。对方向不正确的图像进行旋转还原,以符合阅读习惯。对出现偏斜的图像进行纠偏处理,以达到视觉上基本不感觉偏斜为准。(3)去污。对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等进行去污处理。(4)图像拼接。对大幅面档案进行分区扫描形成的多幅图像进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。(5)裁边处理。采用彩色模式扫描的图像应进行裁边处理.去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

2 档案数字化的保存

2.1 明确电子文件的归档内容

电子文件的归档内容包括电子文件的名称、路径名和盘号,与文件内容相同的其它载体文件的档号,编制该电子文件的软硬件名称、型号、系列和版本等技术环境条件。归档部门,归档日期,档案数字化的有效管理涉及到电子文件的技术环境条件.存贮介质的质量、寿命等问题,因此电子文件的归档时间可视具体情况而定,一般有年度归档、阶段归档等。且归档时间一般不超过2—3个月为宜。

2.2存储要求

2.2.1 选择存储格式。采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时压缩率的选择.应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。(2)命名图像文件。纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号.以该档号为这份文件扫描后的图像文件命名。多页文件采用该档号建立相应文件夹,按页码顺序对图像文件命名。

 1/2    下一页 尾页

上一篇:论省级公共图书馆数字资源建设
下一篇:论图书馆数字文献资源采集和检索模式

相关信息