档案数字化加工是数字档案馆建设的一个重要组成部分,主要是利用计算机、扫描设备、图像处理技术、音视频处理技术等信息技术将传统介质存储的各类档案经过数字化加工处理,转化为档案数字资源,用档案管理信息系统统一管理,方便档案资源的存储、管理和利用。经过多年的档案数字化加工进程,档案数字化加工系统现在已发展得较为成熟完善,档案管理系统中都配备了数字化加工功能,便于档案部门开展馆藏资源数字化加工工作。
因加工传输处理的档案数据量较大,同时加工系统主要部署于档案工作局域网以保证安全等因素综合考虑,数字化加工系统一般采用C/S(Client/Server,客户机/服务器)和B/S(Browser/Server,浏览器/服务器)两种模式结合,主要包括数字化加工流程管理、作业流程控制管理、工作人员管理、档案数字化加工管理、批量格式转换管理、数据自动备份管理、工作情况查询统计管理、批量导入及导出等功能。纸质档案数字化包括档案扫描、图像处理、图像存储、目录建库、数据挂接等功能菜单,能接入扫描仪,在线实时扫描,在线图像处理挂接并存储,声像档案数字化的功能和纸质档案数字化类似,只是纸质档案数字化存储的对象为图像文件,声像档案数字化存储的对象为声音、视频等多媒体文件,数字化加工的流程是一致的,系统能有效管理各类音像档案、图片档案、录音档案等声像档案资源,参照文书档案管理要求和管理结构,对档案资源进行灵活的编目著录,数字化全流程管理,确保档案文件收集、整理、编研、查询及再利用,支持对声像档案资源采集、上传,在线组卷、智能组卷,提供完善的统计功能,无论是什么类型的档案信息资源,系统都能实现馆藏档案数字加工和处理业务的流程化管理。
对于纸质档案的数字化加工,系统可以实现纸质文件的在线扫描、处理和上传,支持采用国际标准的TWAIN(Technology Without An Interesting Name,一个软件和数码相机、扫描仪等图像输入设备之间的通信标准,目前市面上绝大部分扫描仪都支持该标准)接口驱动的扫描仪,支持直接连接扫描仪进行纸质档案的扫描上传,支持单/双面扫描,可以进行插入扫描、追加扫描、替换扫描及删除扫描,可以对扫描件进行编辑(自动消蓝、自动纠偏、自动去污、自动旋转、自动去黑边、自动裁剪、自动去噪点等),自动生成TIFF、JPEG和PDF文件(提供从TIFF自动转换为其他格式功能),提供众多的批量图像处理功能,支持文件名批量命名,支持文件名自动增长,可采用FTP(File Transfer Protocol,文件传输协议)方式批量上传电子文件并批量自动挂接到对应的每一件档案。
OCR(Optical Character Recognition,光学字符识别)识别功能是纸质档案数字化加工的必备功能,OCR是采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式文件的技术。档案数字化加工系统可以借助OCR识别功能实现纸质档案的全文内容检索,从而提高档案资料的查全率和查准率。系统能够对多个文件进行批量OCR识别,支持单个文件、多文件夹(包含子文件夹)批量识别,支持识别过程中的自动纠偏、自动版面分析,支持中文简体、中文繁体、英文、日文等多语言的文字识别。
经过OCR识别后的档案数字资源是一个图像和文字混合的文件,大都使用双层PDF格式文件来进行存储,方便档案管理人员对其进行管理和利用。双层PDF格式文件是一种具有多层结构的PDF格式文件,是PDF文件衍生的一种文件,上层是原始图像,即用户浏览时看到的原文图像,下层是文字,可以提供给用户选择文字进行复制、粘贴和全文检索等,上下两层位置一一对应。纸质档案经过数字化加工转换为双层PDF文件后,在此基础上与档案系统中的目录和元数据挂接后,即可使用档案管理系统创建为索引文件存入数据库,实现档案资源的全文检索,得到高查全率和查准率,提高档案资源的利用价值。
照片档案的数字化加工方式与纸质档案高度相似,只是在扫描分辨率等方面需设置更高参数(一般不低于600dpi),使用更清晰的图像长期保存照片档案,以便更加真实地还原照片档案中的历史场景和人物特征。(www.xing528.com)
录音录像档案的数字化加工处理也和纸质档案相似,只是加工的设备从扫描仪替换为放音机和视频采集卡等音视频处理设备。数字化加工系统同样需要考虑整个录音录像数字化工作的组织与管理,包含档案出库、数字化前处理、数据库建立、信息采集、音视频处理、数据挂接、数字化成果验收与移交、档案归还入库等全过程。设置不同的音频采样频率和视频码率,录音录像档案通过数字化保存为不同格式数字化文件的容量相差很大,效果也有很大差别。而录音录像档案数字化要实现尽可能真实地反映录音录像档案内容和便利的网上传输、利用,就非常有必要生成不同格式的数字化文件,从而满足不同的需要。[18]在录音录像档案数字化加工时,应该直接保存为高压缩率或不压缩格式的数字化文件,便于长期保存和再现原始录音录像档案的全部内容特征,在此基础上,通过数字化加工系统,可以压缩转换处理生成低压缩率格式的数字化文件,便于音视频档案的快速网上传输和利用。
目前绝大部分档案部门对声像档案的管理仅仅采用主题词等简单的文字说明来手工著录标引声像档案,但“读图时代”的到来和新媒体的不断发展,应运而生的海量照片档案、音视频档案也成了当前档案管理工作的重中之重。档案部门收集拍摄的声像档案大多是会议合影等具有保存价值的照片、录音和视频档案,而档案管理人员和摄影者需要对每一张图片、每一条录音和视频的人物、地点等关键词进行手工著录,工作量较大且因为不一定认识档案中的人物等信息,不能完整对声像进行著录。在实际工作中,声像档案文字说明不够齐全,不能全面展示档案中的信息,“有图无真相”的情形越来越多,已难以满足档案精细化管理和查档用户日趋个性化的利用检索需求,针对传统档案管理中对声像档案内容识别仅仅依靠著录的文字说明和部分声像档案文字著录不足等缺点,档案数字化加工系统应充分结合现在的计算机视觉处理技术,运用深度学习网络模型和框架对声像档案中的图片、录音和视频的内容进行识别,通过特征提取与对比,根据声像档案数据集构建本地模型进行训练学习,对照片档案中的人物、场景、建筑和文字等信息进行自动提取,自动著录为文字说明,把音频内容自动转换为文字,对视频档案中的内容进行实时目标检测,把视频中的人物、场景、录音等自动提取转化为视频文字说明,实现自动对声像档案进行自定义分类,对声像档案进行自动著录和内容挖掘,以解决传统声像档案管理中手工著录工作量大、效率低下且内容展示不足的问题。
在计算机视觉和互联网应用领域,对图片、录音和视频进行内容识别和目标检测历来是一个重要的研究领域。计算机视觉处理技术就是用计算机模拟代替人眼实现对目标的识别、分类、跟踪和内容理解。自1963年美国计算机科学家拉里·罗伯茨利用计算机对物体图像的边缘和形状结构进行提取来尝试理解图像内容开始,计算机视觉技术成为各个行业识别、检测和分类物体应用的重要工具。2012年杰弗里·辛顿团队使用卷积神经网络(Convolutional Neural Network,CNN)深度学习模型顺利在ImageNet国际挑战赛击败来自世界各地的高校和研究机构夺冠后,把深度学习方法用于计算机视觉推向了一个又一个高潮。现在,人脸识别和指纹识别在安防领域、自动无人驾驶在交通行业、拍照购物等基于深度学习的计算机视觉技术在各行各业都得到了广泛推广和成功应用。
基于深度学习的计算机视觉技术已经日趋成熟,同样可以应用于声像档案管理。对于档案管理工作来说,运用计算机视觉深度学习方法来对声像档案进行智能管理,通过特征提取与对比,根据档案工作中的声像档案数据集构建模型进行训练学习,对照片档案中的人物、场景、建筑和文字等信息进行自动提取,自动著录为文字说明,把音频内容自动转换为文字,对视频档案中的内容进行实时目标检测,把视频中的人物、场景、录音等自动提取转化为视频文字说明,实现自动对声像档案进行自定义分类,对声像档案进行自动著录和内容挖掘,以解决传统声像档案管理中手工著录工作量大、效率低下且内容展示不足的问题,便于声像档案资源的便捷利用和深度开发利用,为声像档案智能管理提供理论支持和实践指导。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。