档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案信息化 » 档案数字化 » 正文

从数字化前整理迈向数字化后整理

放大字体  缩小字体 发布日期:2019-01-09 17:28:15    浏览次数:41    评论:0
导读

在目前这股席卷档案界的数字化浪潮中,档案整理工作者最直观的感受就是将传统的整理工作纳入了数字化工程的流程之中,成为数字化工程的第一个重要工作环节,称之为“数字化前整理”。

从数字化前整理迈向数字化后整理

() 数字化前整理

在目前这股席卷档案界的数字化浪潮中档案整理工作者最直观的感受就是将传统的整理工作纳入了数字化工程的流程之中成为数字化工程的第一个重要工作环节称之为数字化前整理

从各地档案馆开展档案数字化的实践上看数字化前整理工作主要目标是解决案卷实体长期存在的一些问题集中表现在以下几个方面:

一是档号不规范没有目录号一卷多册现象较多

二是案卷标题不规范有标题但不能反映主题内容或标题缺少基本要素

三是许多案卷没有编页如果使用中掉页很难发现

四是组卷混乱标准不统一有按时间组卷的也有按职能部门管辖权限组卷的还有按文种组卷的

五是案卷厚薄不一薄的仅一二页纸一卷厚的达六七百页纸一卷

这些问题的共性是不规范而不规范是推进数字化工作的一大障碍必须加以克服由此可见数字化前整理工作环节的目的是夯实基础确保后续各环节能够达成标准化规范化和精准化的指标目前各地档案馆经过大规模的集中的数字化扫描形成并积累了巨量的电子档案数据并逐步以电子档案代替档案原件对社会开放基本消除了开放利用过程中档案实体的安全隐患一举解决了长期存在的档案开放与保管的矛盾

数字化前整理主要工作对象依然是纸质案卷的实体所遵循的原则依然是传统的案卷整理中一贯强调的保持文件之间的历史联系”“利用档案原有基础”“必须便于保管和利用等原则所采取的工作手段依然是以手工操作为主所以说尽管被纳入了数字化工程的流程之中数字化前整理从本质上是从传统的整理模式向现代数字整理模式转换的一种过渡形态

() 数字化后整理

所谓数字化后整理也就是对扫描产生的电子档案进行后期处理精细化再加工是对档案信息的深度挖掘

推进数字化后整理的必要性

之所以要推进数字化后整理主要的原因在于此时的电子档案毕竟是案卷级整理加工的产物所形成的案卷级标题存在着先天性缺陷因而导致了案卷级目录检索系统是一种不完善的检索系统为了克服这种不完善就必须再进行数字化后整理

案卷级目录体系的先天性缺陷有两点即题写案卷标题时的人为性和概括性

() 人为性

档案整理人员整理立卷的过程实际是对卷内文件信息进行加工处理的过程从信息学的角度看人们对外界信息的理解要受特定的环境因素如社会政治经济文化条件以及自身经历素质态度知识结构和心理特征等的影响这称为选择性理解不同的人对于同一信息可以有不同的加工处理方式产生不同的反应得出不同的结论英国有句谚语: 1000个读者就有1000 哈姆雷特同样的道理面对相同的一堆零散文档资料1000 个档案整理人员就能整理出1000 个不同的案卷撰写出1000 条不同的案卷标题来

传统的以为单位的整理方法是一种经验型的整理方法不是自然存在的事物它是档案机构为了保管和利用的方便对一组文件进行事后加工整理的产物灵活运用六个特征 (问题作者时间名称通讯者和地区) 以保持文件之间的历史联系并便于利用和保管是整理档案材料的基本原则也是衡量案卷质量的主要标准然而这种标准只是一种主观标准并非客观标准分类组卷案卷标题的拟写等只能凭个人的经验凭主观判断来完成由于这种整理方式的人为性太强因而整理结果难以把握其科学性也就大打折扣

() 概括性

根据笔者对中国第二历史档案馆(以下简称二史馆 ) 馆藏档案的抽样统计二史馆平均每卷的页数在100 页左右每一个案卷平均由20 份文件组成每份文件都反映不同的内容而在传统的以为单位的整理方式中案卷题名的字数一般被限制在50 个字之内以如此精练之文字来揭示如此丰富之卷内内容其难度之大技巧之高可想而知所以对于题写案卷标题的基本要求历来是: 以简练准确的文字概括揭示卷内文件最基本最主要的内容与成分换而言之案卷内其他非基本非主要的文件内容是允许忽略不计的于是卷内大量鲜活颇据价值的信息在整理人员题写案卷标题的过程中被无奈地过滤掉了由此可见案卷标题的概括性是以牺牲案卷标题的完整性和准确性为代价的

电子档案文件级目录制作

目前档案部门开展数字化后整理深度挖掘档案信息的工作集中体现在电子档案的文件级目录的制作上国家档案局在«数字档案馆建设指南»中就此专门提出要全面推进馆藏数字档案基础数据库建设优先建立馆藏档案的文件级目录数据库

开展档案数字化后整理建立馆藏电子档案文件级数据库目的在于有效地组织档案信息资源并方便查询和利用在达到信息整序的同时实现对档案文件的智能控制为此需要特别注意下述两个方面的问题真正做到按档案信息化的原则开展档案信息化

() 要清醒认识到案卷级标题与文件级目录的根本区别

由于两者在主要工作内容技术手段工作目的等方面存在区别因而两者所遵循的原则标准规范实施方案操作流程也存在很大的差异所以说不能用以往长期制作案卷目录时所形成的习惯性思维眼光标准来检视文件级目录不能将文件级目录简单地视为案卷级目录的细化二者的根本区别在于: 案卷级标题是对卷内文件信息集合的主观描述对于查档者而言是对卷内内容的简介和导读而文件级目录则是对单份文件本身所固有的各项信息特征的客观采集可以全面准确地深度揭示档案文件的内容对于查档者而言是对文件内容的报道和导航

文件自身固有的特征有责任者收文者时间文种载体形式关键字档号等项目在著录时必须加以准确地捕捉和规范地标引至于文件题名项则相对复杂: 如果文件原文上已经存在标题或摘要可直接照录如果文件原文上没有标题或摘要则可简要拟写简而言之在电子档案文件级著录时应奉行客观采集的宗旨尽量避免主观的阐释或引申

() 时刻不忘建立文件级档案数据库的初衷践行以用户为中心的服务理念

在设计文件级档案检索系统时应秉持以用户为中心的理念采用基于自然语言的智能化用户界面以及符合查档者行为习惯的解决方案在查档者特定的信息需求与数据库中相关的档案文件之间实现精确匹配消除档案的检索盲点目标是建成一种高效率的人性化检索体系确保用户能有效获取信息

作为自然语言的查询方式优势在于用户无需学习因为自然语言是每个人所熟悉的并且具有丰富的表达能力来表达用户的信息需求因此从检索语言上讲绝大多数用户更倾向于用自然语言进行检索那种受严格控制的专业词表检索方式很难得到用户的认可在自然语言检索系统中用户可以任意输入自由词汇系统直接用这个词在数据库中进行检索或者自动将这个词转换成规范的主题词或叙词后再进行检索


 
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201901/5115.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1