杭州档案 > 档案学会 > 学术论文
文字: 大  中  小     打印
聚焦数字时代归档的变迁

上传时间:2007年10月17日 )

归档的成效决定了数字文件是否纳入档案管理的范畴,从而关系到数字时代档案界履行其分内职责的能力,因而归档一直是电子文件管理中的一大焦点,从期刊论文数量就可见一斑。笔者在中国期刊网上检索篇名中精确包括“电子文件”和“归档”的论文,从1988年至今共有284篇,约占篇名精确包含“电子文件”的论文总数的23%。这些文章反映了数字时代归档方法的点滴变化,如实时归档、综合使用归档软件和规章制度控制归档率等。本文将尝试从目的、对象、主体等新的角度总结归档工作正在面临的时代性变迁,这些变迁揭示了归档方法革新的原因和条件,并或多或少地折射出整个专业的发展方向。

一、归档目的多元化

“为什么”是开展某项工作之前首先要思考的一个问题,对这个问题日趋多元化的解答是数字时代归档工作产生诸种变化的根本原因。关于归档目的,业界曾经有这样两个方面的偏向:或者着眼于传承人类文明、保护社会记忆的高度去描述,或者认为属于归档范围的文件理所当然要归档而予以忽略。后者系未深入档案工作实质所导致,前者的定位则偏向于宏观和单一。在微观层面,除了延续历史之外,归档目的有更为复杂多样的表现。

1、内部管理控制成为归档的重要内部动因

人类文明的传承、社会记忆的保护是若干立档单位集体性行为的综合结果。对于单个机构而言,当前的需要是归档乃至整个档案工作的首要出发点。在这些需要中,内部管理控制是其重要的内部动因。2004年美国技术和市场研究机构Radicati Group对企业电子邮件的归档需求进行调查,结果显示25%的需求来自内部策略管理,15%的需求来自知识库管理(1) 。这两个方面的需求都属于内部管控要求。

……

2、存储成本、系统效率成为归档的重要权衡要素

可能有些读者会发出这样的疑问:即使在纸质环境中,存储成本也是归档时需要考虑的重要因素。的确如此,在纸质时代,人们考虑物理空间的限制而只能留存最有价值的文件。与此明显不同的是,数字时代人们考虑存储成本的主要出发点已经不再是物理空间,而是数据维护成本;已经超出了单纯档案数据存储成本的范畴,而要从整体数据存储、系统效率的角度全面衡量。

……

3、遵从法律规定成为归档的最大外部动因

法规遵从性(compliance)是2002年之后世界范围内文件管理领域的一个最热门的关键词。起因源自2002年7月美国颁布的《萨班斯——奥克斯利法案》(Sarbanes-Oxley Act of 2002,SOX)。2001年始,美国多家大公司,包括安然、冠群电脑、世界通讯、施乐等相继爆出伪造文件虚报收入的丑闻(7),为了重拾公众投资信心,SOX法案应运而生,旨在加强企业监管,防止企业欺诈。这个被布什称为“自罗斯福总统以来美国商业界影响最为深远的改革法案”对文件的归档留存提出了非常严格的要求。比如,其最重要条款之一的404条款要求加强公司内部控制,而保存文件并维护其真实、可用是加强内部控制的基本手段。在美国上市的各大公司都要根据404条款制定了内部控制规章,《中国移动内部控制手册》(第一版)中有44处提到要将相关文件归档。在SOX法案的影响下,为保护公众利益而对文件(包括电子文件)归档相关的其他法案,如《健康保险流通与责任法案》(HIPAA)、美国证券交易委员会的《有关证券交易单位必须保存文件的规定》(SEC Rule 17a-4)近年来也越来越引起欧美国家的重视。……

二、归档对象扩展化

如果要历数归档对象的扩展,我们可以列出很多证据:在归档电子文件时,可能需要同时归档一些在文件形成阶段产生的元数据;同时归档文件的生成软件;无法在纸质载体上再现的多媒体文件也属于归档范围。此外,还有几个值得关注的归档对象扩展,这些扩展系信息技术的应用范围不断拓展所致,只要应用范围的拓展存在,归档对象扩展化的趋势就会一直存在。

1、结构化数据

存放在计算机中的数据可以分为三种类型:非结构化、半结构化和结构化数据,所谓结构化数据是指经过明确定义的数据,它被分解为若干部分,各个部分及其相互关系皆已明确,计算机能够直接处理,如关系数据库;非结构化数据是指无法通过一个固定的模型进行定义的数据,比如文本、图像等;半结构化数据包含部分结构化数据和部分非结构化数据,比如超文本(11)。……

2、网站资源

早在2000年,澳大利亚国家档案馆就指出网站信息也是重要的电子文件资源,应予以归档(14)。但是,由于认识未到位,加上网站信息更新频繁,部分网页内容与内部文档内容一致,故而在我国,立档单位将网站信息归档的情况尚不普遍。由于网站是数字图书馆资源的重要来源,国际范围内图书馆领域相对更为重视网站信息的归档,英国国家图书馆、澳大利亚国家图书馆都是其中的活跃力量。近年来,有一些单位开始认识到,网站上某些资源具有惟一性,比如面向公众的消息、通知,反映机构文化活动的照片、报道等,正在逐步将网站信息纳入归档范围。

3、即时通讯消息

MSN Messenger、雅虎通等即时通讯工具,曾经主要应用于个人通信领域。随着工作节奏的加快以及业务实时通信需求的发展,近几年,越来越多的组织机构在其内部也采用即时通讯工具。这种工具集成了电话、电子邮件等诸多通信工具的特点。一般在即时通讯工具使用的初期,各机构并不会对之加以严格规范,其应用不像其他业务软件那样正式,它所形成的信息也打上了公务性、私人性混杂的特点。不过,人们在利用即时通讯工具进行业务交流的过程中,会产生重要证据信息和情报信息,也存在归档的必要性。……

三、归档主体多样化

归档工作一直被认为是立档单位的内部行为,数字时代,参与这项工作的成员的身份日显复杂。

1、IT厂商

数字文件的归档离不开相关软硬件的支持,随着数字文件归档意识的普及,许多系统供应商都在其原有产品的基础上集成了归档的功能模块,比如IBM 公司2002年推出了IBM DB2 Records Manager,并通过了美国国防部标准《电子文件管理应用系统设计标准》(5015.2-STD)测试,以及英国国家档案馆《电子文件管理系统功能需求》规范的认证。2004年8月Sybase 公司推出在线数据归档解决方案——Sybase Dynamic Archive(16),2006年3月惠普公司完成收购数据库归档软件厂商OuterBay,推出数据库归档解决方案Reference Information Manager(RIM) for Database Suite,由于HP Integrity服务器的客户中,有60%使用Oracle的数据库,50%使用SAP的产品,因而该款产品率先锁定原先使用 Oracle数据库的用户,并陆续将RIM for Database Suite推向SAP、SQLServe及Sybase的客户(17)。……

IT厂商在推出其归档软硬件产品的同时,往往会推出一整套归档的理论、方法、解决方案。IT厂商正在成为发展归档概念和实践的重要力量。比如,有120多家企业成员的存储网络行业协会( SNIA)这样界定了本行业内的归档含义:“拷贝或转移数据的过程,以长久保存关于业务、应用或数据状态的记录。一般情况下,归档通常用以满足审计、管理、分析或参考的目的,而不是用于应用恢复或数据恢复(19)。”这样的定义会成为归档软硬件提供商的共识,并经其反复宣传,无形中对机构内部的归档行为产生影响。

2、公益性组织和个人

在归档市场日益活跃的同时,由各种公益性组织和个人出资,出于文化目的而归档、收集、保存数字文件的公益性项目也不断增加,也许是在商业社会经济资本快速积累的同时,人们在保护历史、守护记忆、共享文化方面的需求也不断旺盛所致吧。


     [关闭窗口]