学术新知电子文件管理前沿基于三态视角的

白癜风的治疗 https://yyk.99.com.cn/fengtai/68389/jingyan-392913.html
本文看点

档案描述的重要意义

描述标准的发展脉络

三态档案及标准匹配

描述标准的开发建议

推荐语

档案描述是对档案对象各类属性进行的抽取和表达。档案描述是档案资源管理中的核心与关键问题,既意味着档案的存在形式,也决定了档案将被如何应用。档案对象态别的变化和数字转型的推进,产生了建立不同档案对象与描述规范之间的匹配关系,以便构建相应的数据基础设施的需求。《基于三态视角的档案描述标准特征及演进脉络分析》一文从档案态别视角对档案描述标准进行梳理,考察不同态别对象描述标准的功能定位和技术路线,呈现描述标准随档案对象态别同步演进的发展脉络,很有启示意义。

感谢《档案学通讯》杂志社

授权“档案那些事儿”分享!

基于三态视角的档案描述标准特征及演进脉络分析

钱毅马林青

摘要:档案描述是档案资源管理的关键问题。随着档案对象从模拟态到数字态再到数据态的逐步演进,所需档案描述标准也发生相应变化,建立描述标准与档案对象态别之间的匹配关系变得尤为重要。以档案态别为视角,对模拟态、数字态、数据态对象分别对应的档案描述标准进行了梳理,提出了不同态别档案对象所需描述标准的功能定位和技术路线,呈现了描述标准随档案对象态别同步演进的发展脉络,并对三态并存状况下档案描述标准的开发和利用提出了建议。

关键词:档案描述标准;模拟态档案;数字态档案;数据态档案

档案描述是对档案对象各类属性进行的抽取和表达。档案在数字空间中如何描述,既是它们的存在形式,也决定了它们将被如何应用,因而描述问题是档案资源管理中的核心与关键问题。影响档案描述规格的影响因素很多,如档案的门类、形式、形成领域乃至功能预期等。一方面,文件形成领域技术环境的变迁导致档案对象发生态别变化(即档案对象从模拟态到数字态再到数据态演进,系统论述详见笔者相关论文[1]),不同态别空间对档案对象的利用和解析程度也大为不同。另一方面,数字转型的深入使得描述标准也在同步演进,总体表现出细颗粒化、数据化、富语义化等特征。为了避免描述不足或过度描述,需要建立不同档案对象与描述规范之间的匹配关系,以便构建相应的数据基础设施(如目录数据库、本体库、知识库)。整体上看,从单纯的规格描述到支持推理和语义搜索的逻辑关系都属于描述范畴,但当前学界尚未对这些描述范畴在具体的档案对象空间中是如何发生、演变与发展等问题做出完整回应。

本文拟从档案态别视角对档案描述标准进行梳理,考察不同态别对象描述标准的功能定位和技术路线,呈现描述标准随档案对象态别同步演进的发展脉络。

1文献综述

1.1档案描述标准的理论研究与实践探索

理论研究方面,张正强对现代档案著录与电子文件元数据领域进行了较为全面与深入的研究。他认为随着“机读档案”的出现,档案工作者必须从现代档案著录的角度来审视档案著录的时间、空间与结果,在分析GB.5—85《档案著录规则》局限性的基础上提出了档案多级著录规则。[2]以此原则为指导,他主持开发了旨在实现档案目录信息交换与共享的基础性标准GB/T—《中国档案机读目录格式》。张正强最早在国内对ISO-1:《信息与文献管理文件元数据第1部分:原则》这一电子文件管理元数据顶层框架设计的基础性标准进行了系统介绍[3],并从功能、基本结构、需求分析方法与保证原则、国际标准化、语法与语义描述的标准化[4],以及如何建立基于本体的电子文件元数据以助力智慧档案馆建设[5]等方面对电子文件管理元数据展开了系统研究。此外,刘越男、钱毅等针对电子文件元数据的封装策略[6]、面向长期保存的元数据模型构建与互操作实现[7]、注册[8]等进行了专项研究。

随着语义网技术的逐步成熟和信息资源利用朝着交换共享、集成检索方向发展,档案著录也开始转向知识化、语义化。段荣婷主张通过语义置标实现知识组织系统(SKOS)系统化与规范化控制,推动档案主题词表、分类法等知识组织系统的语义网络化应用。[9]ICA在年推出了面向未来的档案描述系列标准《背景中的文件》(RiC),该标准搭建了将档案描述数据融入语义网的桥梁,有助于实现档案描述的关联数据化。[10]

实践探索方面,安徽省档案馆黄玉明借鉴维多利亚州电子文件管理策略(VERS)系列标准规范,主持开发了DA/T46—《文书类电子文件元数据方案》,并将其应用于安徽省电子文件中心的建设实践。此外,他还对国际文件/档案及相关资源元数据源流与系谱进行了溯源与归纳,提出通过科学定位、结合实践、制订通用规范和系列标准的方式引领中国电子文件及相关数字资源元数据体系的构建。[11]国际方面,作为行业最佳实践之一,澳大利亚维多利亚州公共文件办公室(PROV)于年发起数字档案馆项目,修订了公共文件的描述方法,通过扩展档案控制模型(ACM)实现同其他组织机构的元数据共享与交换。[12]

1.2文献描述标准的数据化转型

语义网环境下,整个文献领域都在经历由传统文献编目体系向资源编目体系的转型,尤其是图书馆领域已经积累了较多的转型经验。近年来,图书馆的文献描述标准处于迭代的关键时期,文献描述工作的理念与方式经历了从“数字化到数据化”的转变。[13]延续使用了五十余年的机读目录(MARC)由于其封闭性、粗粒度性以及记录结构的单一线性等局限,已经无法适应数字时代关联数据化利用需求,《英美编目条例(第二版)》(AACR2)编目规则也难以指导现代技术环境下书目数据的编目工作,因而逐步被新的支持关联数据的书目框架格式(BIBFRAME)和内容标准RDA取代。BIBFRAME旨在提供基于Web的关联数据标准的转换路径,推动资源编目体系全面转型和创新。[14]瑞典国家图书馆于年首次将书目数据发布为关联数据,并与世界上最大的多领域知识本体之一DBpedia建立连接,标志着图书馆书目数据真正开始融入网络环境中。[15]

总体而言,档案界对描述标准的研究主要集中在著录与元数据规范的制订和扩展上,近年来虽然有一些对档案描述关联化、语义化的理论研究和实践尝试,但数量少、规模小。相较于数据化技术在档案资源管理中的应用与前景,档案界对档案描述标准的实践探索整体上还较为滞后,亟需丰富与全面提升描述标准,满足新型档案对象管理与深度服务的需求,有必要从档案对象的模拟态到数字态再到数据态演进的整体视角出发,系统梳理档案描述标准的发展脉络,考察其演进规律,开发和利用相应的档案描述标准,提升档案资源科学管控和应用水平。

2档案对象态别与描述标准的同步演进关系

基于档案对象的物理信号与语义表达的不同特点,笔者将档案对象划分为模拟态、数字态和数据态三种形态。其中,模拟态对象具有信号与语义连续的特点,数字态则信号离散、语义连续,数据态在信号和语义两方面都呈现出离散的特点。[16]不同态别档案对象需要与之相匹配的描述标准,档案描述标准的升级换代与档案态别演进基本同步。

2.1档案资源空间定位决定总体演进方向

描述工具从本质上取决于对档案资源空间的认知定位与功能需求。当前,我们对于档案资源空间的认知正在经历将档案视为业务记录的馆藏空间、视为留存记录的证据空间、视为历史积累的内容与知识空间的演变之中,存在馆藏观、记忆观与数据观的不同认知[17],这与三态对象管理空间的内在定位基本吻合。

馆藏空间管理需要的描述支持相对简单,诸如编码与分类标识等形式特征的描述就足以支持整序功能。证据空间维护则需要较为完整地反映电子档案的诸多背景因素,加之多元功能的叠加,导致相对复杂的元数据表示方式。知识空间构建需要大规模积累内容表达,偏重于语义抽取,需要更复杂的表达语义认知的工具,从而将档案馆藏展现为一个相互联系的、多维度的知识空间。以图书馆为例,其描述标准也正处于从文献空间描述向知识空间表达的进程之中。图书馆界最初将图书馆视作文献空间,通过类似AACR2的标准去描述和揭示文献,以实现对文献空间的管理和利用。[18]后续则将图书馆视作相互联系的各类实体的空间,通过RDA等描述工具来管理这些实体对象的类型、属性与关联。因而,可以认为图书描述标准存在从基于结构化描述的MARC到基于关联数据的RDA与BIBFRAME规范的演进路径。[19]

2.2不同态别档案管理要求引发描述标准变化

三态对象核心特征不同决定了描述标准不同。三态的核心区别在于物理信号与语义信息的离散和连续性表示各不相同,信号离散意味着必须解决软硬件依赖,语义离散意味着必须进行相关语义描述。这些差异直接导致各态别档案的描述标准需要解决的核心问题不同,因而在描述内涵、形式、复杂度上都有不同表现。三态对象管理空间定位不同导致其基础管理目标不同,模拟态对应的是馆藏空间,重在对形式和核心内容特征进行表达的著录标准是该态别的基础描述标准;数字态对应的是证据空间,需要具备相对复杂要素框架的元数据规范作为基础标准;数据态对应的知识和内容空间需要更为抽象的面向语义和关联的规范作为基础,甚至要求描述规范具备一定的语义搜索、逻辑判断与推理能力。总之,档案描述标准因由管理空间定位的变化,在总体上呈现出向细颗粒度、富语义化、知识表示等方向发展的态势。

3模拟态描述标准:馆藏控制,维护实体有序

模拟态对象空间管理主要功能在于维护实体管理,因而在此阶段档案界主要通过制订系列著录标准,以实施对馆藏档案的识别与管理。

3.1主要标准概述

按经典定义,著录是对档案内容与形式特征进行分析、选择和记录的过程,从《档案著录规则》(DA/T18—)罗列的著录项分析,绝大部分可归结为形式特征,这与模拟态以载体为中心的管理需求密切相关,符合对实体管理的基础需要。内容特征相对较少,仅包括主题词、分类号、提要等项,而这些项目的著录在实际工作中往往更加简化,如主题词著录往往用关键词代替,降格以求。从著录标准源流看,档案著录规则源自国家标准《文献著录总则》(GB.1—83),并因档案的基本门类差异衍生出系列档案著录规范,包括:

DA/T8—明清档案著录细则DA/T17.1—革命历史档案著录细则DA/T20.1—民国档案目录中心数据采集标准——民国档案著录细则DA/T23—地质资料档案著录细则GB/T—城市建设档案著录规范DA/T30—满文档案著录名词与术语汉译规则DA/T51—电影艺术档案著录规则

其他……

此外,ICA也制订了系列通用的国际档案著录标准,包括《国际档案著录规则(总则)》(ISAD/G)、《国际档案权威记录(机构团体、个人与家庭)著录规则》(ISAAR/CPF)、《国际档案职能著录规则》(ISDF)及《国际档案馆藏机构著录规则》(ISDIAH)等,这些标准都已成为国际档案著录的最佳实践,共同推进了档案著录信息的交换与共享。

3.2功能定位于维系空间有序与资源完整性

模拟态描述标准核心功能聚焦于维系有序的馆藏空间,通过对馆藏档案的载体控制达到馆藏空间控制的基本目的,因而著录标准对档案形式特征尤为重视乃理所当然。由于模拟态重在资源完整性控制,依托资源自身层级进行多级著录,以维系实体资源间最初级(亦可能是最根本)的关联关系。具体做法上,通过对分类、编码等核心著录项的控制,指导实体分类与排架,构建有序空间,实施对不同层级实体对象的整序管理。

3.3模拟态标准通常采用结构化表示方式

良好的著录基础有助于输出多种馆藏检索工具,如全引目录、专题目录、各类索引等,实现对馆藏档案的初级智能控制。事实上,著录规则在相当长的时间内就是服务于面向手工操作的著录卡片制作的。在计算机环境中,档案资源机构普遍采用数据库进行著录信息的管理与集成,在技术路线选择上,著录规范可以很好地适用于关系数据库技术,RDBMS(关系数据库管理系统)具有较高的技术成熟度,提供了多种内置的约束与实用工具,能够对档案著录数据进行有效的质量控制,因而数据库技术被普遍视作档案资源管理的底层信息组织技术。同时,关系数据库的结构化特性也有助于开展大规模目录数据集成,目录数据库建设几乎是所有机构开展档案信息化的起步阶段,进而推进联合目录、目录中心等建设工作,实现特定范围内的档案目录数据共享。

4数字态描述标准:建立信任,维系证据价值

从“白纸黑字”的模拟态环境变迁到虚拟的数字态空间,保证在数字空间的可读可信成为电子档案管控的基准目标。相应地,数字态描述标准需要维系由于信号离散带来的软硬件依赖问题,需要

转载请注明:http://www.shijichaoguyj.com/wxgs/11431.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: