研究论文契约文书描述元数据规范设计与应

民间历史文献在不同的语境中,也被称为地方历史文献、民间文书、历史文书档案等。其主要形式包括族谱、碑刻、契约文书、诉讼文书、乡规民约、账本、日记、书信、唱本、剧本、宗教科仪书、经文、善书、药方、日用杂书等,内容广泛涉及民间的社会、经济、政治、文化生活的各个不同领域”。契约文书是民间历史文献中重要的组成部分,作为民间社会在各种活动中直接产生的原始文字资料,具有原始性、惟一性及文物性质,有很高的研究价值。

近十年来,各地契约文书大量发现,但是资源数量的增长并不意味着获取信息的增加,成千上万件杂乱的文献将增加用户使用的困难,只有经过有序组织才能帮助用户使用这些资源。图书馆凭借丰富的资源保存、整理、组织经验成为契约文书研究过程中不可或缺的重要力量。

1契约文书描述元数据研究现状

描述元数据(descriptivemetadata)是图书馆领域用以组织揭示文献资源的技术工具,通过描述文献资源的内容、范围、权限等信息,在文献资源与用户之间构建起使用的桥梁。国际上一些主要的数字图书馆建设项目设计了相应的描述元数据标准指导资源揭示工作。美国国会图书馆将常见的描述元数据分为通用与专门两类,通用的描述元数据中包括了MARC21、MODS、DC、ONIX、EAD,专门描述元数据有CDWA、VRACore、IEEE-LOM、SCORM、PBCore、IPTCCore、FGDC等标准,分别适用于描述图像、学习对象、多媒体出版物、照片、地理数据等多种资源的属性特征。但其中尚无针对类似契约文书资源的描述元数据规范。

在中国图书馆界,随着契约文书研究热的升温,出现一些量身定制的自建元数据方案。目前已展开契约文书资源组织研究的类似项目包括敦煌文书、徽州文书、清水江文书等。网络与文献调研结果显示,敦煌文书、徽州文书、清水江文书已建或在建资料数据库,均采用自建元数据方案的做法。黄山学院为徽州文书制定标识项、内容可选项、外观可选项、文档结构项、实例说明项5类15个元素;中山大学为所藏契约文书制定了由必要项目和选择项目组成的著录项目,归纳起来有12个项目;清水江文书建设中对契约文书主体、契约文书类别、契约文书签订时间、归户、形式特征以及附注等信息进行描述。这些项目从馆藏契约文书出发构建描述元数据方案,适应了本地资源特点,但在规范化、互操作性、资源关联方面尚有待提升。

本文参考借鉴已有项目成果,复用国际通用文献描述元数据,结合资源特点、功能需求,完成契约文书描述性元数据从设计到应用的整个过程,实现如下目标:?设计契约文书组织与揭示的通用型描述元数据方案;?结合都柏林核心元数据集,提升契约文书描述元数据方案的规范化与标准化,提供数据互操作的基础;?针对契约文书描述元数据的具体应用,给出应用实例,提出可推广的契约文书描述元数据应用方法;?突破以往平面的资源组织思路,加强元数据聚类与关联。

2契约文书描述元数据的功能

契约文书描述元数据作为描述元数据的专门类型,应具备描述元数据的基础功能,并且通过元数据对契约文书内容、属性的选取,实现检索与聚类、评估与选择等应用功能,同时,设置体现资源特点的个性化元素,对资源进行个性化的组织与揭示。

2.1基础功能

描述:描述契约文书展现的外在特征与蕴含的内容特征,这是描述元数据应有的最基本功能,为用户检索与利用资源奠定了基础。

定位:通过契约文书数字化对象或实体的标识符,例如唯一标识符、流水号、索取号等,定位到资源的虚拟或实体位置,有利于资源的发现和使用。

管理:通过描述元数据管理契约文书,如资源涉及的权限(包括所有权、使用权等)、数字化文件类型、获取方式、技术细节等,说明用户使用资源的限制并提供必要的技术指导。

保存:通过描述元数据记录契约文书长期保存所需要的信息,如不同材质、不同年代的契约文书对保存方式有不同需求。

2.2应用功能

检索与聚类:在描述过程中将契约文书的重要信息抽出标引并加以组织,形成文书间多种层次与途径的联系,为多维度地检索与聚类体系提供数据基础,有利于用户从中发现其真正需要的信息,找到研究资料与线索。

评估与选择:通过元数据的描述,用户在不必浏览资源对象本身的情况下,能对资源对象取得基本了解和认识,对其价值进行评估,从而决定资源的取舍。

2.3个性化功能

契约文书不仅是历史的记录,也是家族发展的见证,兼具文献性质与档案性质,除了基础与应用功能外,还有必要利用描述元数据完成追溯资料来源的个性化功能,通过揭示契约文书产生的来源家族与获取途径,追溯其产生、积累的过程。

3契约文书描述元数据设计原则

整合国外E.Duval与国内肖珑、赵亮、徐菁等人关于描述元数据规范设计的概念原则,结合契约文书的特征分析与功能需求,除了描述元数据设计普遍应遵循的模块化原则、可扩展原则、互操作原则、实用原则等,契约文书描述元数据还应需遵循归户原则与关联原则。

3.1归户原则

指实现契约文书资源的归户聚类。档案学的全宗原则(respectdesfonds)是同一机构或个人创建、积累、维护、使用的资料必须按照原始顺序(如果有的话)放在一起(视为属于同一集合体)。也就是说,应当以文献产生时的来源单位作为文献保管的基本单位,从而避免打破文献之间既有的有机联系。刘伯山在年国际徽学研讨会上最早提出来的归户性概念,指“分散的、零碎的契约文书经考证可复归原属的同一户”,与档案学的全宗原则不谋而合。根据民间历史文献的归户进行组织,有利于形成以家、族、会、社为单位的资源集群,形成面向组织或个人的组织体系,保存其原始存在环境的完整性及传承脉络的有序性。

3.2关联原则

指提供资源间多维度的联结。契约文书不是孤立存在,而是相互依存、彼此联系,文书的整理水平关系到学者对资料的利用程度。通过描述元数据提供的多重关联,保持其内在关系网络的系统性。契约文书描述元数据的关联性体现在两个方面:一方面,通过具有关联属性的元素,将契约散件在空间、时间、人物与家族关系等维度上缀合成相对完整的全景图像;另一方面,借助分类汇总、比较等手段,在相关内容间的展开联系与比较,有助于进行一些针对性的相互关系研究与比较研究,这样才能更为全面地把握不同区域间乃至全国范围内历史现象的共性和特殊性。

4契约文书描述元数据设计思路

契约文书元数据应遵循从建设目标分析、资源属性提炼、元数据元素的选择与制定、应用指南的设计一直到编制元数据记录的整个流程。

4.1明确建设目标

明确元数据应用目标是整个工作流程的第一步,即确定应用元数据的目标与需要达到的效果。

对契约文书来说,出自同一来源地的资源可能分散保存在多家机构,其数字化版本及目录分散存储在多个异构数据库中,打破了其作为一个整体的原有组织脉络。资料分散的现状使得“研究整体难以实现充分的体系化”。在实体资料归属各家单位,无法集中的情况下,有必要遵循国家、国际标准及已有规范,设计一套兼顾资源特点、用户需求与系统需求,且具有实际使用价值的契约文书描述元数据方案,实现数字化版本的描述元数据关联与互操作,建成易于使用的契约文书特色数据库,为最终形成全国性联合目录构建基础。

4.2提炼资源属性

契约文书作为民间社会的法律文件和私家档案,兼具地方文献与档案特征,从这两个角度重点把握资源特点,将有关的资源属性加以提炼。

(1)在内容特征上反映地域性。契约文书在一定地区范围内产生与积累,具有鲜明的地域特征。如本地个人或组织创建的契约文书,反映本地经济交易或民俗活动等。因此需要从契约文书中抽取代表其地域特征的地理信息,注重对地理信息的标引。有条件的情况下,建议编制地域代码表,将自由行文、用语不规范的地域描述文字转换成计算机可处理的标准化形式。

(2)在元素选择和元数据结构设置时体现档案特征。作为在特定社会活动中直接形成的原始历史记录,契约文书是历史积累的产物,具有重复使用及查考价值,体现了档案化的因素。与契约文书产生、积累有关的人物与家族等信息,应设置相应元素进行著录,体现档案整理中以资源来源及档案原始顺序为主线的原则。

4.3设计描述元数据元素

遵从模块化、可扩展性、互操作性等的描述元数据设计原则,尽量复用已有描述元数据规范,例如复用国家标准《GBT-信息与文献都柏林核心元数据元素集》的总体设置,选择DC15个元素中的部分元素作为核心元素集的同时,根据民间历史文献以及契约文书资源的个性化特点,设置所需元素。

4.4建立使用指南

元数据使用指南是在特定应用环境下,对元数据元素集的解释与说明。契约文书描述元数据使用指南给出元数据描述的指导性原则,包括著录信息源、著录内容、应用规则、是否必备、是否可重复著录、元素取值范围、元素编码规则等内容,制定著录过程中可能遇到的特殊事项的著录原则,同时提供可供参考的典型著录范例。

契约文书作为民间文献而附着的原始性与地方性使著录人员在文字的辨识、意义的理解上都需要较多专业培训与经验积累方能胜任,因此必须考虑数据的实用性,内容揭示详略宜得当,并且需要详细而具体的著录细则给予指导,在著录难点与要点上给出充分的说明,以提高著录工作的准确性与时间效率性。

5契约文书元数据应用实例5.1以建设可互操作的契约文书数据服务系统为目标

上海交通大学图书馆与历史系合作开展中国近现代地方契约文书资源编目和数据库建设工作,描述元数据规范设计与应用是其中重要的环节,着重体现地方历史文献的个性特征,同时使方案具有包容性和灵活性。最终目标是建成契约文书特色数据库服务系统,实现地方历史文献特色资源的描述元数据检索与全文浏览,支持数据互操作,实现资源共享。

5.2构建分模块的描述元数据元素集

首先,进行文献与用户需求调研。通过文献调研了解契约文书在内容上具有朝代纪年、归户、事主等特征要素,在形式上多数是手写繁体字,在类型上较为庞杂,这些特点在设计元数据规范时都纳入考虑。通过访谈历史文献相关领域专家,了解院系研究者对资源的需求,即重视文书本身产生和形成的自然顺序,重视其系统性与连续性,重视资源、人物、家族间的相关性。举例来说,研究者不仅需要地方历史文献中事主的名称,也需要事主在交易等活动中所处的角色,这对厘清土地易手的脉络是十分重要的线索。

其次,分析资源特性,提取资源属性,为设计描述元数据元素集提供基础,并将资源属性归纳为外部物理特征、内容特征、身份识别特征三大属性模块。如图1所示:

图1契约文书的属性提取

(1)外部物理特征。记录资源实体的形态、外观等外部信息,如页数、尺寸、材质等,设置附注项备注其破损情况及有无官印或私印。外部物理特征将为进一步的修复和保存工作提供依据,也有助于判断资源本身历史及文献价值。

(2)内容特征。从人物与家族、时间、地域、事件、物品对象等角度抽取资源描述的相关内容,如签订契约的当事人及见证人、所属的家族、事件发生的时间、交易的对象物品、交易对象坐落的地理位置等,这些信息分别体现了资源的内容特征。提取出资源内容特征,有助于后续通过元数据进行资源聚合,探索资源间关联关系,联结资源形成较为完整的网络体系。

(3)身份识别特征。实现资源的编码与定位。涉及到编码的识别特征既包括使用规范代码表示的识别信息,如语种,也包括根据资源特点自定义取值方法与范围的资源类型、标识符、档案号等信息。在契约文书资料的整理过程中,通常依据来源信息进行档案号的设计与编码,并应用于后续的数字化过程与数据库建设。

通过用户需求收集、应用环境分析,及资源属性和特征的提炼,在复用DC的基础上,制定出18个元素的描述元数据元素集(见表1)。其中自定义元素包括:事主、归户、标的、金额(见表2)。

表1契约文书元数据元素集及定义

表2契约文书元数据自定义元素及说明

为区分交易双方的角色,在事主元素下,进一步限定为第一事主、第二事主,将文书所载行为的发起人视为第一事主,将另一方的交易对象或权利接受者、受业人定义为第二事主。这些元素的设置便于研究人员根据各自研究需要,从分类、朝代、年号、年序、行政区划名、交易对象、地理名称、土名、事主、受业人、交易价格、白契、红契、原始编号等多种不同角度进行资源查找与组织。

5.3设计经济实用的使用指南

完成元素集的构建后,为准确、高效地进行著录,有必要编制使用指南,对著录对象、著录用文字与符号进行规定,对元素使用方法等进行说明,提供具体详细的操作指导。

(1)著录对象。规定以具有独立标识符的一份文献为契约文书的著录单位,这样可以揭示到每一份文献,与揭示到整包文献相比,揭示的颗粒度更小,能发现更多细节信息。

(2)著录用文字与符号。现实中图书馆的契约文书描述元数据著录工作,必须统筹考虑元数据著录的精确性、互操作性、经济实用性进行规定。遵循编目中照录的原则,即摘录自资源本身的内容一律照录。

(3)元素说明。解读每个元素的含义,给出通用的著录格式与示例,说明取值的方法、使用的标点符号,以及如何处理一些不规则的情况等。如事主是原文中出现的所有重要关系人,包括交易双方、证明人、书写者以及其他出现的人名。第一事主通常出现在文书开头、文书结尾,第二事主需从正文中摘录。事主著录的格式规定为:姓名(身份职称)。事主名称之间用半角分号(;)连接,事主身份职称间用半角逗号(,)连接。通过使用指南的说明,强调了著录时辨识、填写事主身份职称的重要性,而事主身份职称信息,正是文献的用户——历史文献研究者所看重的。

5.4实现资源体系化的多重关联

整理编目后的文书材料,形成较为系统与完整的资源集合,是支撑史学研究与撰述的基础材料。而厘清不同文书的内在关联,如时间脉络、地域布局以及人际网络,对文献面对的用户而言尤为重要。因此上海交通大学图书馆契约文书描述元数据规范中设置了多重关联要素。

(1)资源实物关联。档案号元素著录每一份契约文书的唯一标识符,即资源的身份识别代码,具有唯一性。该标识符由分成4段的14位阿拉伯数字构成,分别代表着来源、收集日期、单户序号、单件序号等信息。同一个来源码表示资源从同一个来源采集而来,同一个收集日期表示同一个收集批次,以此类推,保留了契约文书的原始获取信息及顺序关系。档案号在数字化扫描时可关联数字化图像与实物,在资源编目时可挂接数字化图像与编目记录。

(2)中西历关联。契约文书采用朝代与年号组合的年号制度进行纪年,设置公历日期与年号日期两个元素,一方面用时间串起资源,提供时间轴上观察民间地方经济社会变迁的视角,另一方面便于对照推算,将个体事件放置在同时代国内国际比较的位置上。

(3)归户关联。上海交通大学图书馆所藏的契约文书具有较强的系统性,积累了某些乡村家族多代的文书,在横向的家族间有紧密的联系,在纵向的时间维度上也有继承性。通过设置归户元素著录契约文书来源的行政区划、家族信息,尽量细化到村级,可将同一地域同一家族的文献集中在一起。

(4)地域关联。归户元素按照“省-府-县-都-图-村落名-姓氏”的格式著录,既记录文献产生来源的人或社会组织及其所属的行政区划、家族信息,也反映文献形成与收集过程中的地理信息,而地域元素收集从原文获取的村以及村下一级空间信息,两者结合反映了文献间的地域关系,帮助研究者有效地进一步探索文献资源的地理信息。

(5)人物关联。契约文书记录了个人、家族、组织的民事行为,因此人物及其角色是其首要的且重要的内容特征。在上海交通大学图书馆契约文书描述元数据规范中不仅设置了事主元素,而且要求获取到事主的身份职称,即人物在经济活动或民俗活动中的立场、角色,通过事主身份信息的统计,可关联起相关人物的家族、社会、经济关系。

6总结

有序地组织文献资源是其获得利用的充分条件,对契约文书而言,近年来科研机构的广泛收集和深入研究使其获得越来越多的







































北京治疗白癜风的医院
北京白癜风治疗好医院


转载请注明:http://www.shijichaoguyj.com/wxjq/3642.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: