论文推荐DSH从馆藏

从馆藏资源到智慧数据:上海交通大学地方历史文献智能数字人文平台建设

钱吟邢卓媛施晓华

作者:钱吟

作者:施晓华

01研究背景

地方历史文献产生于民间日常生活,属于非公开出版的特藏资源。长期以来,图书馆对地方历史文献存在着重发现和收藏、轻科学整理的状况,导致这些珍贵的文献得不到全面系统的揭示和充分利用。目前大多数图书馆仅实现了文献的数字化或部分文献的数据化,而在对文献数据和知识进行深度挖掘,并提供可视化分析,有效支持人文科学研究方面的还没能完全满足要求。本文以上海交通大学地方历史文献为实例,采用数字人文的相关技术,开展文献数据的深度分析和利用研究,针对人文学者的研究需求进行资源建设、数据库建设和智能平台建设,为人文学者提供更好的研究视角、研究环境、研究支撑和研究体验。

02地方历史文献介绍

地方历史文献,也成为民间历史文献,民间文书等等,主要产生于民间的日常生活。全部由民间收集的途径发现、获得,未经过出版或知识再组织的过程,具有非组织化的特点。这种特点比较接近于档案的性质,是人群在日常活动过程中产生的文字以及其他形态材料[1]。其主要形式包括族谱、碑刻、契约文书、诉讼文书、乡规民约、账本、日记、书信、唱本、剧本、宗教科仪书、经文、善书、药方、日用杂书等,内容广泛涉及民间的社会、经济、政治、文化生活的各个不同领域[2]。学者可从中窥见民间的历史记忆,复原丰富多彩的民间社会生活。

图1地方历史文献实例

收集民间文书,最终目的是开放利用,服务于学术共同体的研究需要。如何整理与利用如此巨量的文献,是图书馆近年来所面临的重要课题。

03地方历史文献智慧数据构建

大数据的飞速发展,带出了一个重要却鲜为人知的概念:智慧数据。在数字人文领域,可以理解成智慧数据就是从大规模的数据资源中得出对人文学者来说有意义的信息[3],智慧数据拥有较强的语义表示能力和关联能力,它从大数据的“大”聚焦到知识层面的数据精华,能够充分表示数据资源的语义属性及特征。通过对地方历史文献数据的有效组织和提取,利用数字技术,并结合人文学者本身已有的知识,能够使地方历史文献数据能加智能匹配人文研究的需求,使人文学者的判断、决策和行为变得更有智慧。智慧数据已经并将持续在数字人文领域发挥巨大的作用。

1.自建元数据方案

元数据结构决定了文献被检索、利用的方式。好的元数据建设将可以使地方历史文献的利用方式由“读”转变成“分析”。在地方历史文献数据库的建设中,如何建立合理的元数据结构,理清不同文书的内在关联,如时间脉络、地域布局以及人际网络。应该是人文学者和技术人员需要着重考量的问题。

以地方历史文献中的契约文书为例,上海交通大学图书馆尝试结合档案学与图书馆学知识,用专门元数据设计方法,提取资源特点与用户需求,设计了一套适用于契约文书的元数据规范。

2.实现资源数据的多重关联

过元数据,可以将描述性的文本转化成可分析的数据,数据的利用会更具有包容性和灵活性,可以实现上下文的关联,人物和事件的相关性分析,也可以与更多其他文献进行关联分析。为了厘清不同文献的内在关联,如时间脉络、地域布局、事件关联以及人际网络等,在描述元数据规范中设置了多重的关联要素。

04智能数字人文平台建设

数字人文平台的建设不仅是数据的存储和检索,主要的目的是要使馆藏的资源可以真正为人文学者所用,变成有用的数据,鲜活的数据,智慧的数据,在此基础上为人文学者提供更好的研究环境和研究支撑,帮助他们重新组织知识、发现问题、带来新的研究视角,同时还要为图书馆的未来工作提供决策依据。

1.平台建设思考

通过对多个数字人文平台的调研以及对本校人文学院教师需求进行整理,从应用的角度出发分析,智能化的数字人文平台应具备以下特征:

(1)数据资源的检索与发现;(2)基于数据挖掘的文本分析与统计;(3)科研数据的保存与管理;(4)研究数据的分析与展示;(5)开放的数据服务支持;(6)人工智能的运用;(7)社群化的交流。

2.平台架构设计

基于对平台的建设规划,构建智能数字人文系统平台架构如图2所示。

图2平台总体架构

3.平台功能模块设计

从人文学者维度、图书馆维度和数字人文技术维度对平台的功能进行划分和模块化设计,如下图所示。

图3平台功能模块设计

05总结与讨论

本文以上海交通大学地方历史文献为例,阐述了利用数字人文的思想来收集整理、组织和利用特藏资源,并通过智能数字文人平台的建立达到有效支持人文科学研究的目的。希望这些有益的思考,会对同类型特藏文献资源的利用机构和个人有一定的启发和借鉴意义。同时图书馆在数字人文的探索实践中,要做好特藏资源的保护开发和开放利用,不断拓展研究思路,提升服务和创新能力,抓住机遇提升图书馆的学术地位及社会地位。

论文

转载请注明:http://www.shijichaoguyj.com/wxgs/11409.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: