墓志文献的整理与数字化

侯君明

1.墓志概述

墓志,一般指放在墓里的刻有死者生平事迹的石刻,亦指墓志上的文字。历史上对墓志的称谓较多,有的是名称不同,实质无差别,有的则因时代、对象、内容不同,而略有差异。主要的称谓有“墓碣”“圹志”“圹刻”“圹铭”“葬志”“坟记”“墓记”“志问”“埋铭”“槨铭”“墓版文”“神铭”“玄堂志”“阴堂文”“砖志”“墓砖记”“塔铭”“塔记”等等。墓志大多分上下两层,上层称为“盖”,下层称为“底”,底部刻有墓志铭,盖上刻有标题。数字化过程中的“墓志”往往采用较为广义的概念,包括上文的墓志铭,也包括神道碑、墓表、买地券、墓志题跋、哀册等人物墓葬文献。

墓志从汉代开始出现,南北朝直至隋唐时期,其发展已经进入成熟阶段。隋唐以后墓志一般依据亡者的行状撰写,主要涵盖了世系、生卒葬时、名讳、官宦等方面,是记载墓主人行迹的第一手资料。这一时期,墓志数量众多,内容丰富,不仅具有重要的学术研究意义,也具有一定的文物价值。

随着碑刻文献进入研究者视野,墓志文献也开始得到广泛关注。但关注点多在唐及唐以前,宋及宋以后的墓志仍然少有人问津。至今,宋代以前的墓志得到了较好的搜集与整理,但宋代和宋代以后的墓志文献还未得到相应的重视。

2.墓志的价值

 

      2.1增补和订正人物信息。

各代史书因修纂者价值取向不同对史料进行筛选,加上史料散佚等,许多重要历史人物被史书漏载。墓志与正史不同,在人物叙述方面约束较少,往往详细述及墓主的家庭成员、世系等信息,对正史世系错误的补正作用较为突出。如唐高慈夫妇墓志提供了高氏父母的家族世系和其父母生平情况,载高慈“曾祖王臣,北齐给事中、广德将军、散骑常侍、蓝田公”,《北齐书》《北史》均未记载。又如《旧唐书》卷一八八:“陸南金,蘇州吳郡人也。祖士季,從同郡顧野王學《左氏傳》,兼通《史記》《漢書》。隋末,爲越王侗記室兼侍讀。侗称制,授著作郞……貞觀初,爲太學博士,兼弘文館學士,尋卒。”即载陆南金祖为陆士季,而《大唐故朝散大夫护军行黄州司马陆府君墓志铭》则明确指出陆南金的父亲为陆元感,陆士季实为其曾祖。

      2.2补充史实。

志主的生平是墓志记述的核心,一些被正史漏记、略记的信息,会出现在墓志文献中,可以为相关史实研究提供材料依据。如《吴本立墓志》言及其父“医举及第,寻授太医监”,为唐代医举科提供了相关资料。志主的生平是墓志记述的核心,一些被正史漏记、略记的信息,会出现在墓志文献中,可以为相关史实研究提供材料依据。如《吴本立墓志》言及其父“医举及第,寻授太医监”,为唐代医举科提供了相关资料。

      2.3为史地研究提供助益。

墓志中对志主的丧葬地点多有详细记载,有的甚至罗列出乡、里、坊、街的名称及其隶属关系。官宦家族墓志还常会出现任职地、迁转地以及治下的风土人情、山川地理等。官员外任亡故,墓志还可能会提及归葬途经的道路、城镇与距离的信息,这些都为史地研究提供了宝贵的材料。

      2.4对文集进行辑补。

首先,补充佚文。古人为亲友撰写墓志碑传是常见的事,现存文集中就流传下大量碑传资料,是研究人物、史事、制度以及家族衰替的重要资料。从已经出土的墓志资料来看,出手名家的就有很多,其中为文集佚文或少见文献的也不少。如宋代《王纯中(黄庭坚的长辈姻亲)墓志》《徐佖(黄庭坚的表兄)墓志》,即为黄庭坚所写,为传世文献中所缺。

其次,出土墓志在校勘异文方面也发挥了重要作用。如《李处道墓志铭》为张耒所作,其文收入中华书局点校本《张耒集》,文集与志文校勘,仍有差异。《文集》页八八四述李处道在兴国军“数年反重囚,得免死者甚众”,墓志作“数平反重囚,得免死者甚众”。

      2.5家族史的研究。

唐以前,世家大族在政治、社会乃至经济上都具有举足轻重的地位,形成门第社会。宋代,科举考试成为步入政治的主要阶梯,是当时影响家族兴衰的重要因素。新兴科举士人家族批量登上历史舞台,竞争激烈,社会流动渐趋频繁。这种迅速的转变,使当时社会各种家族形态并存。有的家族如河南吕氏,世代高官,在政治或学术上具有广泛的影响力。但通过科举考试而入仕,成为地方名族,或一段时间内在政治、学术上具有相当知名度与影响力的士人家族也逐渐增加。这些家族的骤然兴衰,形成近世中国家族发展的一个模式,也是传统社会的一个常见现象。但是,宋代的族谱及其相关资料,由于年代久远大多未能留存,仅能依靠家族墓志等资料对家族史进行调研。如20世纪三十年代起,河西折氏族人的神道碑、墓志等陆续被发掘、公布,由于出土资料丰富,可以建构较完整的家族发展历史。戴应新就其调查、发掘的部分折氏族人墓志资料,撰成《折氏家族史略》一书。

      2.6反映社会历史现象。

多种正史无传的出土墓志,收录了相当多角色各异、出身不同的人物,这些人物墓志所反映的现象,对了解当时的社会更有代表性、更具研究意义,史料价值也更高。如张确及其妻杜氏二篇墓志,提及胥吏构陷张确兄弟的事例。当时胥吏欲罗致张确之兄张砺的罪,张确救兄,吏追捕,杜氏劝其避去,阻止其子张无逸出庭,亲自应讯,以智慧化解危机。这从一个侧面展示了宋代部分胥吏的猖狂。又如《宋中山劉君(再思)墓誌》(见下图)载志主“少時家居晝寢室中,家人見一物出入其鼻口……既寤,了不自知,恍惚若狂人”,有时他的话“驗若符契”等等。这也能反应出宋人日常思想。多种正史无传的出土墓志,收录了相当多角色各异、出身不同的人物,这些人物墓志所反映的现象,对了解当时的社会更有代表性、更具研究意义,史料价值也更高。如张确及其妻杜氏二篇墓志,提及胥吏构陷张确兄弟的事例。当时胥吏欲罗致张确之兄张砺的罪,张确救兄,吏追捕,杜氏劝其避去,阻止其子张无逸出庭,亲自应讯,以智慧化解危机。这从一个侧面展示了宋代部分胥吏的猖狂。又如《宋中山劉君(再思)墓誌》(见下图)载志主“少時家居晝寢室中,家人見一物出入其鼻口……既寤,了不自知,恍惚若狂人”,有时他的话“驗若符契”等等。这也能反应出宋人日常思想。

 

3.墓志存量与数字化

 

      3.1宋及宋以前墓志总量

现存墓志的总量,因有些存在与私人手中,较难得到有效统计;公藏单位除图书馆、博物馆、高校外,各级考古队中也存有一定数量的墓志从未公开。但从现在各种出版物目录等统计,宋代以前的墓志总量已有比较可靠的估算。

据赵超《汉魏南北朝墓志汇编》、毛远明《汉魏六朝碑刻集释》(未出版)、梶山智史《北朝隋代墓志所在总合目录》、毛远明等《隋唐五代石刻校注》系列(未完全出版)、气贺泽保规《新编唐代墓志所在总合目录》、曾枣庄等《全宋文》及此类图书参考范围之外的部分图书、公私博物馆、藏家等粗略统计大致如下表:

墓志存量简表:

时代

粗计总量(篇/拓)

出版总量

主要来源

汉魏六朝

1211+55+100+

1300上下

《汉魏六朝碑刻集释》《北朝隋代墓志所在总合目录》《全北魏东魏西魏文补遗》《全三国两晋南朝文补遗》等

726+200左右

800+

《北朝隋代墓志所在总合目录》《全隋文》《全隋文补遗》等

唐五代

12523+2000+

14000+

《新编唐代墓志所在总合目录》及相关书籍与藏家

4800++4200+

7000+

《全宋文》以及各种宋代墓志图书、藏家

 

      3.2数字化主要问题

3.2.1墓志文献中冷僻字的处理

在墓志文献中,异体字、通假字和不规范字的使用十分常见。因此,墓志文献数字化过程中不可避免地会遇到字体障碍,这突出地表现在两个方面:一个是对字体的识别障碍,即准确录入冷僻汉字的人需要有较好的文字基础。另一个是技术障碍,目前广泛应用的Unicode字符集虽能较好地解决字库问题,但常用的输入法不太支持大字符集,导致众多的冷僻字无法准确显示和检索。因此,如何处理冷僻汉字仍是墓志文献数字化过程中必须要克服的一道难题。

3.2.2墓志拓片的版权问题

目前,墓志拓片分藏于各地,很少有集大成的墓志拓片成果。拓片版权分散,一一解决比较困难。

3.2.3文献信息的准确检索。

墓志文献数字化的主要目的和基本功能之一就是迅捷、精确地检索到所需要的内容。全文本的数字化墓志文献已经能够做到实现所有字符的检索。由于墓志文献中普遍存在使用通假字、异体字的现象,就使得内容的精确检索更加困难。因此,推进后台词库建设,实现关联检索是墓志文献数字化必须要解决的问题。

      3.3数字化原则建议

 3.3.1元数据处理。

元数据(Metadata),又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息。任何文件系统中的数据都分为数据和元数据。数据是指普通文件中的实际数据,而元数据指用来描述一个文件特征的系统数据,诸如访问权限、文件拥有者、数据状态、时间、人物等。元数据的制作就是将文献资料变成可以检索、分析型数据的过程,也是史料数字化的关键。

所以在墓志数字化的过程中要注意以下几点:

第一,尽量保证元数据项目的准确性。关于拓片元数据项目的设置,在《国家图书馆拓片元数据规范与著录规则》一书中已非常详备。只是墓志数据录入项目的详备,仍不能避免墓志信息录入的遗漏,从而影响了数据信息的准确性。因此对墓志文献进行较为全面的考证,准确判断墓志的作者、时间、志主等信息非常有必要。

第二,保留元数据的弹性设置。元数据标准化、墓志内容的多样化和研究者对信息需求的特殊化,都要求对元数据的设置必须预留高度的弹性空间,以便于能够容纳更多的墓志文献及其它资料。因此元数据上需预留简介、世系;墓志简题;墓主字号、谥号;墓志书丹、篆盖、镌刻人;下葬地点;载体形式;墓主籍贯;墓主家族;墓主历官;墓主著作等信息,以便日后持续完善。

第三,保证数据文本的完整性与客观性。课题数据文本的客观和完整是研究结论可信的前提条件,在墓志信息的录入过程中,即便是残存墓志也不能遗漏,以确保研究对象各要素间关系的变化不受墓志文本的影响。

3.3.2资源采集全面

从墓志保护的角度出发,应以墓志文献的原始文本图像作为主要数据来源,尽力实现全文本化。但也不能忽视传见于史书、别集、总集等传世文献的墓志内容,以及墓志研究的相关著作与文论等,使数据库涵盖墓志资料与研究成果的资料合集。

3.3.3 对墓志文献进行点校与整理

由于石刻、墓志文献的发现是长期的、复杂的,以至于商人射利造假,发现的墓志需要详细的考订才能够纳入使用范围。为了保证数据库中资料的权威性,对墓志进行真伪辩正、文字认同、史实解释等工作都很重要。以古联公司的墓志数字化为例,数字化过程中,每个子库都邀请其领域的专家来整理,比如宋代墓志作者是宋史专家李伟国先生、汉魏六朝时期有拓片的墓志部分作者是已故的毛远明先生。对墓志文献进行较为全面的点校、注释等,整理过程中详细考证了墓志的作者、生卒葬时、志主、地点等信息。同时,整理者对墓志中的疑难字、俗字进行考订,以出版规范字体进行整理,也解决了大多墓志文献中冷僻字的问题。

3.3.4 积极处理版权问题

为了解决墓志拓片的版权问题,整理者一般既是专业领域的专家,又是专业墓志拓片的收藏者。汉魏六朝碑刻与宋代墓志的作者,多年积累了大量的汉魏六朝拓片,未收藏拓片数量不多,大多能从朋友处获得图片授权。唐代墓志作者本身是收藏家,现藏有唐代墓志拓片8000种以上,承担项目后,更是继续积极大量获取墓志拓片,或从友人处取得授权。

 3.3.5 解决信息检索的准确性

在墓志中,志主的姓名往往分开填写,不利于检索。为了让数据库更加准确的检索,整理者需在标题中增加完整的志主姓名信息。同时还应根据墓志的情况,编制适合墓志需求的关联字表;编写设置人名、字号、地名、职官名的同位语检索体系。

3.3.6 保持可持续性

数据库应保持持续编制,不断完善,作者根据新的资源,不断补充和完善数据库内容,收入最近的墓志资料,吸收最新的研究成果。