中医古籍校注文件中存在的数据类型

更新日期：2019-10-24 来源：中华中医药杂志浏览次数：302 在线投稿

[ 论文导航搜索 ] [ 加入收藏 ] [ 告诉好友 ] [ 打印文本 ] [ 关闭窗口 ]

核心提示：1.古籍校注文件的基本特征著名语言学家王力曾言：语文学的兴起，是在文化遗产积累较多的时代。书籍多了，时代远了，字形、字音、字义都有了变化，于是

1.古籍校注文件的基本特征
著名语言学家王力曾言：“语文学的兴起，是在文化遗产积累较多的时代。书籍多了，时代远了，字形、字音、字义都有了变化，于是促使人们进行探讨”。其实，久远时代的书籍中还存在着字迹模糊、传抄错误、简牍脱损等一系列问题，还需校勘。探讨字义、校正讹误的结果便产生了独具特色的古籍校注专著。这些专著由抄录自底本中的文字和注经者校注的文字两个部分组成，如果删除注文，剩余部分依然是一部完整的著作，如果删除原文，剩余部分就只是一盘散沙。也就是说，注文只有依附于原文才能发挥其应有的作用，才能成为有价值的材料，不过没有注文，后世读者可能很难读懂原文，原文极可能沦为神秘的符号系统。原文与注文是古籍校注专著中两个性质各异却又密不可分的组成部分，这是任何其他著作都没有的特性。
从数据化的角度看，原文与注文是性质截然不同的两种数据类型，各自的差异性显而易见，如作者不同、文字形成的时代不同、在著作中的地位不同、可读程度不同等。但原文与注文又密切相关，注文是对原文中的字词句语义的解释，这种相关关系是注经者建立起来的，虽然具有主观性，却跟语言的双重特性（duality feature ）具有相似之处，可认定为天然的相关关系，其中必然蕴含着丰富的信息需要进一步解读。从大数据分析的角度看，古籍校注著作中这两种数据类型总是交织在一起，要获取最基本的数据，如原文的总字数与词频列表、注文的总字数与词频等，首先必须把原文与注文分解开。从表面看，这种分解操作非常简单，但深入研究就会发现，粗暴地删除操作不但会破坏注文，还可能会损伤原文。
2.数据化与中医古籍校注文件数据化的基本内容
按照舍恩伯格的解释，数据化是把一种现象转化成为可制表分析的量化形式的过程，例如把坐在驾驶座位上的坐姿、或者把航海过程等转化成为可制表分析的量化形式。数据化是获取大批量数据的必备环节。2016年，刘知远曾报道，为了高效率地获取数据，一些大型搜索引擎公司早已开始从各种专业知识库、互联网链接数据、互联网网页等途径以自动化的方式搜集数据，建立各自的知识图谱，“现在谷歌的这幅知识图谱已经将5亿个实体编织其中，建立了35亿个属性和相互关系，并还在不断扩充”。跟这些海量数据相比，中医古籍校注文件中所包含的数据量可谓沧海一粟。然而，数据自有适用范围，对于中医文献学来说，中医古籍校注文件的数据化可能会形成该领域内最大的数据量。
数据化过程需要可靠的数据采集工具，对于中医古籍校注文件的数据化而言，这种数据采集工具就是按照一定的标准进行分类，也就是把古籍校注著作的文字按照各自在文件中的功能差异性转化成为原文、注文、衍文、译文等既相关又可以计数的形式。
古人校注经书，编排经文与校注文字的方式比较简单，注解文字被直接安插在需要注解的文字之后。唐王冰校注的《黄帝内经》还采用了注解文字与音释文字分离的方式，把所有释音的内容附加在原书之后。这种编排方式虽然有利于读者参照阅读注解内容，但弊端也显而易见，原文与注文混杂、原文会显得支离破碎。今天，按页面脚注、或按段落脚注的排列方式已成常规方式，这种方式虽然兼顾了原文的完整性和读者使用注文的便利性，但需要设计额外的脚注序号如“1、②、”等来标记对应关系，引导读者在脚注区域里寻找对应的注文。在原文与注文的对应关系能够清楚显示的时候，这种序列符号就丧失了其应有的作用，可以舍弃。
在研究过程中发现，要把中医古籍校注文件数据化，首先必须调查清楚古籍校注文件中所包含的详细内容及其相互关系，弄清楚什么项目需要输入计算机、什么内容可以舍弃、以何种方式舍弃。然后再把待输入的内容分类并组织成为相互关联的数据结构，以便计算机程序能够自由处理这些数据。
3.中医古籍的数据化
3.1 原文、校文与注文
调查中医古籍校注所涉及的内容，最直接而有效的方法莫过于调查出版物中注经者关于校注的说明。郭霭春在他校注作品的后记中列举了古人校注古籍的23种方法，引述如下：
清·孙德谦对刘向之校讐chóu学有深入的研究，其在《校讐chóu学纂zuan微》一书中，总结出刘向等校书的各种方法。计有俱众本、订脱误、删重复、修篇目、定书名、谨编次、析内外、待刊改、分部类、辨异同、...增佚(yì )文、考师承、纪图卷、存别义。
引述中孙氏的总结指明了汉代学者校勘古籍过程中可能处理的各种内容，校勘与注解内容并提。从校勘方式方面看，古人注经，对底本文字会实施直接操作，主要有三种方式：添加、删除、更改。在这些操作的基础上可能会对增减、更改的原因作一些必要的说明，形成校文，这是底本之外的文字。直接更改底本文字且少有说明的校勘方式一直持续到唐王冰校注《黄帝内经》时期，此书自序中就有“迁移以补其处、加字以昭其义、削去繁杂”的校注方法说明。甚至在今天这种方式偶尔间还会用到。刘渡舟[3]在《伤寒论校注》中说：“我们除了直接改正了其中明显的错字以外，其余文字，一律不加改动。改正了的讹字，在校注后记中已作了说明”。这里我们需要分辨一下底本文件和原文之间的差别。对于无需校勘的古籍而言，原文等同于底本文件，对于需要校勘的古籍来说，原文不等于底本文件，原文是更正底本中有问题文字之后的校勘结果文件。直接更改底本文字，我们姑且不论这种校勘方式的优劣与得失，从数据分类与量化的角度看，原文和校文之间保持着清晰的从属关系，原文是校勘之后基于底本文件生成的新文件，在数据化过程中，可以直接确认为原文，校文是另一种文件。不过，古籍校注过程中，校文与注解文字以及其它一些说明性文字被混编在一起，统称注文，即底本之外的文字或原文之外的文字。要想把校文单列出来，就必须把它从注文中分离出来。
3.2 原文、校文与注文的关联
（1）校文中包含着原文
跟直接更改底本文字形成对照的是，自宋以来，校勘产生的原文，有些却隐藏在校文之中，组成原文数据类型的时候，需要从校文中提取出来。特别是近代以来，按照“四校法”惯例，很少有学者在校勘古籍过程中直接更改底本中的文字。郭霭春在他的校注说明中就明确规定：“凡底本文字，一律不予改动，一切问题，在校文中说明。（《黄帝内经素问校注》校注说明）”，按照这种校勘方式产生的校勘数据如下几例所示（符号“//”之后为注文，方括号是郭氏的注文，下文例句亦同此）：
1）木运升天，金乃抑之，升而不前，即清生风少，...//木运升天：据下文“君火欲升”、“金欲升天”、“水欲升天”文例，当作“木欲升天”。《黄帝内经素问校注·遗篇》
2）...或为偏枯，或为风也，其病各异，其名不同，//或为风也：明抄本无此十二字。...按“或”疑是“咸”之误，“或”“咸”形似致误。《黄帝内经素问校注·风论篇第四十二》
例1）中的原文究竟应该是“木运升天”还是“木欲升天”？例2）中的原文应该是“或”还是“咸”？
根据校注者在“校注说明”中的规定，“凡底本与校本或据校各书不一，显系底本有误者，均出校文，并注明某某误、某某是、某某衍、某某当删等字样”，这个问题的答案是明确的。事实上，这种校勘说明文字只有一种功能，即校注者认为，应该用列举出来的文字替换掉底本中的文字。其实，这种校勘注解方式稍加改进，就能够跟直接替换掉底本中的文字再作进一步说明的方式保持一致，例如例1）就可以修改为：
**木欲升天，金乃抑之，升而不前，即清生风少，...//木欲升天：据下文“君火欲升”、“金欲升天”、“水欲升天”文例更改，底本作“木运升天”。

点击在线投稿

上一篇：中医古籍校注文件中存在的数据类型

下一篇：中医古籍校注文件中存在的数据类型

在线客服