中国民族古文字的文字学意义
作者:孙伯君 日期:2020-09-01 浏览次数:4044


       从远古到20世纪初,中华大地上曾经出现过近40种民族古文字,它们和汉字一起组成了中国文字的百花园。本文从普通文字学层面讨论了坡芽歌书、尔苏沙巴文、纳西东巴文等“助记符号”与语言关联的方式,认为“助记符号”演变为成熟的音节文字必然要经过同音假借;认定一种象形符号是否原始文字,不应过多地考虑其形态,或其是否具有交际功能,而应该更多地衡量它们是否与固定的语言单位发生了关联。同时,本文还讨论了民族古文字造字法丰富了汉字“六书”及其理论、决定一个民族选用哪种文字记录本族语的主因等问题。

一  中国民族古文字简介

中国民族古文字是指中国境内历史上少数民族创造或从域外传入的记录民族语言的文字。这些文字曾在特定历史时期使用,有些因使用这些文字的民族群体的分化融合或语言转用等原因而停用并逐渐消失,成为“死文字”;有些经过改进现仍被本民族使用,记录其现代语言。一般来说,中国民族文字的古和今以辛亥革命(1911)为限,辛亥革命以前创制或借用的各种记录汉语之外的民族语的文字均可称作民族古文字。民族古文字的产生和使用年代最早可追溯到公元2—3世纪,如大约于2世纪传入于阗(今新疆和田)、鄯善(今新疆若羌)一带的佉卢文。而创制于16世纪的清代通用文字满文则一直沿用至近现代。惟傈僳族哇忍波于1923—1927年创制的傈僳音节文字因形态原始,一直以来也被归入民族古文字的范畴。
中国是世界上文字种类最丰富的国家,傅懋勣曾统计古今少数民族文字共57种,聂鸿音认为加上20世纪以后传教士创制的民族文字,以及20世纪40年代以后国内创制完成但试行较短的文字,中国古往今来的民族文字当近百种,其中民族古文字近40种。这些文字的产生和来源异常多样,除了仿汉字的方块壮文、方块白文,变汉字的契丹大字、契丹小字、女真文、西夏文之外,还有些出自域外非常古老的阿拉美字母,如佉卢文、焉耆—龟兹文、于阗文、粟特文。粟特文进而衍生出回鹘文、蒙古文、满文、锡伯文等。作为元朝国书的八思巴字依藏文变化而成,而藏文则出自印度的婆罗米字母。这些民族古文字和汉字一起组成了中国文字的百花园。
       按照文字的发生学关系,学界一般把古往今来中国境内出现和使用的民族古文字作如下分类:

1. 阿拉美字母系文字
       (1)佉卢文
       (2)婆罗米字母文字:焉耆—龟兹文、于阗文;藏文、八思巴字;西双版纳老傣文、西双版纳新傣文、德宏傣文、傣绷文、金平傣文。
       (3)突厥文
       (4)粟特系文字:粟特文、回鹘文、蒙古文、托忒式蒙古文、满文、锡伯文。
       2. 汉字系文字
       仿汉字:方块壮文、方块白文、方块苗文、方块瑶文、方块布依文、方块侗文、方块毛南文、方块哈尼文。
       变汉字:契丹大字、契丹小字、女真文、西夏文、水书。
       3. 阿拉伯系文字
       察合台文、维吾尔文、哈萨克文、柯尔克孜文、乌孜别克文、塔塔尔文。
       4. 自源文字
       云贵川老彝文、纳西东巴文、哥巴文、尔苏沙巴文、傈僳音节文字。
       5. 拉丁字母文字
       老傈僳文、滇东北老苗文、波拉字母傈僳文、撒拉佤文等。
       从18世纪开始,西方探险队在我国“丝绸之路”沿线获取了大量少数民族文字文献。而19世纪末,随着西方传教士和驻华使节在中国北方游历,又陆续在居庸关、唐乾陵、辽庆陵、河南开封等地发现了八思巴字、西夏文、契丹小字、契丹大字、女真文等碑刻。随后,敦煌莫高窟和黑水城“大塔”被发掘,数以万计的藏文、回鹘文、西夏文等文献出土。在对这些文字加以辨识的过程中,西方学界遂掀起了研究中国民族古文字的热潮。在这一历史背景下,“东方学”中很快建立了以中国少数民族文字文献为基本素材的学术研究体系,继而分化出了敦煌学、西夏学等一批分支学科。
       随着世界范围内被发现的文字形态越来越丰富,西方文字学家对于文字的定义与性质、文字与语言的关系、文字与符号的区别等讨论越来越理性与成熟。与之相比,中国文字学界则显得相对保守,对中国文字的深入研究往往局限于汉字。尽管到20世纪末为止,中国学者对少数民族古文字与文献的研究得到了长足的发展,涉及的文种超过30种,已经初步形成了一个语文学和历史学相交叉的新学科,但从普通文字学层面就其共性和规律加以讨论的文章很少,换言之,把民族古文字纳入中国乃至世界文字发展的序列,进而就这些文字记录语言的方式等进行深入探讨的学者寥寥无几,只有周有光、聂鸿音、王元鹿等屈指可数的几位,这与中国作为文字富矿的国情显然很不相称。

二  纳西东巴文与系统的“助记符号”

20世纪20年代,洛克(Joseph Charles Francis Rock)受美国国家地理学会、美国农业部、哈佛大学植物园和哈佛燕京学社委派,前往中国西南搜集植物标本。在进入云南丽江雪嵩村之后,接触到纳西东巴文,并把这种文字及其记录的经典介绍给世人。这不仅使学界接触到一种文字的“活化石”,即处于童年时期的文字形态,而且把中国学者的视野转向了南方民族古文字的研究。
       关于纳西东巴文的产生与应用时间,一般认为在公元7世纪左右。严格来讲,纳西东巴文是一种系统的“助记符号”,是纳西族东巴教的祭司东巴为了记忆经书中的词语、句子、片段、篇章而写画的图形符号。其中表示否定等意义的助词无法用图形表示的,往往采用同音假借的形式。在具体使用中,纳西东巴文可以用一个图形记录一句完整的话,也可以记录到一句话里最主要的词或词组。若想了解这些符号的意义,必须通过东巴把文字所反映的言语成分“记诵”出来。
       纳西东巴文的助记功能,以及它所呈现的文字与所记录的语言单位的这种原始对应关系,促使学界思考“助记符号”与成熟文字的区别在哪里。
       传统上,我们对成熟文字的定义是“文字是记录语言的书写符号系统”;亨利•罗杰斯给文字下的定义是“文字是再现具体口说话语的书面标记”;伊斯特林的定义是“文字是有声言语的补充性交际手段,这种手段在语言的基础上产生,主要用来把语言传到远处,长久保持,并且借助图形符号或形象来表现;通常这些符号或形象表达某种言语要素——一个个最简单的信息、单词、词素、音节或音素”;德范克在《可视言语:文字体系的多样同一性》一书中把文字分为成熟文字与不成熟文字,不成熟文字包括用于提示已存在信息的“助记符号(mnemonic symbols)”和用于传递某些未知的新信息的图画符号(notificational pictographs),并认为“一切成熟的文字体系都是记录语言的”。
       与德范克的分类相对照,像纳西东巴文这样甚至能够助记语言中的“词”的符号,属于较为完备的“用于提示已存在信息”的“助记符号”;而著名的加拿大印第安人“欧吉蓓(Ojibwa)”少女幽会信,则是“用于传递某些未知的新信息”的图画符号。前者强调助记语言信息,后者功在传递语言信息。如果给文字下一个能够涵盖不成熟文字和成熟文字的定义,可以是“文字是助记、传递或记录语言的书写符号系统”。
       一般来说,助记符号很难直接演化为成熟文字,因为只有没有完全符号化的图形才具有“助记”的功能,而成熟文字必然要遵守书写便利原则,成为一种颇为抽象的“符号系统”,并能够记录语言的最小单位“词”或音节。如果从“文字是记录语言的书写符号系统”这一定义出发,纳西东巴文离成熟文字只差一步,即图形符号与语言中的最小单位“词”或音节建立直接关联,这也是学界称之为文字“活化石”的最主要原因。

                                     纳西东巴经 “祭署•董若阿夸的故事•崇忍利恩的故事”首叶

 

除了纳西东巴文,东巴在书写经书时还创制了一种音节文字——纳西哥巴文。哥巴文是纯记音符号,最初产生于记录经文中咒语的需要。不过,现存的几万卷东巴经中,纯粹用哥巴文书写的文本极少,更多的是在东巴文中掺进去个别哥巴字。

三  彝文、傈僳音节文字与成熟文字的界定

关于彝文的起源时间,比较有影响的观点是其产生于汉代或更早一些,据《滇系•杂载》记载:“汉时有纳垢酋之后阿町者,为马龙州人,弃职隐山谷,撰爨字如蝌蚪,二年始成。字母千八百四十有奇,号书祖。”贵州《大定县志》卷十三“风土志”载:“阿町,唐时纳垢酋,居岩谷,撰爨字,字如蝌蚪,三年始成,字母一千八百四十,号曰韪书,即今夷字。文字左翻倒念,亦有象形、会意诸义。”彝文在初创时期也应该是“助记符号”,随着时间的推移,彝族先民大量采用同音假借的手段,使传统彝文逐渐向音节文字过渡。新中国成立之前,彝文没有进行过系统的整理和规范,云南、贵州、四川以及广西等彝区毕摩所使用的彝文各自不同。新中国成立后,四川、云南和贵州三省的有关部门先后都对传统彝文进行了规范或整理,形成了在传统彝文基础上的规范彝文,即云南规范彝文、贵州规范彝文、凉山规范彝文(也称四川新彝文),其中云南规范彝文2508个字符,凉山规范彝文819个字符。

                                                                清代《倮儸译语》(凉山传统彝文)

 


                               彝文武定李氏墓碑拓片(朱崇先拓)

 

云南迪庆州维西县哇忍波创制于20世纪20年代初的傈僳音节文字,从一开始就是一种成熟文字。傈僳音节文字当时被称为“竹编文字”或“獐皮书”,创制者哇忍波是当地的祭司(尼帕),从小善于记诵。哇忍波把傈僳语音节加以归纳,创制了独有的图形符号记录这些音节。据汉刚(个人通信)研究,哇忍波编写的《识字歌谣》共出现了918字,而从《洪水滔天》及《创世纪》等书中又可辑出71个不同的字符,傈僳音节文字总数为989个字。从形体上看,傈僳音节文字还有很多由弧线、曲线构成的符号,与汉字相比,其符号化较差。

                                                    傈僳音节文字
     

彝文的演化和傈僳音节文字的创制,启发我们思考下面三个问题:
       1.判断一种文字是否成熟的主要标准并不是这种文字符号化的程度,而应是文字能否按照语词次序记录语言的最小单位“词”或音节,即如周有光所言,“‘成熟’是能够完备地按照语词次序记录语言”。
       2.系统的“助记”符号发展为成熟文字一般要通过同音假借。由“助记符号”演变为成熟文字的过程中,彝文经过同音假借,并对字形本身加以“符号化”。这一演化往往来自应用者的自觉,当助记符号细化到提示语言中的词的时候,其本身的繁琐就会促使应用者求变,合并、减省助记符号,质变到“记录”语言的成熟文字。同时,合并、删减的过程中,也必然伴随着“符号化”的过程,因为一旦助记符号向纯音节文字演化,其原始形态就成了记忆的障碍。彝文正是经历了这样一个“符号化”和同音假借的过程,才成为现在这样真正记录语言中词素的音节文字。
       3.一种文字的成熟与否与文字创制年代的早晚没有必然的联系。按照学界的观点,纳西东巴文创制的时间晚于彝文,而傈僳音节文字创制的时间比纳西东巴文和彝文更晚。文字创制的年代可称作历史学年代,在文字发展史上所处的地位可称作文字学年代。文字的使用者往往很重视文字的历史学年代,以为形态原始的文字一定是历史学年代较早的文字。实际上,形态原始的文字不一定产生于远古时代,而成熟的文字也不一定在相对晚近的时候才会出现。人们应该更加重视文字学年代,因为只有完美地记录语言的成熟文字才能代表使用这种文字的人对其母语的了解程度。从这个意义上说,哇忍波既是文字学家,又是首次对其母语音节进行归纳的出色的语言学家。
除了“助记符号”发展为成熟文字要通过同音假借,用来表情达意的加拿大印第安人“欧吉蓓”少女幽会信质变到成熟文字也要经过同音假借,不然就无法记录表示语法意义的虚词。正如聂鸿音所言:“图画文字系统彻底变为象形文字系统的前奏是同音假借现象的出现和逐步增多”。

四  “坡芽歌书”与原始文字的助记功能

2006年,云南省文山壮族苗族自治州富宁县政府工作人员在剥隘镇坡芽村调查时发现了一块布,上面画有81个图形符号。据这块布的持有者介绍,这是她们家上辈传下来的歌书,每一幅图案代表一首固定的壮族山歌,只要见到一个图形,即可想起一首歌,继而咏唱出来。这些歌都是情歌,内容有长有短。“坡芽歌书”被报道后,引发了学界对这81个图形符号性质的热烈讨论,进而引起了学者对于文字的原始功能的深入思考。
如果单纯从图形上看,这81个符号跟图画没有区别,为月亮、人、稻谷、鸭子、鱼等自然形态的象形。不过,既然它们能够帮助人们想起一首歌,而一首歌可以认为是语言中的篇章,无疑具有了助记的功能,可以认为是81个助记符号。

                                                                                      坡芽歌书
     

在“坡芽歌书”发现之前,人们一直以为尔苏沙巴文可能是最古老的文字样本。尔苏沙巴文是四川省凉山州的尔苏人祭司(沙巴)使用的文字,起源何时,由谁创制,无确切记载,总共只有200多个单字。其特点为:文字的形体多为自然事物的象形,有少量的衍生字和会意字;常在文字中配用白、黑、红、蓝、绿、黄等颜色,不同的颜色表达不同的附加意义,如白色代表金,绿色代表木,蓝色代表水,红色代表火,黄色代表土;文字无固定的笔顺和书写格式,但有时为了说明时间顺序,可以在一个复杂的图形中将单字按左下、左上、右上、右下、中间的顺序排列;尔苏沙巴文单个字体和语言里的词和音节不是一对一的关系,往往一个字读两个音节或三个音节,有时一个图形代表一段话。

                                                                                  尔苏沙巴文

 

如果把坡芽歌书、尔苏沙巴文、纳西东巴文作为一个演化序列来看,可以看到助记符号与语言单位关联的进展,由提示语言中的篇章,发展到提示语言的段落,再发展成为提示语言的句子、词组。从目前学界的认可度来看,尔苏沙巴文和纳西东巴文均算文字,那么比它们更为原始的“坡芽歌书”算不算文字呢?即一种只与语言中的篇章相关联的助记符号算不算文字呢?按照德范克等学者的分类,助记符号是不成熟文字,那么“坡芽歌书”就属于文字的范畴。如果确信它是文字,那就意味着我们见到了形态最古老的、还没有从图画脱胎出来的文字样本。近年来学者发表的意见基本也都是肯定“坡芽歌书”上的图画是文字,认为它符合形、音、义俱全的传统文字定义。周有光在《中国富宁壮族坡芽歌书》一书扉页题有:“坡芽歌书,文字之芽”,也持肯定意见。不过,如果把像“坡芽歌书”这样的助记符号也算作文字,恐怕会颠覆此前学界对原始文字性质的认知:(1)语言文字是交流的工具,著名的加拿大印第安人“欧吉蓓”少女幽会信,使我们认识到原始的文字画是用来表情达意的,我们很难想象一种文字甚至不是用来交流,只是帮助记忆的图形;(2)作为记录语言的书写符号系统,文字中必有一些可以拆分出来另行组合或反复使用的“单体符号”,就像彝文、汉字的偏旁、纳西东巴文中的符号那样,可是我们在“坡芽歌书”里找不到此类独立成分的有效例证;(3)文字具有约定俗成性,我们判断纳西东巴文是文字,是因为不同的东巴在助记同一句话时,所用的符号基本是一样的,而“坡芽歌书”显然还不具备这样的属性。
       此前学界基于文字发展史对文字进行分类时,往往比较注重文字形态的变化,忽略了原始文字与成熟文字最根本的区别是文字与语言关联方式的不同。上文所引德范克把不成熟文字符号划分为两类:用于提示已存在信息的“助记符号”和用于传递某些未知的新信息的图画符号。詹森(Jensen)在《标记、符号和文字》中也认为文字“它的目的与功能在于信息的传播(可以是同他人交际;也可以是对本人的记忆提示)”。所谓“助记符号”,即人们大脑中已经存储大量的口传文献,文字只是帮助记诵这些文献的符号。纳西东巴文、尔苏沙巴文、彝文、水书、傈僳音节文字等均产生于“助记”的需要,东巴、毕摩、尼帕等除了作禳灾、超度、祭祀等法事外,还承担着本民族宗教、历史、星相、历法、农耕经验等传承任务,大脑中记存有大量的口传文献,需要一些助记符号帮助记忆。这种作为助记符号的原始文字与记录语言的成熟文字有本质的区别,即无需按照语词次序逐词提示,因而不必像成熟文字那样记录到语言的最小单位。
       “坡芽歌书”的文字学意义在于,它首先启发我们思考文字的最初功能之一是“助记”语言,其次促使我们进一步思考认定一种图形符号是否是原始文字的标准,与区分原始文字和成熟文字一样,不应过多考虑其图形是否接近图画,或是其是否具有交际的功能,更或是其时代产生的早晚,而应该更多地衡量这种文字是否与固定的语言单位发生了关联。如果某种图画的功能是对语言进行了“助记”,不论“助记”语篇、段落,还是句子、短语,都应该认定其为原始文字。

五  民族古文字对“六书”的继承与发展

西夏文创制于1036年,是西夏(1038-1227)的官方文字,记录的主要是党项语。西夏字是在短时间内集中创制的,《宋史》卷485《夏国传上》记载:“元昊自制蕃书,命野利仁荣演绎之,成十二卷,字形体方整类八分,而画颇重复。教国人纪事用蕃书,而译《孝经》《尔雅》《四言杂字》为蕃语。”(《宋史》 )西夏字典《同音》中收录有6133个西夏字,但据李范文统计,实际字数只有五千八百多。西夏字里没有汉字“六书”中相对原始的象形字和指事字,“会意”和“形声”是最能产的两种造字方法,会意字的数量超过形声字。同时,仿汉字“转注”造字法,西夏字用“左右易形”的方式为同义词或近义词造字。

                                                                                 西夏文《三代相照文集》
  

    1. 西夏字对汉字“六书”造字法的继承与发展
       (1)会意
       许慎在《说文解字》的序言里对会意的解释是:“会意者,比类合谊,以见指撝,武信是也。”是指用两个或两个以上的汉字,根据各自的意义关联组合成新字。西夏文的会意字与汉字有所不同。
       首先,汉字会意字多表示动词,而由于西夏字里没有相对原始的象形字,大量的名词、动词、形容词都用会意的形式加以表现,且构字的部件更多,至少由两个组成,如《文海》36.121:“禓kjir?”(腰)和“饯t?j??”(围)组成“诚nj??”(裙);《文海》7.112:“毕?wer?”(膝)、“聜l??”(手)、“盎d?ji”(行)组成“簣bia?”(爬),意思是“用膝盖和手触地前行”。
       其次,为了更好地会意,便于记忆,西夏字大量采用“省形”的方式造字,并创造了相应的术语加以表现,如用“緵?u?”(头)表示保留了上部;用“崇t?hj?j?”(底)表示保留了下部;用“纳pha?”(半)表示保留了左半,用“緈bj?j?”(右)表示保留了右半;用“蛃nji?j?”(中)表示保留了中部;用“饲i??”(围)表示保留了外缘;用“臔khj??”(脚)表示保留了延伸到下面的左部。例如:《文海》14.121:“蠗pie?”(阔),“坞zjij?”(广)左“山low?”(宽)全;《文海》75.143:“吻ts???”(秋),“谓rer?”(稻)左“癿ljij?”(见)全。
       此外,大量用否定义的部首“形”,即“篟mji?”(不)的左面表示反义:《文海》9.111:“倦dju?”(告),“篟mji?”(不)左“皮w???”(服)右;《文海》30.231:“觅mja??”(粗),“篟mji?”(不)左“关tshj?j?”(细)右;《文海》31.211:“紝sã?”(散),“篟mji?”(不)左“并?io??”(集)全。
       (2)转注
       许慎在《说文解字》的序言里对转注的解释是“建类一首,同意相受,考老是也”,所谓“建类一首”指的是“把同类的字归入一个部首里”;而“同意相受”,即用意义相同或者相关的两个字互相解释。段玉裁《说文解字注》(1981)释曰:“转注犹言互训也。”西夏语有些同义词或近义词由“左右易形”的两个完全相同的构字部件组成,西田龙雄首用“转注”这一术语来指称这种造字方法。例如:
         插煌  d?jwu? wj??  人人    縦菞  khwej? lj?j?  大大
         蠂圭  pjowr? phu?  茂盛    蘁脀  d?jwu? thj?j?  电闪
         鸥菺  war? b??   枝叶    翖絅  •jiw? nio?w?  因缘
       用这种“易位”方式造出的字在西夏字典里一般都可以“互训”或者组合成双音词。如第一组字,《文海》杂7.111释曰:“插d?jwu?”(人)者,“煌wj??”(人)也;《文海》72.152释曰:“煌wj??”(人)者,“插d?jwu?”(人)也。这种“互训”的训解格式与《说文解字》里最经典的转注释例“考,老也”、“老、考也”如出一辙。
       从传统的“六书”立场上看,西夏字的造字法是对汉字“会意”、“转注”等造字法的创造性继承和发展。
       2. 音读与训读
       在民族文字中,借用汉字记录民族语,其读音无外乎有音读和训读两种方式,如同汉字“东”借到日文里音读作to、“川”训读作kawa一样。这种借用方式是南方仿汉字等民族古文字的普遍做法,如汉字“风”,借到白文里训读为pi??,义为“风”;汉字“走”,借到古壮文中训读为byaij,义为“走”。只是与日文相比,民族文字借用汉字时会有如下变化:
       (1)整字借用,“音读”时,其意义与汉语不同。如白文“波”,音读po??,义为“他的”;古壮文“斗”,音读daeuj,义为“来”。
       (2)整字借用,“训读”时,会在原汉字之上加区别性符号,如:古壮文“  tou”,义为“门”,在汉字“門”里加“丶”;古壮文“圡 to”,义为“土”,在汉字“土”上加“丶”;女真文“  *inengi”,义为“日”,在汉字“日”上加“丶”;女真文“  *biya”,义为“月”,在汉字“月”上加“丶”;西夏文献中,个别汉字采用训读,也会用加“口”的方式以示区别,如“嘿”字,《掌中珠》用它为西夏字“梆njaa?”(黑)注音。
       (3)拼合成字,表意义的意符+音读汉字,如古壮文“??”,义为“秧苗”,音读gyaj;“??”,义为“削”,音读dat;侗文“伓”,义为“父”,音读pu。
       (4)拼合成字,表意义的意符+训读汉字,如古壮文“??”,义为“种”,训读为ndaem(与壮语“黑”同音)。
       “仿汉字”和“变汉字”民族文字对汉字的借用和改造,极大地丰富了汉字“六书”造字法,充分反映了中国古代各民族之间的交融与交流。正如骨勒茂才在《掌中珠》“序言”中所说:“今时人者,番汉语言可以俱备。不学番言,则岂和番人之众?不会汉语,则岂入汉人之数?番有智者,汉人不敬;汉有贤士,番人不崇。若此者,由语言不通故也,如此则有逆前言。”

六  契丹小字和女真小字与文字对语言的适用性

辽朝建立以后,先后创制了两种文字,契丹大字和契丹小字。契丹大字创制于辽神册五年(920),是太祖阿保机命突吕不和鲁不古仿照汉字隶书创制的。《辽史》卷2《太祖本纪下》:“[神册]五年春正月乙丑,始制契丹大字。……九月己丑朔,梁遣郎公远来聘。壬寅,大字成,诏颁行之。”契丹大字创制不久,太祖之弟耶律迭剌又创制了契丹小字。《辽史》卷64《皇子表》:“迭剌,字云独昆。……性敏给。……回鹘使至,无能通其语者,太后谓太祖曰:‘迭剌聪敏可使。’遣迓之。相从二旬,能习其言与书,因制契丹小字,数少而该贯。”契丹大字是依照汉字创制的表意文字,对笔画繁复的汉字加以变笔,对笔画简单的汉字采用加笔。契丹小字则是耶律迭剌受回鹘文启发,把一些契丹大字固定为音符而制成的音节文字。这些音符被学界习称为原字,共有近500个。
与契丹大、小字相应,金代也曾创制过两种文字,女真大、小字。女真大字是表意字,女真小字是表音字。女真大字的颁行时间是天辅三年(1119);小字的创制和颁行时间为天眷元年(1138),初用时间是皇统五年(1145)。《金史》卷73《完颜希尹传》:“金人初无文字,国势日强,与邻国交好,乃用契丹字。太祖命完颜希尹撰本国字,备制度。希尹乃依仿汉人楷字,因契丹字制度,合本国语,制女直字。天辅三年(1119)八月,《字书》成,太祖大悦,命颁行之。赐希尹马一匹、衣一袭。其后熙宗亦制女直字,与希尹所制字俱行用,希尹所撰谓之女直大字,熙宗所撰谓之女直小字。”《金史》卷4《熙宗本纪》:“天眷元年(1138)正月戊子朔,上朝明德宫。高丽、夏遣使来贺。颁女直小字。”(皇统五年,1145)“五月戊午,初用御制小字。”

                                       女真进士提名碑
     

契丹语、女真语同属阿尔泰语系,为黏着语,其语法变化主要依靠黏着形式来实现。契丹小字和女真小字就是为了适应黏着语复杂多变的语法形式,通过改造意字或增加音字而对大字进行的改良。尽管都称作小字,但契丹小字和女真小字有很大的区别。契丹小字是受回鹘文启发而改进的音节文字,虽然契丹小字并没有改进为像回鹘文一样的音素文字,但它属于表音文字系统是毫无疑义的。而金熙宗所制女真小字,只有表音的词缀和语法附加成分,还不能作为一套完备的文字体系来看待。换句话说,熙宗对女真大字的改革,并没有像耶律迭剌改造契丹大字那样彻底,只是创制了一些表示词缀和语法形式的表音字补充到完颜希尹所撰的大字中一起使用。女真文是用两套文字系统记录女真语的,就像日文用汉字与假名两套系统记录日语一样。
       明代《女真译语》中的女真字仍没有像契丹小字一样脱离表意系统,女真语词干往往用表意字记录,女真语的构词成分以及表示语法意义的虚词都用表音字。不过,《女真译语》中已经有很多记录词干的女真大字被表音字所替换,且很多表意大字经过同音假借,也变成了纯音节文字。如:
       (1)沉bie,动词基本形的语尾词。如:《女真译语》“鞭附沉”xa-?a-bie,“见”;“宾富沉”o-mia-bie,“会”。“沉”还可用作纯表音字,如:“侗沉樊”?ï-bie-xu?,“燕”。
       (2)缄,本义为“山”,《女真译语》“缄淬”ali-in,“山”;还可以用作表音字,如:《女真译语》“缄加”ali-buwi,“赐”。
       现存女真文尽管从体系上说还不是纯音节文字,但有非常明显的向音节文字过渡的倾向。
       契丹小字与女真小字对两种大字的改良,是在充分适应本族语特点基础上的一种改进。这种改进的文字学意义在于,尽管文字有其自身的发展规律,一个民族选用什么文字记录其语言往往受宗教、文化等因素的影响,语言并非决定性因素。但文字毕竟是记录语言的书写符号系统,在使用过程中,文字一定会更好地适应所记录语言的特点。

七  八思巴字的创制与文字的社会属性

八思巴字,又称“蒙古新字”,是忽必烈命国师八思巴罗古罗思监藏依照藏文创制的,于至元六年(1269)颁行。《元史》卷202《释老传》载:“至元六年,诏颁行天下。诏曰:‘朕惟字以书言,言以纪事,此古今之通制。我国家肇基朔方,俗尚简古,未遑制作,凡施用文字,因用汉楷及畏吾字,以达本朝之言。考诸辽、金,以及遐方诸国,例各有字,今文字寖兴,而字书有阙,于一代制度,实为未备。故特命国师八思巴创为蒙古新字,译写一切文字,期于顺言达事而已。自今以往,凡有玺书颁降者,并用蒙古新字,仍各以其国字副之。’”现存八思巴字文献不仅有译写蒙古语、汉语的,还有译写藏语、梵语以及回鹘语的。
       为充分体现八思巴字“译写一切文字”与作为“国字”的特点,国师八思巴对藏文的字形和书写形式做了一些改造:一是字母形状仿汉字加以方块化;二是字符组合仿回鹘式蒙古文上下叠加;三是增加了几个表示梵文的字母;四是书写形式仿回鹘式蒙古文从左向右竖写。

                                           泉州海外交通史博物馆藏八思巴文泉州叶氏墓址界石

 

本来此前已有回鹘式蒙古文记录蒙古语,1204年,成吉思汗西征灭乃蛮部时,俘获其掌印官畏兀儿人塔塔统阿,成吉思汗遂命其教太子、诸王学习回鹘字母,记录蒙古语。回鹘语与蒙古语均属阿尔泰语系,选用回鹘文也能较好地表现蒙古语的黏着语形式。如果没有其他因素的影响,本没必要再创制一种新文字。忽必烈命八思巴根据藏文重新创制一种新文字的动机,有其深厚的社会政治背景。首先,创制文字与改正朔、易服饰一样,一直以来被当做统一、独立国家的标志。契丹文、女真文、西夏文创制均有作为统一国家、完备制度的大背景。《辽史》卷103《萧韩家奴列传》载:“昔我太祖代遥辇即位,乃制文字,修礼法,建天皇帝名号,制宫室以示威服,兴利除害,混一海内。”《金史》卷73《完颜希尹传》载:“金人初无文字,国势日强,与邻国交好,乃用契丹字。太祖命希尹撰本国字,备制度。”而在占领河西走廊、完成开疆拓土之后,西夏开国皇帝元昊于宋景祐三年(1036)创制了西夏文,在向宋朝递交的表文中,元昊把创制文字与“张礼乐”、“备器用”相提并论:“臣偶以狂斐,制小蕃文字,改大汉衣冠。衣冠既就,文字既行,礼乐既张,器用既备,吐蕃、塔塔、张掖、交河,莫不从伏。称王则不喜,朝帝则是从,辐辏屡期,山呼齐举,伏愿一垓之土地,建为万乘之邦家。”(《宋史》卷485《夏国传上》 )近代,蒙古国选用西里尔字母记录蒙古语无疑也有政治方面的考虑。
       其次,决定借用哪种文字来记录本族语占首位的并非语言因素,而是宗教、文化等因素。八思巴字因藏文而造是受藏传佛教的影响。夏元之交,与藏族毗邻的甘州、永昌、凉州等地延续了西夏的风俗,笃信藏传佛教。1240年,蒙古王子阔端从凉州派多达那波带兵进藏,并招请噶举派止贡寺法台京俄扎巴迥乃到凉州时,扎巴迥乃转而推荐了萨迦班智达,此后遂有萨迦班智达携八思巴于1247年在凉州与元朝统治者的历史性会面,后来,八思巴成为帝师,成就了藏传佛教萨迦派在元朝宫廷的百年兴盛。与此背景相同,辽、夏、金三个王朝都推行了仿照汉字设计的全新文字,包括契丹小字最终没有改用回鹘文字符,均是受唐宋时期中原儒学在周边民族地区得以广泛传播的影响。这种影响在下面一段对话中可见一斑,《辽史》卷72《义宗倍传》载:“时太祖问侍臣曰:‘受命之君,当事天敬神。有大功德者,朕欲祀之,何先?’皆以佛对。太祖曰:‘佛非中国教。’倍曰:‘孔子大圣,万世所尊,宜先。’太祖大悦,即建孔子庙,诏皇太子春秋释奠。”从13世纪开始,伊斯兰教从西域大规模传入了中国,很快就在新疆取代了原来佛教的统治地位,使得那里的许多民族也相继放弃原来的文字,转而借用阿拉伯字母文字记录自己的语言。
       八思巴字借用藏文与改造藏文字母的方式,其文字学意义在于,尽管文字是记录语言的符号系统,但语言有时并不是决定借用哪种系统的文字记录本族语的主要因素,文字具有社会性,宗教信仰、政治背景、文化认同等是影响一个民族选用哪种文字记录本族语的主因。

八  结  语

我们虽习惯把语言和文字并提,但从科学的意义上说,语言与文字有着各自不同的发生学系统,语言学和文字学在研究目标、研究对象和研究方法诸方面都存在本质的差异。语言学研究一般无需过多考虑文字问题,文字学研究则需要适当考虑语言问题,文字对语言有适用性。一种文字形体如果不能完备地记录本族语,则需要考虑语言的特点适当地对文字加以改造。
       文字虽然是记录语言的书写符号系统,因语言而命名,但却不能按照语言来分类。文字因“助记”语言与表情达意的需要而产生,最终趋于成熟,按照语言次序逐词记录语言。中国民族古文字千差万别,我们首先可以按照“语言的助记符号”和“记录语言的符号”分成两类,前者有纳西东巴文、尔苏沙巴文等;后者可看作成熟文字,据所记录语言的成分和系统可将其分为以下几类:
       1.音素文字:佉卢文、焉耆—龟兹文、于阗文、傣文、藏文、八思巴字、突厥文、粟特文、回鹘文、回鹘式蒙古文、托忒式蒙古文、满文、察合台文、维吾尔文、哈萨克文、柯尔克孜文、老傈僳文、滇东北老苗文等;
       2.音节文字:彝文、契丹小字、纳西哥巴文、傈僳音节文字等;
       3.表意字与表音字的混合系统:女真文等。
       4.表意文字:契丹大字、西夏文、方块壮文、方块白文等。
       相对语言,文字的借用更能反映外来文化、宗教对该民族的影响,不过,几乎每一种文字对既有文字的借用均非照搬,而是创造性地继承与发展,甚至最终会成为一个民族的标志性符号。古往今来中国境内出现的民族文字大多是某个人一次性创制的,如藏文、契丹文、女真文、西夏文、八思巴字、傈僳音节文字等,汉字式民族古文字灵活的造字法,丰富了汉字“六书”及其理论。
       我们把文字的创制年代称作历史学年代,并根据文字能否逐词记录语言的成熟程度来判定它的文字学年代。产生较早的文字其文字学年代不一定早,而产生较晚的文字其文字学年代也不一定晚,反之亦然。学界往往很重视一种文字的创制时间,认为创制时间较早的一定是有历史的成熟文字,实则不然。

(本文原刊于《民族语文》2020年第2期。参考文献及注释等详参原文。作者:孙伯君,中国社会科学院民族学与人类学研究所民族文字文献研究室主任、博士生导师。)

 

文章来源:原创
版权所有:中国社会科学院中国少数民族语言研究中心
地址:北京市海淀区中关村南大街27号院6号楼     邮政编码:100081
E-mail:zgmzyyx@163.com