藏缅语族语言的数理分类及其形成过程的分析(一)

藏缅语族语言的数理分类及其形成过程的分析(一)

发布时间:2015-11-24

  传统的藏缅语族语言的分类只重视语言差异的定性分类,而无法作语言间亲缘关系的距离的程度的量的分析。本文运用词源统计分析法,对中国境内的藏缅语族语言作出数理分类以及亲缘关系程度的描述,并通过树枝长短来表示距离关系。显示藏缅语族语言的类簇和分级层次。同时计算出藏缅语族诸语言的时间深度,并分析其形成过程。

一、藏缅语族的民族、语言、人口及分布
  藏缅语族是汉藏语系中语种最多、分布最广、内部差异最大的一个语族。在中国,使用藏缅语族的民族有:藏、门巴、珞巴、景颇、独龙、怒、羌、普米、彝、哈尼、阿昌、拉祜、基诺、傈僳、纳西、白、土家族等 17个民族,据87年《中国语言地图集》公布中国境内的藏缅语族语言共有23个,即藏、嘉戎、错那 -门巴、仓洛 -门巴、博戈尔 -珞巴、义都 -珞巴、格曼 -簦语、达曼 -语、景颇、载瓦、独龙、怒、羌、普米、彝、哈尼、阿昌、拉祜、基诺、傈僳、纳西、白、土家语。而据最近的研究 (97),中国境内的藏缅语族语言则已增加到36种,原因是发现了一些新的语种,例如,木雅、道孚、扎巴等。就国内外藏缅语族语言的数量来说,分歧较大,国内学者认为 100余种,而马提索夫则认为至少有250种。主要原因是划分语言和方言的标准不统一,国内民族数量划分少,语言数量也少。彝语六大方言根本不能通话。藏缅语族内民族与语言关系极其复杂,有的一个民族使用多种语言,例如,藏族使用藏、嘉戎、木雅、扎巴、道孚等语,景颇使用5种语言,除了景颇语外,其他4种则属彝缅语支。有的几个民族使用同一种语言,例如羌族和部分藏族使用羌语。使用藏语的则包括:藏、蒙、土、回、珞巴等民族族。据估计,藏缅语族语言人口约1千5百万。例如羌语人口15万,其中羌族9万,藏族6万。
  藏缅语族的分布:主要分布在中国、缅甸、泰国、越南、孟加拉、老挝、印度、尼泊尔、不丹、锡金等国。在中国,藏缅语族主要分布在西南、西北、及中南地区的西藏、青海、甘肃、云南、四川、贵州、广西、湖南、湖北等省。
二、藏缅语族语言的传统分类
 1、语言分类是认识语言关系具突破性的层面。
    19世纪50年代开始认识藏文跟缅文有同源关系。最早英国学者Konow Sten《印度语言调查》(1903-1928)藏缅语分 9个分支。
    1937李方桂《中国的语言和方言》采用谱系树分类法,分藏缅语族为4个语群,即1、藏,2、景颇,3、缅,4,彝;分语群和语言 2级。
    罗常培、傅懋绩《国内少数民族语言文字概况》藏缅语族分类近似李,分4个语支。
    而《地图》则分藏缅语族23种语言为7类:
A、藏、嘉戎、错那-门巴、仓洛-门巴、
B、羌、普米
C 、博戈尔 -珞巴、义都 -珞巴、格曼-簦语、达曼 -簦语
D、独龙、景颇
E、载瓦、阿昌
F、彝、纳西、白、傈僳、怒、拉祜、哈尼、基诺
G、土家语
马提索夫的藏缅语族分类:
   分类的标准主要有:语音面貌,语法范畴,词汇系统即同源词的多寡和对应关系的远近。
   以上分类除了国外藏缅语,涉及国内藏缅语问题的主要分歧有:
   1、羌语是否单列一个语支,瞿蔼堂归藏语支,戴庆厦归嘉戎-独龙语支,孙宏开单列。
   2、白语的归属,两种意见:
   A、归汉语族,格林伯格1953《历史语言学和无文字语言》认为白、汉有发生学关系,主张白语归汉语族,本尼迪克特同意此观点,划归汉语族。郑张尚芳同此观点。
   B、归藏缅语族。
   或单列独立语支,或归入彝语支。戴庆厦单立、孙宏开、吴安其归入彝语支。他们都认为白、汉是接触关系,而非发生学关系。
三、藏缅语族语言的计量分类
    1、分类的标准和方法:100词及数量方法。
    本文主要运用词源统计分析的理论和方法来作藏缅语族语言的亲缘关系分类。词源统计分析法的基本观念是两种具有亲缘关系的语言分离的时间深度,可以通过它们继承的词的共享程度来判断。语言的亲疏关系不同于语言的亲缘关系,亲疏分类是一种类型上的分类,而亲缘分类便是遗传上的分类。亲疏分类的对象是不必有遗传上的联系的,但是,如果是亲缘分类的话,分类对象就必须是有亲缘联系的。词源统计分析法最初由 Swadesh 提出,近年来,由于生物学种系发生树理论的不断完善和计算机的巨大进步,词源统计分析法又开始受到历史语言学家的极大重视。王士元(1995)曾运用词源统计分析法作出壮侗语族的分类,但国内学者仍较少运用此方法作民族语言分类。
    我们主要依据Swadesh的100词表作同源词的数理分析,同时参考选择雅洪托夫的35词表,具体分析了藏缅语族的12个语言,最后画出藏缅语族语言树形图。树形图包含两个重要的信息:1、语言集团的呈阶级式的聚合分类; 2、树枝的长度可以反映语言从祖语分离的时间距离以及各语言间亲缘程度。
 2、数理分类的主要步骤:
  (1)相似矩阵( Similarity Matrix)首先优选出同源词,编制同源词表,然后计算出每对语言的同源百分比。
     lasa  Alike qiang pumi  jiarong  jingpo  yangguang sani mojiang naxi bai tujia OC
lasa       92   54    49   53     44     52         51    55  54  33  35  31
alike           52    50   52     43     52         52    55  51  31   33  31                      
qiang                79   73     56     60         58     60  65  40  40   34
pumi                     74     46     65         63     66  64   34  32  34
jiarong                           49    63         60     60  59    34  37  33
jingpo                                  54         43     48   50  34   33  28
yang
guang                                             67     69    68  34   35  32
sani                                                      72    61  31   37  30
mojiang                                                         72  34   38  32
naxi                                                                 32  33  31
bai                                                                       23  33
tujia                                                                          20
(2)距离矩阵( Distance Matrix)
由于数理树形图是通过分枝的长度来反映语言间的距离的,所以,我们必须把上面的相似矩阵转换为距离矩阵 (Distance Matrix)。
 
(3)从无根树到有根树
从距离矩阵转换成无根树有许多种方法,所有这些方法都需要大量的计算。生物学家为生物种系发生分类设计出很好的计算程序。我们采用的计算程序,则是最有影响的,1967年由Fitch和 Margoliash发明的以及 1987年由 Saitou和 Nei发明的程序。
 
藏缅语族语言数理树形图:
树图一:12 languages:
 Neighbor joining: bai as an outgroup
树图一显示藏缅语族12支语言,可分为6个较大的聚类,即白、景颇、土家、藏 (拉萨、阿力克 )、彝缅(哈尼、彝、纳西、缅 )、羌(嘉戎、普米、羌 )。其分级和层次可假设为:由于白、景颇的树根分叉点的数字为零,所以可以认为树图的第一层为三分,即白、景颇和土家等;第二层次则为;土家与藏(拉萨、阿力克 )等;第三层次则为藏与彝缅(哈尼、彝、纳西、缅)、羌(嘉戎、普米、羌);第四层次则为彝缅与羌,显示平行关系。彝缅的远近关系依次为哈尼、彝、纳西、缅;羌的远近关系依次为普米、羌、嘉戎。树图的数字代表树枝的长短距离,反映语言之间的亲缘关系的远近,树枝长的表示两种语言亲缘距离远,树枝短的则表示两种语言亲缘距离近。而同一个小簇类里的语言关系则比外簇类的语言关系近。树图一显示在藏缅语族 12支语言中,白、与土家的线条特别长,这可理解为:如果我们假设语言分化后,各自演变的速度本来应是均等相同的,但是由于白与土家与其他语言接触多,借词成份特别多,所以其变化速度特别快,这就显示出白与土家与其他语言的不同的演变结果。
树图二:增加古汉语的数据,变成13支语言,发现图一计算出来的12支藏缅语族语言分类格局仍然未变。
neighbor joining
图二显示13支语言,可分为7个较大的聚类,即古汉、白、景颇、土家、藏(拉萨、阿力克)、彝缅(哈尼、彝、纳西、缅)、羌(嘉戎、普米、羌)。由于景颇、土家的树根分叉点的数字近为零,所以不能认为土家跟藏(拉萨、阿力克)为一个小簇。可以假设认为树图的第一层为三分,即古汉、白与景颇等;第二层为四分,即景颇、土家、藏(拉萨、阿力克)、彝缅(哈尼、彝、纳西、缅)和羌(嘉戎、普米、羌)。第三层为二分,即彝缅(哈尼、彝、纳西、缅)和羌(嘉戎、普米、羌 ),其内部距离远近一如图一所示。
树形图说明:
   我们使用了Neighbor Joining 和 Fitch两种计算方法,结果都一样。各分级层次的类簇相同。增加汉语数据,由12支语言变成13支语言后,分类的情况仍然相同。
    我们曾经考虑过白与土家的线条特别长,是否因为白与土家这两支语言的借词成分特别多,我们采用了排除的方法,即先排除白与土家语,看看其他语言的分类结果是否跟未排除前一样,结果显示跟原先的分类基本一致,这就说明分类结果是可信的。
    从三个不同的树图比较来看,我们有个重要的发现:随着语言数的增加和减少的数据的变化,树图的反映很敏感,都会体现在树图的不同变化上;而最重要的变化是白、景颇、土家这三支语言在图中出现的位置,即摆放的位置不同,这就反映了这三支语言在12支藏缅语言中的特殊地位不同,而传统的分类正是认为白、土家系属未定,而景颇地位特别,学术界为此常常引起争论。数理分析的结果跟传统的定性分析相合。
 3,几点结论:
 A、据树图藏缅语族语言可分为 6个较大的聚类,即白、景颇、土家、藏(拉萨、阿力克)、彝缅(哈尼、彝、纳西、缅 )、羌(嘉戎、普米、羌 );这种分类结果与戴根据不同材料、不同的方法作出的分类完全一致。
 B、树图表示白、景颇、土家各自为独立一个聚类,可视为单一语支;特别是白语,单一性特别明显,这个结论与《地图》将白语归入彝语支的观点有很大差异。但是白语虽然跟古汉语在假设的同一个分级层次上,两者关系特殊,但并没有跟古汉语形成同一个簇类。从亲缘关系的距离来 看,白语离树根最远,其次是景颇语和土家语。同其他藏缅语族语言比较,白语与彝缅语聚类最近,特别是跟哈尼语最近;这结果跟传统分类往往把白划入彝语支相似。
 C、本尼迪克特认为白语归汉语,藏缅语族语言以景颇语为中心,向四周其他语言辐射。树图表明第一层次上的分类即景颇语、白语及其他藏缅语的三大聚类。这在一定程度上,跟本氏设想相合。
 D、藏缅语族语言有相当高的同质性,确实存在一个藏缅语族语言共同体。
 E、羌语支语言为独立一个聚类,可视为独立于藏的另一语支。黄布凡认为羌语支保留古藏文已没有的小舌音和9个辅音韵尾及其他复辅音韵尾,保留古老面貌,独具特点。树图的结果支持把羌独立为一个语支的观点。
4、计量分类跟传统分类的比较
最重要的差别:
(1)、传统分类只重视语言差异的定性分类,而无法作语言间亲缘关系的距离的程度的量的分析。而计量分类可作亲缘关系程度的描述,并通过树枝长短来表示距离关系。
(2)、虽然使用的材料和方法不同,但分类的结果却大致一样。
(3)、可以显示语言的类簇和分级层次。
(4)、传统分类都没有细分出藏缅语族各语言的较小的聚类和关系程度,我们的树图显示,羌语支内部羌语跟普米的距离最近,其次是嘉戎;而彝缅语支内部哈尼与彝关系最近,其次是纳西,最远的是缅。
5、关于白语的系属问题
    白族是整个西南民族汉化最早、最深刻的一个民族。白语是否属于古汉语的一支?虽然白语中的汉语借词高达百分之60以上,包含了古今汉语各个时期的新、老借词,但是我们仍然认为白语属于藏缅语族语言。主要证据有:
 (1)、语言学内部证据,在106个核心同源词中,与羌语同源40个,与彝语同源34个,有些是与其他藏缅语族语言交叉同源,有些单读同汉字,但与藏缅语族同源部分,保留在合成词的语素中;如此统计则数量更多。有些同源词虽然可以追溯到与上古汉语同源,但同源词音韵变化形式与其他藏缅语族语言相同或相似,走的是同一条音变路子。例如:“太阳、地、树、根、叶子、狗、鱼、虱、鸟、尾巴、羽毛、犄角、脖子、头、眼睛、鼻子、耳朵、嘴、脚、牙齿、乳房、胸、腹、舌头、肉、血、心脏、皮、名字、人、男人、妇女、说、吃、知道、死、杀、燃烧、给、飞、来、站、大、小、冷、满、新、好、干、白、黄、绿、你、我、我们、那 (近)、那(远)、胖、肥、什么、一、二、没有”。
   统计结果表明白语在106词中有超过45个词与藏缅语族语言同源。据此,白语与藏缅语族语言是发生学关系。
    如果将白语与汉语一对一的单独进行比较,很可能会认为白语中许多词是古汉语借词,但经过多语言的全面比较后,则会有新的看法。例如“新”貌似借词,实际上来源于古汉藏语。
(2)、人文科学证据,即语言学外部证据
     据多学科研究,云南的汉文化直到明代才占统治地位,成为“主流文化”,明代之前汉文化为“非主流文化”,即明之前以“土著文化”的“地方化”为主,明之后以“主流文化”的“汉化”为主,所以云南的少数民族包括白族操明清时形成的西南官话,而不同于闽、粤、客方言保留唐、宋时代的中原汉语音韵。白族自称“民家”,其认同形成于明代,明政府将云南居民划分为官户、民家、夷,其中官户、民家系汉族,民家为一般汉人,夷则为云南少数民族,虽然汉族仍称白族为“夷”,但白族精英坚持自称为“民家”,以示认同汉文化,以别于云南其他少数民族。白族汉化过程很早,白族政权南诏国与唐王朝关系极密切,但据日本发现的宋元写本《南诏图传》看,白族文化与汉文化仍有较大差异。元代白族模仿汉字创造白文。宋元时,白族地主经济以及科举文化水平已与汉族地主无异。
    白族是自新石器时代生活在甘、青地区的氐羌的后裔,春秋、秦汉称“滇”,三国时称“叟人”,南北朝时称“人”,唐代“白蛮”,宋元“白人”,明清“民家”。自称“爨子”,“白子”,“白尼”,“白伙”等。唐宋以前仍实行“石棺葬”和“火葬”,文化类型同彝缅民族,而异于汉族。