新疆自古以来是多民族的聚居地和世界印度、波斯、希腊、中国四大文明的荟萃地,作为各民族相互交融和经济、文化相互交流的工具,语言文字在此裂变衍生,得到充分的发展。历史上在新疆繁衍生息的古代民族(或部族)有30多个,先后在当地使用的语言有30多种,主要有匈奴语、犍陀罗语、于阗塞语、汉语、焉耆一龟兹语、突厥语、粟特语、回鹘语、中古波斯语、吐蕃语、蒙古语、满语等等。当地使用的文字亦有20多种,主要有汉文、佉卢文、焉耆——龟兹文、于阗文、突厥文、粟特文、叙利亚文、回鹘文、吐蕃文、摩尼文、波斯文、哈卡尼亚文、察合台文、契丹文、回鹘蒙古文、托忒文、八思巴文、满文等等。这些语言文字大多数使用范围较小,时间较短,流传不广,有的已经消亡,有的融合到其他语言文字中。影响比较大的是回鹘文和察合台文。前者是近现代胡都木蒙文、托忒文、满文、锡伯文的源泉,后者是现行维吾尔文、哈萨克文、柯尔克孜文的滥觞。而汉语言文字则是新疆有文字记载以来,唯一贯穿西域历史的语言文字。
大体说来,北疆和南疆历史发展各具形态,古代北疆主要生活着游牧民族,南疆主要居住绿洲农业民族。游牧民族号称“行国”,语言虽然发达,文字却不兴盛。如匈奴,作为公元前3世纪末至公元2世纪中叶统治西域的游牧民族,语言很丰富,《汉书·匈奴传》载匈奴语谓天为“撑犁”、子为“孤涂”、广大貌为“单于”,等等,却没有文字。又如(本字无法显示:“口+厌”)哒,公元4~6世纪活跃在北疆,并一度控制中亚和南疆,但“无文字,以木为契。与旁国通,则使旁国胡为胡书,羊皮为纸”①。再如柔然,公元5~6世纪曾经统治西域,亦“刻木记事,不识文书”②,只是后来与中原交往,在汉文化影响下,一定程度上使用过汉字③。南疆则不一样。南疆农业民族经济水平比较高,文化比较发达,语言文字也比较兴盛。中古后半期以后,民族构成不断变化,南北疆之间的这种差异逐渐消失。
1.曾经使用的语言文字
西域曾经使用过多种语言文字,随着历史的变迁,其中有些语言文字已经消亡。这些消亡的语言文字是:犍陀罗语佉卢文、吐火罗语焉耆—龟兹文、塞语于阗文、粟特语文、突厥语文、突厥语回鹘文、吐蕃语文、契丹语文、满语文等等。另外,哈卡尼亚文、察合台文、回鹘式蒙文、八思巴文、托忒文、以及梵文、摩尼文、叙利亚文、阿拉伯文也曾在西域使用并逐渐消亡,由于它们或是现行语文的前身,或是宗教圣语文字,我们将在下面的篇目里叙述,此处不赘。
犍陀罗语 佉卢文。 佉卢文是一种用阿拉美字母书写的拼音文字,表达的是印度西北部犍陀罗语。公元初,佉卢文成为贵霜王国(今巴基斯坦境内)的官方文字。2世纪后半叶,传入西域于阗,3世纪初传入鄯善(今若羌),成为当地的官方文字。鄯善等地东汉时行用汉语文,此时接受佉卢文和印度俗语,学者们推测可能是一批贵霜王国居民因战乱移民至此,他们人多,文化高,因而对当地的语文产生了重大影响。5世纪以后,佉卢文在西域消亡。
佉卢文作为“死文字”人们重新认识它,得益于19世纪下半叶之后陆续发现的出土材料。塔里木盆地周边的疏勒、和田、库车、尼雅、米兰、楼兰以及河西走廊敦煌等地都曾发现佉卢文。这些佉卢文书写在木牍、木简、皮革、绢帛、纸张、桦树皮、钱币之上,总数达千余件多,主要属于于阗、鄯善两个王国。于阗的考古资料主要有汉佉二体钱币(312枚)、S.661号文书和《法句经》抄本残页。鄯善的考古资料主要为国王敕谕、公私信札、各种契券和簿籍帐历,世俗文书之外也有佛教文书。佉卢文字母数量各个时期不同,从22到57个不等。从右向左横写,词间无间隔,亦无标点符号。于阗、鄯善两地佉卢文字体略有不同,语言分别掺杂了一些当地方言成分。
——————————
①《梁书·滑国传》
②《南齐书·芮芮传》。
③《魏书·柔然传》载,柔然可汗予成在位第二年即公元466年曾仿汉制,立永康年号。吐鲁番出土《高昌永康十七年(482)残文书》中的“永康”,就是高昌所奉柔然年号(载《吐鲁番出土文书》第2册,北京,文物出版社,1981年,第4~5页)。
于阗、鄯善都有佉卢文、汉文双体并存的考古文献。如于阗流通的汉佉二体钱,正面用汉文篆字标志币植,背面用佉卢文标明国王的尊号和名字,是于阗王国双语并存的典型;鄯善楼兰出土的东汉锦,上有汉字“延年益寿大宜子孙”,边幅有佉卢文“频婆·室利可陀之锦(价值)百万”,是鄯善王国双语并存的证明。
于阗语文。于阗语是和田地区古代民族使用的语言,属于印欧语系东伊朗语族的一种方言。由于操这种语言的民族是塞种人,又称于阗塞语,简称于阗语。于阗语文字是印度婆罗迷字母的一种中亚变体。于阗文晚于汉文和佉卢文,约通行于5~10世纪(或说4世纪已出现)。公元1006年喀喇汗朝灭于阗王国,伊斯兰教取代佛教,回鹘语亦逐渐取代于阗语,于阗语文字成为“死文字”。《大唐西域记》卷12记载:“瞿萨旦那国(于阗)……文字宪章,聿遵印度,微记体势,粗有沿革,语异诸国。”19世纪末20世纪初,新疆和田、巴楚、图木舒克、木头沟及甘肃敦煌等地发现于阗语文献,于阗文得以重现天日。经过几代人的努力,于阗语文献大部分已能通读转写,但仍有部分世俗文书和文学作品未能圆满解释。早期于阗语字体规范,语法严谨,晚期于阗语字体潦草,有些合体字很难辨识。
现存于阗语文献以佛教文献居多,特别是大乘佛经最为丰富,如《僧伽吒经》、《维摩诘经》等等。于阗曾是大乘佛经翻译盛地,中原历代皆有来此求法取经者。唐宋时于阗已不局限于翻经译典,而是开始解说,敦煌曾发现这类于阗作品,如《佛本生赞》就是缩写加工而成的。于阗语世俗文献出土亦多。和田地区曾出土百余件唐代于阗语世俗文书,内容包括诏令、帐簿、契约、书信等等。敦煌莫高窟藏经洞发现120余件于阗语文献,大多数也是世俗文书。10世纪沙州归义军曹氏与于阗王室世代通婚,关系密切,于阗使者、僧侣出使沙州、中原、西夏、河西甘州回鹘汗国,在敦煌留下了大量书信、愿文、公私帐簿、地理文书、医药文献、文学作品、双语词表、习字、字母表和给于阗王府的报告副本。
于阗地区受汉文化影响颇深,继汉代以后,唐在于阗设毗沙都督府;唐退出西域后,于阗与沙州保持姻亲关系,汉文始终通行这个地区。与佉卢文与汉文并用相同,于阗文始终与汉文并用,后期还与吐蕃文并行。出土文书中,于阗文、汉文、吐蕃文并存已能说明问题,出土文献中还有汉文、于阗文对应书写的双语文书。如策勒县达玛沟遗址所出7件公元755~790年间的“六城”百姓激纳丝绸帐簿和军事戌防文书,就是用汉文、于阗文对应书写的。不少于阗语文献还夹用汉文,如《于阗王致曹元忠书》中,于阗王尉迟输罗向其舅沙州大王曹元忠报告970年(天尊四年)于阗对喀喇汗王朝的宗教战争获得胜利,信函末尾大书汉文“敕”字(珲有两个相应的于阗词Parau——敕),信尾和纸缝共钤九方汉文“书诏新铸之印”。有些于阗语明显译自汉语,如此“si”音结尾的于阗佛寺名称就译自汉语的“寺”。于阗语文献还有长史、节度使、宰相、都督、判官夫人、大德、世尊等名称,也是采用汉语的官称和尊称。于阗语文献中的“同庆”、“天尊”、“天兴”、“中兴”“天寿”等年号,显然也是仿汉制的年号。
吐蕃语文。吐蕃文是书写吐蕃文献所用的藏文,又称古藏文,语言属汉藏语系。公元7世纪,吐蕃崛起于青藏高原,662年开始进入西域,与唐朝争夺西域统治权。8世纪末9世纪初,吐蕃占领西域。866年,由于本土内乱,退出西域。吐蕃在西域统治半个多世纪,对西域的语言文字产生了重要的影响,吐蕃语文一度成为塔里木盆地南部诸国的官方语文。
20世纪以来,若羌县米兰故城遗址、和田以北麻扎塔格古堡遗址出土了大是吐蕃文简牍、写卷,总数达700件,米兰吐蕃戌堡遗址还发现一块保留着吐蕃文卜辞的卜骨。敦煌也出土了《P至少8件与于阗有关的吐蕃文文献、1件与伊州(哈密)有关的吐蕃文文献。于阗是吐蕃统治西域的重要的重要据点。所世藏文《甘珠尔》、《丹珠尔》两大文献结集中 《净光明佛所说经》、《牛角山授记》、《僧伽伐弹那授记》、《于阗阿罗汉授记》、《于阗国授记》五部专讲于阗的著作,可见西藏与于阗关系密切。米兰是吐蕃统治西域的重要军事据点。敦煌曾被吐蕃占领,9~10世纪归义军又与于阗关系密切,因此,这三个地方出土吐蕃文非常正常。
新疆出土的吐蕃文文献基本上属于8~9世纪,内容涉及吐蕃统治西域的各个方面,如经济方面有土地、粮食、赋税、借货、物品等内容,军事方面有武器、斥堠、巡逻驿站等内容,政治方面有报告、指令、公私文牒等内容,社会生活文化方面有宗教、氏族、部落、地名、占卜等内容。敦煌所出文献都属于10世纪。虽然吐蕃9世纪后半期已退出西域和河西,但影响所致,吐蕃文一直行用到吐蕃结束统治后相当长一段时间。敦煌吐蕃文《沙州曹尚书致于阗书》,《于阗王至沙州令公书》、《于阗王致甘州长史书》等是于阗、沙州(敦煌)归义军、甘州(张掖)回鹘三个地方政权统治者之间往来的书信,《于阗教法史》是有关于阗佛教盛衰及沧桑变迁的历史文献。《伊州李曾政贝登致沙州李僧政书》则是伊州、沙州僧俗交换物资的文献。
吐蕃在西域实行与唐羁縻制类似的管理体制,在语言文字方面也允许吐蕃文、于阗文、汉文同行并用。吐蕃这个政策有利于发展西域的新文化,保护西域的传统文化。
焉耆—龟兹语文。20世纪初在新疆发现一种用中亚婆罗迷斜体字母书写的文字,这种文字记载了两种印欧语系语言。两种语言词汇和语法差异不大,但呈现了方言的不同,于是学者们根据它们出土地点的不同分别称在吐鲁番、焉耆发现者为焉耆语,在库车发现者为龟兹语。文字亦分别称作焉耆文和龟兹文。以前有学者称前者为吐火罗语A或甲,或称东吐火罗语;后者为吐火罗语B或乙,或称西吐火罗语。焉耆—龟兹语文大约行用于3~9世纪。
现存焉耆—龟兹文文献比较丰富,有诗歌,如《箴言诗集》、《摩尼赞美诗》;有演唱故事,如《六牙象本生故事》、《木匠与画师故事》;有字书,如古龟兹语—回鹘语、梵语—龟兹语对译字书;有公私帐册,如《商旅通行简》、政令残片、寺院出纳帐目;还有医术咒语。但焉耆—龟兹文文献现存最著名的是《弥勒会见记剧本》,共存88页,27幕,是国内发现最古老最长的一部剧本。现存最多的是佛典,有《法句经》、《佛所行赞》、《脱胎经》等等。然只有小乘佛典,没有大乘经典,从中可以看出西域当时佛教大小乘的分野。
焉耆—龟兹语文献中,焉耆语资料都是手抄本,龟兹语材料除此(占绝大多数)之外,尚有木简、壁画题记和石窟铭刻,数量较多。《大唐西域记》卷12载:屈支(龟兹)国“文字取则印度,粗有改变”,现存焉耆龟兹文表明情况属实。焉耆龟兹语文虽以印欧语系婆罗迷文为特征,但外来语甚多。据研究,其与印欧语系的伊朗语族、日耳曼语族、斯拉夫语族等都相同相似之处,与非印欧语系也有某种关系,这种关系主要表现在语言结构和借词两个方面。以汉语为例,汉语中有吐火罗语借词,反之亦然。《隋书·音乐志》讲七声:“一曰娑陀力,华言平声,即宫声也。”第一个字就是龟兹语(或通过龟兹语变来的印度字)。汉文“沙门”或“桑门”亦出自焉耆语。早期(东汉、三国)汉译佛典中的佛教术语,都并非直接译自梵文或巴利文,而是通过吐火罗语等古代中亚民族语言的媒介而来。吐火罗语借自汉语的例子亦颇多,如cane是汉语的“钱”,tau是汉语文的民族生活在西域,西域是古代世界文明的交汇之处,其语文与其他民族语言发生关系是必然现象。
粟特语文。粟特文是记录粟特语的文字,由阿拉美文发展演化而成,又称窣利文。粟特语言属印欧语系伊朗语族东伊朗语支,至少在公元前6世纪已盛行于中亚泽拉夫善河流域。粟特文约于公元13世纪蒙古人进入中亚后废弃。粟特是一个擅长经商的民族,曾在中亚国际商路上起着十分重要的中介作用,粟特语文因此成为中亚地区的通用语文,并对一些民族和国家的语文产生了重要的影响。
——————————
①季羡林:《敦煌吐鲁番吐火罗语研究导论》,台湾:新文丰出版公司,1993年,第254页。
突厥人曾用粟特语文作为官方的语言文字。回鹘汗国建立后,也以粟特语文为官方语文。后来,回鹘人在粟特文的基础上创制了回鹘文。回鹘文以后演变成回鹘式蒙文,回鹘式蒙文派生出满文,满文又成为锡伯文的原型,粟特文是这些文字的基础或源头,十分典型地反映出西域各民族文化相互融合的关系。
粟特文遗存在中外“丝绸之路”沿路都曾发现。如塔吉克斯坦穆格山遗址曾发现一批8世纪粟特文书,印度河上游丝绸古道旁的石崖上曾发现数百计的粟特文题记,蒙古布古特附近曾发现《木杆特勤纪功碑》等等。中国境内也发现大量粟特文献。敦煌汉长城烽燧遗址发现8封4世纪初粟特书信,是现存最古老的粟特文书,敦煌藏经洞还发现了不少粟特文佛经。
新疆发现的粟特文献最为丰富。天山伊犁特克斯河北岸西突厥汗陵前有粟特文碑铭石人。楼兰至和田古代遗址中有许多商业性粟特文书。吐鲁番出土有粟特文契约文书主其他世俗文书,还有佛教、景教、摩尼教等多种宗教的粟特文经典。新疆粟特文献年代跨度较大,既有840年回鹘汗国西迁之前的文献,又有西迁之后的文献,如吐鲁番所出“代人”木牌,背面为粟特文突厥语“人”字,大约是公元5世纪末的遗物,粟特文买婢契是公元639年麴氏高昌国的遗物;而吐鲁番所出粟特语地名录,记载9~10世纪粟特人在欧亚大陆自拂林(罗马)至薄骨律(宁夏灵武)的经商路线,则属于高昌回鹘汗国时期。吐鲁番所出摩尼教、景教等粟特文文献也都属于9~10世纪。粟特语文与西域的关系源远流长。
粟特文是一种没有标明元音的音节文字,有19个音节字母,用弱辅音字母兼表元音。在中国境内发现的粟特文献主要有三种字体:佛经体(标准体)、古叙利亚体(景教徒使用)、摩尼体(摩尼教徒使用)。粟特文写法一般自右至左横写,但也有受汉文的影响,改为从上至下竖写者。
突厥语文系。突厥一词有狭义与广义之分。狭义指公元6~8世纪在中国北方和西北建立突厥汗国的突厥族;广义包括突厥部落联合体的诸部落。突厥部落联合体曾一度十分强大,因此,操突厥语的部族众多。公元6~7世纪,西突厥统治西域,此地开始行用突厥语。8~9世纪,操突厥语的葛逻禄、回鹘两大游牧部族迁到塔里木盆地,并转入定居农业生活,以回鹘语、葛逻禄语为核心的突厥语逐渐成为当地的通用语言,而原来居民的印欧语言则逐渐消亡,仅保留了一些语音、词语、语法融合到突厥语之中。至迟11世纪末,突厥语已基本普及到南北疆各地。
突厥文是一种拼音文字。根据突厥铊钵可汗记功碑用粟特文记事可以推知,6世纪80年代,粟特文仍为突厥的官方文字。《北齐书·斛律羌举传》所谓“后主命世清作突厥语翻涅槃经,以遗突厥可汗”发生在公元574~576年间,当指突厥语而非突厥文。《周书·突厥传》所谓“其书字类胡”可能指稍后之事。突厥文大约行用于7世纪末至10世纪间。突厥汗国、回纥汗国、高昌回鹘汗国以及语言与突厥语相近的黠戛斯都曾使用过这种文字。如漠北回纥汗国时期,回纥人曾用突厥文刻写石碑。回纥人受外来影响,所使用的突厥语中的借词不断增加。这些借词的来源有汉语、吐火罗语、希腊语、梵文、藏语、粟特语和伊朗语等。其中最多的是汉语借词,例如大部分丝织品和一部分官职的名称:锦缎、都督、将军、都统等。其他还有面团、墨、茶、包子、罪、龙、蜡、升、法师、密、万等各类词语。还有来自粟特语的大麦、黏液;来自希腊语和焚文的经典、鳄鱼、官爵等。突厥语本身还继承了匈奴、柔然和其他一些草原民族的词汇,如可汗、可敦、天等①
突厥文失传甚久,19~20世纪重新发现后,学者们曾根据其外形颇似古代日耳曼民族所用卢尼文而称之为突厥卢尼文,又根据其重要碑铭发现地鄂尔浑河、叶尼塞河流域而称之为鄂尔浑一叶尼塞文。
突厥文各个时期各个地区使用的字母数目和形体不全相同,一般有38~40个字母,其中23个源于阿拉美文,其余来自氏族、部族标志和一些表意符号。突厥字母变体颇多,有些甚至有5~6种变体。其文通常从右向左书写,每个词(或词组)之间用两点隔开。
———————————
①克劳森:《早期突厥语的外来成分》,载《民族语言研究》,1981年第3期。
现存突厥文文献主要是一些碑铭墓志(大约有200多件),多发现于北蒙古高原、叶尼塞河流域、勒拿河—贝加尔湖地区、阿勒泰地区等地。重要者有《阙特勤碑》、《毗伽可汗碑》、《暾欲谷》、《翁金碑》等等。《阙特勤碑》、《毗伽可汗碑》用汉文、突厥文两种文字刻成,《阙特勤碑》并有明确的汉文纪文纪年——大唐开元二十二年(734年)。《回纥葛勒可汗碑》还用突厥文、汉文和粟特文三种文字刻写。现存突厥文文献也有写本,如敦煌曾发现完整的突厥文写本《占卜书》。
新疆发现的突厥文文献主要为米兰所出突厥文军事文书,吐鲁番地区鄯善县吐峪沟所出突厥文写本残卷,交河故城附近洞窟所存突厥文题记。新疆还有用其他文字拼写的突厥语文献,如伊犁、库车、吐鲁番等地所出土的突骑施汗国钱币,文字为粟特文,语言为突厥语。吐鲁番发现的“代人”汉文木牌,背面“人”字亦用粟特文突厥语写成。新疆还出有79件婆罗迷文突厥语文献,等等。
突厥文文献的发现不仅有助于我们了解突厥语言文字,而且也是我们研究突厥历史以及西域突厥化进程的重要依据。
回鹘语文。回鹘语属阿尔泰语系突厥语族东支,回鹘文是记录回鹘语的文字。公元744年,突厥部落联合体中的回纥部族取代突厥建立回纥汗国。回纥汗国建立之初,政治制度、文化、语言文字仍袭突厥传统之旧。788年(唐贞元四年)回纥上表唐朝,请改回鹘。840年(唐开成五年),回鹘汗国灭亡,回鹘人分三支西迁,其中重要的一支迁到西域别失八里(今吉木萨尔县境内),后越过天山占领吐鲁番、焉耆、库车等地,建立高昌回鹘王国。回鹘西迁前已开始使用回鹘文,高昌回鹘王国时期,回鹘文逐渐取代突厥文成为通行文字。14~15世纪,由于伊斯兰教的影响,阿拉伯字母拼写的察合台文逐渐取代回鹘文成为当地通行的文字。
回鹘文是一种音素文字,由18~22个字母组成(各个时期字母数不尽相同)。其文字来源于古代草体粟特文,因回鹘人广泛使用而名回鹘文。其与草体粟特文也有一些不同之处,主要表现在,不使用粟特文中的四个表意符号,在某些字母之上或之后加某些符号等方面。回鹘文通常使用一点或两点作为标点符号,有时用四点表示段落。早期从右到左横写,晚期从左往右竖写。其字体大致可分为写经本,楷书体、草书体和木版印刷体多种。
回鹘文对周围和后世的民族文字发生过重大影响。13~15世纪,回鹘文曾用作蒙古族建立的金帐汗国(又称钦察国)、帖木儿帝国、察合台汗国的官方文字。13世纪初,蒙古族采用回鹘文,创制成回鹘式蒙古文,后来变化成托忒蒙文和现在的胡都木蒙文。
回鹘文是维吾尔族历史上(采用阿拉伯字母文字之前)使用最广、保存文献较多的一种文字。其中回鹘佛教文献最多,大乘教文献尤甚,也有小乘教和密教文献。其他宗教如摩尼教、景教、伊斯兰教文献亦有留存,如《摩尼教徒忏悔决词》是摩尼教回鹘文文献,《福音书》、《圣乔治殉难记》是景教回鹘文文献,《圣徒传》、《升天记》、《心之烛》是早期伊斯兰教回鹘文文献。回鹘文还有其他作品留存,如文学作品有《福乐智慧》、《真理的入门》;医学作品有《细达撒拉》;社会生活文献有《善斌卖身契》、《黑汗王朝买卖土地文书》,等等。回鹘文文献很多是双语文献,如明代《高昌馆来文》是回鹘文、汉文合壁,《高昌土都木萨里修寺碑》、《亦都护高昌王世勋碑》、《大元肃州路也可达鲁花赤世袭之碑》、《重修文殊寺碑》、《乌兰浩木碑》等也都是回鹘文、汉文合壁。
契丹语文。契丹语属于阿尔泰语系蒙古语族,契丹文是记录契丹语言的文字。契丹文分契丹大字和小字。大字参照汉字而成,因不适合契丹语多音节词比较多和语法中有粘着词尾等特点,又参照汉字和契丹大字制成契丹小字。契丹小字为拼音文字。
公元1124年,契丹贵族耶律大石从辽国分裂出来,向西发展,建立西辽帝国,并统治西域。西辽王朝在西域主要使用汉语文和契丹语文。新疆伊犁发现了契丹文铜印,印文为契丹篆字,印背四周亦有契丹字,这是西辽官府行用契丹文的证据。西辽官府中,契丹人和汉人大约都会契丹文。耶律楚材在《湛然居士文集》卷8中称,受封为西辽郡王的汉人李世昌即会契丹文。13世纪初,蒙古灭西辽帝国,契丹文成为死文字。
2.现在使用的语言文字
新疆世居民族中,汉、回等民族使用汉语言文字,维吾尔、蒙古、哈萨克、柯尔克孜、锡伯和俄罗斯等民族有自己的语言文字,塔吉克、乌孜别克、塔塔尔、达斡尔等民族有自己的语言。其他迁入新疆的民族也有自己的语言。
汉语文。汉语文属汉藏语系汉语族,汉文是西域发现最早的文字。西域语言文字变化很大,各个时期都有不同的语文,但唯有汉语言文字几乎伴随西域历史的每个时期。
公元前2世纪,汉朝张骞出使西域,汉语言文字随之传到西域。前60年(神爵二年),汉朝在西域设立西域都护府,“汉之号令颁西域”,汉语言文字成为当地各国官方使用的语言文字。《汉书·西域传》所谓“最凡国五十。自译长、城长、君、监、吏、大禄、百长、……王侯、王,皆佩汉印绶”,是西域各国接受汉朝统治,置译长行用汉语文的正史记载,众多出土材料更从各个方面证实了汉语文的行用。如沙雅县于什格提故城出土“汉归义羌长印”,罗布泊北岸土垠遗址出土70余枚屯田汉简、尼雅东汉墓出土“延年益寿大宜子孙”汉字锦等等,都证实当地官府、军事据点、商业用品中汉文的使用。尼雅还出有一件汉简,大约为礼品木牌,上有“休乌宋耶谨以琅玕一致问(面)小大子九健持一(背)”及“且夫人”等汉字,则是汉语文深入到一般土著居民生活中的明证。
两汉以后,汉语文仍在西域通行。如高昌地区(今吐鲁番)汉族是当地的一个主要民族,汉语文始终是这里的主要语文。9世纪回鹘人统治此地之后,汉语文依然发挥着重要作用。这一时期篆刻的《高昌土都木萨里修寺碑》、《亦都护高昌王世勋碑》、《大元肃州路也可达鲁花赤世袭之碑》、《乌兰浩木碑》等等都是汉文—回鹘文合壁的碑铭,13或14世纪的《善斌卖身契》、柏孜克里克石窟第9号洞窟供养人题记等等,也都是汉文和回鹘文合壁的文献。
鄯善地区(今若羌),汉至魏晋时期一直为西域长史的驻节之地。境内的楼兰城汉语文为主要语文。这里出土了大量汉简,反映当地军政、经济、文化、刑法、社会生活各个方面的情况,这里还出土了著名的前凉西域长史李柏文书。鄯善其他地方也出土了许多汉简及“长乐光明”、“延年益寿”等汉字织物。1987年,这里还发现元代汉文文书,说明汉文在此地长期使用。
于阗地区(今和田),2世纪后半叶至4世纪行用犍陀罗语佉卢文,5~10世纪改行于阗塞语文,9世纪后半叶至10世纪流行吐蕃语文,但无论怎样转换变化,汉语文都一直通行使用。大量出土汉文书、汉佉二体钱、汉文一于阗文双语文书,及同时期的吐蕃文书充分说明了这一点。
龟兹地区(今库车),魏晋以来,涌现了一批佛经汉文翻译家,他们对汉文精深的理解和掌握,代表了当地汉语文的最高水平。龟兹石窟留下了许多唐代汉文题记主干支纪年,包括唐朝势力退出西域约百年后的丁未(光启三年,公元887年)纪年干支等等。库木吐拉石窟还有汉文、龟兹文、回鹘文三体题记,说明汉文一直沿用到回鹘人统治时代。
汉语文在西域的使用发展,与两汉以后统一国家或集权王朝的推广分不开。唐朝统一西域,有力地推动了汉语文的使用,不仅使之成为各级地方政府的官方语文,而且成为民间交流的工具。西辽虽然是契丹族建立的王朝,但是汉化程度极深,在西域大力推行汉文化,汉语文得到广泛传播。元朝时期,西域涌现了许多精通汉语文的著名学者,别失八里人全谱庵撒里“旁达诸国及汉语”,曲先(库车)人盛熙是著《法书考》,研究汉字书法及八思巴文和梵文,皆是其例。明朝与西域的联系相对少一些,但仍一度控制哈密,并颁给瓦剌部汉文之印。清朝统一西域后,汉语文不仅与满语文成为官方语文,而且在民间广泛运用。近现代以来,新疆各族人民无论有无本民族的语文,汉语文都是重要的通行语文。新中国成立以后,政府重视各民族语文的同时,大力提高汉语文教育,新疆汉语文得到长足的发展。
总之,汉语文自公元前2世纪传入新疆以来,历经2 000多年,虽然各个时期行用范围和程度不同,但一直沿用不废,是有文字记载以来,唯一与西域历史相始终的语言文字。
维吾尔语文。维吾尔语属阿尔泰语系突厥语族。维吾尔文是以阿拉伯文字母为基础的拼音文字。维吾尔文在长达八九百年的历史中,经历了哈卡尼亚文、察哈台文、维吾尔老文字、维吾尔新文字和现行维吾尔文几上发展阶段。
哈卡尼亚文阶段。公元9~13世纪初,南疆存在两个王朝,一个是以喀什噶尔为中心的喀喇汗朝,一个是以吐鲁番、库车为中心的高昌回鹘王朝。这两个王朝虽然都说基本相同的突厥语言,但由于宗教信仰不同,官方文字也不相同。高昌回鹘王国信奉佛教,使用回鹘文作为官方文字,并一直使用到明代(高昌、哈密等地)。喀喇汗朝公元10世纪下半叶皈依伊斯兰教,阿拉伯字母文字逐渐取代回鹘文成为官方文字。人们称喀喇汗朝所用阿拉伯字母文字为哈卡尼亚文。成书于11世纪的《突厥语大词典》和《福乐智慧》是哈卡尼亚文的代表作。
察合台文阶段。公元14~15世纪,伊斯兰教成为整个天山南部占统治地位的宗教,察合台文作为维吾尔族普遍使用的文字也应运而生。察合台文在哈卡尼亚文的基础上演变而成,共有32个字母,其中采用阿拉伯文字母28个(哈卡尼亚文采用24个),借用波斯文字母4个,字母又分单写、词首、词中、词末四种形式。察合台文以单词为单位,但字母互相连接,从右往左横写,一般不用标点符号。现存察合台文文献很多,14~19世纪的文献皆有,如14世纪有长篇散文《先知的故事》、15~16世纪有《四部抒情诗集》等等。
老、新维吾尔文阶段。察合台文与突厥语有不相适应的地方,如有些语音没有相应的字母,有些不同的字母表达相同的辅音,以及相同的字母表达不同的元音等等,因此,20世纪30年代,维吾尔族中开始进行文字改革,1954年经过进一步修订,公布了维吾尔文的正字法,形成了维吾尔老文字。20世纪50年代,新疆维吾尔自治区曾尝试以斯拉夫字母取代阿拉伯字母,未果。20世纪60年代,又以拉丁字母为基础制定了维吾尔新文字,逐步推广和取代维吾尔老文字。
现行维吾尔文阶段。1982年,自治区决定恢复使用维吾尔老文字。此后,又对老文字及正字法中存在的缺点进行修改,公布现行维吾尔文字母表,并规定从1984年起全面使用,这就是现行维吾尔文字。
蒙古语文。蒙古语属阿尔泰语系蒙古语族。蒙古民族使用过几种文字:回鹘式蒙古文、八思巴文、托忒蒙文和胡都木蒙文。
蒙古语与回鹘语关系密切,二者不但在类型上同属粘着语,而且有大量的共同成分,语音系统也相似,因此,适合回鹘语的字母也适合蒙古语。13世纪初,蒙古帝国以回鹘字母为基础创制了回鹘式蒙古文。回鹘式蒙古文是拼音文字,有表元音和表辅音的两类字母,并将回鹘文由14个字母增至31个。回鹘式蒙古文有两个发展阶段。第一个阶段为13~17世纪。这一阶段,字母的笔画结构、基本拼写规则和书写体式与回鹘文基本相似。17世纪进入第二个阶段。这一阶段,回鹘式蒙古文在不同的地区向着不同的方向发展。在蒙古草原和其他广大地区,传统回鹘式蒙文在字母笔画、拼写规则等方面发生变化,形成了区别于古代蒙古文的近代蒙古文。新疆蒙古族称之为胡都木蒙文。在西域,形成了适合西蒙古卫拉特方言特点的托忒蒙文。卫拉特部由于长期远离蒙古本部,语言文化形成了鲜明的地域特色,因此,1648年,著名高僧咱雅班第这根据卫拉特的语言特点,在回鹘式蒙古文基础上创制了托忒文,托忒文仅在新疆蒙古族中使用。
13世纪中期,蒙古帝国征服了众多民族国家,为了巩固统治,元世祖忽必烈登基后命国师八思巴创制一种可以“译写一切文字”(拼写境内各民族语言)的文字,1269年颁行,这就是八思巴文(初名“蒙古新字”,不久改名“蒙古字”,又称“国字”、“国书”等)。八思巴文是一种拼音文字,由41个字母组成,后陆续增加到57个。绝大多数字母仿照吐蕃文体式,少数字母采用梵文,亦有个别新造字母。其文行用了大约100年,元朝灭亡后成为“死文字”。
蒙古族早期使用的回鹘式蒙古文、八思巴文,以及西蒙古使用的托忒文在新疆都有遗存,如吐鲁番所出《亚历山大传奇》蒙文译本,是回鹘式蒙古文文献;吐鲁番所出《萨迦格言》是八思巴文文献,而托忒蒙文则是明清以来直至20世纪70年代新疆蒙古族主要使用的文字。1981年,为了统一我国蒙古族的文字,新疆维吾尔自治区蒙古语文工作会议决定,从1982年起,全区正式推广使用胡都木蒙文。胡都木蒙文是一种超方言的文字,对于有方言差异的蒙古语来说比较合适。
柯尔克孜语文。柯尔克孜族史称坚昆、黠戛斯、乞儿吉斯、布鲁特等。柯尔克孜语也称“吉尔吉斯语”,属于阿尔泰语系突厥语族。其语文吸收了许多蒙古语、维吾尔语、哈萨克语、汉语的借词,也吸收了阿拉伯语、波斯语、俄语和英语的部分词语。柯尔克孜语言的特点是牧业方面的词语比较丰富。柯尔克孜语有22个辅音、14个元音,有6种语音结构。柯尔克孜语的重要特征是保持严格的元音和谐律。
14世纪,柯尔克孜人开始使用察哈台文。由于察哈台文与柯尔克孜口语距离较大,因此使用不广泛。19世纪,经过柯尔克孜化的察哈台文记录了一些民间文学作品,如史诗《玛纳斯》等等。1912年(民国初年),吉尔吉斯学者在简化察合台文的基础上编写了《识字课本》,柯尔克孜人接受了它,并以此为基础,在30年代编写了《柯尔克孜识字课本》。这是中国柯尔克孜族第一次编写的本民族语言文字课本,其文字在学校、政府公文中广泛运用。1955年,克孜勒苏柯尔克孜自治州语文文字委员会编写了《柯尔克孜文正字法。》1989年,新疆出版了经过修改的《柯尔克孜正字法》,这是柯尔克孜文字史上规则最全面、最完整的正字法。
哈萨克语文。哈萨克语属阿尔泰语系突厥语系突厥语族西匈语支。哈萨克族先民曾使用图画文字和表意文字,其后又长期使用突厥、回鹘语言文字。以后又有采用察合台文拼写的克普恰克语言。15世纪末至16世纪初,哈萨克民族形成。开始以阿拉伯字母拼写哈萨克文字,表达哈萨克语言。1912年,哈萨克斯坦学者阿合买提·巴依吐尔逊提出以阿拉伯字母为基础的哈萨克文字新方案,新疆哈萨克族人民接受了新方案,并逐步完善,使用了近40年。此后曾进行过以斯拉夫字母为基础的新文字改革和以拉丁字母为基础的新文字改革。1982年,新疆维吾尔自治区人民政府决定恢复原文字,而将新文字作为音标保留。
锡伯语文。锡伯族原世居东北,清乾隆年间,部分锡伯族西迁新疆伊犁驻防,其后裔遂定居新疆。古代锡伯族先操鲜卑语,后学女真语言文字。在科尔沁蒙古管辖期间,大部分锡伯族人又学蒙语蒙文。17世纪末,锡伯族纳入满洲八旗,在保留自己口头语言的同时,开始全面学习满语满文。1764年(乾隆二十九年),西迁伊犁的锡伯族将满语满文及自己的口头语言带到新疆,经过200多年的历史变迁,其语文有了新的发展,增进了一部分词语,语音和语法也发生了变化,形成了新的特点。1947年,锡伯族语文工作者根据这些特点,在满文基础上加以改进,如废除了第六个元音字母和以此为音节的13个音节,增加了3个新的音节拼写形式等等,创立了锡伯族,并出版了《锡伯语文法》,创制、规范了一大批新词术语。
3.宗教圣语文字
世界五大宗教佛教、基督教、摩尼教、犹太教和伊斯兰教都在历史上相继传入中国。随着这些宗教传入新疆,带来了各自的宗教圣语:梵语、叙利亚语、婆罗钵语、希伯来语、阿拉伯语和相应的文字。这些语言文字除希伯来语文留存甚少外,其他均在新疆留下了痕迹。
梵语文。印度是佛教的发源地,梵语是印度贵族的语言(人造标准语)。4世纪末,印度笈多王朝重新统一印度,佛教上升为统治阶级的宗教,佛教徒纷纷摒弃俗语,采用梵语作为佛教圣语。这股梵语文化影响到塔里木盆地诸国。20世纪,新疆喀什佛寺遗址、巴楚托古孜沙来故城和图木舒克佛教遗址、和田的约特干和丹丹乌里克遗址、若羌且尔乞都克故城、米兰寺院遗址、库车苏巴什故城、克孜尔千佛洞、库木吐拉千佛洞和都勒都、阿护尔故城、吐鲁番高昌故城和柏孜克里克千佛洞发现了数千件梵文佛经,说明梵文作为宗教圣语文曾在西域各地一定范围内流传。
叙利亚语文。景教是基督教的异端分支,6世纪传入西域。叙利亚语文作为景教的圣语文字亦随之传入西域。20世纪,吐鲁番、阿力麻里故城(在今霍城县)、喀什、库车等地发现不少用叙利亚文写成的景教碑铭文献。其中有叙利亚文突厥语文献,叙利亚文回鹘语文、叙利亚粟特语文献,还有叙利亚语景教祈祷文。吐鲁番地区发现的叙利亚语景教祈祷文属于9世纪末文献、叙利亚文粟特语景教经典残片属于10世纪左右文献,伊犁、库车发现的叙利亚文文献属于元朝时期。叙利亚文在本土广泛使用于公元4~6世纪,7世纪受阿拉伯文的限制开始走向衰亡,其在西域行用时间似乎更长。
婆罗钵语、帕提亚语及摩尼文。摩尼教是波斯人摩尼公元3世纪中叶创立的宗教。婆罗钵语、帕提亚语是中古时期波斯语的南北方言(婆罗钵语或称巴列维语、中古波斯语)。漠北回鹘汗国和高昌回鹘汗国曾以摩尼教为国教。7~9世纪,随着摩尼教的传入,婆罗钵语、帕提亚语及摩尼文作为摩尼教的两大圣语和文字传入西域。吐鲁番古代遗址发现大批帕提亚语和中古波斯语书写的摩尼教文献,数量达数千件之多。一上地下摩尼教书库也在此发现,但因水泡文献无法复原。吐鲁番吐峪沟还出土过一张突厥文和摩尼文字母对照表残片,亦都护遗址也出土过一本摩尼文《忏悔词》残卷(共118行)。摩尼文只有一种写经体,字体工整,结构简单,清晰易读。其外形优美典雅,书写亦讲纸张质地和装饰美观。婆罗钵语、帕提亚语及摩尼文在新疆大量发现,说明波斯文明对此地有相当的影响。
阿拉伯语文。伊斯兰教产生于阿拉伯半岛。公元10世纪,伊斯兰教传入西域,并逐渐成为西域占统治地位的宗教。由于伊斯兰教认为《古兰经》是安拉用阿拉伯语颁降的“天启”经典,只能用阿拉伯语文诵读书写《古兰经》,因此,阿拉伯语文成为伊斯兰教统一用的语文,并传播到西域。和田地区曾发现4件阿拉伯文契约,其中一件阿拉伯文波斯语文书有回历501(公元1107年)纪年。和田出土的喀喇汗朝窖藏铜器,其中一方盘上装饰着精美的科菲体阿拉伯文图案。莎车地区也出土过3件公元1096~1114年间的阿拉伯文契约。巴楚托古孜沙来故城也发现过不少喀喇汗朝时期的阿拉伯文书。这些都是喀喇汗朝以伊斯兰教圣语阿拉伯文作为官方、民间文字的证明。阿拉伯语言文字对西域的影响巨大,以阿拉伯字母为基础的哈卡尼亚文、察合台文是现行维吾尔文的前身。
4.新疆语言文字的特点
新疆语言文字以8~9世纪葛逻禄、回鹘两个部族入居为界限,可以分为两大时期。前期是印欧语、婆罗迷文字及汉语文占主导地位时期;后期是阿尔泰突厥语、阿拉美字母和阿拉伯字母文字占主导地位时期。前期按地域可以划为两个部分:塔里木盆地北部(包括东部),主要是印欧语系吐火罗语和婆罗迷文斜体文字焉耆—龟兹文及汉语文流行;塔里木盆地南部,其先(约2~4世纪)主要是印欧语系犍陀罗语佉卢文及汉语文流行,其后(约5~10世纪)主要是印欧语系塞语和婆罗迷文的直体文字于阗塞语文及汉语文流行。后期按时间可以分作两个阶段:第一阶段,公元9~14世纪。此时虽然都是操突厥语的回鹘族为统治阶级,但由于宗教不同,政权对立,语言文字亦不统一。东北部高昌回鹘王国奉行佛教,以突厥语回鹘文为官方语言文字,西南部喀喇汗王国奉行伊斯兰教,以突厥语阿拉伯字母为基础的哈卡尼亚文为官方语言文字。第二阶段为15世纪至今。此时伊斯兰教成为整个天山南部占统治地位的宗教,前一时期两种书面语并存的局面让位于统一的书面语——察合台语。其后,察合台语又历经老、新维吾尔语文的变化,最终形成现行维吾尔语文。在这2 000多年发展过程中,新疆作为世界四大文明的荟萃之地,其他语言文字也在此流传行用。粟特语文作为最古老的国际通商语文,公元以后在此行用,并影响了突厥文、回鹘文,甚至蒙文、藏文、满文的形成和使用。突厥文作为操突厥语民族的原始语文亦曾一度通行无阻。此外,吐蕃古藏文、西辽契丹文、蒙古三种文字(回鹘式蒙文、八思巴文、托忒文)、清朝满文都在一定的时间和范围内通用。四大宗教圣语文字梵文、摩尼文、叙利亚文、阿拉伯文也在此留下了痕迹。近现代,由于民族迁徒、文化发展,新疆则主要流行多种语言和汉文、维吾尔文、蒙古文、哈萨克文、柯尔克孜文、锡伯文和俄罗斯文七种文字。上述所有这些语言文字都或前或后或同时存在一个时期,唯有汉文在此最早出现,并一直使用到今天。
新疆语言文字的最大特点是丰富多彩,它体现在以下几个方面:
其一,各种方言文字数量多。新疆历史上使用过30多种语言、20多种文字,其数量是任何其他地区所远远不能比拟的。
其二,语言系统多。世界上四大语言系统阿尔泰语系、印欧语系、汉藏语系、闪含语系在新疆都有代表。突厥语、回鹘语、维吾尔语、蒙古语、满语等属于阿尔泰语系,并分属于阿尔泰语系之下的三个语系,即突厥语族(突厥语、回鹘语、维吾尔语等)、蒙古语族(蒙古语)和满—通古斯语族(满语)。犍陀罗语、吐火罗语、于阗塞语、粟特语等属于印欧语系,并分属于印欧语系之下的印度语族(犍陀罗语、吐火罗语)和伊朗语族(于阗塞语、粟特语)。汉语、吐蕃语属于汉藏语系,并分属于汉藏语系之下的汉语族(汉语)和藏缅语族(吐蕃语)。阿拉伯语、叙利亚语属于闪含语系,并同属于此语系之下的闪语族。
其三,文字来源多。新疆各种文字大约有五种来源:焉耆—龟兹文、于阗文、吐蕃文、八思巴文来源于印度婆罗迷文,佉卢文、粟特文、突厥文来源于波斯阿拉美字母(回鹘文、回鹘式蒙古文、托忒文、满文、锡伯文受粟特文影响已如前述),哈卡尼亚文、察合台文、维吾尔文、哈萨克文、柯尔克孜文来源于阿拉伯字母,契丹字来源于汉字,俄罗斯字来源于斯拉夫文。
新疆语言文字充分体现了世界文化交融荟萃的特点,也充分体现了该地接受外来文化的能力和包容性。
新疆语言文字还有一个特点,就是其发展变化与政治、经济、文化紧密相关。宗教文化对新疆语言文字的影响最大。梵文、摩尼文、叙利亚文、阿拉伯文作为四大宗教的圣语文字传入西域是这种影响的一种表现形式,伴随伊斯兰教传入的阿拉伯字母最终取代了婆罗迷文主导的格局,则是这种影响的更深刻的表现形式。经济影响为其次。粟特语文的传入,是经济影响西域语言文字的一个典型。粟特语文的传入,不仅增加了一个语种文种的数量,而且影响了一整串文字链条诞生,其作用无论如何也不能低估。汉文、摩尼文的传播也或多或少与经济的需求直接相关。政治的影响则每个时期都存在。汉语文、古藏文、契丹文、蒙古文、满文作为各个时期统治王朝的语文加入了西域语文的洪流,它们并且在各种语言文字上或多或少打下了烙印。各个时期各种的文献上,汉文几乎都以双语或夹语的面貌出现,是这种影响的典型表现。