我们通常所讲的“语言文字”这个词汇其实是由两个彼此联系而又不完全相同的概念共同构成的:所谓语言就是我们平时所说的话,文字则是一种用于书面记录的工具。事实上语言的历史远比文字悠久:自300多万年前人类诞生之日起只要不是聋哑人都会开口说话,然而文字的发明不过就是最近几千年的事。事实上迄今为止世界上仍有相当一部分民族只有口头语言而没书面文字。
我国的56个民族几乎都有本民族的语言,然而拥有文字的民族只有31个。美国的一些印第安部落、澳大利亚土著居民以及亚马逊丛林和非洲的一些原始部落都没自己的文字。非洲与东南亚等很多地方的语言受殖民历史影响都是用拉丁字母拼写的。目前的波斯语、乌尔都语等诸多语言都采用阿拉伯字母进行拼写。全世界现存仍在使用的文字大约有2500-3500种。
相比之下全世界现已查明的语言一共有5651种,此外还有一部分不被视为独立语言的方言。19世纪比较学派研究了世界上近一百种语言,结果发现有些语言的某些语音、词汇、语法规则之间有对应关系,于是他们便把这些语言归为同一语族。有的语族与其他语族之间又有些对应关系,于是又归在一起称为同系语言。各种语言之间的谱系关系由此形成。这实际上是基于生物学概念假设若干语种是由特定祖语演化而来。
人类语言之间的具体谱系关系是如何划分的呢?首先按各种语言的亲属关系分为若干语系,每一语系之下又分为若干语族,每一语族之下分为若干语支,语支之下是语种,语种之下是方言。这种划分模式就类似于生物学中的界、门、纲、目、科、属、种。目前全世界5651种语言主要属于汉藏语系、印欧语系、阿尔泰语系、闪-含语系、乌拉尔语系、高加索语系、南岛语系、南亚语系、达罗毗荼语系这九大语系。
我国56个民族各自的语言分别属于汉藏语系、阿尔泰语系、南岛语系、南亚语系和印欧语系。作为我国官方语言的汉语属于汉藏语系。汉藏语系是以汉语和藏语为代表的一个有亲属关系的语言群,分为汉语族、藏缅语族、壮侗语族、苗瑶语族四个语族。我国的汉语、藏语、苗语、壮语、土家语、瑶语均属于这一语系,我国南方的缅甸、泰国等中南半岛国家的语言也多属于汉藏语系。
汉、藏两族的祖先都是发源于如今黄河上游的青海河湟谷地一带的古羌人,后来古羌人中有一支迁徙到了今天陕西、甘肃一带的黄土高原——这就是轩辕黄帝部族。汉、藏两族由此开始了不同的历史演化进程。距今大约4600年前黄帝部落联合炎帝部落与蚩尤部落在涿鹿激战。正是这一战塑造了以炎黄部族为核心融合羌、夷、苗、黎等氏族部落集团的华夏民族。
事实上被炎黄部族征服的蚩尤部族中就有相当一部分人融入到日后的汉民族中。除此之外也有虞舜出自东夷、夏禹出自羌戎等说法。这些彼此矛盾的传说恰恰证明汉族远古先民很可能来源于不同的氏族部落集团。从公元前21世纪起中原地区先后出现了夏、商、周三个王朝:夏王朝是大禹之后;商王朝的祖先出自东夷;周王朝自称其先民为夏人的一支,杂居于戎、狄之间,与羌人关系密切。
在夏、商、周三个上古王朝时代生活在青藏高原的民族称为孟族。春秋战国时期发羌、迷唐等一些羌族部落逐渐迁徙到如今的西藏地区并逐渐和当地土著融合,从而繁衍发展形成了大大小小的各个部落。直到公元7世纪松赞干布的吐蕃部统一青藏高原后这些分散的部族开始逐渐演化成为如今的藏民族。《新唐书》曾援引《后汉书》以来诸史籍认为吐蕃本西羌属。
目前史学界的主流观点认为吐蕃人的祖先应当是西迁的古羌人。汉人作为东迁的古羌人后裔与西迁的古羌人后裔藏人同宗同源。甲骨文时代的一些汉字在后世滋生出大量的同根词族,而它们的语音和语义在汉语和藏语中均非常接近(至少在上古时代是这样)。汉藏同源词举不胜举:许多汉语谐声的、藏语也谐声;汉语有形态变化的、藏语也有形态变化。
汉族和藏族尽管同宗同源,但毕竟经历了数千年各自发展的历史。汉语与藏语尽管有着共同的源头,然而在数千年的发展过程中实际上已成为两种不同的语言。汉语与藏语之间的亲缘关系决定了这两种语言同属汉藏语系,不过彼此之间的区别使这两种语言分别属于汉藏语系中的不同语族:汉语属于汉藏语系汉语族;藏语属于汉藏语系藏缅语族。与藏语同属藏缅语族的还有缅甸语、景颇语、纳西语、彝语等语言。
汉藏语系中除了汉语族和藏缅语族之外还有苗瑶、壮侗两大语族:属于苗瑶语族的有苗、布努、勉、畲等语言;属于壮侗语族的有壮、布依、傣、侗、水、仫佬、毛南、拉珈、黎、仡佬等语言。汉藏语系是我国乃至全世界最大的语系:光是使用这一语系中的汉语的人口在全世界范围内就有15亿左右。在我国不仅使用汉藏语系语言的人口是最多的,同时使用汉藏语系的民族数量也是最多的。
我国56个民族中有32个民族的语言属于汉藏语系(占我国民族总数的57.1%)。阿尔泰语系是我国仅次于汉藏语系的第二大语系。阿尔泰语系之下分为蒙古、突厥、满-通古斯三个语族:蒙古、达斡尔、东乡、土、保安等民族的语言属于蒙古语族;维吾尔、哈萨克、柯尔克孜、乌孜别克、塔塔尔、撒拉等民族的语言属于突厥语族;满、锡伯、赫哲、鄂温克、鄂伦春等民族的语言属于满-通古斯语族。
我国56个民族中有17个民族的语言属于阿尔泰语系(占我国民族总数的30.4%)。我国云南省的佤语、布朗语、崩龙语属于南亚语系。我国俄罗斯族和塔吉克族的语言分别属于印欧语系中的斯拉夫语族和伊朗语族。在我国只有台湾高山族的语言属于南岛语系。此外我国56个民族中朝鲜族和京族的语言系属尚未确定。当然同一语系之中也可能存在多种不同的语言。
汉藏语系之中就存在汉语、藏语、壮语、苗语、土家语、景颇语、纳西语、彝语、泰语、缅甸语……使用汉藏语系内不同语言的人在不懂对方语言的前提下是不能实现自由交流的。有时甚至两个同样使用汉语的人由于各自的方言口音不同都会造成交流障碍。众所周知我国是一个幅员辽阔、人口众多的大国,因此各地的语言口音或多或少存在一些差别也是正常的。
中国社科院编纂的《中国语言地图》把汉语方言分为官话区、粤语区、吴语区、客语区、闽语区、湘语区、赣语区、晋语区、徽语区、平话区十大方言区。如今大约73%的汉族人口使用的是官话方言。所谓官话方言是指古代以洛阳为中心的北方方言向各地扩散形成的:长江以北除山西外的汉族聚居区、长江下游镇江、南京北部及皖南部分沿江地带、除东南角以外的湖北大部、西南地区的汉族聚居区大多属于官话区。
官话区是汉语方言区中分布地域最广的。此外由于历史原因也形成了一些与主要官话区域相隔绝的官话方言岛:海南岛崖县、儋县的“军话”,福建南平城关的“土官话”,长乐洋屿的“京都话”等都属于这种例子。目前全国使用汉语官话方言人口在7亿以上,不过各地的官话方言并不完全相同,所以官话方言又可以具体细分为东北官话、北京官话、冀鲁官话、胶辽官话、中原官话、兰银官话、西南官话、江淮官话。
不仅汉语中存在方言,少数民族语言同样存在方言。藏语就分为卫藏、安多、康巴三大方言。苗语分为川黔滇、湘西、黔东三大方言。彝语分北部、东部、南部、东南部、西部、中部六大方言。纳西语分为以丽江坝区为代表的西部方言和宁蒗永宁为代表的东部方言。壮语大致以郁江和右江为分界线分为南、北两大方言区:北部壮语方言又可以具体细分为8个土语区;南部壮语方言又可以具体细分为5个土语区。