首发于 溟舟客语
【微语传记5】亚非语系概况——撒哈拉南北的闪与“含”

【微语传记5】亚非语系概况——撒哈拉南北的闪与“含”

本系列旨在关注全球的冷门微语种。感谢 @H Zhang 老师对本文提供的帮助。
考虑到本语系有广为流传但已 过时 的称呼“闪含语系”,有些读者可能只见过“闪含”而未见过“亚非”,故也放在标题中,下面便会说明过时原因。

从本篇起,【微语传记】系列将进入非洲,这个包含全球约30%语言(仅次于亚洲的32%)、同时又在语言学上默默无闻的大洲。说起非洲给人的印象,或许离不开战乱、贫穷、疾病等负面标签,可能对于很多学科来说研究非洲的意义远远比不上欧洲、北美、东亚等,然而在语言学上“语言无优劣”,从使用遍布全球的欧洲语言到只在一两个村庄中使用的非洲语言,都蕴藏着语言演化的潜在可能,语言的本体特征与社会发展水平等并不存在必然联系。那么,从亚非语系(Afroasiatic)这个非洲相对最知名的语系开始,我将收集整理一批可能是汉语互联网上第一次出现的资料。当然这意味着,本篇与本系列前面四篇的联系很少,若未看过也可放心阅读本篇。

基于2023年版 Ethnologue 的数据(以下人口数、语种数等若无说明均来源于此),亚非语系目前拥有6亿使用人口和377种语言,分别居于全球第4和第6,仅印欧语系、汉藏语系、尼日尔-刚果 语系三者在人口数和语种数上均多于亚非语系 [1] 。如果综合人口数和语种数,我会将“印欧、汉藏、尼-刚、南岛、亚非”列为五大语系,然而亚非语系在汉语互联网上的存在感大概也就比尼-刚 语系高一些,和南岛语系接近,而同印欧和汉藏语系相比则遥不可及。

事实上,亚非语系的存在感主要也仅依赖阿拉伯语和希伯来语两种 撒哈拉以北的闪语 撑起,通过下图可知,亚非语系在撒哈拉以南同样有着庞大的语种数量,然而包括很多有语学基础的人说起“亚非语系”时,不过也只是在谈论撒哈拉以北的那几个而已。这样的偏见并不新奇,也谈不上国内独家,本质上可以追溯到西方学界长期的 “闪-含”二元对立 ,以至于起下了“闪含语系”这样一个名字。接下来本文将会对亚非语系的方方面面作简要介绍,当然过于庞杂以至于很难都记住,但是希望留下一个最基本的印象——请改“闪含”为“亚非”。

以下主要参考自 The Afroasiatic Languages (由 Frajzyngier 等分章撰写)和 The Languages and Linguistics of Africa (由 Güldemann 等分章撰写),这是两本集合了大量前人研究成果的综述,想深入了解的读者请直接参考这两本书的引用部分,本文涉及其中每篇著作时就不提供引用了。

长文预警,本文有 1.9万字 ,收藏的同时也请麻烦点赞。

一. “闪含”还是“亚非”?

根据《圣经》记载,挪亚有闪(שֵׁם Šēm)、含(חָם Ḥām)、雅弗(יֶפֶת Yép̄eṯ)三个儿子,依次对应亚洲、非洲、欧洲人的祖先。其中含对挪亚犯下罪过,于是含的儿子迦南遭到诅咒,成为了闪和雅弗的奴隶。(创世纪9:22-9:27)

在1781年,von Schlözer 首次提出“闪语”这一概念,用于统称当时已确定有亲属关系的希伯来语、阿拉伯语、阿拉姆语(אָרָמָיָא ʾārāmāyā(ʾ) ,Aramaic)、阿姆哈拉语(አማርኛ Amarəñña ,Amharic)、格厄兹语(ግዕዝ, Gəʿəz )等。在这之后,1876年 Müller 基于已有的“闪语”称呼,将位于非洲且同样确认有亲属关系的柏柏尔语和埃及语统称为“ 含语 ”,由此有了语系整体的称呼“闪含语系”,基于内部“闪”与“含”的二元对立。

在“含”(通用汉译名“含米特”是带形容词 -ite 后缀的 Hamite)的概念提出之际,也适逢欧洲开始全方位瓜分非洲。殖民者提出了“ 含米特假说 ”,认为非洲的一切文明成果都由来自白人移民与黑人混血的“含米特人”创造,而非洲本土则愚昧落后“有待开化”,从而为殖民事业的正义性背书 [2] 。而在语学方面,由于在瓜分非洲之前西方对于非洲的认识主要仅停留在沿海地区,实际有一定研究的只有三块:①东方学传统研究所涵盖的北非闪语、②奴隶贸易重点的西非“苏丹语” [3] 、③开普殖民地(今南非西部)的科依桑诸语和班图语,而除此之外有大量 非洲内陆 的语言都被塞进了“含语”这样一个泛泛的统称里,并不清楚内部的关系具体如何(比如在 Meinhof (1912) 里甚至囊括了西非的富拉语/Fula、东非的马赛语/Maasai、南非的科依科依语/Khoekhoe 等)。事实上直至20世纪中期,多数涉及非洲语言的研究不过是在 西方本土 远程展开,加之西方社会对于非洲的歧视与偏见根深蒂固,在历史语学方面也不可避免地受这些因素的影响,未能将当时已相当 成熟 印欧语系 研究成果延伸到非洲语言上 [4]

在20世纪前期的这团迷雾中,首先1924年由 Marcel Cohen 开始反对“闪含语系”的二分法,他发现柏柏尔语族 [5] 、埃及语族和新增的 库施语族 (位于非洲之角到东非)之间差异巨大,且无法找到 统一的、可以和闪语分开的特征 ,理应把这三者和闪语族视作 平级 概念,而非先有一个和闪语族平级的“含语族”、再分出这三者。另外,事实上1914年时 Delafosse 已经有了“亚非”(Afro-Asiatique,有连字符)这一新称呼,但未被 Cohen 采纳,直到 格林伯格 (Greenberg)的出现。

当绝大多数西方语学家还在本土远程研究非洲语言时,格林伯格作为非洲语言 田野调查 的先驱,对西非的 豪萨语 做了详尽的记录,并识别出了包括豪萨语在内的 乍得语族 (现在认为有200多种语言)同样和上述几个语族有同源语素,由此“闪含语系”补上了目前最后一个确凿的语族。 [6] 同期,1963年格林伯格划时代性地提出了非洲的“ 四大语系 ”,正式运用“亚非语系”取代“闪含语系”,与“尼罗-撒哈拉语系、尼日尔-科尔多凡语系、科依桑语系”三者并列 [7] 。至于后三者的问题,在本系列后续文章中会详细说明。诚然,格林伯格突破性地在“含语”中 拆分 出了亚非语系、“尼罗-撒哈拉语系”和“科依桑语系”,并提出 语言分类一定要基于语学本身 而非人类学、社会学等等杂七杂八的指标,让心存偏见的西方学者真正平等地对待非洲语言;然而,也因为四分法的知名度过高,以至于许多从事语言之外的非洲研究的学者会将其视作金科玉律,忽略了其提出已有60年、 许多想法早已过时 的事实。

不过……亚非语系的分类问题解决了吗?上述提到的五个语族都没有什么争议,只是,埃塞俄比亚西南的 奥莫诸语 仍是亚非语系研究之上的一朵乌云。

二. 亚非语系的起源与分布

开头必须说明的是,亚非语系的研究比起印欧语系而言 严重不足 (详见下面 @H Zhang 老师的回答),尽管在现阶段可以有从原始印欧语向现代各印欧语的逐步推导和完善的跨语族比较,然而在亚非语系里,连 跨语族 研究都很不现实(甚至库施语族和乍得语族连语族整体层面都达不到),讨论 原始亚非语 的行为大多数可以认为是 无稽之谈 ,本文仅介绍 Diakonoff 对于亚非语系发源地和各语族分离时间的猜想,不介绍具体的原始亚非语构拟。

根据 Diakonoff (1975, 1988),亚非语系发源于提贝斯提高原(Tibesti,乍得最北端)到苏丹达尔富尔之间,①埃及语族在前8千纪率先分离;②原始乍得语分离,并与撒哈拉以南的其它一些语系融合(留下许多底层痕迹);③奥莫语向东南方向移动;④前7千纪时库施语向东分离;⑤前6~5千纪时原始闪语与原始柏柏尔语分离,闪语顺着尼罗河谷和西奈半岛进入亚洲(因为前4千纪时闪语就已分化出很多支,推测分离时间早于此)。

且不论 Diakonoff 理论中分离时间的可信度如何,总之“ 亚非语系源自非洲 ”这一结论还是有着较高的接受度。不过,还记得上一章里提到的“含米特假说”认为非洲文明均来自白人移民的混血吗?这就和现在普遍认可的理论恰恰相反,亚非语系并非从西亚传入非洲,而是反之从撒哈拉沙漠中走出,跨越沙漠南北。

然而事实上,直到现在仍然有不少大百科的语系介绍里,会把亚非语系(甚至包括其撒哈拉以南的部分)有意 剥离出非洲 ,和亚欧大陆的语系放在一起讲解,本质上仍然是一种重视西亚闪语(尤其是阿拉伯语)而轻视其它所有非洲的亚非语的偏见。所以,Güldemann 创新性地提出了“ 阿非拉比亚 ”(Afrabia,Afro+Arabia)的概念,不是把亚非语系从非洲抽离,而是反过来 把说闪语、且后续从非洲扩张出的阿拉伯半岛合并成一个更大的概念 ,这也就是他对非洲基于语言接触的六大分区中的VI“亚非扩张区”。

需要指出的是,Güldemann 这里给出的是基于类型学而非语言谱系的分区,所以VI“亚非扩张区”其实只包含了亚非语系的闪语族(不含埃塞闪语支)、埃及语族、柏柏尔语族三者,而V“乍得-埃塞俄比亚”则囊括了埃塞闪语、库施语族、奥莫诸语,至于乍得语族则主要挤在狭长的IVa“中间过渡层(萨赫勒)”里。——这里又遇到了一个大语系里老生常谈的问题, 语言谱系和类型学是两个概念 ,语言谱系衡量的是分离时间长短,但是早早分家的一片语言和晚近才分家的另一片语言尽管在谱系上差异很远,却可能因为 后续接触 而又发生了一些类型学上的趋同,就好比鲸鱼虽然在后续演化中向鱼类靠拢,但论亲属关系则和河马更近。在亚非语系这里,相对较早分离的埃及语族和晚近分离的闪语族、柏柏尔语族产生了相似性;而在非洲之角, 埃塞闪语 从阿拉伯半岛跨过红海登陆了埃塞高原,由此和当地库施语族广泛接触并趋同,由此便脱离闪语族主体的VI“亚非扩展区”,成为V“乍得-埃塞”中作为核心的埃塞语言联盟(Sprachbund)成员。

三. 闪语族

(前言:因为要介绍多达六类语言,闪语族部分我会刻意 缩短篇幅 ,仅提纲挈领,下述许多语言的详细信息可搜索 @H Zhang 的回答)

得益于阿卡德语、希伯来语、阿拉姆语、格厄兹语、阿拉伯语等等历史悠久且数量丰富的文献记录,闪语族是亚非语系中 研究最完备 的语族。又由于阿拉伯扩张的影响,使得闪语族同样也拥有了亚非语系中目前 最广阔 的分布范围,在核心地带的阿拉伯半岛-埃塞高原以外,最东端延伸到塔吉克斯坦(方言岛),最西端抵达毛里塔尼亚的大西洋沿岸(哈桑尼亚语/Ḥassānīya),最南端顺着尼罗河来到最上游的肯尼亚(努比混合阿拉伯语/Nubi),另有一支向西南沿埃及-苏丹-达尔富尔-乍得东北-喀麦隆极北省-尼日利亚北部抵达萨赫勒地区(乍得-尼日利亚阿拉伯语),仅最北端是位于格鲁吉亚的博赫坦新阿拉姆语(Bohtan),但阿拉伯语也曾经于后倭马亚王朝时期扩张到了伊比利亚半岛。

当然了,既然是【微语传记】,那么作为超大语种的阿拉伯语的话题到此结束(尽管阿拉伯语下细分出的许多方言区仍旧是冷门话题,但也只能打住),接下来顺着闪语族往下拆分。

1. 东闪语群

如上图红点所示,目前仅发现阿卡德语和埃卜拉语(Eblaite)两种灭绝语言,而剩下的主体部分均为 西闪语群 。阿卡德语的语料起源于前3千纪中期的“古阿卡德语”,然后分成了北方的 亚述语 (靠近今摩苏尔)和南方的 巴比伦语 (从今巴格达到波斯湾),其中可细分为古(前2千纪前半)、中(前2千纪后半)、新(前1千纪)三期。著名的《汉谟拉比法典》使用 古巴比伦语 ,谈论“古典阿卡德语”时默认为此。直到波斯阿契美尼德帝国崛起并推广阿拉姆语时(并非古波斯语),两河地区仍在使用新巴比伦语和新亚述语,在前1千纪逐渐被阿拉姆语取代。

2. 西闪语群埃塞闪语、现代南阿拉比亚语

在西闪语群里,再分离出 埃塞闪语支 (黄)和 现代南阿拉比亚语支 (蓝),剩余的主体红色部分为 中闪语支

I. 埃塞闪语支

埃塞闪语支在公元前1千纪从阿拉伯半岛 跨过红海 来到埃塞高原(并非是由留在非洲的亚非语演化而成),之后不断 南移 并取代当地原本的库施语(尤其是阿高语群,见第六章)。其中格厄兹语是 阿克苏姆王国 的官方语,从350年确立埃塞正教(基督教分支)为官方宗教起,直至今日依旧作为宗教语,尽管格厄兹语从中世纪起便不再有母语者——这些都和380年罗马确立基督教的官方地位、拉丁语持续作为天主教宗教语的发展类似,然而并不像拉丁语的后代形成了罗曼语, 格厄兹语不存在学界公认的后代

其后,1270年 埃塞俄比亚帝国 建立,和格厄兹语关系较近但并非直系后代的 阿姆哈拉语 开始长期作为唯一的官方语,直至近些年埃塞境内其它语言的地位才开始提高。事实上在阿拉伯语以外,闪语的主要人口集中在埃塞高原,包括阿姆哈拉语(5700万)、提格里尼亚语(ትግርኛ Təgrəñña ,Tigrinya,近900万)、提格雷语(ትግረ Tigrä ,Tigré,80万)等,只是存在感很低。

II. 现代南阿拉比亚语支

注意命名基于“阿拉伯半岛”Arab ian 而非“阿拉伯语”Arabic。位于阿拉伯半岛南部和索科特拉群岛,存在感更低。它们长期被视作是阿拉伯语的方言,但事实上独立构成一支,在音系和形态上也较为 存古

3. 西闪语群中闪语支

至于为何说“现代南阿拉比亚语”,是因为还有 古代 的。对中闪语支继续拆分,出现古代南阿拉比亚语团(蓝)、西北闪语团(黄)和阿拉伯语(红)。在也门西部发现了一系列古代南阿拉比亚语的文字记录,它们同样不属于阿拉伯语,但属于中闪语支,和现代南阿是不同的语支 [8]

在西北闪语团里, 希伯来语 于前10世纪开始出现记录,目前主要的文本是《圣经》(“ 旧约 ”),作为口语使用一直维持到公元200年,之后便被阿拉姆语取代,只在书面上保留。直至 1880年代开始复兴 ,以伊比利亚 塞法迪 犹太人的诵读传统为主,出现了一种和圣经希伯来语差异较大的现代希伯来语,1920年代开始出现新的母语者。

同样从约前10世纪开始的是 腓尼基语 ,从今黎巴嫩一带向地中海沿岸各地拓展,其中位于今突尼斯的 布匿语 一直持续到了5世纪。

而从沙姆/黎凡特地区看到 新月沃地整体 阿拉姆语 自前9世纪起从今叙利亚北部开始扩张,逐渐取代了新月沃地各语言,前7世纪开始主宰此地,而前4世纪起随 希腊化时代 到来而逐渐衰弱,直到7世纪被阿拉伯语扩张取代。阿拉姆语发展出了至少6种书面语,其中记录最完好、文献数目最庞大的是 叙利亚语 (ܣܘܪܝܝܐ Sūryāyā ,Syriac),目前仍作为当地基督教分支的经典语。此外,时至今日,位于西亚各地仍零星分布着近20种“ 新阿拉姆语 ”,值得一提的是使用者有 亚述认同 ,但在语言上并非东闪语群亚述语的直系后代。

四. 埃及语族

和闪语族的记录历史相当的是埃及语族,作为口语使用的时间从 前3000年 持续到公元1300年,但一般只分出 古代 埃及语(ancient ~)和科普特语(Coptic)两种“语言”。尽管有证据表明埃及语曾一度延伸到努比亚(今埃及南部到苏丹中部)和沙姆/黎凡特南部的上层阶级中,并留下了一点语言接触的痕迹,但并未作为当地的实际通用语。

古代埃及语的各时间段、各文本类型对应的书面形式

1. 古代埃及语

第一阶段,早期埃及语(earlier ~),指从前3000-前1300的所有书面记录,又作为宗教文本 持续书写到公元3世纪 。此时有较为丰富的后缀,无定冠词,VSO语序。

  • 上古埃及语(old ~):古王国到第一中间期(前3000-前2000),主要为王室宗教文本。
  • 中(古)埃及语/古典埃及语:从中王国到第18王朝结束(前2000-前1300),此时圣书体的发展已较为完备,因此中埃及语也是古代埃及语里最重要的形式,如果要入门古典学中的 埃及学 并学习“古典埃及语”(classical ~),默认为中埃及语。
  • 传统埃及 :从新王国到古埃及文明结束,书写上复古并 与口语脱离 ,所以和晚期埃及语以 双言形式 (diglossia)共存了千年以上。传统埃及文的语法和中埃及语相近,但书面上新增了大量字符(尤其是托勒密-罗马时期)。

第二阶段,晚期埃及语(later ~),从第19王朝到中世纪(前1300-公元1300)。开始变得分析化, 前缀 变得发达,出现 冠词 (定冠词来自近指指示词,不定冠词来自数词“一”),向 SVO 语序转换。

埃及新王国时期的疆域,作为古代埃及文明最鼎盛的时期,也可称为“埃及帝国”
  • 新埃及语(late/new ~,注意不是 later):前1300-前700,在书写和日常文献中出现,但宗教和官方文献仍在用传统埃及文,同时两者也有很多互相影响之处。
  • 世俗埃及语(Demotic ~):前7世纪-公元5世纪(古埃及晚期到古典时代晚期),语法上和新埃及语仍然接近,但书写上已发生重大变化,采用相比于圣书体而言更为简化(同时也更缺乏统一形式)的 世俗体

尤其值得一提的是,一般在埃及学里使用的中埃及语和实际历史语学里构拟出的形式会有 很大差异 ,主要分歧点在于 元音 。由于圣书体不记录元音,而埃及学以释读文本而非研究语言为目的,所以传统上会简单粗暴地 把若干个辅音字母按元音来念 ,比如 ꜣ 和 ꜥ 读/a/、j 和 y(jj) 读/i/、w 读/u/,当缺乏这几个字母时就会在辅音间直接填充/ɛ/。所以,比如太阳神 rꜥ“拉”按语学构拟可能读作 *ˈɾiːʕuw,但在埃及学传统上把 ʿ 当作/a/后变成了/ra/,两者相去甚远 [9] 。更多信息可见我的中埃及语教程以及相关回答:


2. 科普特语

可视作古代埃及语两个阶段后的第三个阶段。

在公元开头的两个世纪,已经出现希腊字母+世俗体的混合文本“古科普特文”。之后4世纪起随着埃及 基督化 而正式产生科普特字母,用基础希腊字母的变体+6个 来自世俗体的新造字母 (ϣ /ʃ/, ϥ /f/, Ϧ /x/, ϩ /h/, ϫ/t͡ʃ(ʼ)/, ϭ /t͡ʃʰ/, ϯ /t(ʼ)i/)书写, 到5世纪时埃及精英阶层已不再知晓圣书体 (毕竟本来书写能力就只掌握在精英手中)。不过此时正式行政用语为 希腊语 ,和日常口语、宗教用语的科普特语长期保持双言。希腊语对科普特语有很大影响,两者也进一步构成了后来埃及阿拉伯语的底层。

阿拉伯语传入后,先是取代了希腊语作为上层语言的地位,而后逐渐取代科普特语作为日常用语(基本在 9世纪 完成)。而科普特语的书写一直持续到14世纪,之后也仍然作为宗教语言。值得一提的是阿拉伯人在14世纪写了科普特语语法概要,属于 全非洲最早的语法记录

现代科普特语主要分为萨义德(Sahidi,上埃及即南方)和布海拉(Bohairi,下埃及即北方)方言。前者是底比斯(今卢克索,从中王国起长期作为首都)方言,也是科普特 文学 的首要方言。后者是亚历山大(今埃及西北沿海)方言,用于 科普特正教 ,是唯一仍具备 语音形式 的埃及语(尽管音系大体基于埃及阿拉伯语),一个明显特征是保留了来自古代埃及语清塞音的 清送气音 ,并没有像萨义德方言那样和古代埃及语“浊塞音”(埃及学传统上这么读,但历史语学上倾向于认为是 挤喉音 )变为的清不送气音合并。 [10]

时至今日,根据一般的说法,科普特语已不存在母语者,仅作为第二语言在宗教场合使用,但事实上或许已经重新出现了一些新的母语者。

3. 尼罗河谷整体

如果从埃及语看到整个尼罗河谷的语言情况,Kammerzell (2005) 提出上古埃及语是由下埃及的某种亚非语和当地另一种 印欧语 融合而成,然而尽管在考古层面有充足的证据说明当时尼罗河谷和周围其它文明有往来,但归根结底仍缺乏语学证据。

Peust (1999) 则提出前500-300年的世俗埃及语纳帕塔变体(Napata,位于古代埃及南部的库施王国)受到了一些当地 梅罗埃语 (Meroë)和/或 努比亚语 的影响,而 梅罗埃字母 也是唯一已知在埃及语以外采用圣书体-世俗体书写的语言(但谱系仍然不明 [11] ,在埃及圣书体破译后事实上也只能破译出一些梅罗埃语人名)。

此外根据借词证据,在南部远离古埃及文明核心的地区可能还存在过柏柏尔语、和贝贾语(Beja)以外的库施语。

五. 柏柏尔语族

1. 谱系、分布、语言接触

柏柏尔语族的内部差异偏小,只相当于日耳曼或罗曼语。尽管第二章介绍的 Diakonoff 分类里认为柏柏尔语在公元前6~5千纪与闪语分离,但根据 The Afroasiatic Languages 里柏柏尔语一章的作者 Kossmann,原始柏柏尔语只能追溯到前1千纪,实在太晚,相比于其它动辄七八千年的语族而言,柏柏尔语或许不足以构成亚非语系下的一个“语族”,而是“语群”或“语支”。不过,有可能该“语族”还存在一些 已灭绝、关系更远 的语言,如摩洛哥以西大西洋中 加纳利群岛 上于17世纪灭绝的 关切语 (Guanche,仅有一些旅行者记录的词表,关切人的介绍详见 这里 ),无法确定其是否为柏柏尔语,亦或是柏柏尔语底层或借词;又比如位于今利比亚的 努米底亚语 (Numidian),只留下一些人名和提非纳字母(Tifinaɣ,具体见下)。

柏柏尔语曾经在 北非 广泛分布,在阿拉伯扩张后受到了极其强烈的影响,使用范围急剧缩小,整体呈现出高度的 不连续性 (相对连续的只有摩洛哥南部的什勒赫语/Taclḥiyt、摩洛哥北部的中阿特拉斯语、摩洛哥北部沿海和阿尔及利亚北部沿海的部分),而与之相对的则是语言本体特征上的 连续性 ,说明在被阿拉伯语鲸吞蚕食之前,整个北非应该 遍布柏柏尔语 ,呈现出渐变式差异,只是后来萎缩成了一个个彼此独立的小片,而不是空降到了一处又一处。与此同时,柏柏尔语和阿拉伯语也有广泛的语言接触现象,两者互相大量借入词汇(往往也难以分辨是亚非语系两个语族层面的同源词,还是后期的借词),同时 音系 上也趋同(比如马格里布阿拉伯语的短元音删除,详见 这里 )。

撒哈拉及以北的柏柏尔语

相比之下,主要位于撒哈拉以南尼日尔和马里境内的 图阿雷格语群 (Ṭuareg)则分布较为连续。同时,图阿雷格语也与 桑海语系 (Songhay)里靠北的语言产生了许多接触,使得北部桑海语在形态上高度趋向柏柏尔语,并出现了一些基于双方的混合语(creole)或融合语(mixed language)。 [12]

目前柏柏尔语族最东端是 埃及锡瓦绿洲 的锡瓦语(Siwi),最西端是 毛里塔尼亚 沿海的兹纳加语(Znaga)。然而由于目前的柏柏尔语研究主要针对共时层面,所以历时谱系的争议仍较大,Glottolog 上只是姑且分成了7个单位(另有关切语的谱系不明),Kossmann 也只是从纯 类型学 角度将摩洛哥和阿尔及利亚的统称为“北部柏柏尔语”,利比亚和埃及的统称为“东部~”,毛塔的兹纳加语有时可称“西部~”,图阿雷格语群则是“南部~”,但其中只有后两者真正是基于谱系的分类。

2. 身份认同

谈论“柏柏尔”时需要特别注意的是,Berber 是对北非除阿拉伯人以外族群的 蔑称 ,现在在语学上只是充其量用于表示语族整体 [13] ,当具体称呼其中任何一个具体族群时都不宜使用“柏柏尔”。而事实上,很多语言中都存在“imaziɣən”的自称(单数 amaziɣ 或 maziɣ),语言名则为添加阴性标记 t-...(-t) 的 t(a)maziɣt(包括像 tămašăq 之类的变体)。而在音译语言名称时则需去除这个阴性环缀 t-...(-t),所以比如 Tamaziɣt 不应译作“塔马齐格特”( 很可惜现在报批到教育部的专业名称就是这个…… ),而去除后的 ⴰⵎⴰⵣⵉⵖ Amaziɣ 的“ 阿马齐格 ”才最合适。 [14]

所以,目前以 摩洛哥 阿尔及利亚 为中心的柏柏尔复兴运动者认可的称呼是“阿马齐格人”,旗帜见下,两国的柏柏尔语也具备官方语地位,尤其是摩洛哥付出了巨大努力来推动柏柏尔语的现代化、标准化,并将自南向北的什勒赫语、中阿特拉斯语、里夫语(Tarifit)三者结合,制定了 标准摩洛哥阿马齐格语 。——然而,利比亚政府仍激烈反对柏柏尔语的使用,卡扎菲时期甚至不承认国内有柏柏尔人。此外,突尼斯、毛里塔尼亚、埃及的柏柏尔语地位也较低,埃及阿拉伯人印象中的“少数民族”通常只有努比亚人和贝都因人 [15] 两类,并不关心锡瓦人(即埃及的柏柏尔人)、科普特人、贝贾人(语言属于库施语族,见后)等。

3. 文字、音系、形态

马格里布地区最早的文字记录是前800年-公元1世纪的“利比亚文字”,主要在突尼斯出土。一般认为这种文字后来演变为了 提非纳字 (ⵜⴼⵏⵗ Tfnɣ ,词根 √fnɣ<√pnq<拉丁语 Pūnicus“布匿/迦太基”),是 辅音音位文字 (abjad),在撒哈拉以南的图阿雷格语中始终保持使用,相比之下北非柏柏尔语则在罗马统治后放弃了这种文字。而随着阿马齐格复兴运动,摩洛哥和阿尔及利亚出现了“ 提非纳字”(ⵜⵉⴼⵉⵏⴰⵖ Tifinaɣ ),改造为可记录 元音 的全音位文字(alphabet),摩洛哥也在2003年承认了其官方文字地位。除此之外,摩洛哥南部(主要是什勒赫语)也长期有用阿拉伯系字母记录的传统;而拉丁字母的使用则以阿尔及利亚的 克拜勒语 (Taqbaylit/Kabyle)为代表,同时这也是柏柏尔语研究的中心。

音系上,尤其是存在感最强的“北部柏柏尔语”有着较为简单的底层元音系统,一般是/a, i, u/加地位不确定的/ə/(在图阿雷格语和“东部柏柏尔语”里则有/ə, ă/两个央元音,其它则可统称“ 边缘元音 ”),甚至摩洛哥的什勒赫语在理想情况下可分析为没有底层元音(见下)。而可能受阿拉伯语的影响或是共同创新 [16] ,柏柏尔语的普遍存在 咽化辅音 (尽管在本土词里只有/dˤ, zˤ/两种,其它都借自阿拉伯语或是类推),长辅音也很常见,反之较为存古、受阿拉伯语影响较小的辅音音系可参考图阿雷格语。

形态上,根据上面例子里从拉丁语 Pūnicus 中提取出辅音词根 √pnq,有闪语基础的读者可以发现,这其实和闪语的 词根-词式 模式一致,柏柏尔语同样依靠将辅音词根插入由不同的元音辅音构成的“词式”中来派生或屈折。然而需要特别说明的是,这一模式基本 只在闪语族和柏柏尔语族里有 ,像下面会出现的库施语族和乍得语族就未必存在(乍得语会倾向于用 声调 变化,比如分析为动词词根没有声调、靠代入不同的声调模式来屈折或派生,就像闪语和柏柏尔语分析为动词词根没有元音),而往往有些仅基于闪语族乃至阿拉伯语的“亚非语系介绍”里会把这一点列为语系整体特征,其实是以偏概全。

六. 库施语族

上述的闪、埃及、柏柏尔语族属于亚非语系里研究相对完备的语族,下面来到 撒哈拉沙漠以南 ,库施和乍得语族则研究仍有很大不足,能提取出的语族层面共性也较少。而包括闪语族部分提到的埃塞闪语在内,这三片语言的存在感都相当低,甚至当说起亚非语系使用人群时,似乎会觉得基本都是“白人”,这也是为何我必须在标题里强调是“撒哈拉 北”。事实上, 埃塞俄比亚 的1亿人口中绝大多数都说亚非语,下一章即将出场的8000万人使用的豪萨语也是如此,亚非语系不应只被西亚北非“代表”。

1. 谱系与分布

尽管第二章介绍的 Diakonoff 观点认为亚非语系里埃及语族最早分离,但写 The Afroasiatic Languages 库施语族的作者 Mous 则认为库施语族最早分离。不过即便如此,库施语族整体在类型学上还算接近。

根据上图所示,库施语族主要分成四个语群:

  • 北库施/贝贾语(Beja,黄):位于埃及东南部、苏丹东北部、厄立特里亚西北部。地位很特殊,甚至早期认为其可单独作为亚非语系下的一个语族。
  • 中库施/阿高语群(Agaw,红):是下图中零星分布于灰色的埃塞闪语区(尤其是阿姆哈拉语)内部的土黄色部分,在埃塞帝国不断南移的过程中被逐渐侵蚀。其中 埃塞犹太人 (Falasha)使用 Kemantney/Qimant、Qwara 等。
  • 东库施语群(上上图为蓝):位于埃塞高原南部和非洲之角东部的广大低地地区,少量位于南部的肯尼亚境内,构成了库施语族的主体部分。可细分为高地东库施语支、低地东库施语支、达哈洛语(Dahalo,是否归入南库施有争议)。其中达哈洛语有大概40个含 搭嘴音 的词。
  • 南库施语群(上上图为粉红):下图浅蓝色区域中靠南的一片,孤立地分布在坦桑尼亚北部,和东库施语群并不连续,中间被班图语支(绿,属于大西洋-刚果语系)和尼罗语系(紫) 切断 。基于形态层面,很多学者赞同将南库施并入东库施,但缺乏词汇层面的对应,且出现了较为罕见的边擦音和边塞擦音。

2. 埃塞语言联盟与埃塞断崖

相比于尚且不足的历史语学研究,库施语族在 语言接触 方面受到的关注更多,主要涉及非洲之角上的“埃塞语盟”和南库施语与班图语、尼罗语(以及其它更早期语言)的接触。

“埃塞语盟”在 Ferguson (1970, 1976) 中率先提出,而后成为了全非洲语言接触研究的典范,也经常会出现在各类语言接触著作的举例中。尽管其具体的划分准则在之后不断遭到质疑,并被 Tosco (2000) 彻底否决,但可以肯定的是, 以埃塞高原为中心 的周边一带存在非常明确的语言接触现象,只是具体涉及哪些语言、范围多大、具体由接触导致的特征、更长距离接触路径等等都有待商榷。而在第二章中也提到,Güldemann 提出的非洲6大语言分区里就包括了 V“ 乍得-埃塞 ”这样一个更大的范畴,认为东起非洲之角、西至尼日尔和乍得,广泛存在中心语后置、“轻动词结构”(表类助动词+非动词成分,类似于 这个回答 )等由接触导致的共性。

然而,本文的主题是亚非语系,无论是乍得-埃塞地区还是其中的埃塞语盟,都包括了大量被格林伯格扔进“尼罗-撒哈拉语”这个筐的小型语系,为什么还要隆重介绍?这就是自 Ferguson 以来研究非洲之角语言接触问题的普遍情况,可以说主要就集中在 埃塞闪语和库施语的接触 上(包括库施语被埃塞闪语替换时留下的底层痕迹)。读者可能注意到了上图的阿拉伯数字“2”,观察下图中的埃塞地形可以发现,埃塞高原向东的高度变化相对平缓,向西则落差较大,所以“2”指的是“ 埃塞断崖 ”(~ Escarpment,北起厄立特里亚北部的低地,顺着埃塞高原西端,南至肯尼亚北部的图尔卡纳湖),这就是 Güldemann 划分出的非洲4个语言“ 冲积区 ”(accretion zone)之一,表示有多批移民陆续迁入某地后,导致了某地有极高的语言多样性,“2”埃塞断崖和“3”努巴山脉(苏丹南部)是 全非洲语言最多样 的地区——而埃塞语盟正好就会涉及“2”这片断崖带,那如果只关注埃塞闪语和库施语,有可能事实上发掘出的是 亚非语系共性 而已(尽管如第二章所说,亚非语系分化时间很长,语族间的共性比较小),不足以代表当地其它密密麻麻的小型语系,更多信息会在第八章奥莫诸语中作进一步补充。 [17]

3. 东非的库施语

从埃塞高原过渡到东非,这里语言到来的先后顺序为“科依桑”、库施、班图、尼罗。所谓“科依桑语”指的是非洲所有含搭嘴音的语言,现存的“科依桑语”可分成三个语系和两种孤立语,和“尼罗-撒哈拉”一样是个筐。目前主要的“科依桑语”分布在非洲西南部的纳米比亚、博茨瓦纳等国,与此处相去甚远,会在之后的文章中细说。这里先看到上上图中冲积区“1” 格里高利裂谷 (即东侧大裂谷) 南部 ,仍存留着两种 搭嘴音 语言——靠北的是哈扎语(Hadza),靠南的是桑达维语(Sandawe),如下图中深蓝色所示(这是孤立语的统一标记,彼此 无亲属关系 )。之所以提及这两者,是因为在肯尼亚东部属于东库施语群的 达哈洛语 同样含有搭嘴音,可以认为达哈洛语保留了非常古老的语言接触痕迹。

回想一下介绍北非柏柏尔语时提到过,“跳跃式”的分布本来应该是连续的,只是中间受其它语言的扩张而 切断 了联系。从西南非洲到格里高利裂谷再到肯尼亚沿海,所谓“科依桑语”(搭嘴音语言)可能曾经 广泛分布在赤道及其以南的非洲 ,使用者的肤色可能偏 而没有那么黑,他们可能也正是库施语向东非扩张时遇到的那一片原住民。

然而公元前1000年从中部非洲喀麦隆高原出发的 班图扩张 改变了一切(下图,具体过程见本系列后续文章),向东向南扫平了绝大多数中南部非洲的原住民语言,由此才有了现在一般印象中的“撒南非洲都是黑人”。当班图语抵达东非海岸时,同样也侵蚀了许多原本的库施语地区,所以此地很多班图语都存在库施语底层,目前留下最有意思的证据是坦桑尼亚东北部的 融合语 —— 马阿语 (Maʼa),其使用者从 南库施语切换到了班图语 ,而后在几乎完成切换时,又有意识地停止并试图切换回去,所以词汇层面来自南库施,而类型学上又属于班图,是两种/类语言融合的结果。 [18]

在这之后,又有尼罗语系(Nilotic)向白尼罗河上游来到东非大湖区,再一次侵蚀了库施语地区。甚至,Heine et al. (1979) 基于目前尼罗语系中的 借词 ,构拟出了一种已经 不存在 的库施语 Proto-Baz。同样地,Nurse (1988) 和 Ehret (1998) 也基于坦桑班图语的借词,认为当地还存在过另外一些南库施语。

4. 主流库施语现状

而如果回到库施语核心地区——除埃塞高原北部中部以外的非洲之角, 奥罗莫语 (Oromo)以3700万的母语者位居全库施和全埃塞之首(阿姆哈拉语母语者仅3200万),也曾作为埃塞南部的通用语,但在埃塞帝国崛起后长期受到阿姆哈拉语的打压,直到上世纪终于才确定了拉丁正字法(并且奥罗莫人也抵制埃塞闪语的格厄兹字母),近些年才被埃塞政府提升到“工作语言”地位。

相比之下 索马里语 则具备官方语地位,然而大索马里地区却是非洲“ 语言单一但冲突严峻 ”的典例(毕竟非洲大量的冲突和语言族群过于多样有关)。总而言之,不难理解不到50种语言的库施语族的研究情况比近200种语言的乍得语族也并没有好太多。

5. 音系、形态句法、词类

元音一般是五元音分长短,但阿高语群没有长度对立且倾向于有六元音(一般是/ɨ/且可预测)。有着丰富的 语法调 ,在词层面很少对立(只在南库施语中略多),但具备大量形态功能,比如索马里语“牛”词典形 díbì、阳性主格 dìbì、属格 dìbí。

库施语在 声门性音 (内爆+挤喉)方面提供了许多案例。埃塞西南部的 Tsʼamakko、Konso、Dhaasanac 有/ɠ/甚至是/ʛ/,因为 越靠前越倾向于内爆、越靠后越倾向于挤喉 ,所以后部的内爆非常罕见。奥罗莫语有/pʼ, tʼ, kʼ, ɗ~ᶑ/ (对应魔性的正字法⟨ph, x, q, dh⟩),不过/ɗ/在音系行为上不同于挤喉音,反而像是喉塞或清普爆,比如/ɗː/和/t/在动词变位中交替出现,所以底层可能是个/*ʔt/;同时也基于奥罗莫语和索马里语的音位变体[ᶑ], 内爆可能会将发音部位向后拉 ,从齿/龈音变成 卷舌 。此外根据声门性音的思想,和清普的差异仅在于 紧喉性 (即内爆可 不考虑浊音特征 ,挤喉和内爆可合成一组,只看部位差异),于是发现 有全套四部位声门性音 的语言倾向于 没有咽音 (至少对高地东库施语完全符合),反之有咽音的语言则一般完全没有声门性音。

而说到咽音,/ħ, ʕ/的书写非常多样,依次为:索马里语⟨x, c⟩、阿法尔语⟨c, q⟩(无/q/,且⟨c⟩和索马里语相反)、伊拉库语(Iraqw,南库施)⟨hh, /⟩(正字主要基于斯瓦希里语)。当然此外,如上面所说,咽音在很多库施语里则缺失。

在形态句法上,库施语的一个突出特征是“选择器”(selector),指一系列表示从句类型、TAM、极性、话题-焦点等的 语法语素 黏在一起构成的复合体,但完全不涉及实词,从而通过一个某NP以外的别的成分将其与谓语产生联系,以 Alagwa(南库施)为例,里面的 lo-s-o 就是“选择器”:

P.S. 在南库施语群的布伦格语里有指示词四分,其中两类是 叙事 中用到的非空间指示词:

七. 乍得语族

按照第二章介绍的学术史顺序,来到最晚归入亚非语系、同时也是其中最庞大、研究最缺乏的成员——乍得语族, 语种数占据全语系一半以上 ,Diakonoff (1988) 甚至认为单一个乍得语族的 类型学差异就能大过整个印欧语系 。所以,任何基于闪语族(甚至单单基于标准阿拉伯语)而提出的所谓“亚非语系共性”,在乍得语族这边都很可能轻松打脸。只是……甚至包括将近 8000万人口的豪萨语 在内,乍得语族的存在感实在太低,时常会让人忘了亚非语系这半壁江山,忘了亚非语系是跨撒哈拉南北分布的。

1. 谱系、分布、语言接触

乍得语族得名于 乍得湖 而非乍得共和国,分布在萨赫勒地区乍得湖以南的东西两侧,主要横跨乍得、喀麦隆、尼日利亚三国(另外豪萨语北端延伸到尼日尔并作为第一大语言),并非都在乍得使用。目前相对较为公认的是西乍得(粉)、中乍得/比乌-曼达拉(Biu-Mandara,红)、东乍得(黄)三个语群,而蓝色的马萨语群(Masa)被一些学者认为可以和中乍得语群合并。可以发现, 萨赫勒地区的语言密度非常高 ,其中乍得语分布最密集的地方有两处,如上图所示,左右依次对应尼日利亚中部的 乔斯高原 (Jos) [19] 、和尼日利亚-喀麦隆边界北端的 阿达马瓦山脉 (Adamawa)。不过,由于语言谱系相对单一,所以称不上是上一章提到的“冲积区”。

乍得语族进入萨赫勒的时间相对较晚,和大西洋-刚果语系(下图浅蓝,其中的夸沃尔塔-刚果语群/Kwa Volta-Congo 和诸阿达马瓦语)、中苏丹语系(浅绿,其中的萨拉-邦戈-巴吉尔米语族/Sara-Bongo-Bagirmi)、桑海语系(Songhay,在下图范围以西,主要是和豪萨语西侧接触)、撒哈拉语系(下图尼日利亚东北的紫三角,主要是卡努里语/Kànùrí,在下下图是右上方的红色区域)、以及更晚到来的乍得阿拉伯语等等有长期接触,由此产生的特征包括双唇-软腭爆音(这是本系列后续介绍 Güldemann 非洲分区 III“ 大苏丹带 ”的特征之一)、声门性音、话语代词 [20] 、一称复数包含式-排除式、中心语编码 [21] 、在动词上区分宾语的确指、有些语言里性系统消失等等。——亦或是说,是原始乍得语扩张到此处后,和当地原住民语言接触后形成的结果,留有强烈的 底层 。当然了在含米特假说盛行时,则认为是反之“浅色皮肤的含米特人对中苏丹地区的影响”。

极高的语言密度也就意味着每种乍得语的使用人口都不多,除了豪萨语之外,没有任何一种乍得语有 百万 以上的使用者,仅有8种的使用者在十万以上。而且双语现象很普遍,乍得语地区很多人同时或说豪萨语、富拉语(主要是阿达马瓦山区的 Fulfulde)、卡努里语等西非通用语,同时大量更小的语言群体正在转向使用豪萨语。

2. 豪萨语概况

凭目前的研究,想要再介绍什么乍得语族的整体情况已经很困难了,现在的研究顶多也只针对下层分类。在 Güldemann 的分区里,乍得语族基本属于IV“中间过渡层”这个垃圾桶,不仅是语言谱系一团乱麻,连语言接触的研究都很缺乏,所以 The Afroasiatic Languages 乍得语族一章的作者 Frajzyngier 能做的也只是罗列许多可能只有某几片语言(甚至仅某几种)具备的特征。总之,本文不如来聊聊豪萨语。

在公元一千纪内,豪萨人逐渐向西扩张,抵达了今天的尼日利亚北部和尼日尔南部,并于11世纪起在这片豪萨语核心地带建立了诸多豪萨城邦,其中 卡诺 (Kano,今尼日利亚北部,全国第二大城市)方言成为了标准豪萨语。在豪萨语地区西侧,15-16世纪 桑海帝国 从加奥(Gao,今马里东部,尼日尔河沿岸)向东扩张, 桑海语系 与豪萨语产生接触;在豪萨语地区东侧,乍得湖沿岸的 卡涅姆-博尔努帝国 (Kanem-Bornu)从8世纪持续到19世纪,其官方语 卡年布-卡努里语 不断取代当地诸多小型乍得语,同样也作用于豪萨语。

1500年前后的桑海帝国
1200年前后的卡涅姆帝国,之后由博尔努帝国继承

之后来到1804年,从西非最西端塞内加尔一路顺着萨赫勒向东迁徙的 富拉人 (在尼日利亚为 Fulani,通译“富拉尼人”)在萨赫勒多地发动圣战(区域见下),其中在今尼日利亚北部与豪萨人融合的富拉人建立了 索科托哈里发国 (Sokoto),由此豪萨语开始迅速传播到西非各地,包括东部的许多卡努里语地区也被豪萨语同化。——于是,当19世纪下半叶英国人来到西非海岸时,便“惊奇”地发现在跨越了茫茫撒哈拉和西非之后,西非的豪萨语竟和北非的阿拉伯语有亲属关系。

时至今日,豪萨语以8000万总使用人口(母语5000万,二语3000万)位居非洲母语第二、总人口第三,斯瓦希里语(坦桑+刚果,两者共母语2000万+二语6500万)只有总人口才能超过豪萨语,总之这两者和全方位第一的阿拉伯语并称“非洲三大语言”。

有关豪萨语的拉丁记录历史、拉丁正字演变、豪萨语和卡努里语的阿拉伯系字母记录,分别可见下面三篇:

回到语言本体层面,豪萨语在乍得语族研究中最常被引用,并不因为“最典型”(凭现在对乍得语族的了解,本身就很难说什么是“典型”或“存古”),而只是因为 研究最详尽 ,也是唯一有详细方言研究的乍得语。而在其余乍得语中,只 有1/4~1/3有描写语法 ,语学家数量比语言数量要少很多,毕竟考虑到 乍得湖沿岸的安全局势非常严峻 ,以博科圣地(发源自使用卡努里语的博尔诺州)为代表的恐袭不断,去做田野调查相当困难。而在有语法记录的语言中,除了 Munjuk 和 Ouldémé 有两部参考语法以外,其余所有有记录的乍得语只存在一部,而且很多记录非常简单,只涉及音系、形态概况、语序而已。——因此,目前还很难做任何原始乍得语的构拟,研究原始亚非语当然更是空想。

八. 奥莫诸语的问题

最后,回到库施语族介绍里提到的埃塞高原和埃塞断崖,简要介绍一下目前亚非语系分类中最大的问题:奥莫诸语的归属。根据 Glottolog“不确定有联系就先划成独立语系”的原则,奥莫诸语不仅不属于亚非语系,还要拆分出 北奥莫语系 (又称 Ta-Ne-Omotic,包含奥莫诸语中人口最多的沃莱塔语/Wolaytta,250万)、 南奥莫语系 类迪济语系 (Dizoid,下图中三块彼此不连续的桃红色区域,中间插入了苏尔米语系/Surmic [22] )、 青尼罗河茂语系 (Blue Nile Mao,埃塞西部的淡蓝色区域,与前三者不连续)4个独立语系——这只是冲积区埃塞断崖语言复杂程度的一部分,下图中除了闪语族和库施语族以外,所有不同颜色均表示(基于 Glottolog 的)不同语系:

奥莫诸语的记录时间相当晚,差不多要等到1840年左右,而主要的分类工作则一百多年后才开始,70年代 Harold Fleming 也才根据埃塞南部的奥莫河(下图)提出了“奥莫语”这一统称。(P.S. 可能有一定知名度“ 唇盘族 ”也出自奥莫河谷的风俗)

奥莫诸语谱系的争议点主要包括三个:

  • 奥莫诸语是否能构成 一个整体 ,因为有些语言似乎和其它的有很大差异,且不具备亚非特征。
  • 如果奥莫诸语能构成整体,和周围其它语言的关系如何。早先认为奥莫诸语(除了 Aroid,现在称为“南奥莫语系”)都构成所谓的“ 西库施语 ”,同时也隐含了奥莫诸语属于亚非语系。
  • 奥莫诸语是否属于亚非语系。而就算支持奥莫诸语属于亚非语系,具体内部分类仍然有很大争议,包括:①奥莫诸语是独立语族,即原始亚非语的直接后代;②属于库施语族下的分支;③属于库施-奥莫语族下的一个平级语群;④亚非语系整体是奥莫-非奥莫二分,相当于奥莫诸语是个“次语系”;⑤亚非语系是奥莫-库施-其余三分;⑥北奥莫语和类迪济语属于亚非语系,南奥莫语和青尼罗河茂语划出。

The Afroasiatic Languages 中的奥莫语族一章里,作者 Azeb Amha 单单是“主要的分类方式”就整理了多达7种,总的来说因为争议实在过大,历史语学的部分还是打住,来看点语言接触。先前介绍库施语族时提过,库施语是被从阿拉伯半岛渡红海而来的埃塞闪语不断吞并取代,而在此之前,则 奥莫诸语使用者是原住民 ,逐渐被库施语使用者同化,库施语里也有许多奥莫底层。埃塞断崖固然是冲积区,但气候宜人的埃塞高原则是 扩散区 ,一波一波地将原住民赶入周边更不适合居住的地方。目前,奥莫诸语的使用仍然在不断收缩,主要向 奥罗莫语 等主流库施语转变,或是在西南部分向 苏尔米语系 (Surmic)转变,而北部的 青尼罗河茂语系 则和 科曼语系 (Koman)有着非常复杂的融合。


篇幅实在有限,只能到此结束。本篇的写作思路是弱化闪语族部分,同时重视起(资料相对还算多但存在感低的)柏柏尔语族和库施语族,真正试图做到均衡亚非语系整体;而不是花大篇幅介绍研究最完备的闪语族,而其它语族则简单带过,仿佛还是丢在当年那个“ 含语族 ”的筐里一样。

亚非语系是我做【微语传记】系列以来准备时间最长、收集资料最丰富的一期,本文引用开头介绍的两本书的篇幅约占一半,而这些内容只占所收集资料的1/10,篇幅的另一半则来自各种早已内化的记不清来源的知识储备。截止2023年,我是央视 CGTN 英语频道 Africa Life 的八年忠实观众,同时也作为阿拉伯语本科生的最后一年,我无论如何都该专门做一期亚非语系概况。甚至为了亲身体验,我还去了一趟亚非语系范围内的埃及和阿联酋,亲身体会后也对出行前就已完工的初稿做了些修改。

看到结尾,可能读者会想问:说了半天,亚非语系到底有没有什么对全语系(或至少每个语族都沾点)的共性呢?不能说没有,Frajzyngier 总结的共性包括:

  • 音系:至少含有一组咽化音/挤喉音/内爆音/声门化音,辅音能双化(gemination),底层音位元音一般数量偏少 [23] 。关于原始亚非语是否有声调还有很大争议。
  • 词类:限定词(determiner)数量较多。
  • 形态句法:所有语族中都存在语言对名词区分 [24] ,可重叠(reduplication,单个语素)和重复(repetition,多个语素乃至整个短语), [25] 倾向于比时更丰富。
  • 语义:主动-被动-使动(有/s/标记)-反身/中动四分。 [26]

当然了,考虑到库施语族和乍得语族的研究尚不明朗(普遍缺乏长篇记录也导致难以深入总结句法共性),奥莫诸语能否归入亚非语系也成问题,上述这些的可信度如何仍有待商榷。只是可以确定的是,亚非语系仍然是格林伯格四大分区中可信度最高的一个,在本系列接下来的文章中,将会见到“尼日尔-科尔多凡”、“尼罗-撒哈拉”、“科依桑”有多么匪夷所思,敬请期待。


同系列传送:

参考

  1. ^ 另有南岛语系和跨新几内亚语系(见:【微语传记2】)仅在语种数上胜于亚非语系。
  2. ^ 造成最知名的灾难包括卢旺达大屠杀,被比利时政府选中作为统治阶级的图西人(Tutsi)就被认为“有白人血统”。
  3. ^ “苏丹”(Sūdān)来自阿拉伯语“黑人居住的地方”,词根是√swd“黑”,原本指萨赫勒到西非的一大片撒哈拉以南的地区,并不局限于今天的苏丹共和国。
  4. ^ 尽管在班图语研究中已经证明可以运用。
  5. ^ 当时称为“利比亚-柏柏尔语”。
  6. ^ 尽管 Cohen (1947) 已经有了归入豪萨语的想法,但他不承认整个语族的存在。
  7. ^ 尽管在 1950d 里还是16个单位,反而更接近现在的观点。
  8. ^ 注意,Glottolog 上这个单位是“赛哈德语”(Ṣayhadic),把现存的拉齐赫语(Rāziḥ)和费法语(Faifi)也视作“现代赛哈德语”,这是有问题的,可能不过是阿拉伯语中两种较特殊的分支,并非古代南阿的后代。
  9. ^ 问题更大的是 ꜣ,一般被视作辅音/ʔ/和元音/a/,但它通常对应闪语的/r/,所以事实上发生过 *r>ʀ>ʔ>∅ 一系列复杂变化。
  10. ^ 真正的浊塞音/d, ɡ/只见于希腊语借词,或是鼻音后原清音的浊化。
  11. ^ 可能和努比亚语系有关。
  12. ^ 甚至桑海语系最北端是阿尔及利亚西部的 Korandje/Tabelbala。
  13. ^ 英法西德俄等文献中如此,但阿拉伯语文献中已用“ʔAmāzīġīyah”代替“Barbarīyah”,所以反而导致在指称语族整体和单一语种时可能混淆。
  14. ^ 在北非到萨赫勒看见名字带 t-...(-t) 且辅音较多、看着较长的名字一般是柏柏尔语,但不一定,比如上面提到的北部桑海语就是受图阿雷格语影响强烈,也出现了如 Tadaksahak、Tasawaq、Tagdal 等桑海语的名称。
  15. ^ 事实上“贝都因人/Badawī”是城市里定居阿拉伯人对游牧阿拉伯人的统称,并不是某个特定族群。
  16. ^ 注意整个闪语族现存语言里基本只有阿拉伯语(+与其频繁接触的新阿拉姆语)的强势音实现为咽化,其余的主要是挤喉。
  17. ^ 另外 Ferguson 的问题也包括选取了一些类型学上并不罕见的特征,很有可能只是在不同语言间平行出现,并不由接触导致。
  18. ^ 另外该社群还使用 Mbugu,是一种接近于 Pare 的真正意义上的班图语。
  19. ^ 此处的西乍得语群和大西洋-刚果语系下的贝努埃-刚果高原次群有海量的接触现象,包括罕见的12进制等。
  20. ^ logophoric ~,搭配“说”、“相信”、“报道”等带间接引语的动词,从而表明间接引语的主语是说话者自己而非别人。
  21. ^ head-coding,尤其是将语义关系表现在动词上。
  22. ^ Güldemann 认为苏尔米语系和尼罗语系可合并。
  23. ^ 但埃塞闪语、库施语和奥莫语的元音则相对偏多(尽管央元音和中元音事实上未必完全是音位),像索马里语通过舌根和谐来大幅扩充元音音位。
  24. ^ 不涉及格,整个乍得语族都不变格。
  25. ^ 往往会粗略地分成 (im)perfective 对立,但法语用 (in)accompli,所以按英语文献区分的是事件是否有界,而按法语文献则是事件是否完成。
  26. ^ 其中后三者的标记在柏柏尔、闪、埃及、库施语里均同源,说明可构拟到原始亚非语。但是和乍得语不同源,甚至在形态上完全缺乏被动和反身/中动的表示方式,反之采用主语观点标记。
编辑于 2023-07-09 03:02 ・IP 属地上海

文章被以下专栏收录