日语的五十音图并不是非常整齐,有一些音是空缺的。
其中一些空缺是发音合并造成的,比如,约一百年前,wi 变成了和 i 一样的音,那么「ゐ」自然也就作废了。而另一些空缺则是从来没有过对应假名,比如 yi 和 wu(理论上发音是 /ji/ 和 /wɯ/)。对于日语音系来说,它们和「い」、「う」的发音差别微乎其微,所以连万叶假名里都没有 yi 和 wu。
但与假名同为音节文字的切罗基音节文字却有 Ᏹ(拉丁转写为 yi,理论上发音为 /ji/ [1])和 Ꮽ(wu,/ɰu/)。这两个音和元音 Ꭲ(i,/i/)和 Ꭴ(u,/u/)在发音上也很相近。
另外,切罗基音节文字还有 Ꮚ(quu,/kʷu/),它和 Ꭻ(gu,/ku/ [3])在发音上也很难区分,可以看作是和 wu-u 一样的情况。
那么为什么日语在书面上不需要区别这两对极其相近的音节,而切罗基语需要呢?
一、日语的音系和词素特点
日语音系很简单,还是封闭音节。除了「ん」和促音等少数情况,绝大多数音节又都是元音结尾,并且没有辅音群。而促音只出现在两个连续音节之间,不会有类似汉语入声字可以出现于词语最后一个音节的情况。
日语是胶着语,但日语的词干和词缀都是完整的音节。尤其是词缀,就算它们不是完整词语,却也不会违反封闭音节的原则。
二、切罗基语的音系和词素特点
切罗基语虽然使用音节文字,却有着开放音节的音系。例如数词「十七」,切罗基语写为 ᎦᎵᏆᏚ,如果不懂切罗基语的人用切罗基音节文字的拉丁转写去套(这四个文字的拉丁转写分别为 ga-li-qua-du),会以为它读作 /ka.li.kʷa.tu/,但实际上这个词读作 /kaɬ.kʷa.tu/,文字 Ꮅ 在这个词语里并不成音节——虽然切罗基音节文字里只有 Ꮝ 是明确地表示辅音而非音节的,但在实际使用中,很多(我没有看到过准确的统计,我不知道这个比例是多少,但我确实看到过很多)其他音节文字都只表示辅音而非音节。
切罗基语是复综语,然而作为本族文字的切罗基音节文字却不能用来书写切罗基语单独的词干、词缀,只能书写完整的词语。
这是因为切罗基语的词干、词缀里以辅音结尾的音节的情况比完整词语里还要多得多,而特定发音的词缀附着在特定发音的词干(或其他词缀)上时,新形成的词语的发音会有变化,这种发音变化在切罗基语里非常常见,导致了切罗基语词素的拆分难度远远大于日语。切罗基音节文字是切罗基本族人塞阔雅创造的,和所有这门复综语的母语者一样,拆分词素并用文字写下来对他们来说并没有实用意义——切罗基语在上千年的历史中都没有文字,塞阔雅在 19 世纪能够创造文字已经很不容易了;按这个状态发展下去,也许上百年以后会有其他母语者拆分词素并记录——但其后不久,就有美国的语言学家在研究这门语言了,当然,他们也开始用拉丁转写去拆分词素了。所以从一开始,切罗基音节文字就不是为了词素——而是完整词语——服务的,并且还没来得及发展出原生的拆分词素方法。
三、为什么切罗基语需要区别 yi-i 和 wu-u
一、切罗基语特殊的音系规则
日语和诸如夏威夷语之类的南岛语的音系可以说是非常奇葩,走上了一条音节极简的不归路。切罗基语音系总体上似乎比较正常,却也有非常怪异的一个规则:切罗基语禁止两个以上元音连续出现,或者说,切罗基语禁止复元音 [4]。
但书面切罗基语里却又经常见到混入词语内部的元音文字 Ꭰ、Ꭱ、Ꭲ、Ꭳ、Ꭴ、Ꭵ。这里以 Ꭲ 为例,因为表示言据性(Evidentiality)的两个后缀里都有元音 i,而如果要使用动词的完成词干或非完成词干来描述过去的事情,那么必须带其中一个后缀,所以 Ꭲ 的出镜率特别高。
比如:
ᎤᏩᏎᎢ
uùhwaséeʔi
uu-hwas-éeʔi
组 B 三人称单数代词前缀-买(完成词干)-未经历后缀
(我没看见,但听说)他买了(某物)。
注意这个词语的拉丁转写,最后的元音 e 与 i 之间有个声门塞音的符号 ʔ——虽然它不是拉丁字母而是国际音标的符号,但我所参考的切罗基语语法书用这个符号来转写声门塞音,所以我也沿用了——普通话里也有这个音,比如「西安」的发音,用国际音标写为(从简,就忽略声调了)/ɕi.ʔan/,这个 /ʔ/ 是从发音上区别「西安」和「先」的关键之一。也就是说,虽然单独出现的 Ꭲ 我们把它转写为 i,但词语中的 Ꭲ 是 /ʔi/,是自带一个声门塞音的——而 Ᏹ 则是 /yi/。熟悉普通话的我们是能够区别这两个音的,切罗基母语者当然也能区别这两个音。
对比日语音系——是允许两个以上元音连续出现的。例如「大好き(だいすき)」,元音 a 和元音 i 就连续出现了。此外,日语在语音上被称为音拍(mora)语言,即每个假名(促音、拗音等不算)表示的音的长度都是一样的,严格说来日语并没有双元音,但在诸如「だい(dai)」的组合里,我们可以直观——虽然不是很正确——地把 ai 理解为一个双元音,并且长度是单元音的两倍。而像「葵(あおい;aoi)」这种组合,甚至有三个元音连续出现,我们可以直观——虽然不是很正确——地把 aoi 理解为一个三元音,并且长度是单元音的三倍。
双元音、三元音之间是没有任何辅音——当然也包括声门塞音 /ʔ/——阻隔的。实际上,日语音系里根本就没有声门塞音,「い」在任何时候都是 /i/,而绝不可能是 /ʔi/,所以如果假名 yi 存在的话,它和「い」也就无所谓语音上更大的区别。
二、切罗基语词素里的音系规则
切罗基语的代词前缀里有一类叫做「结合代词前缀」,用于表示第一、第二人称之间的相互作用。其中,前缀 sgi- 具体用于表示第二人称单数(「你」)对第一人称单数(「我」)的动作。而由于切罗基语音系禁止两个元音连续出现,所以在下一个词素为元音开头的情况下,前缀 sgi- 要变为 sgw-。
例如:
ᏍᏉᎵᎦ
sgwooliìga
sgi-oolihka
第二人称单数对第一人称单数的代词前缀-知道(现在进行词干)
你懂我。
这个词语里构成了 Ꮙ(quo)音节。而如果后面的词干是元音 u 开头的,自然就会形成 Ꮚ(quu)音节了。
例如:
ᏍᏊᎢᏍᏗᏍᎦ
sgwuuʔisdiisga
sgi-uuhisdiisga
第二人称单数对第一人称单数的代词前缀-指责(现在进行词干)
你指责我。
虽然母语者不会去拆分词素,但他们对母语音系肯定是非常敏感的。由于存在着其他的 sgwa、sgwe、sgwi、sgwo、sgwv [5],那么很明显,类似形态下的、听着像是 sgu 的音,实际上应该是 sgwu 才对。
换句简单一点的话来说,切罗基音节文字之所以保留 yi、wu 和 quu 的另一个重要的原因是,在有的情况下,这几个音节的辅音部分和元音部分分别属于不同的词素。
四、其他一些相关的问题
一、切罗基音节文字表里的空缺
一个非常明显的现象:切罗基音节文字表也不是很整齐。除了唯一一个纯辅音 Ꮝ 以及我在注释里说明过的「切罗基音节文字不区分所有的送气/不送气辅音对」以外,切罗基音节文字表还有一个空缺:拉丁转写 mv 所对应的字。
在塞阔雅创造切罗基音节文字的时候,是有 mv 这个字的,但由于 /m/ 这个音在切罗基语里太少见,造成了切罗基语里根本就没有 mv 这个音节。出于实用性——而非强迫症——考虑,现代切罗基语放弃了这个字。
/m/ 这个音在切罗基语里少见到什么程度呢?语言学家布拉德·蒙哥马利-安德森的《Cherokee Reference Grammar》里说:
The sound /m/ only appears in a small set of native words; it is more commonly found in borrowed words and names from English.
/m/,一个原生音,在外来词里比原生词里更常见。
切罗基语音系除了「禁止两个元音连续出现」以外还有一个怪异的地方——由于和 yi、wu、quu 的保留无关,我前面没说——就是在它的元音和辅音都不算很少的前提下,却极其匮乏唇音。严格说来,/m/ 是切罗基语唯一一个唇音;但一般把唇化的 /kʷ/ 和 /kʰʷ/ 也算作唇音。因为 /m/ 真的太少见了,在音译外来词的时候,除非原词里就是 /m/,切罗基语才会用到 /m/;而其他的唇音,切罗基人宁可用 /kʷ/ 或 /kʰʷ/ 来对应也不愿意用 /m/。
例如:
英语:Mary;切罗基语:ᎺᎵ(meli;这个转写并不表示发音,只是让大家清楚具体用的哪个字来转写)
英语:Gabon;切罗基语:ᎦᏉᏂ(gaquoni)
英语:The Bahamas;切罗基语:ᎾᏍᎩ ᏆᎭᎹᏍ(nasgi quahamas)
二、汉语拼音的 yi 和 wu
汉语拼音是文字而不是音标,它并没有做到音形一致。拼音字母 a 在拼音表里是 a,在单独给汉字注音的时候还是 a;而拼音字母 i、u 在拼音表里是 i、u,在单独给汉字注音的时候就要写成 yi、wu 了。也就是说,汉语拼音里的 yi 就是 i,wu 就是 u。希望大家能够和本文所说的事情区分清楚。
注释:
[1] 切罗基音节文字的表音方式远比这个复杂,这个(以及后面几个)例子只是标注了单个音节文字可以表示的最简发音。
[2] 虽然看起来切罗基音节文字似乎是没有除 ka 以外的其他 k 开头的音节,但实际情况是,切罗基音节文字区分 ka 和 ga,但不区分其他 k/g 开头的、元音相同的音节。关于切罗基语的表音方式可以参考我之前写的《切罗基音节文字及其表音策略》。
[3] 切罗基语拉丁转写 g 实际上是 /k/,k 实际上是 /kʰ/,也就是说它和普通话一样只分送气,不分清浊。
[4] 维基百科说切罗基语有且只有一个复元音,/ai/。但我确实从来没看到过哪个切罗基语原生词语含有这个复元音,维基百科里也没有举例子。所以我不接受这一看法。
[5] 切罗基语拉丁转写 v 表示的是鼻化元音 /ə̃/。