方案有了新的修订稿,请点击下面知乎的扩展汉语拼音功能。新修改的方案和转写的文章知乎的扩展汉语拼音功能专栏都有。简书转写的文章不再更新。
扩展汉语拼音功能——拼音拼写实验方案20210701修订
设计人:金铁军
第一部分 规则
一、简介
方案以汉语拼音为基础,进行拼音拼写实验,扩展汉语拼音的使用功能。它不是取代汉字的文字改革,而是汉语拼音辅助汉字的一套实验方案。方法是对同音节汉字进行归类并定型拼式,定型的拼式与对应的汉字具有一样的表义,至少在通用字范围内一一对应,方案还进一步探索了汉语拼音单词的拼写。这些扩展汉语拼音功能的拼写实验,能运用于中文信息处理、幼儿提前阅读、外国人学汉语以及其他需要使用字母化书写的地方。为了方便推广使用,可以设计汉字与定型的拼式相互转换的软件。
二、音节
定型拼式的音节采用不标声调的汉语拼音。其中,Ji、yi音节同音字异常多,采用异拼标调以分化同音字。Ji四声改写为gi;yi四声改写为ii。
单韵母ü需要带点时写成io;üe均写为ue。韵母uo写为o。ang eng ing ong写为ag eg ig og。
er只在零声母时做韵母使用,标儿化音不简写为r。
三、定型方法
拼式的定型方法有二种。
(一)汉语拼音音节。用于定型每个音节里字频最高的字。如:“定”定型为dig;详见附表1:《用汉语拼音音节定型的高频字表》
(二)汉语拼音音节加上不发音的归类字母。这是拼式定型的主要形式。
归类字母有18个,表示18类意思,同音字确定归类字母的时候,类别与字义仅仅是相关,这种相关是粗线条的大概联系,是帮助记忆的拐杖,不是确定字义的规则。概括为以下十八个字诀:“金木水火土,人口手足心,身衣草兽陆,强形无”。
1. j金类:字义中含有与金属有关的意思用此类,延伸到金钱、各种兵器、舟车、军事、政治、暴力、刑罚、监狱等。
2. m木类:字义中含有与树等木本植物有关的意思用此类,延伸到木制品、房屋、器具、构成件、结构、制造等。
3. s水类:字义中含有与水有关的意思用此类,延伸到冰、风、云、气体等。
4. h火类:字义中含有与火、热有关的意思用此类,延伸到光、日、天、太空、时间、天干、地支、数字、数量等,还有物质在热度作用下发酵的产物等及化学反应。再加上大自然中的雷电、春夏秋冬等。
5. t土类:字义中含有与土、石、山、玉有关的意思用此类,延伸到一些与土石相关的制品、器具、物体及形状等,由山延伸到孔洞,由玉延伸到宝贝、财物。
6. r人类:字义中含有与人有关的意思用此类,涉及到指称人类的字,延伸到友、生、寿,以及没有具体意义的百家姓、民族名称等。
7. k口类:字义中含有与口有关的意思用此类,延伸到语言、声音、食物等,以及叹词、语气助词、象声词的字用此类。
8. d手类: 字义中含有与手有关的意思用此类,动作、行为归入本类(能归入其他各类的除外),延伸到体力、做的事及成就等。
9. z足类:字义中含有与足及站立行走跑跳等活动和状况有关的意思用此类,延伸到速度、长度单位(或许过去丈量与足有关),再从丈量延伸到距离和比较等。
10. x心类:字义中含有与心里活动有关的意思用此类,心态、心理、思维、所感、所想延伸到鬼神巫玄,延伸到性格、生病,再延伸到死夭丧亡等类字。
11. p身类:字义中含有与人或动物的皮肉身及器官(比如眼耳鼻活动等)有关的意思用此类,延伸到身体状态等。
12. y衣类:字义中含有与衣服、穿戴有关的意思用此类,延伸到系、毛、布、纸制品、绳索、文化、文明、娱乐、艺术、色彩、美丽、阴性、缓和等。
13 c草类:字义中含有与草本植物有关的意思用此类,延伸到草本类做的东西、种类、种属、条状物体等。
14.f兽类:字义中含有与飞禽走兽等各种动物有关的意思用此类,包括天上水里地上的,家养的,野外的,画上的所有动物等。
15. l陆类:字义中含有与陆地及城堡建筑有关的意思用此类,延伸到广大、坚固、包围、方位(前后左右南北东西等)、行政区域及机构名称(省市县乡科局等)、国地名用字。
16. q强类:字义中含有与动作、行为和状态有关的意思其程度稍强一些的用此类。
17. b形类:表示事物形状、性质和状态用此类(能归前16类的尽量归)。
18. w无类:无意义表示或者字义杂乱的字用此类,代词、虚词(连词、介词和仅作构词成分等)用此类。
上述18个归类字母只能区分一个音节的18个同音字,如还有同类同音字时,用联想词的声母确定第二个不发音字母。如:堤dit砥ditl(砥砺)。
单字定型拼式表。详见附表2:《单字定型拼式全表》
主要对国标GB2312范围的字,定型拼式,这些字已能够满足汉语的需要,其他偶尔出现的生僻字,其归类字母暂时使用sv(生僻)或者lv(冷僻),如需要再正式定型。
四、文本书写规则
1.文言文同传统汉字一样,用单字定型的拼式书写,字与字之间加一个空格。
2. 现代汉语探索以单词为单位加空格书写。
3.音译的外来词,用汉语拼音直接记音。如:奥林匹克aolinpike等。这些词汇按约定成俗的声调读。两音节的音译词为了和固有词区分,词中加符号-,比如:拉丁la-dig。
4.的、地、之、着、了、是、和、也、个、我,这十个高频字,可简写成d、dd、zh、z、l、s、h、y、g、w。
五、探索单词拼式:
确定单词的原则是能分写的不合写成单词,可单字也可成词的,保持单字书写,只有结构紧密性很强的才作为单词拼写。同音的一组汉字词汇,结构紧密性强的一个拼写为单词后,其余的可以按单字分写。
1.单字词采用单字定型的拼式;
2.两字词和三字词,最后一个字采用单字定型的拼式,前面的字采用不标调的汉语拼音;
3.四字以上的词定型,均采用不标调的汉语拼音;
4.为了分化同音同形词,拼写两个字和三个字的单词时,“子、头、儿、们、的、然、气、人、心、学”这十个字的前一个字也采用单字定型的拼式。
5.单字的介词、连词、助词、量词、副词、数词和方位字、可独立使用的名词单字、颜色用字,“到”字,一般要单写,不与其他字连写成单词。但是结构紧密性太强的和组成三字以上的词也可以连写成单词。
通过以上方法分化后,仍有同音同形词时,可容忍为该单词多一种义项,确实混淆必须区分的,将词尾字外的其他字也用单字定型的拼式来书写,其相对日常用的单词和单字定型是拼音原型的优先用拼音原型定型。举例:起兵qibigj奇兵qibbigj骑兵qifbigj。附表3:《用规则分化后特别定型的常用两字同音单词表》为部分此类词。
第二部分 附表