|
选择“简体”还是选择“全集”?
紫光华宇拼音输入法“设置”中“输出集合”有“简体”、“繁体”、“全集”之分,紫光用户有必要了解这里的“简体”、“繁体”、“全集”含义。
一般用户对于简体字、繁体字是有感性认识的,但要说清简体字、繁体字的准确概念恐怕有点难度。学术界、网络上对简体字、繁体字讨论、争辩非常激烈,可以说“简体字”是个较为复杂的概念。
繁杂问题简单化。大家既不是语言学家、文字学家,也不想参与简繁之争,那只需了解“简体”、“繁体”、“全集”的大概意思就可以了。
我的理解,“简体字”或“简体”有两层意思,第一层意思指中国大陆目前通用的汉字系统,是个集合,包含非简非繁的历史传承字在内,它相对于繁体字系统(或传统汉字系统、正体字系统);第二层意思是指20世纪五六十年代汉字简化运动中新造、历史上本无该字(字形)的那些具体汉字。
搜索网络得知,1986年重发的《简化字总表》中,482个纯简化字+类推简化字1753个=2235个简化字,它相对的繁体字字数理论上也是2235个(实际上不只2235个,一简对多繁关系)。如考虑482个“纯简化字”中部分字借用其他汉字字形(如“台-臺”这组的“台”、“丑-醜”这组的“丑”,假定这部分数量为 N ),那么上面第二层意思的“简化字”数量少于2235个。
从上面的理解出发,紫光拼音的“简体”、“繁体”、“全集”可这样理解:
“简体”≈“全集”-2235个繁体字【带有没剔除的异体字、貌似繁体字实是历史传承字、未类推简化的疑似繁体字】
“繁体”≈“全集”-(《简化字总表》中的2235个- N )
“全集”=CJK及其扩展集全部汉字【75000多个】
由于紫光拼音字库从原来的GBK字符集21003个汉字一下子扩大到75000多个汉字,在选择“国际超大字符集”情况下,开发组没有精力也没有能力将2235个简化字和之外汉字的对应异体字全部挑出来,因此紫光拼音输入法V6.7.1.36版本内的“简体”必然掺杂了为数不少的异体字。就像有洁癖的人容不得家里有半点垃圾一样,很多紫光用户觉得紫光华宇拼音输入法“简体”内存在“鉴、鋻”并收这类现象很不舒服,这可以理解。好在紫光拼音“简体”集合中的异体字、貌似繁体字实是历史传承字、未类推简化的疑似繁体字的字频都极低,一般不影响汉字输入的流畅性。我总是选择“全集”,汉字输入中并无不便,因为目前的字频总体上还算合理。希望更新版能对多音字不同读音下的字频进行优化。
如已基本了解了上面的意思,选择“简体”还是选择“全集”应该不是个问题。 |
|