华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 2569|回复: 11

选择“简体”还是选择“全集”?

[复制链接]
发表于 2011-8-10 17:42:20 | 显示全部楼层 |阅读模式
选择“简体”还是选择“全集”?

  紫光华宇拼音输入法“设置”中“输出集合”有“简体”、“繁体”、“全集”之分,紫光用户有必要了解这里的“简体”、“繁体”、“全集”含义。
  一般用户对于简体字、繁体字是有感性认识的,但要说清简体字、繁体字的准确概念恐怕有点难度。学术界、网络上对简体字、繁体字讨论、争辩非常激烈,可以说“简体字”是个较为复杂的概念。
  繁杂问题简单化。大家既不是语言学家、文字学家,也不想参与简繁之争,那只需了解“简体”、“繁体”、“全集”的大概意思就可以了。
  我的理解,“简体字”或“简体”有两层意思,第一层意思指中国大陆目前通用的汉字系统,是个集合,包含非简非繁的历史传承字在内,它相对于繁体字系统(或传统汉字系统、正体字系统);第二层意思是指20世纪五六十年代汉字简化运动中新造、历史上本无该字(字形)的那些具体汉字。
  搜索网络得知,1986年重发的《简化字总表》中,482个纯简化字+类推简化字1753个=2235个简化字,它相对的繁体字字数理论上也是2235个(实际上不只2235个,一简对多繁关系)。如考虑482个“纯简化字”中部分字借用其他汉字字形(如“台-臺”这组的“台”、“丑-醜”这组的“丑”,假定这部分数量为 ),那么上面第二层意思的“简化字”数量少于2235个。
  从上面的理解出发,紫光拼音的“简体”、“繁体”、“全集”可这样理解:
  “简体”≈“全集”-2235个繁体字【带有没剔除的异体字、貌似繁体字实是历史传承字、未类推简化的疑似繁体字】
  “繁体”≈“全集”-(《简化字总表》中的2235个-
  “全集”=CJK及其扩展集全部汉字【75000多个】
  由于紫光拼音字库从原来的GBK字符集21003个汉字一下子扩大到75000多个汉字,在选择“国际超大字符集”情况下,开发组没有精力也没有能力将2235个简化字和之外汉字的对应异体字全部挑出来,因此紫光拼音输入法V6.7.1.36版本内的“简体”必然掺杂了为数不少的异体字。就像有洁癖的人容不得家里有半点垃圾一样,很多紫光用户觉得紫光华宇拼音输入法“简体”内存在“鉴、鋻”并收这类现象很不舒服,这可以理解。好在紫光拼音“简体”集合中的异体字、貌似繁体字实是历史传承字、未类推简化的疑似繁体字的字频都极低,一般不影响汉字输入的流畅性。我总是选择“全集”,汉字输入中并无不便,因为目前的字频总体上还算合理。希望更新版能对多音字不同读音下的字频进行优化。
  如已基本了解了上面的意思,选择“简体”还是选择“全集”应该不是个问题。
发表于 2011-9-2 21:12:33 | 显示全部楼层
最好能有个gb2312的6763个简体字的选项
我用这些字一般也够用了
里面没有的字,比如 镕,都是可以打词组的。
发表于 2011-9-8 15:02:20 | 显示全部楼层
解释的很全面
 楼主| 发表于 2011-9-24 12:39:52 | 显示全部楼层
原帖由 紫光蓝天 于 2011-9-2 21:12 发表
最好能有个gb2312的6763个简体字的选项
我用这些字一般也够用了
里面没有的字,比如 镕,都是可以打词组的。

我曾经对此提议持赞同、附和态度。
你可这样选择:
TM截图未命名.jpg
这个组合,应该约等于GB2312字符集。
发表于 2011-9-24 12:53:56 | 显示全部楼层
是的。很久以前的紫光版本有GB2312字符集。这个字符集各大输入法现在大都不用了,直接选简体就可以了
 楼主| 发表于 2011-9-24 17:10:26 | 显示全部楼层
不大对。GB2312字符集仍是各大输入法的首选啊。
发表于 2011-11-3 00:48:39 | 显示全部楼层
GB2312字符集仍是各大输入法的首选
发表于 2011-11-8 22:37:47 | 显示全部楼层
建议用gbk+全集。
 楼主| 发表于 2011-11-9 10:38:01 | 显示全部楼层
猜测:
GBK+简体≈GB2312所收汉字
GBK+繁体≈BIG-5所收汉字
GBK+全集=GBK字符集所收汉字
发表于 2011-11-9 16:03:36 | 显示全部楼层
紫光拼音不能输出大5码(big5)的!
繁体字不等于big5字……
 楼主| 发表于 2011-11-9 18:45:46 | 显示全部楼层
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2021-1-16 16:23

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表