华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 12067|回复: 10

【CJK 汉字拼音表——42856字】

[复制链接]
发表于 2013-12-27 15:54:03 | 显示全部楼层 |阅读模式
本帖最后由 wangyanhan 于 2014-3-12 09:03 编辑


【CJK 汉字拼音表——42856字】

一直想弄份比较全面的汉字拼音表,进了不少网站,但始终不能如愿,就只好自己动手了。值此岁末之际,权当一份礼物献给大家呵呵!

小编这个《Unicode CJK 拼音表》,是依据“Unihan Database Lookup”数据库中的相关资料整理制作的。拼音源于《重编国语辞典修订本》中的国语拼音、《汉语大字典》中的汉语拼音和《现代汉语词典》中的汉语拼音。

整理出来一看,连俺自己也吓了一跳,哟!共计有41138个中日韩汉字的拼音啊!范围为“Ext-基本、Ext-A、Ext-B、Ext-C”区的汉字。

因数据浩瀚,估计整理中错误总是难免的,还企盼网友们多加指正呵呵!

正文预览:
正文预览.png

2014.3.12更新_【CJK 汉字拼音表——42856字】

详情见本帖8楼,附件在本楼下载。

附件下载:

空附件,意在保留下载数呵呵!.rar (134 Bytes, 下载次数: 1062)
发表于 2013-12-28 11:29:23 | 显示全部楼层
本帖最后由 sanwsw 于 2013-12-28 11:30 编辑

这份资料或是有拼音汉字最多的资料了。希望华宇拼音开发组看到并利用起来。
 楼主| 发表于 2013-12-28 15:34:38 | 显示全部楼层
sanwsw 发表于 2013-12-28 11:29
这份资料或是有拼音汉字最多的资料了。希望华宇拼音开发组看到并利用起来。

感谢戴老师关怀、鼓励和推荐! 倍感荣幸呵呵!

为弄好这份表,也断断续续的忙乎了十几天,现在能得到戴老师出面关怀,一天来又有几十名网友下载支持,很高兴哈!
 楼主| 发表于 2013-12-31 17:19:46 | 显示全部楼层
本帖最后由 wangyanhan 于 2014-3-12 09:05 编辑

【Unicode CJK 拼音表_增补】发布

感谢戴老师的关怀支持及广大网友的信任使用,自《Unicode CJK 拼音表》放出后,迄今为止已有80多名网友下载。

今天小编又放出【Unicode CJK 拼音表_增补】.txt ,以此回报大众的支持呵呵!

【Unicode CJK 拼音表_增补】
    ——计41384个汉字的拼音
华宇输入法论坛wangyanhan整理制作
说明:
(一)“Unihan Database Lookup”数据库拼音表:
1、拼音表依据“Unihan Database Lookup”数据库中的相关资料制作。
2、拼音源于《重编国语辞典修订本》中的国语拼音、《汉语大字典》中的汉语拼音和《现代汉语词典》中的汉语拼音。
3、计41138个中日韩汉字拼音,范围为“Ext-基本、Ext-A、Ext-B、Ext-C”区的汉字。
(二)Unicode 私用区中的有音汉字:
1、范围为\uE600-\uE6CE。
2、拼音资料最初源于“字海zisea.com”网,后又参照《汉语大字典》,对类推简化字的拼音进行了再次校正。
3、计178个私用区中的汉字拼音。
(三)另在其它资料上发现的有音汉字:
1、是在网上资料中另发现的有音汉字。这一部分汉语拼音仅供参考。
2、计68个网上资料提供的汉字拼音。
(四)因数据浩瀚,估计整理中错误难免,企盼网友们多加指正。

附件下载:(一楼也有一个下载链接)

空附件,意在保留下载数呵呵!.rar (134 Bytes, 下载次数: 923)
发表于 2014-3-8 09:15:08 | 显示全部楼层
谢谢老王,老当益壮。方便网友,赶紧收藏。
 楼主| 发表于 2014-3-8 09:50:46 | 显示全部楼层
泡人 发表于 2014-3-8 09:15
谢谢老王,老当益壮。方便网友,赶紧收藏。

谢谢泡哥多次使用老弟的作品,谢谢鼓励和鞭策呵呵!
 楼主| 发表于 2014-3-10 10:49:41 | 显示全部楼层

最新更新版_【CJK 汉字拼音表——计41397字】

说明:
(一)“Unihan Database Lookup”数据库汉字拼音表:
1、依据“Unihan Database Lookup”数据库中的语音信息制作。
2、拼音源于《重编国语辞典修订本》中的国语拼音、《汉语大字典》中的汉语拼音和《现代汉语词典》中的汉语拼音。
3、计41150个中日韩汉字拼音,范围为“Ext-基本、Ext-A、Ext-B、Ext-C、Ext-D”区的汉字。
(二)Unicode 私用区汉字拼音表:
1、范围为\uE600-\uE6CE。
2、拼音资料最初源于“字海zisea.com”网,后又参照《汉语大字典》,对类推简化字的拼音进行了再次校正。
3、计178字。
(三)其它资料上收集的汉字拼音表:
1、是在其它资料中另收集到的有音汉字。这部分汉语拼音仅供参考。
2、计69字。
(四)由规范声调拼音和数字声调拼音两种形式加注。
(五)因数据浩瀚,估计整理中错误难免,盼网友们多加指正。

更新内容:
1、纠错2字:① 乄 原wu5,现根据《汉语大字典》改为wu3 ;② 桛:原uu5,现根据《汉典》改为ka1 。
2、增加一字:𠀤 bing4 ,源于《汉语大字典》。
3、在原数字声调中,有 “ 1-jun ” 这类不规范的格式,现已全部更正。
4、在原数字声调的基础上,又增加了规范声调。

请移步到1楼下载
 楼主| 发表于 2014-3-12 08:02:40 | 显示全部楼层

2014.3.12更新_【CJK 汉字拼音表——42856字】


说明:
(一)“Unihan Database Lookup”数据库汉字拼音表:
1、依据“Unihan Database Lookup”数据库中的语音信息制作。
(数据库主页:http://www.unicode.org/charts/unihan.html
2、拼音源于《重编国语辞典修订本》中的国语拼音、《汉语大字典》中的汉语拼音和《现代汉语词典》中的汉语拼音。
3、计41134个中日韩汉字拼音,范围为“Ext-基本、Ext-A、Ext-B、Ext-C、Ext-D”区汉字。
(二)“Unicode 6.3.0”中仅有的汉字拼音表:
1、是“Unihan Database Lookup”数据库中没有,而“Unicode 6.3.0”数据库中仅有的汉字拼音,现也补进《CJK 汉字拼音表》中。
2、数据从英国语言学家魏安(Andrew West)先生著名的字符软件“BabelMap 6.3”中提取。计523字。
(三)私用区汉字拼音表:
1、范围为[E600-E6CE]、[E815-E864]。
2、拼音资料最初源于“字海网、叶典网”(http://yedict.com/)。后又参照《汉语大字典》,用繁体字对类推简化字拼音进行了校正。计236字。
(四)兼容表意文字区和增补集区中的汉字拼音表:
1、“中日韩兼容表意文字”区和“中日韩统一表意文字增补集”区多为兼容变体汉字,这些汉字的拼音,都是依照本体汉字语音加注的。
2、合计928字。其中兼容表意文字453字;增补集475字。
(五)其它资料上收集的汉字拼音表:
1、是在其它资料中另收集到的有音汉字。计35字。
2、这部分汉语拼音仅供参考。
(六)由规范声调拼音和数字声调拼音两种形式加注。数字声调的优点是便于检索。
(七)用“◆”查找,可在各正文标题跳转。
(八)因数据浩瀚,整理中估计错误难免,盼网友们多加指正。

更新内容:
-2014.3.12-
1、在“Unihan Database Lookup”数据库汉字拼音表中,因多音字优化不彻底,造成有3个重复汉字。现已去重复,将多音合并。
2、经排查,发现“Unicode 6.3.0”数据库中有523字是“Unihan Database Lookup”数据库中没有的,现将其添加进了本表。
3、私用区汉字拼音表原只有178字,后改变BabelMap字符映射表的显示字体,新发现了[E815-E864]码段汉字,增加到236字。
4、新增“中日韩兼容表意文字”区和“中日韩统一表意文字增补集”区兼容变体汉字拼音929字。
5、其它资料上收集的汉字拼音表原为69字,后在私用区和兼容变体汉字中找到了,减至35字。

请移步到1楼下载
发表于 2015-2-16 11:27:50 | 显示全部楼层
作为资料,老王的整理很有意义。将其完全用于输入法,对于拼音输入法来说不一定是好事,那会极大地增加单字候选项,对字频科学设定的要求就更高了。
 楼主| 发表于 2015-2-16 11:42:10 | 显示全部楼层
本帖最后由 wangyanhan 于 2015-2-16 11:43 编辑
sanwsw 发表于 2015-2-16 11:27
作为资料,老王的整理很有意义。将其完全用于输入法,对于拼音输入法来说不一定是好事,那会极大地增加单字 ...

对于紫光拼音输入法来说,戴老师的担忧是必要的,主要是因为紫光除有单字调频功能外,就没有辅助码等其它筛选功能了。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2020-1-23 04:24

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表