华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
12
返回列表 发新帖
楼主: wangyanhan

Unicode_GB18030编码对应表(更新5)

[复制链接]
 楼主| 发表于 2014-2-26 19:50:00 | 显示全部楼层
紫光蓝天 发表于 2014-2-26 16:17
老王:
和 日本汉字短语 对照了一下
gb2312常用汉字内

蓝天版主:

把您的列表和“Unihan Database Lookup”数据库的语音信息对照了一下,发现您列举的数据在“Unihan Database Lookup”数据库中都是有的,但在“Unicode 6.3.0.0”版的语音信息中却没有。

看来,还是“Unihan Database Lookup”数据库的语音信息详细。难怪戴老师在《【Unicode CJK 拼音表】——含41138个汉字的拼音》帖子(http://bbs.unispim.com/forum.php?mod=viewthread&tid=31644&extra=page%3D1)的2楼,有“这份资料或是有拼音汉字最多的资料了。希望华宇拼音开发组看到并利用起来。”的说法。

今后有时间,还是要用“Unihan Database Lookup”数据库的语音信息,来充实《CJK/Unicode/GB18030编码对应表》中的汉语拼音。当然,也需要用您提供的语音信息及网上搜罗的其它正确语音信息,来进一步完善《编码对应表》中的汉语拼音。

——————————————————————————
附:《蓝天列表》、《Unicode CJK 拼音表》对照结果
——————————————————————————

《蓝天列表》、《Unicode CJK 拼音表》对照结果
    说明:“【】”前为《蓝天列表》数据;“【】”中为《Unicode CJK 拼音表》数据。

ba 抜【抜 ba2】
bai 拝【拝 bai4】
bang 幇【幇 bang1】
bian 邉【邉 bian1】
bian 変【変 bian4】
bian 辧【辧 bian4】
bian 辺【辺 bian1】
bing 餠【餠 bing3】
bu 歩【歩 bu4】
ce 厠【厠 ce4】
ceng 曽【曽 ceng1】
cha 挿【挿 cha1】
chai 犲【犲 cai2】
chan 懴【懴 chan4】
chang 甞【甞 chang2】
chao 巣【巣 chao2】
chen 鎭【鎭 zhen4】
cheng 乗【乗 cheng2】
chi 鵄【鵄 zhi1】
chi 遅【遅 chi2】
chi 歯【歯 chi3】
chuan 伝【伝 chuan2】
cong 聡【聡 cong1】
cong 従【従 cong2】
cu 卆【卆 zu2】
cuan 攅【攅 zan3】
cuan 簒【簒 cuan4】
cui 忰【忰 cui4】
cui 翆【翆 cui4】
cui 粋【粋 cui4】
cuo 嵳【嵳 cuo2】
da 逹【逹 da2】
dai 帯【帯 dai4】
dan 単【単 dan1】
dan 弾【弾 dan4】
dao 嶋【嶋 dao3】
dao 稲【稲 dao4】
de 悳【悳 duo2】
de 徳【徳 de2】
di 逓【逓 di4】
dian 巓【巓 dian1】
die 畳【畳 die2】
die 疂【疂 die5】
die 疉【疉 die2】
dong 鶫【鶫 dong5】
dou 闘【闘 dou4】
dou 鬪【鬪 dou4】
dou 読【読 du2】
du 涜【涜 du2】
dui 対【対 dui4】
duo 駄【駄 tuo2】
e 悪【悪 e4】
e 蕚【蕚 e4】
er 児【児 er2】
er 尓【尓 er3】
er 弐【弐 er4】
er 貮【貮 er4】
fa 発【発 fa1】
fa 髪【髪 fa4】
fan 飜【飜 fan1】
fei 廃【廃 fei4】
fo 仏【仏 fo2】
fu 釡【釡 fu3】
fu 冨【冨 fu4】
gai 葢【葢 gai4】
gai 漑【漑 gai4】
gao 皐【皐 gao1】
geng 羮【羮 geng1】
geng 頚【頚 jing3】
guai 枴【枴 guai3】
guan 観【観 guan1】
guan 潅【潅 guan4】
guang 広【広 guang3】
gui 帰【帰 gui1】
gui 亀【亀 gui1】
han 凾【凾 han2】
hu 壷【壷 hu2】
huai 懐【懐 huai2】
huai 壊【壊 huai4】
huan 歓【歓 huan1】
huan 渙【渙 huan4】
hui 恵【恵 hui4】
hui 絵【絵 hui4】
ji 喞【喞 ji1】
ji 撃【撃 ji2】
ji 韲【韲 ji1】
ji 鶏【鶏 ji1】
ji 羇【羇 ji1】
ji 剤【剤 ji4】
ji 済【済 ji4】
ji 継【継 ji4】
ji 曁【曁 ji4】
ji 斉【斉 qi2】
jia 仮【仮 jia3】
jia 頬【頬 jia2】
jian 殱【殱 jian5】
jian 倹【倹 jian3】
jian 検【検 jian3】
jian 鹸【鹸 jian3】
jian 剣【剣 jian4】
jian 剱【剱 jian4】
jian 賎【賎 jian4】
jian 劒【劒 jian4】
jiang 醤【醤 jiang4】
jiao 撹【撹 jiao3】
jiao 覚【覚 jue2】
jie 掲【掲 jie1】
jie 畍【畍 jie4】
jin 菫【菫 jin3】
jin 侭【侭 jin3】
jing 亰【亰 jing1】
jing 経【経 jing1】
jing 浄【浄 jing4】
jiong 烱【烱 jiong3】
ju 倶【倶 ju4】
ju 挙【挙 ju3】
ju 欅【欅 ju3】
ju 拠【拠 ju4】
juan 圏【圏 quan1】
juan 巻【巻 juan4】
jue 絶【絶 jue2】
jun 皹【皹 jun1】
kuang 昿【昿 kuang4】
kuang 砿【砿 kuang5】
kuang 鉱【鉱 kuang4】
kuo 拡【拡 kuo4】
la 蝋【蝋 la4】
lai 頼【頼 lai4】
lai 瀬【瀬 lai4】
lan 覧【覧 lan3】
lao 労【労 lao2】
le 楽【楽 le4】
lei 塁【塁 lei5】
lei 涙【涙 lei4】
li 茘【茘 li4】
li 暦【暦 li4】
li 歴【歴 li4】
li 檪【檪 li5】
lian 聨【聨 lian5】
lian 錬【錬 lian4】
liang 両【両 liang3】
liang 輌【輌 liang4】
lie 猟【猟 lie5】
ling 霊【霊 ling2】
ling 齢【齢 ling2】
liu 畄【畄 liu2】
liu 璢【璢 liu2】
liu 澑【澑 liu4】
long 篭【篭 long2】
long 滝【滝 long2】
mai 売【売 mai4】
man 満【満 man3】
mao 貎【貎 ni2】
me 麼【麼 me5】
meng 萠【萠 meng2】
mian 麺【麺 mian4】
mo 黙【黙 mo4】
mu 嘸【嘸 fu3】
mu 畆【畆 mu3】
nang 嚢【嚢 nang2】
nao 悩【悩 nao3】
nao 脳【脳 nao5】
nao 閙【閙 nao4】
niang 嬢【嬢 niang2】
niang 醸【醸 niang4】
nie 噛【噛 nie4】
ning 侫【侫 ning4】
ou 鴎【鴎 ou1】
po 醗【醗 po4】
po 溌【溌 po1】
pu 舗【舗 pu4】
qi 気【気 qi4】
qian 銭【銭 qian2】
qian 濳【濳 qian2】
qian 籖【籖 qian5】
qiu 逎【逎 qiu2】
qu 駆【駆 qu1】
qu 駈【駈 qu1】
quan 権【権 quan2】
quan 勧【勧 quan4】
rang 穣【穣 rang2】
rang 壌【壌 rang3】
rang 譲【譲 rang4】
ren 仭【仭 ren4】
rong 栄【栄 rong2】
run 閠【閠 run4】
sao 掻【掻 sao1】
sao 騒【騒 sao1】
sao 鯵【鯵 shen1】
se 渋【渋 se5】
shao 焼【焼 shao1】
she 舎【舎 she5】
she 渉【渉 she4】
she 摂【摂 she4】
shen 愼【愼 shen4】
sheng 縄【縄 ying5】
sheng 剰【剰 sheng4】
shi 実【実 shi2】
shi 丗【丗 shi4】
shi 亊【亊 shi4】
shi 釈【釈 shi4】
shou 痩【痩 shou4】
shou 獣【獣 shou5】
sou 捜【捜 sou1】
su 粛【粛 su4】
sui 髄【髄 sui3】
sui 砕【砕 sui4】
sui 穂【穂 sui4】
suo 簔【簔 suo1】
teng 籘【籘 teng2】
tie 鐡【鐡 tie3】
ting 聴【聴 ting1】
ting 廰【廰 ting1】
tou 偸【偸 tou1】
tu 図【図 tu2】
tuan 団【団 tuan4】
tun 呑【呑 tun5】
tuo 楕【楕 tuo3】
wa 膃【膃 wa4】
wan 晩【晩 wan3】
wang 徃【徃 wang3】
wen 穏【穏 wen3】
wu 呉【呉 wu2】
xi 渓【渓 xi5】
xi 煕【煕 xi1】
xi 犠【犠 xi5】
xian 繊【繊 xian5】
xian 纎【纎 xian1】
xian 険【険 xian3】
xian 顕【顕 xian3】
xian 県【県 xian4】
xian 陥【陥 xian4】
xiang 郷【郷 xiang1】
xiao 暁【暁 xiao3】
xiu 繍【繍 xiu4】
xu 続【続 xu5】
xu 聟【聟 xu4】
xun 勲【勲 xun1】
xun 薫【薫 xun1】
ya 圧【圧 ya1】
ya 唖【唖 ya3】
ya 亜【亜 ya4】
yan 塩【塩 yan2】
yan 厳【厳 yan2】
yan 巌【巌 yan2】
yan 焔【焔 yan4】
yan 鳫【鳫 yan4】
yan 験【験 yan3】
yan 艶【艶 yan4】
yang 様【様 yang4】
yao 尭【尭 yao2】
yao 揺【揺 yao2】
yao 薬【薬 yao4】
ye 曵【曵 ye4】
yi 壱【壱 yi1】
yi 訳【訳 yi4】
yi 駅【駅 yi4】
yin 隠【隠 yin3】
yin 飮【飮 yin3】
ying 応【応 ying1】
ying 桜【桜 ying1】
ying 鴬【鴬 ying1】
ying 蛍【蛍 ying2】
ying 営【営 ying2】
ying 蝿【蝿 ying2】
yu 娯【娯 yu2】
yu 楡【楡 yu2】
yu 喩【喩 yu4】
yuan 渕【渕 yuan1】
yuan 縁【縁 yuan2】
za 雑【雑 za2】
zan 讃【讃 zan4】
zang 賍【賍 zang1】
zang 弉【弉 zang4】
zang 臓【臓 zang4】
zao 竃【竃 zao4】
ze 択【択 ze2】
ze 沢【沢 ze2】
zen 譛【譛 zen4】
zeng 増【増 zeng1】
zhai 斎【斎 zhai1】
zhan 桟【桟 zhan4】
zhan 戦【戦 zhan4】
zheng 徴【徴 zheng1】
zhi 値【値 zhi2】
zhu 鋳【鋳 zhu4】
zhuan 専【専 zhuan1】
zhuan 転【転 zhuan3】
zhuang 荘【荘 zhuang1】
zhun 凖【凖 zhun5】
zi 姉【姉 zi3】
zong 惣【惣 zong3】
zong 縦【縦 zong4】
zou 赱【赱 zou3】
zu 爼【爼 zu3】
zuan 鑚【鑚 zuan4】
zuan 纉【纉 zuan3】
zui 酔【酔 zui4】

发表于 2014-2-26 20:06:33 | 显示全部楼层
老王,看了你的这份对比资料
声母和韵母是正确的
但是有很多声调5
这是错误的
 楼主| 发表于 2014-2-26 20:34:51 | 显示全部楼层
本帖最后由 wangyanhan 于 2014-2-26 20:44 编辑
紫光蓝天 发表于 2014-2-26 20:06
老王,看了你的这份对比资料
声母和韵母是正确的
但是有很多声调5
蓝天版主是这样的——

在 “Unihan Database Lookup” 数据库语音信息中,用的是数字声调。对 “阴、阳、上、去” 是用“1、2、3、4” 标注的,对轻声则不标注。俺把轻声则标注成了 “5”(有很多资料上也把轻声标注为 “0” ) 。看来有些不是轻声,可能是“Unihan Database Lookup” 数据库漏掉标注了。

上次俺也发现,乄 原为 “wu5” (可能也是漏掉标注了),但依《汉语大字典》应改为 “wu3” 。这样吧,以后搞个变通,把 “5” 干脆去掉,不标注,以后再慢慢纠正。不过难以全部纠正,这个过程太浩大了呵呵!不标注的变通办法却很现实的呵呵!
发表于 2014-2-26 23:01:36 | 显示全部楼层
声调5以外的也有个别差错
比如

【曽 ceng1】应为【曽 ceng2】和【曽 zeng1】
【犲 cai2】应为【犲 chai2】
【験 yan3】应为【験 yan4】

还有,多音字欠缺读音
【悳 duo2】不应缺少【悳 de2】
【澑 liu4】不应缺少【澑 liu1】
……
 楼主| 发表于 2014-2-26 23:40:18 | 显示全部楼层
紫光蓝天 发表于 2014-2-26 23:01
声调5以外的也有个别差错
比如

    记得《Unicode CJK 拼音表-含41138个汉字的拼音》在加加论坛初发帖时,网友cyf0717就回帖提过“似乎不准确”的话。
    俺回帖说:“其实俺只做了一个收集整理工作,估计还有大量的校改工作有待日后去做。能有广大网友参与,靠群策群力来进行校改工作那是最好不过了呵呵!”
    cyf0717说:“校改也很困难,有本权威字典的“长”只有“长c”没有“长z”……

    俺想也是这样的,“Unihan Database Lookup”数据库——当然是顶级学术机构和众多学者门熔炼出的产品,都似乎多有憾缺,何况俺们呢?    其实俺早就抱着这个宗旨在办事——学《康熙字典》,述而不作……。当然,明显的错误也是要修改的,明显的欠缺也是要补足的,但数量有限呵呵!
发表于 2014-2-27 10:18:30 | 显示全部楼层
老王,你加注音后,这个码表出现了错误
请看
不 ❶4E0D ❷B2BBù/bú
丙 ❶4E19 ❷B1FBǐng
並 ❶4E26 ❷814Bìng
……
 楼主| 发表于 2014-2-27 20:25:54 | 显示全部楼层
紫光蓝天 发表于 2014-2-27 10:18
老王,你加注音后,这个码表出现了错误
请看
不 ❶4E0D ❷B2BBù/bú

万分高兴蓝天版主!及时指出了《Unicode_GB18030编码对应表》(更新3)的加注拼音错误。

今天,俺接着放出了《Unicode_GB18030编码对应表》(更新3修改)稿,删除了第 “ ❸ ” 项新增的汉语拼音。


《Unicode_GB18030编码对应表》(更新3修改)

━━━━
更新列表
━━━━

1、2014.2.6    完成第一稿,合计76131字。
2、2014.2.21   增“12、增补私用A区(73字)”,合计76204字。
3、2014.2.22   增Unicode编码区块英文名。
4、2014.2.26   增“7、Unicode私用区部件及汉字”80字,合计76284字。

说明:
昨天放出的 “(更新3)” 稿,在GB18030编码后,还新增了第 “ ❸ ” 项,对37996个汉字加注了汉语拼音。因制作匆忙,错误不少,故今天又放出了 “(更新3修改)” 稿,删除了第 “ ❸ ” 项新增的汉语拼音。特此说明。

附件下载:仍然在一楼原下载链接。↑↑↑↑↑
发表于 2014-2-28 00:43:26 | 显示全部楼层
老王
你的成果取消了
稍微有一些遗憾
俺的成果却保留了
我挑出的298个日本汉字
将留在这个帖子里了
这对于我们对比中日汉字
也是很有意义的
 楼主| 发表于 2014-2-28 12:24:42 | 显示全部楼层
本帖最后由 wangyanhan 于 2014-2-28 12:32 编辑
紫光蓝天 发表于 2014-2-28 00:43
老王
你的成果取消了
稍微有一些遗憾


有错就改呵呵!

不是取消,是暂时收回,等弄好了再放出呵呵!因为在私用区又新发现了99个汉字部件。

至于“Unicode 6.3.0”数据库语音信息,打算只搜集整理,不搞再创作,这样会引出很多负面效应的,到时会感到力不从心……
再说,资料是开源的,又是最普通的txt文本格式,用户根据各人的需要,想怎么改都可以呵呵!


发表于 2014-2-28 14:22:10 | 显示全部楼层
老王,其实我的原意是这样的:
就用你原来弄的三万多注音的版本
然后把我列出的298个字加上注音
再把码表的格式错误修改一下
就是很完美的了
 楼主| 发表于 2014-3-16 19:18:49 | 显示全部楼层

Unicode_GB18030编码对应表(更新5)已发布

详情介绍和附件下载均一楼
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2019-12-9 02:46

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表