华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 11264|回复: 32

再来几个生僻字,你认识几个?

[复制链接]
发表于 2009-10-9 13:24:25 | 显示全部楼层 |阅读模式
今天又看到几个生僻字,认识的并不多。大家一起学习交流一下,看有几个是你认识的?

[ 本帖最后由 cunqiu 于 2009-10-9 13:26 编辑 ]
生僻字1.gif
生僻字2.gif
生僻字3.gif
 楼主| 发表于 2009-10-9 14:34:40 | 显示全部楼层
烜、 烓、燚、瑱以及琤的读音分别见附件,其中“琤”通过紫光看到的候选字与实际生成的貌似不一致。
更多图片 小图 大图
组图打开中,请稍候......
发表于 2009-10-9 15:53:33 | 显示全部楼层
0063.gif 0064.gif 选用字体不同所致。

[ 本帖最后由 sanwsw 于 2010-6-13 21:51 编辑 ]
 楼主| 发表于 2009-10-9 16:45:18 | 显示全部楼层
原帖由 sanwsw 于 2009-10-9 15:53 发表
选用字体不同所致。


经过验证,确实与字体有关,宋体不正常,仿宋体正常,不应该与选用的字体有关啊。其它输入法的宋体是正常的。
紫光仿宋.gif
紫光宋体.gif
1宋体.gif
发表于 2009-10-9 17:11:00 | 显示全部楼层
原帖由 cunqiu 于 2009-10-9 16:45 发表


经过验证,确实与字体有关,宋体不正常,仿宋体正常,不应该与选用的字体有关啊。其它输入法的宋体是正常的。

不应该与字体有关,看来还是程序上的问题!希望开发组……
1.png

 楼主| 发表于 2009-10-9 17:17:00 | 显示全部楼层
原帖由 野风 于 2009-10-9 17:11 发表

不应该与字体有关,看来还是程序上的问题!希望开发组……


顶一下···
发表于 2009-10-9 18:01:56 | 显示全部楼层
我这儿挺正常的。大家都有问题么?

111.PNG
发表于 2009-10-9 18:03:19 | 显示全部楼层
错了,我的是雅黑
发表于 2009-10-9 18:10:33 | 显示全部楼层
原帖由 sunmd 于 2009-10-9 18:01 发表
我这儿挺正常的。大家都有问题么?

3671


sunmd兄,是的!我周围用紫光的几个人,只要皮肤的中文字是宋体,这个字都是如此。
发表于 2009-10-9 18:44:06 | 显示全部楼层
我的初步判断:xp下宋体“琤”用的是旧字形,4楼新字形(就是“正常”的那个)不是仿宋,xp仿宋应该没“琤”,可能是调用了新宋体。
 楼主| 发表于 2009-10-9 20:28:31 | 显示全部楼层
在宋体下,输入候选字里看到的“琤”是有点问题,但上屏后却是正确的。请各位试试。
紫光宋体.gif
发表于 2009-10-9 20:57:00 | 显示全部楼层
原帖由 cunqiu 于 2009-10-9 20:28 发表
在宋体下,输入候选字里看到的“琤”是有点问题,但上屏后却是正确的。请各位试试。

是的!估计是输入法调用字形错误。
发表于 2009-10-9 21:27:31 | 显示全部楼层
肯定与字体有关。我的系统默认字体是修改过的雅黑化宋体,不好验证。

0008.GIF

[ 本帖最后由 sanwsw 于 2009-10-9 21:47 编辑 ]
发表于 2009-10-9 21:43:26 | 显示全部楼层
推翻10楼说法。xp仿宋确实没“琤”,但显示为新字形还是旧字形,与新宋体、宋体差别无关。新宋体、宋体都是在12号下“琤”显示为旧字形,在其他字号下显示为新字形。
 楼主| 发表于 2009-10-9 22:35:15 | 显示全部楼层
原帖由 mmm 于 2009-10-9 21:43 发表
推翻10楼说法。xp仿宋确实没“琤”,但显示为新字形还是旧字形,与新宋体、宋体差别无关。新宋体、宋体都是在12号下“琤”显示为旧字形,在其他字号下显示为新字形。


在你的提醒下,再次验证了“琤”,前提条件是候选字词个数为8个,中文字体为宋体。我发现在官方提供的字体大小从12个像素到32个像素中,只有默认的字体大小为16个像素的存在问题,其它字体大小下没有问题。
更多图片 小图 大图
组图打开中,请稍候......
 楼主| 发表于 2009-10-9 22:50:00 | 显示全部楼层
在宋体下,再看看其它输入法是不是也与字体大小有关系?经过验证发现,搜狗输入法和QQ输入法也存在类似问题。

搜狗输入法只有字体大小为16时不正常,其它字体大小正常;QQ输入法只有字体大小为12时不正常,其它字体大小正常。
搜狗琤16.gif
搜狗琤18.gif
QQ琤12.gif
QQ琤15.gif
发表于 2009-10-10 03:41:01 | 显示全部楼层
是不是点阵字体会出现这种问题?
发表于 2009-10-10 06:51:01 | 显示全部楼层
cunqiu兄厉害!工作做得到家了!
恭喜!cunqiu兄已经成为了“论坛元老”了!


 楼主| 发表于 2009-10-10 08:36:13 | 显示全部楼层
原帖由 野风 于 2009-10-10 06:51 发表
cunqiu兄厉害!工作做得到家了!
恭喜!cunqiu兄已经成为了“论坛元老”了!


谢谢了,俺还得继续学习啊,水平还有待提高。
发表于 2009-10-10 08:43:30 | 显示全部楼层
实至名归,恭喜恭喜!
发表于 2009-10-10 09:23:00 | 显示全部楼层
还不算完,有更诡异的如图所示:明明显示的是6画的“争”,却按“爭”归到了8画里面。

[ 本帖最后由 kingdick 于 2009-10-10 09:25 编辑 ]
2.png
发表于 2009-10-10 10:26:53 | 显示全部楼层
搞清楚了问题的原因:显示大小变化为何会引起字体的变化?

很奇怪啊!楼上显示出来的繁体文字,应该是细明体,而非宋体。而且,从“呈”字来看,放大图片的话就可以看到这个字在不同的大小下,也是不同的字体。

为什么呢?哪位可以回答一下呢?
发表于 2009-10-10 12:38:12 | 显示全部楼层
具体字形的提取及其在屏幕上画出的windows底层机制尚不完全明了,对于已经把握到的知识,想用通俗的文字表达,也一言难尽,且深具挑战,姑且放一放,有待继续研究和普及。
关于字号之16或12,个人有些认识,加上一些猜测,试着说明如下:
1.基于某些历史原因(想彻底说清楚不容易,暂略),windows字体的属性中有关显示大小的,有尺寸(size)和高度(height)两项,size用正整数表示,height用负整数表示
,两者的绝对值比例是4:3,设定任何一个,另外一个则同比变化;有的程序(不限于输入法)告知操作系统显示字符时,设定height值(如-16),有的则设定size值(如12),从实际效果看,两者均可,故不同软件中的具体数值设定就出现了两个数值序列,各有各的道理,难以强制统一。
1)设定height的,是看中该数值与屏幕上的像素个数相当,对于脑子里以像素为单位来体会大小的人适用;
2)设定size的,是继承印刷领域的度量单位(磅),以1/72英寸为一磅,数值12对应的为1/6英寸大小(转换为毫米,则为4.23mm,即在一厘米的纸上,能够印出两个字符左右吧);绝大多数编辑器采用windows的标准字体选择对话框来让用户设定字体,大小的度量就采用这种风格,对于汉字,还有相应的别名,如“小四”对应12磅,“二号”对应20磅,“小初”对应36磅等等;实际上,如果是将字符画在屏幕上,操作系统还要按照4:3的比例转换为像素个数的,所以,有些铁定知道最终目的地是屏幕的软件,也就用前述的height属性来设定了;
3)关于本帖所指的“琤”字在不同字号下显示有别的情形,我的猜测是:对于12磅或16像素的字体大小,windows显示字符时,用的是点阵字库(继承自久远的DOS年代,16×16的规格是最通用的点阵字库,高精度的24×24点阵应用并不广泛),对于其它字号,系统提取字形信息用的是矢量字库(TrueType,一种曲线字体);采用点阵字库,则因字体缩放时的棱角处理缺乏良方,难以改善视觉效果,往往表现为锯齿现象严重,呈现出逐渐没落的趋势,windows在少数场合还在沿用它,大概是点阵的画出方法最简单,性能最高之故;“琤”字在点阵字库中的位图信息,应该就是近乎繁体风格的那个样子,而按照矢量字库中的曲线描述,画出来的就是简体风格的样子,且放大时平滑圆润,理所应当地受到精益求精的人们之青睐。


本回复的另一目的是为诸多输入法鸣一嗓子不平:有关字符显示的活儿,一直是由操作系统把持着的,输入法不宜跳出来宣称对此负责。
究其本质,输入法的功效仅仅是完成字词句编码的转换——由拼音、笔画、五笔、自定义短语等林林总总的英文字母(拼音和五笔等都是用字母来表达)与数字(按某个数字键
将中意的候选上屏操作可视作输入完整编码的末位吧)的组合字符串码流转换成所谓的字符内码(对于汉字来说,或GB系列,或Unicode之UTF-16LE),然后把一个或一串儿内码甩给操作系统,由它去调取相应的字库、提取适当的字形或方法、画在输出设备上,再由它通知应用程序实现存储、传输等操作。若干种输入法的比拼要点也在于如何把这种编码的转换弄得方便快捷,干涉不到字符显示出来什么样子等底层实现。
发表于 2009-10-10 12:43:18 | 显示全部楼层
哇,我滴神呀,看了这个帖子,我觉得我是真正的无知……
 楼主| 发表于 2009-10-10 12:59:51 | 显示全部楼层

回复 23楼 的帖子

经过认真的学习,对字符显示有了进一步的认识···
发表于 2009-10-10 17:04:53 | 显示全部楼层
原帖由 kingdick 于 2009-10-10 09:23 发表
还不算完,有更诡异的如图所示:明明显示的是6画的“争”,却按“爭”归到了8画里面。


这个问题也想听听四哥的解释。
发表于 2009-10-10 17:27:24 | 显示全部楼层
原帖由 野风 于 2009-10-10 17:04 发表


这个问题也想听听四哥的解释。



查看了字库,发现这部分汉字是依据笔画数排序的。繁体和简体都是同一个码位,因此这是按照繁体排序的。
发表于 2009-10-10 17:42:14 | 显示全部楼层

回复 21楼 的帖子

CJK部首笔画按康熙标准,而不是新华标准(除非简化字),紫光这个程序的素材应该源自Unicode相关资料。“爪琤”和“刀琤”一般不看作繁简关系,而看作旧、新字形的不同,所以琤是玉部8笔。大家可以再看“娜”,女部7笔,而不是6笔。
发表于 2009-10-10 17:56:04 | 显示全部楼层

回复 22楼 的帖子

如果是细明体,“鏳”右上是八,而非丷,“琤”右上的“爪”的走向也是类似的变化,所以cunqiu用的不是细明体。
汉字字体在小字号下多要用点阵,12到16像素的字形都是单独的。“琤”恰好就是16像素的字形出了差错。“呈”的字形应该没变化,只是在某个没做点阵字形的字号下,插值计算生成的衬线很难看。
发表于 2009-10-10 18:16:59 | 显示全部楼层
原帖由 mmm 于 2009-10-10 17:42 发表
CJK部首笔画按康熙标准,而不是新华标准(除非简化字),紫光这个程序的素材应该源自Unicode相关资料。“爪琤”和“刀琤”一般不看作繁简关系,而看作旧、新字形的不同,所以琤是玉部8笔。大家可以再看“娜”,女部7 ...

受教了!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2020-10-27 02:19

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表