华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 593|回复: 0

拼音输入法的AEO陷阱及其破解思路

[复制链接]
发表于 2017-1-10 14:34:01 | 显示全部楼层 |阅读模式
前几天,我在描述加加的“声母造词功能”时,联想到了这一问题。
原帖地址(第2-4页):
http://www.pkucn.com/thread-356351-2-1.html
在那个帖子,我相信我已经描述清楚了“AEO陷阱”的表现。

陷阱一词,在经济学界挺时髦的,照猫画虎,俺将拼音输入法中的aeo捣乱现象称为“AEO陷阱”。这本是老生常谈,但俺发现,破解此题——不难。
解此题,需要如下的信息检测步骤和逻辑判断:

一、检测:输入的字母串是否包含i、u、v?
1、包含。说明包含正常音节,无需修改字母串。
0、不含。继续检测。

二、检测:是否包含a、e、o?
0、不含。说明是简拼,无需修改字母串。
1、包含。则存在两种可能:
①混拼或全拼,无需修改字母串。如:hanm,寒门
②简拼,需修改字母串。如:h’a’n’m,很爱你们
结论:经两次检测,字母串中若含aeo(不含iuv),则需要两个字母串。一是用户输入的,二是程序自动修改的。

三、用两个字母串同时检索词库
问题至此应该结束了。就是用hanm和h’a’n’m同时检索“寒门”与“很爱你们”。另举两例来说明,因为原理相同。
㈠用Excel的筛选功能来检索汉字。
检索条件:止于1135,或,止于1132(笔画码)
此时可检索到以“元、开”为后半的诸多汉字。
大家不妨用我发在本坛的汉字笔画码数据试一试。
㈡参照“先”与“西安”的检索
这是近些年才解决的问题。就是输入xian,“先”与“西安”同框显示。
其实质是用xian与xi’an两个字母串来检索字库、词库。
先与西安.PNG

四、总结
破解“AEO陷阱”,只需修改用户输入的字母串,即得另一字母串。不要去改动词库结构,那才是真的陷阱。
如此一来,简拼打词(或简拼造词)的所有困扰就全部破解了。
现在看来,这只是一个芝麻粒问题。只是这个芝麻粒,竟然长期困扰输入法界!数十年的大好时光就这么白白流逝了!
研究智能拼音的IT精英们,赶快行动吧。谁搞掂此问题,那就是属于你的创新,而且是首创!问题虽小,但意义重大,有可能颠覆整个拼音输入法市场。搜狗、紫光、QQ、百度、谷歌的小伙伴们,听到了吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2017-4-24 15:28

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表