华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 49970|回复: 517

野风精确词库(2015年06月28日更新)

  [复制链接]
发表于 2012-9-30 23:01:44 | 显示全部楼层 |阅读模式
野风精确词库

野风精确词库.zip

2.02 MB, 下载次数: 24017

发表于 2012-10-1 17:55:46 | 显示全部楼层
回复  cenfit
30万和23万区别:
一、30万包含23万,且两者词频是一致的。
二、30万整理工作还在进行中, ...
紫光蓝天 发表于 2012-10-1 16:34


请教,使用23万的词库,是不是还要使用语言模型?
发表于 2012-9-30 23:48:22 | 显示全部楼层
沙发
发表于 2012-10-1 00:03:45 | 显示全部楼层
赞一个
发表于 2012-10-1 11:00:01 | 显示全部楼层
又一个精品
发表于 2012-10-1 11:30:57 | 显示全部楼层
楼主是否可以介绍一下,25万与30万有什么区别,不会只是差了7万此条吧?
发表于 2012-10-1 15:37:18 | 显示全部楼层
多了一个选择!呵呵!
下载试试看!
 楼主| 发表于 2012-10-1 16:34:24 | 显示全部楼层
回复 5# cenfit
30万和23万区别:
一、30万包含23万,且两者词频是一致的。
二、30万整理工作还在进行中,23万已整理完毕。
三、30万以后还会有更新,23万基本不用更新了。
四、30万包含大量词组和理科词汇,23万则很少。
五,30万对语言模型依赖较少,23万对语言模型依赖较多。
六,30万覆盖面较广、兼收并蓄,23万适合有洁癖的人使用
 楼主| 发表于 2012-10-1 17:59:27 | 显示全部楼层
回复 8# 好休闲
两者差异不是十分巨大,如果你以前不用语言模型,23万依然可以不用语言模型。
发表于 2012-10-1 18:04:28 | 显示全部楼层
回复  好休闲
两者差异不是十分巨大,如果你以前不用语言模型,23万依然可以不用语言模型。
紫光蓝天 发表于 2012-10-1 17:59



    谢谢!
发表于 2012-10-2 10:26:24 | 显示全部楼层
回复  cenfit
30万和23万区别:
一、30万包含23万,且两者词频是一致的。
二、30万整理工作还在进行中, ...
紫光蓝天 发表于 2012-10-1 16:34


谢谢蓝天的解释。
发表于 2012-10-2 17:37:53 | 显示全部楼层
怎么感觉蓝天快要成为野风版主的经纪人了,两次词库都是蓝天代为发布的
发表于 2012-10-2 22:22:41 | 显示全部楼层
这个词库去除了很多错词、冷僻词和过于专业的词。
蓝天兄为此词库付出了大量的心血。在此特向蓝天兄表示感谢!
发表于 2012-10-2 22:54:10 | 显示全部楼层
本帖最后由 cenfit 于 2012-10-2 23:40 编辑

感谢野风和蓝天。
又精简了,这个与紫光自带的模型库配合,反应应该很快吧。
====
试用了一会儿,感觉几乎没有缺词现象(按我的打字方式)。
但是,发现没有“定制”这个词。
发表于 2012-10-2 22:57:43 | 显示全部楼层
今天又变为17万了,少了好几万。
 楼主| 发表于 2012-10-3 00:03:11 | 显示全部楼层
感谢野风和蓝天。
又精简了,这个与紫光自带的模型库配合,反应应该很快吧。
====
试用了一会儿,感觉几乎没有缺词现象(按我的打字方式)。
但是,发现没有“定制”这个词。
cenfit 发表于 2012-10-2 22:54

多谢使用,不客气。
这个词库的确能和紫光的语言模型很好地配合,反应也快。
常用词应该没有缺词现象,主要是语言模型给力。
词库里有“订制”,没收录“定制”,下次更新时我会把这个词加上。
欢迎继续提出宝贵意见
发表于 2012-10-3 12:55:28 | 显示全部楼层
怎么悄悄地变为17万了啊
 楼主| 发表于 2012-10-3 13:03:52 | 显示全部楼层
永远的紫光兄,你不就是喜欢小词库吗
发表于 2012-10-3 16:55:00 | 显示全部楼层
希望大神们讨论一下,小词库与紫光默认语言模型库以及中型或大型模型库匹配时的效果,输入反应速度。
用野风兄的这个17万词库,有没有必要匹配中型模型库?
 楼主| 发表于 2012-10-3 17:10:12 | 显示全部楼层
这个17万的配合默认语言模型
上屏速度快、打字准确率高
我觉得cenfit兄是比较识货的
该词库已很难找到错词废词了
发表于 2012-10-3 17:25:42 | 显示全部楼层
本帖最后由 admin03 于 2012-10-3 17:27 编辑

回复 20# 紫光蓝天


    如果要这样精简词库,那么需要单字的精确输入了。一旦遇到生僻的文字,恼火!
一旦没有某个词语的时候,很恼火的。我遇到过几次词库丢失那种类型的问题,输入法完全和费了差不多,这个词库也不大,到时候很多都是需要输入法智能组词
这个好歹有17万,至少不会出现我说的这么倒霉的情况呵呵。
 楼主| 发表于 2012-10-3 17:32:22 | 显示全部楼层
回复 21# admin03
admin03兄,不会的。
从30万到17万,到底删除的是什么呢?
一部分是正如野风兄所说可能一辈子也用不到的生僻词。
另一部分就是语言模型可自动组出的短句。
你可以先只用这一个词库试试效果,
如何呀
发表于 2012-10-3 18:12:17 | 显示全部楼层
小巧玲珑的词库,其实很适合移植到手机上面去。
发表于 2012-10-3 19:47:31 | 显示全部楼层
本帖最后由 wang2lang 于 2012-10-3 19:49 编辑

呵呵。这个词库,俺来评分的话:35分吧(100分制)
没别的理由,就一条,过于精简。
年打字量超过10万(即每天录入300字以上)的,不宜使用……
发表于 2012-10-3 20:09:21 | 显示全部楼层
如果每天打300字以上,都是在一般办公、聊天,不涉及很专业的范畴,呵呵,这个词库完全没有任何问题!
发表于 2012-10-3 20:24:07 | 显示全部楼层
不会哦,每天才三百字
这个量实在是小的没有办法了。
  我周围的好像很少有低于1000字的吧。
发表于 2012-10-3 20:39:01 | 显示全部楼层
是的。
晚上在群里聊聊天,300字是无论如何要超过的,我觉得。
发表于 2012-10-3 20:42:23 | 显示全部楼层
我每天打字估计都在3000字以上。
发表于 2012-10-3 20:47:31 | 显示全部楼层
每天3000字的都是很多的,一不注意有时候很多字的
 楼主| 发表于 2012-10-3 20:55:25 | 显示全部楼层
自从二郎兄发完贴后,本帖就变成1级热门“火”了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2018-6-25 02:14

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表