华宇拼音输入法论坛

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 3000|回复: 1

语言模型相关

[复制链接]
发表于 2015-7-16 16:27:45 | 显示全部楼层 |阅读模式
在智能组句时,如果两个相邻的词在语料库中找不到,如何计算这两个词之间的估计概率,在开源代码里面有看到1.0 * freq2 / bigram_data->header.total_word_freq * (1.0 - 1.0 * in_freq1 / freq1);这个公式能大概解释下嘛。有那些因素会影响这个概率。 特别是对(1.0 - 1.0 * in_freq1 / freq1)这部分不理解。谢谢 大神了
发表于 2016-11-21 18:15:19 | 显示全部楼层
将概率统一成词频。这样可以让所有的词频的词频具有横向的可比性。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|华宇拼音输入法网站  

GMT+8, 2019-11-22 07:21

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表