感觉 Rime 的分词和搭配很成问题啊

Irilsy · 昨天 23:36 · 824 次点击

如题,用的白霜词库,已经快一年了。虽然一直在用,以前就遇到过这些问题但还能忍受,不过最近经常要写一些东西,这方面的困扰明显严重了很多。


比如下面这些句子:

渐渐地就不在意了: jmjmdejqbuzdyile (「不/在意/了」被理解成了「不再/一乐」)

以前就会这样: yiqmjqhvveyh (「以前/就会」被理解成了「一千九/会」)

不管怎么使劲都不行: bugrzfmeuijbdzbuxk (「不管怎么/使劲/都/不行」 => 「不管怎么/是/筋斗/不行」)

无论如何你都不可能再离开这里了: wulyruhenidzbukengzdlikdvelile (「离开/这里/了」 => 「离开/这/离了」)


还有一些可能有些强求的例子,因为即使是别的输入法也可能处理不好。

这不是你该管的事情: vebuuinigdgrdeuiqk

这种方法会更加有用: image.png 之所以会出现「游泳」这个搭配可能跟我之前有一阵子经常打「游泳」有关,但是我觉得连词性都判断不出来也不太正常吧……


想问问大家有没有什么好的解决办法?

举报· 824 次点击
登录 注册 站外分享
7 条回复  
noisay 小成 昨天 23:43
同感,这个好像几个词库的效果都不是很好
omz 小成 昨天 23:50
你之所以用不联网的输入法,不就是因为你能接受这些缺陷吗
yukino 小成 2 小时前
我选择 [小企鹅输入法]( https://github.com/fcitx-contrib/fcitx5-macos/tree/master) ![不管怎么使劲都不行]( https://s2.loli.net/2024/12/15/7eyh8NEkpxuGn3a.png)
Irilsy 楼主 初学 2 小时前
@yukino #3 谢谢老哥,我研究研究。
NoOneNoBody 小成 1 小时前
好像并没有分词,只是匹配越长优先级越高而已 我这里(养了多年)可以打出“不在意了”,因为词库中有“不在意”
billlee 小成 1 小时前
RIME 没有语言模型,根本没有分词的能力
docx 初学 半小时前
个人觉得词库从自己用了多年的搜狗之类导出,再适应一段时间,就很可以了。大可不必去用什么所谓的三方库。
返回顶部