仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关 Issues 约为161
搜索工具
排序方式: 最佳匹配
the pinyin of the entry. jcseg.loadpinyin = 1 ``` 已经开启了加载拼音,但是分词结果没有拼音,搜索的时候也搜索不到,怎么情况?
网上能搜到的大部分文章都是过期和不正确的,用的是很老版本的 Sphinx + Coreseek 插件。 老版本的 Sphinx 不支持中文分词,于是有国人做了一个插件来支持,这个方案主要问题在于,coreseek 已经凉了很久了 某份fork的最后更新是 7 years
true, 编译 jar 包; 2. jcseg.properties 中 jcseg.loadpinyin = 1; 3. 在分词结果中, 也能看到有拼音的结果, "长春/ns/chang chun/null/"; 4. 在搜索中, 我测试 "chang
他方式可以较为显著地提升词性分析的速度? 我目前采用的是在保证句子不被切断的前提下将文章尽可能切割成500字符一下的分段,在分词结束后再重新拼接。如果开启多进程的话,更多分段和较少分段应该如何取舍呢?
.png "微信图片_20210617220807.png") elasticsearch搜索内容和结果完全没有关联,可能是分词器的问题,请介绍一下elasticsearch服务器的正确配置 ![输入图片说明](https://images.gitee
您好作者, 对于将jcseg作为elasticsearch的分词器,想实现中文简体和繁体的相互检索,可行的方法是什么呢?希望您能给些思路啊,看介绍说jcseg有简体和繁体的转换工具什么的没有找到啊。
t恤男会被拆分成 t恤/n t恤衫/n 男/f 不想要 t恤衫/n 这个,改怎么配置,或者用哪种分词模式呢?
php 5.2.9 版本。 换回 friso 1.6.0 使用 robbe 1.6.0 加载就一切正常。 顺便感谢作者,这个分词工具真心不错!
我使用了这个库,我需要分词检索我表中的一个title字段,然后拿出来之后根据state和createtime进行排序,最后发现查询出来的数据只有我所操作的这三个字段,其他字段全部空 ![截图1](https://images.gitee.com/upl
非常感谢您将自己的项目开源。 您的《Jcseg-开发帮助文档》中第9页中“3.创建 ASegment 或者 ISegment 分词实例:”条目下"(1). 不带 Input(构造方法一):"项中的示例代码"Asegment seg = ..."应为"IS
com/PaddlePaddle/Paddle/issues/8047): 使用paddlepaddle进行机器翻译训练,使用的语料是中英文语料,已分词已对齐 引用训练集直接更改的.cache/paddle/wmt/wmt14.tgz里的内容,其他代码参数未修改,在开始程序后出现AssertionError错误

推荐博客

...