仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关 Issues 约为161
搜索工具
排序方式: 最佳匹配
jcseg库:2.6.0 solr字段说明: id 主键 title_most 使用jcseg 检索模式分词 字段 title_ik 使用ik分词器 的字段 solr有这样一条测试数据,如下图: ![输入图片说明](https://images.gitee
请问: 天狗DB对内存要求如何? 索引是如何更新的? 使用自己开发的分词还是用的现有第三方分词
### 版本情况 JDK版本: openjdk_8_202 hutool版本: 最新版 ### 问题描述(包括截图) 1. 复现代码 ```java Console.log("报错了"); ``` 2. 堆栈信息 3. 测试涉及到的文件(注意脱密) 比
如果文章里有这些字符的话,分词出来也有这些字符。应该把这些过滤掉才对吧。
大神,刚刚发现一个情况,autoLoad会影响分词结果,版本2.2.0 autoLoad按我的理解就是词库变化时是否自动加载, 不应该影响分词结果吧? ``` public static void main(String[] args) throws JcsegException
2504_bcd16763_1005939.png "TIM图片20180327122546.png") 问题描述:ktv 分词错误 ,如图描述,如何解决???
[源自github用户biubiuyi](https://github.com/PaddlePaddle/PaddleHub/issues/993): aistudio 中,paddlehub 1.6.0, paddlepaddle 1.7 ``` import
现在遇到一个问题,复杂问题分词会丢一些词组合,`search`模式又不能匹配姓名,能不能中和一下?你百度一个名字也是可以的嘛
elasticsearch7.2版本如何使用你的分词
理想状态是额外含有`kd`,`hq`,`kdhq`分词。 另外有一点想请教作者,检索分词时应该不需要进行拼音分词,因为索引分词中已经存在拼音了,检索时输入什么就搜什么对吧,这种情况下应该怎么设置屏蔽拼音分词呢?
重现条件: 1. 检测模式。 2. 词条中有we,而没有web 3. 分词内容包含web 分词结果为we,而不是期望中的空结果。 这是检测模式下的故意设置吗?看了源码,确实当匹配到就设置为了结果,而没有检测下个位置是否为停止词。 ![输入图片说明](https://gitee

推荐博客

...