Gitee 搜索 - Gitee.com

jcseg库：2.6.0 solr字段说明： id 主键 title_most 使用jcseg 检索模式分词字段 title_ik 使用ik分词器的字段 solr有这样一条测试数据，如下图： ![输入图片说明](https://images.gitee

feedBackNeeded

请问：天狗DB对内存要求如何？索引是如何更新的？使用自己开发的分词还是用的现有第三方分词？

### 版本情况 JDK版本： openjdk_8_202 hutool版本：最新版 ### 问题描述（包括截图） 1. 复现代码 ```java Console.log("报错了"); ``` 2. 堆栈信息 3. 测试涉及到的文件（注意脱密）比

question

如果文章里有这些字符的话，分词出来也有这些字符。应该把这些过滤掉才对吧。

大神，刚刚发现一个情况，autoLoad会影响分词结果，版本2.2.0 autoLoad按我的理解就是词库变化时是否自动加载, 不应该影响分词结果吧? ``` public static void main(String[] args) throws JcsegException

2504_bcd16763_1005939.png "TIM图片20180327122546.png") 问题描述：ktv 分词错误，如图描述，如何解决？？？

[源自github用户biubiuyi](https://github.com/PaddlePaddle/PaddleHub/issues/993): aistudio 中，paddlehub 1.6.0, paddlepaddle 1.7 ``` import

现在遇到一个问题，复杂问题分词会丢一些词组合，`search`模式又不能匹配姓名，能不能中和一下？你百度一个名字也是可以的嘛

elasticsearch7.2版本如何使用你的分词器

理想状态是额外含有`kd`,`hq`，`kdhq`分词。 另外有一点想请教作者，检索分词时应该不需要进行拼音分词，因为索引分词中已经存在拼音了，检索时输入什么就搜什么对吧，这种情况下应该怎么设置屏蔽拼音分词呢？

重现条件： 1. 检测模式。 2. 词条中有we，而没有web 3. 分词内容包含web 分词结果为we，而不是期望中的空结果。这是检测模式下的故意设置吗？看了源码，确实当匹配到就设置为了结果，而没有检测下个位置是否为停止词。 ![输入图片说明](https://gitee