Gitee 搜索 - Gitee.com

&& NEW_NAME=${NEW_NAME#./} && unzip -o ${DATA_PATH}中文分词fluid.zip && cp -rf 中文分词fluid/. . && mv jieba_practice_complete.ipynb ${NEW_NAME}"_complete

您好，以下问题帮忙看一下把词条：`必修1/n/bi xiu/null` 必修1的分词结果 most模式：必必修修 1 complex模式：必修1 因为我们索引时使用most模式，搜索使用complex模式，导致“必修1”关键词搜索不到包含必修1的数据

如"海与沙·豚之音"，分词的位置有误（版本:master2.3.0,在elasticsearch中使用），如图![输入图片说明](https://images.gitee.com/uploads/images/2018/0713/000623_318f25ff_948631

### Steps to reproduce 打开 http://jimuyouyou.gitee.io/i3000men/ 输入“公开课” 能看到”慕课“，有“完整,专业,靠谱,大学,自学,公开课”这些标签输入靠谱，和自学，却搜素不出任何东西原因

hi， `漂亮mm`这个词分成如下，如果我索引用search分词，搜索用complex分词，那么我搜'漂亮mm'不是找不到这条记录了？ > search: 漂亮/a mm/en > complex: 漂亮mm/nz

```python _tokenize_chinese_chars，用于切分中文，这里的中文分词很简单，就是切分成一个一个的汉字。也就是在中文字符的前后加上空格，这样后续的分词流程会把没一个字符当成一个词。 ```

词库，不同的方案可以用不同的词库可以有多个manager

"_source": { "description": "哎中文不艾汉语/OCSinaWeiBo Jcseg是基于mmseg算法的一个轻量级中文分词器" }, "highlight": { "description": [ "哎中文不艾汉语/OCSinaWeiBo Jcs

同义词高亮异常

【(北大)高准确度中文分词工具包】'pkuseg-python - python版本：高准确度中文分词工具，简单易用，跟现有开源工具相比大幅提高了分词的准确率。' by LancoPKU GitHub: https://github.com/lancopku/PKUSeg-python

德塔急速分词下载地址: https://gitee.com/DetaChina/Deta_Resource/blob/master/Deta_Parser.jar 德塔中文分词 具体使用方法 见 deta parser 介绍页面. https://gitee

前端的数据检索有一部分需求是对中文的全文检索，mongodb在全文检索方面对中文的支持不好，网上参考了一些解决方案。主要是两个途径： ##1.使用分词库 将中文或者整份数据同步到分词库中，查询时直接查询分词库 ##2.增加字段 在mongo中添加一个字段，将中文转成英文或