Gitee 搜索 - Gitee.com

html 2. 【Issues Section】/【问题文档片段】 Windows平台上不支持 BasicTokenizer等分词器，但是mindspore报错信息不准确，具体如下： ``` from mindspore.dataset.text import

sig/minddata mindspore-assistant usability kind/maintenance

1. 如何使用自定义分词器看了文档，可以使用注解设置字段使用什么analyzer和searchAnalyzer，但是枚举中支持的分词器只有 ![输入图片说明](https://images.gitee.com/uploads/images/2022/

安装分词器是不是应该放到plugin

install --index-url https://pypi.douban.com/simple pyecharts ``` 评分词云图 ``` from pyecharts.charts import Page, WordCloud import pandas

希望能参考.现在搜索大部分是java的,神烦这些玩意,要装一堆东西.好用且简单的,只有sphinx,但实时搜索支持差且需要自己做分词.你有希望替代它. :smiley:

html，输出处理（分层，前/后处理）过的数据集； **要求** ：按照设计的数据格式（待更新），基于MindSpore/MindData完成分词等数据处理； **交付件** ： 1. 整理过的原始数据集； 2. 数据处理实现的代码； | 数据集类别 | 原始数据地址 |

html ），我看到文档中说是可以直接通过dict构建的，想问这个类可以直接通过原始数据来构建吗？我现在的数据集是中文，我分词后找中文预训练好的词向量（如 https://github.com/Embedding/Chinese-Word-Vecto

有研究过IK分词器支持正则表达式查询吗？

### 版本情况 JDK版本： openjdk_8_202 hutool版本：最新版 ### 问题描述（包括截图） 1. 复现代码 ```java Console.log("报错了"); ``` 2. 堆栈信息 3. 测试涉及到的文件（注意脱密）比

question

将输入的文本，使用tokenizer进行分词，得到token 2. 进行token to index，得到输入文本的index ## Describe the current behavior 1. 目前在mindspore的编程指南中，有分词器（tokenizer）

usability user/research mindspore-assistant kind/bug

您好，以下问题帮忙看一下把词条：`必修1/n/bi xiu/null` 必修1的分词结果 most模式：必必修修 1 complex模式：必修1 因为我们索引时使用most模式，搜索使用complex模式，导致“必修1”关键词搜索不到包含必修1的数据