Gitee 搜索 - Gitee.com

找到相关 Issues 约为26个

搜索工具

排序方式：最佳匹配

最佳匹配最多评论最近发布最近更新

我们为数据集选择了5个最大的类别，每个类别有90000个样本用于培训，12000个样本用于测试。拼音文本的转换采用拼音结合中文分词系统。总共有45万个培训样本和6万个测试样本。目录结构： ![输入图片说明](https://images.gitee.

MindSpore/mindspore #I40GXN 已关闭 1 更新于 2022-06-10

https://github.com/ownthink/Jiagu Jiagu以BiLSTM等模型为基础，使用大规模语料训练而成。将提供中文分词、词性标注、命名实体识别、情感分析、知识图谱关系抽取、关键词抽取、文本摘要、新词发现、情感分析、文本聚类等常用自然语言处理功能。https://github

同济大学-裴喜龙/AutoDataServices #I16QIN 开启中 1 更新于 2019-12-14

# 4. 分词器 ## 4.1. 分词理解 在对Document中的内容进行索引之前，需要使用分词器进行分词 ，分词的目的是为了搜索。分词的主要过程就是先分词后过滤。 - 分词：采集到的数据会存储到document对象的Field域中，分词就是将Doc

千锋北科Java/Java技术提升库 #I3PSKI 已关闭 0 更新于 2021-05-06

这个项目我有一个闭源词库，现在放在github上，最新的词库我还没有更新上来，准备做词库商业销售版，毕竟要养家糊口，见谅，公开的算法部分永久免费开源，作者谢谢大家。

罗瑶光/快速中文分词分析word segmentation #IXYJD 开启中 1 更新于 2019-06-15

推荐博客