仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为748
搜索工具
mmseg4j core 使用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器。
Java 1 0 0 更新于 2020-07-14
Java分布式中文分词组件 - word分词
1 0 0 更新于 2020-12-19
汉语文本字数统计,汉语分词,词频统计,分词等级统计,词汇多样性,词汇复杂度计算,根据分词等级作色工具
Python 1 0 0 更新于 2022-07-15
Prose 是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(标记化)、part-of-speech tagging(词性标注)、named-entit
Go 4 5 3 更新于 2020-07-14
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
Java 1 0 0 更新于 2020-12-19
GoJieba 是 Jieba 分词 (结巴中文分词)的 Golang 语言版本分词
1 2 0 更新于 2022-03-09
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
Java 1 0 0 更新于 2021-09-18
Springboot2.1+Solr7.5搭建的企业级搜索平台,项目目前支持文档内容和数据库检索,已经集成分词技术。支持文档内容检索类型包含:pdf、doc、docx、ppt、pptx、txt、log等 数据库已支持MySQL增量自动建立索引,如果帮到您,麻烦点下Star,谢谢。
Java 220 1.2k 406 更新于 2022-09-28
结巴分词
Scala 1 0 0 更新于 2020-12-19
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 0 0 更新于 2020-12-19
中文分词:elasticsearch-analysis-ik
1 0 0 更新于 2020-12-19

推荐博客

...