仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为1078
搜索工具
Paoding分词器基于Lucene4.x
Java 29 54 28 更新于 2023-08-22
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 68 26 更新于 2023-08-09
Java开源项目cws_evaluation:中文分词分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java 9 13 8 更新于 2022-06-29
汉语文本字数统计,汉语分词,词频统计,分词等级统计,词汇多样性,词汇复杂度计算,根据分词等级作色工具
Python 1 1 0 更新于 2024-01-03
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java 11 16 4 更新于 2021-12-13
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 28 232 56 更新于 2024-04-09
基于HanLP自然语言处理包的elasticsearch分词
Java 35 138 38 更新于 2024-04-03
盘古分词组件,Forked from Eaglet
C# 13 39 14 更新于 2024-04-26
Go 语言高效分词, 支持英文、中文、日文等
Go 53 125 0 更新于 2024-01-28
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 60 16 更新于 2023-06-12
仿照Sphinx for Chinese,基于sphinx 2.2.9版本,结合cppJieba分词系统,让sphinx支持中文
C++ 7 21 5 更新于 2023-12-27

推荐博客

...