仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为894
搜索工具
IKAnalyzer.NET 是 IKAnalyzer 中文分词器在 .NET 平台下的实现
C# 3 1 0 更新于 2023-09-12
solr5版本以上IK分词器 支持扩展词、停用词、同义词热更新
3 1 0 更新于 2021-10-29
PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成词库载入,因此内
3 4 1 更新于 2020-12-19
elasticsearch-jieba-plugin 是 Jieba 中文分词插件
Java 3 1 2 更新于 2023-08-17
jieba.NET 是 jieba 中文分词的 .NET 版本(C#实现)
3 1 0 更新于 2023-08-17
snailseg:Chinese Words Segment Library in Python 简单的中文分词库 在线分词效果展示 https://snailsegdemo.ap
Python 3 0 0 更新于 2023-09-12
"哑哈"中文分词,更快或更准确,由你来定义
Python 3 0 0 更新于 2023-09-12
TextGrocery 是一个基于SVM算法的短文本分类工具,内置了结巴分词,让文本分类变得简单
C/C++ 3 1 0 更新于 2023-09-12
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java 3 6 3 更新于 2023-09-13
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
3 29 11 更新于 2023-09-15
FoolNLTK 中文处理工具包 特点 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率
3 1 2 更新于 2023-09-12

推荐博客

...