仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为976
搜索工具
词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划
HTML/CSS 3 1 0 更新于 2023-08-17
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized
Java 3 3 0 更新于 2023-08-17
为应用提供全文检索功能,目前的版本(2.x 3.x)基于 Sphinx 0.9.8,支持使用 Python 定义数据源,支持中文分词
C/C++ 3 2 3 更新于 2023-09-12
IKAnalyzer.NET 是 IKAnalyzer 中文分词器在 .NET 平台下的实现
C# 3 1 0 更新于 2023-09-12
solr5版本以上IK分词器 支持扩展词、停用词、同义词热更新
3 1 0 更新于 2021-10-29
elasticsearch-jieba-plugin 是 Jieba 中文分词插件
Java 3 1 2 更新于 2023-08-17
jieba.NET 是 jieba 中文分词的 .NET 版本(C#实现)
3 1 0 更新于 2023-08-17
snailseg:Chinese Words Segment Library in Python 简单的中文分词库 在线分词效果展示 https://snailsegdemo.ap
Python 3 0 0 更新于 2023-09-12
"哑哈"中文分词,更快或更准确,由你来定义
Python 3 0 0 更新于 2023-09-12
TextGrocery 是一个基于SVM算法的短文本分类工具,内置了结巴分词,让文本分类变得简单
C/C++ 3 1 0 更新于 2023-09-12
PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成词库载入,因此内
中英文分词 3 5 2 更新于 2023-11-02

推荐博客

...