仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为839
搜索工具
中文分词库 IKAnalyzer,基于IK-Analyzer-2012FF修改而来,适用Lucene 5.2.1
Java 3 1 1 更新于 2020-12-19
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl 3 3 0 更新于 2020-12-19
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 6 11 更新于 2022-04-27
基于Lucene索引+IkAnalyzer分词器+WebService实现搜索引擎服务
Java 3 2 2 更新于 2022-06-13
jieba.NET 是 jieba 中文分词的 .NET 版本(C#实现)
3 2 3 更新于 2022-08-05
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具
Java 3 10 5 更新于 2022-06-26
PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成词库载入,因此内
3 4 1 更新于 2020-12-19
solr5版本以上IK分词器 支持扩展词、停用词、同义词热更新
3 1 0 更新于 2021-10-29
中文分词器,这么好用,作者居然不更新了 http://git.oschina.net/wltea/IK-Analyzer-2012FF
Java 2 2 0 更新于 2020-12-18
solr中文分词插件,jieba-solr
Java 2 4 2 更新于 2020-12-19
"结巴"中文分词的Node.js版本
2 6 1 更新于 2021-05-10

推荐博客

...