仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为869
搜索工具
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具
Java 4 12 6 更新于 2023-03-16
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
Java 4 22 8 更新于 2023-03-29
基于Lucene索引+IkAnalyzer分词器+WebService实现搜索引擎服务
Java 3 2 2 更新于 2022-06-13
jieba.NET 是 jieba 中文分词的 .NET 版本(C#实现)
3 2 3 更新于 2022-08-05
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl 3 26 0 更新于 2022-10-09
中文分词库 IKAnalyzer,基于IK-Analyzer-2012FF修改而来,适用Lucene 5.2.1
Java 3 1 1 更新于 2020-12-19
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 8 11 更新于 2023-01-27
solr5版本以上IK分词器 支持扩展词、停用词、同义词热更新
3 1 0 更新于 2021-10-29
PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成词库载入,因此内
3 4 1 更新于 2020-12-19
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
3 17 8 更新于 2023-03-22
中文分词器,这么好用,作者居然不更新了 http://git.oschina.net/wltea/IK-Analyzer-2012FF
Java 2 2 0 更新于 2020-12-18

推荐博客

...