仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为854
搜索工具
敏感词过滤:ik分词的使用,以及DFA算法。只有接口,木有页面
Java 1 2 1 更新于 2022-06-14
百度NLP:分词,词性标注,命名实体识别
1 2 1 更新于 2021-11-22
jieba.NET 是 jieba 中文分词的 .NET 版本(C#实现)
3 2 3 更新于 2022-08-05
PHP 中文工具包,支持汉字转拼音、拼音分词、简繁互转、数字、金额大写;
1 2 1 更新于 2021-04-01
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
Java 1 2 0 更新于 2020-12-19
ctbparser是一个用C++语言实现的开源的中文处理工具包(GBK编码),用于分词、词性标注、依存句法分析,采用的是中文宾州树库(Chinese Tree Bank, CTB)标准。
C++ 1 2 0 更新于 2020-12-18
ik分词器搬运
1 2 0 更新于 2021-10-26
solr-5.5.4与spring集成,增加了账号密码身份验证,增加了zk中文分词,增加了增量导入,mysql数据同步
2 2 0 更新于 2020-12-19
chinese processng 中文处理,有中文转拼音(首拼和全拼)、中文分词等等。
C++ 1 2 0 更新于 2022-10-31
pscws 中文分词扩展
PHP 1 2 2 更新于 2022-01-13
为应用提供全文检索功能,目前的版本(2.x 3.x)基于 Sphinx 0.9.8,支持使用 Python 定义数据源,支持中文分词
C/C++ 1 2 3 更新于 2022-10-21

推荐博客

...