仓库 779 Issues ... 博客 ...
语言: 全部
排序: 最佳匹配
找到相关仓库约为779
搜索工具
是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(标记化)、part-of-speech tagging(性标注)、named-entit
Go 4 5 3 更新于 2020-07-14
中文析(LAC) 中文(Word Segmentation)是将连续的自然语言文本,切出具有语义合理性和完整性的汇序列的过程
C++ 4 24 5 更新于 2021-10-20
基于ik-analyzer器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java 1 15 4 更新于 2021-06-28
pscws 中文扩展
PHP 1 1 0 更新于 2021-10-18
一个轻量级,基于库的引擎,包含基本的,和混淆字处理等功能。但目前由于缺乏语义理解,后的汇含义会有些不同。
Java 1 0 0 更新于 2020-12-18
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim基于频修正jieba中文误拆(其他什么的也可以)
Python 1 1 0 更新于 2021-06-05
手动修改的ik
Java 1 0 1 更新于 2021-10-18
基于 python pkuseg 对定值单的名名称进行匹配
Python 1 0 0 更新于 2020-12-19
基于IK-Analyzer-2012FF,为了solr6.0.1改的
Java 1 1 0 更新于 2020-12-18
Elasticsearch的扩展
1 0 0 更新于 2021-07-26

推荐博客

...