仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为11010
搜索工具
快速中文分词分析word segmentation
Java 14 76 13 更新于 2022-07-29
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python 52 225 46 更新于 2022-08-10
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、e
Java 483 1.9k 565 更新于 2022-11-26
结巴中文分词做最好的Python分词组件
Python 81 257 69 更新于 2022-11-07
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java 169 462 217 更新于 2022-11-28
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要
Python 77 360 123 更新于 2022-11-28
Go 语言高效分词, 支持英文、中文、日文等
Go 53 116 0 更新于 2022-11-13
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
Python 1 1 0 更新于 2021-06-05
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 59 16 更新于 2022-10-14
基于人民日报语料库,实现以下操作:加载语料库进行n-gram词频统计生成词典;用生成的词典生成有意义的语句;对任意输入语句进行正确分词,实现FMM和BMM的分词方法。有GUI界面
Java 1 0 0 更新于 2022-03-08
pscws 中文分词扩展
PHP 1 2 2 更新于 2022-01-13

推荐博客

...