仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为385
搜索工具
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、e
Java 481 1.8k 537 更新于 2022-07-04
1+elasticsearch6.5.3搭建的企业级搜索平台,支持PB级数据(elasticsearch分布式部署),目前已经支持中文分词,检索关键词高亮操作,如果帮到您,麻烦点下Star,谢谢。
Java 219 1.2k 469 更新于 2022-06-30
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java 169 457 217 更新于 2022-05-28
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C 106 333 101 更新于 2022-06-14
结巴中文分词做最好的Python分词组件
Python 81 253 69 更新于 2022-05-25
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要
Python 74 341 120 更新于 2022-07-03
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python 52 221 46 更新于 2022-06-03
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 58 15 更新于 2022-03-28
快速中文分词分析word segmentation
Java 14 75 13 更新于 2022-07-01
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 12 75 28 更新于 2022-06-30
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 10 33 9 更新于 2022-04-26

推荐博客

...