仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为748
搜索工具
作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo等功能...
Java 741 2.4k 968 更新于 2022-09-28
各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java 481 1.9k 554 更新于 2022-09-27
1+elasticsearch6.5.3搭建的企业级搜索平台,支持PB级数据(elasticsearch分布式部署),目前已经支持中文分词,检索关键词高亮操作,如果帮到您,麻烦点下Star,谢谢。
Java 223 1.3k 481 更新于 2022-09-27
Springboot2.1+Solr7.5搭建的企业级搜索平台,项目目前支持文档内容和数据库检索,已经集成分词技术。支持文档内容检索类型包含:pdf、doc、docx、ppt、pptx、txt、log等 数据库已支持MySQL增量自动建立索引,如果帮到您,麻烦点下Star,谢谢。
Java 220 1.2k 406 更新于 2022-09-28
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java 169 461 217 更新于 2022-09-15
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C 107 342 105 更新于 2022-09-23
结巴中文分词做最好的Python分词组件
Python 81 256 69 更新于 2022-09-19
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要
Python 75 349 122 更新于 2022-09-28
Go 语言高效分词, 支持英文、中文、日文等
Go 53 115 0 更新于 2022-09-08
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python 52 225 46 更新于 2022-08-10
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
C++ 38 202 36 更新于 2022-09-23

推荐博客

...