仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为921
搜索工具
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
C++ 39 232 49 更新于 2024-03-21
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python 52 243 49 更新于 2023-12-04
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java 18 191 42 更新于 2024-03-17
基于HanLP自然语言处理包的elasticsearch分词
Java 35 138 38 更新于 2024-04-03
SpringBoot整合Hadoop,项目功能包括HDFS文件操作、MapReduce分词操作以及案例数据分析,系统推荐,个体价值估算等,进击大数据一小步。
Java 6 43 29 更新于 2024-03-26
Paoding分词器基于Lucene4.x
Java 29 54 28 更新于 2023-08-22
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 68 26 更新于 2023-08-09
tarter便可开始你的项目。封装了数据库操作、认证授权、单点登录、文档操作、工作流、统一支付、WebSocket/Sse、分词敏感词过滤、钉钉通知、微信SDK等各种开箱即用的Starter。还有中间件(如Es、Mq、Flink等)、各场景下应用解决方案的代码示例。
Java 3 131 24 更新于 2024-04-17
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
4 55 24 更新于 2024-04-03
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 20 更新于 2023-06-27
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 60 16 更新于 2023-06-12

推荐博客

...