仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为859
搜索工具
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
C++ 38 213 40 更新于 2023-01-18
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 13 91 33 更新于 2023-01-09
基于HanLP自然语言处理包的elasticsearch分词
Java 34 126 32 更新于 2023-01-10
Paoding分词器基于Lucene4.x
Java 28 53 29 更新于 2022-04-21
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 67 26 更新于 2022-05-02
SpringBoot整合Hadoop,项目功能包括HDFS文件操作、MapReduce分词操作以及案例数据分析,系统推荐,个体价值估算等,进击大数据一小步。
Java 5 38 26 更新于 2023-01-12
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 19 更新于 2022-07-19
基于NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java 8 74 18 更新于 2023-01-30
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 59 16 更新于 2022-10-14
快速中文分词分析word segmentation
Java 14 77 14 更新于 2022-12-20
地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该
Python 5 16 14 更新于 2022-12-18

推荐博客

...