仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为741
搜索工具
基于HanLP自然语言处理包的elasticsearch分词器
Java 34 120 29 更新于 2022-08-12
Paoding分词器基于Lucene4.x
Java 28 53 29 更新于 2022-04-21
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 12 76 28 更新于 2022-08-10
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 67 26 更新于 2022-05-02
SpringBoot整合Hadoop,项目功能包括HDFS文件操作、MapReduce分词操作以及案例数据分析,系统推荐,个体价值估算等,进击大数据一小步。
Java 5 35 24 更新于 2022-08-07
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 19 更新于 2022-07-19
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 59 15 更新于 2022-08-10
地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该
Python 5 15 13 更新于 2022-08-19
快速中文分词分析word segmentation
Java 14 76 13 更新于 2022-07-29
基于springboot的在线答题系统,使用HanLP分词器分词,结合mysql自带的全文搜索功能实现问题的全文搜索
Java 1 14 12 更新于 2022-03-09
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 6 11 更新于 2022-04-27

推荐博客

...