仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为859
搜索工具
基于HanLP自然语言处理包的elasticsearch分词
Java 34 126 32 更新于 2023-01-10
Go 语言高效分词, 支持英文、中文、日文等
Go 53 119 0 更新于 2023-01-04
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 13 91 33 更新于 2023-01-09
基于 PHP 和 word2vec 的分类器,用于文章、新闻等内容自动分类,项目包含样本训练、识别代码,分词组件用的是 PhpAnalysis,简单灵活。欢迎大家一起优化并完善。
PHP 31 89 44 更新于 2022-10-24
快速中文分词分析word segmentation
Java 14 77 14 更新于 2022-12-20
基于NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java 8 74 18 更新于 2023-01-30
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 67 26 更新于 2022-05-02
该项目已经更换,在码云上不在更新,请更换地址如下。
Python 26 60 8 更新于 2021-07-26
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 59 16 更新于 2022-10-14
Paoding分词器基于Lucene4.x
Java 28 53 29 更新于 2022-04-21
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
Android 21 49 10 更新于 2022-11-15

推荐博客

...