仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为11814
搜索工具
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 60 16 更新于 2023-06-12
"结巴"中文分词的C++版本
C++ 7 16 5 更新于 2024-03-09
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 28 232 56 更新于 2024-04-09
Java开源项目cws_evaluation:中文分词分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java 9 13 8 更新于 2022-06-29
"结巴"中文分词的Node.js版本
2 6 1 更新于 2021-05-10
仿照Sphinx for Chinese,基于sphinx 2.2.9版本,结合cppJieba分词系统,让sphinx支持中文
C++ 7 21 5 更新于 2023-12-27
php中实现的中文分词算法
PHP 1 1 1 更新于 2023-06-26
我打算DIY一个智能家居项目,需要对语句进行中文分词,之前想用jieba做,但是jieba的速度很是无奈,不适合做实时语音信息提取,所以根据分词算法编写了这个工具。
1 0 0 更新于 2020-12-19
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
Android 21 49 10 更新于 2022-11-15
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
Python 1 1 0 更新于 2022-12-14
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java 2 7 1 更新于 2022-08-11

推荐博客

...