仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为1078
搜索工具
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python 52 243 49 更新于 2023-12-04
Go 语言的汉语拼音合集包
Go 41 166 34 更新于 2024-03-14
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
C++ 39 236 49 更新于 2024-05-05
在U盘和移动硬盘中运行。它支持包括iPhone,iPad在内的手机和平板电脑的浏览和访问。它支持英语、法语、俄语、西班牙语和汉语,方便生活在不同国家的亲属无障碍使用同一套系统。
Java 36 62 33 更新于 2023-10-17
基于HanLP自然语言处理包的elasticsearch分词
Java 35 138 38 更新于 2024-04-03
基于 PHP 和 word2vec 的分类器,用于文章、新闻等内容自动分类,项目包含样本训练、识别代码,分词组件用的是 PhpAnalysis,简单灵活。欢迎大家一起优化并完善。
PHP 32 102 50 更新于 2024-04-11
Paoding分词器基于Lucene4.x
Java 29 54 28 更新于 2023-08-22
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 28 233 57 更新于 2024-05-06
该项目已经更换,在码云上不在更新,请更换地址如下。
Python 26 61 8 更新于 2023-08-09
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 68 26 更新于 2023-08-09
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
Android 21 49 10 更新于 2022-11-15

推荐博客

...