仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为1078
搜索工具
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
C++ 39 235 49 更新于 2024-04-26
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
Python 28 232 56 更新于 2024-04-09
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java 18 191 42 更新于 2024-03-17
Go 语言的汉语拼音合集包
Go 41 166 34 更新于 2024-03-14
基于HanLP自然语言处理包的elasticsearch分词
Java 35 138 38 更新于 2024-04-03
tarter便可开始你的项目。封装了数据库操作、认证授权、单点登录、文档操作、工作流、统一支付、WebSocket/Sse、分词敏感词过滤、钉钉通知、微信SDK等各种开箱即用的Starter。还有中间件(如Es、Mq、Flink等)、各场景下应用解决方案的代码示例。
Java 3 136 26 更新于 2024-04-29
Go 语言高效分词, 支持英文、中文、日文等
Go 53 125 0 更新于 2024-01-28
基于 PHP 和 word2vec 的分类器,用于文章、新闻等内容自动分类,项目包含样本训练、识别代码,分词组件用的是 PhpAnalysis,简单灵活。欢迎大家一起优化并完善。
PHP 32 102 50 更新于 2024-04-11
H5可以使用的汉字转拼音库 实现汉字转拼音 实现汉语单词转拼音 实现汉语句子转拼音,在一定程度解决多音字问题
JavaScript 15 84 23 更新于 2024-02-14
快速中文分词分析word segmentation
Java 14 79 15 更新于 2024-02-21
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python 21 68 26 更新于 2023-08-09

推荐博客

...