仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为922
搜索工具
elasticsearch的ik分词器动态扩展词库
Java 7 18 10 更新于 2024-01-31
分词
Python 7 13 2 更新于 2021-08-03
中文词法分析(LAC) 中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程
C++ 7 27 4 更新于 2023-09-12
"结巴"中文分词的C++版本
C++ 7 16 5 更新于 2024-03-09
仿照Sphinx for Chinese,基于sphinx 2.2.9版本,结合cppJieba分词系统,让sphinx支持中文
C++ 7 21 5 更新于 2023-12-27
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
Java 7 33 14 更新于 2024-04-24
通过web服务器对word分词的资源进行集中统一管理。本站是word_web在Github的镜像站点,仅做备份使用。
Java 6 6 2 更新于 2023-03-06
文本分类器集合 一个强大易用的Java文本分类工具包 特色 功能全面 内置信息检索中各种常用的文本预处理方法,如语言感知分词、词干提取、繁简转换、停用词去除、同义词插入、n-gra
Java 6 11 7 更新于 2024-03-12
数据库模型映射,自动建表, 自动更新表,数据增删改查, FTS全文搜索, 支持自定义fts3,4,5分词器,可拼音分词. sql,fmdb,wcdb,sqlite3,orm,fts,fts3,fts4,fts5
Objective-C 6 25 3 更新于 2022-10-03
聊天机器人,客服机器人 HTML5版 首先从根据录入的聊天内容,进行分词,然后分析(通过分词软件)出关键词,然后在本地sqlite 库 查询关键字,如果没有查询第三方图灵机器人接口。可做简单的客服。采用javascript+php
JavaScript 6 15 6 更新于 2022-04-27
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java 6 61 14 更新于 2024-04-17

推荐博客

...