仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为748
搜索工具
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 7 11 更新于 2022-09-07
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java 2 7 1 更新于 2022-08-11
springmvc集成Elasticsearch实现一个简单的全文检索系统,系统包含tika提取文件内容,hanlp进行自然分词、提取短语关键字等
2 7 2 更新于 2022-04-08
简易分词软件
C 8 7 3 更新于 2022-03-06
啊哈自然语言处理包,提供包括分词、依存句法分析、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。
Java 2 6 0 更新于 2020-12-19
"结巴"中文分词的Node.js版本
2 6 1 更新于 2021-05-10
中文分词;关键词提取;自动摘要;文本分类
Java 4 6 1 更新于 2022-05-30
养疗经 华瑞集:一个集成最新分词,排序,索引,变换,分析,预测, 数据库,ETL, VPCS, 综合 元基催化与肽计算应用研究 的展示作品。 https://gitee.com/DetaChina/DNA_Chromosome_backup20210705
Java 2 6 5 更新于 2022-06-04
FudanNLP:复旦大学自然语言处理实验室开发的中文自然语言处理工具包,包含信息检索: 文本分类、新闻聚类;中文处理: 中文分词、词性标注、实体名识别、关键词抽取、依存句法分析、时间短语识别;结构化学习: 在线学习、层次分类、聚类。 Github地址:https://github
2 6 1 更新于 2022-08-01
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java 1 6 3 更新于 2022-09-21
通过web服务器对word分词的资源进行集中统一管理。本站是word_web在Github的镜像站点,仅做备份使用。
Java 6 5 1 更新于 2021-10-18

推荐博客

...