仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为992
搜索工具
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 8 11 更新于 2023-01-27
自然语言处理探索入门的整个心路历程都记录在这个工程下面。保存的内容有: 中文分词: Ansj 复旦大学(fnlp) 中科院(nlp) 斯坦福(Stanford segments、Stanford ner、Stanford pos tagger、Stanford
Java 2 8 3 更新于 2021-10-08
基于java开发的,在springBoot框架上开发的,用到了redis,mongoDB,ElasticSearch IK及其中文分词,搭建fastdfs文件系统,以及rabbitmq,即时通讯用的环信,mysql数据库脚本已没有,需要自己再根据自己需求设计,该项目仅供参考
1 8 1 更新于 2023-07-17
springmvc集成Elasticsearch实现一个简单的全文检索系统,系统包含tika提取文件内容,hanlp进行自然分词、提取短语关键字等
2 8 1 更新于 2024-03-10
本项目由数据爬取、数据清洗、数据存储、预测算法、分词设计等组成。
1 8 1 更新于 2024-01-26
啊哈自然语言处理包,提供包括分词、依存句法分析、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。
Java 2 7 0 更新于 2023-02-04
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java 3 7 3 更新于 2024-04-24
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java 2 7 1 更新于 2022-08-11
狂神聊 ElasticSearch(IK分词器+Rest+集成SpringBoot+实战爬虫项目+完整代码及资料)
Java 1 7 3 更新于 2023-04-20
"结巴"中文分词的Node.js版本
2 6 1 更新于 2021-05-10
通过web服务器对word分词的资源进行集中统一管理。本站是word_web在Github的镜像站点,仅做备份使用。
Java 6 6 2 更新于 2023-03-06

推荐博客

...