找到相关仓库约为899个
搜索工具
排序方式:
最多forks
基于springboot、websocket的简易聊天室,并分词使用echarts进行词频可视化展示,新人练手向
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
一个简单的相似度比对核心。将一片文章拆分一句一句的跟另一篇进行比对,分词使用盘古分词。支持重写比对方法实现自己的比对。
Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading。本站是superword在Github的镜像站点,仅做备份使用。
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译
此组件可用项目初期的小功能上进行基础构建工作和帮助工作:中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记,汉字转拼音、简繁体转换、bloomfilter、指纹去重、SimHash文章相似度计算、词贡献统计。
SpringBoot如何整合Elasticsearch7的IK分词器实战
推荐博客
...