仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为859
搜索工具
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 1 3 0 更新于 2020-12-19
用于医疗大数据处理的文本信息分类模型首先使用分词算法与doc2vec算法计算文本间的相似度,然后使用KNN聚类方法对文本进行有效聚类。将医生的医嘱文本信息转换为0-1标签信息,方便预测模型进行进一步处理。为了限制项目内存消耗数据做过阉割
Python 1 3 1 更新于 2022-03-01
python3 django2 结合jieba,wordcloud讲excel中内容分词后生成词云,显示到web页面
Python 2 3 1 更新于 2022-04-14
啊哈自然语言处理包,提供包括分词、依存句法分析、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。
Java 1 3 1 更新于 2021-11-09
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
1 3 2 更新于 2021-04-12
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译
1 3 2 更新于 2022-06-13
基础的nlp技术的使用,包括分词、词性标注、命名实体识别、依存句法分析、词向量表示、词义相似度计算、短文本相似度计算等
Python 1 3 1 更新于 2022-10-29
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized
Java 1 3 0 更新于 2022-12-29
solr集成tomcat8,集成ik中文分词器,mysql数据导入,相关包均已经包含其中。
Java 1 3 3 更新于 2022-05-26
自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool)
Python 1 3 0 更新于 2022-04-29
啊哈自然语言处理包,提供包括分词、依存句法分析、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。
Java 1 3 2 更新于 2022-01-17

推荐博客

...