仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为921
搜索工具
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 1 3 0 更新于 2020-12-19
用于医疗大数据处理的文本信息分类模型首先使用分词算法与doc2vec算法计算文本间的相似度,然后使用KNN聚类方法对文本进行有效聚类。将医生的医嘱文本信息转换为0-1标签信息,方便预测模型进行进一步处理。为了限制项目内存消耗数据做过阉割
Python 1 3 1 更新于 2022-03-01
python3 django2 结合jieba,wordcloud讲excel中内容分词后生成词云,显示到web页面
Python 2 3 1 更新于 2022-04-14
啊哈自然语言处理包,提供包括分词、依存句法分析、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。
Java 1 3 1 更新于 2021-11-09
实现jieba分词+LDA热点话题发现+绘制词云
Python 2 3 0 更新于 2023-02-07
MMSegmentation 是一个基于 PyTorch 的语义分割开源工具箱。它是 OpenMMLab 项目的一部分
1 3 1 更新于 2023-03-01
中文词云【词频统计;过滤指定词汇】
Python 1 3 2 更新于 2024-03-25
中文分词器,这么好用,作者居然不更新了 http://git.oschina.net/wltea/IK-Analyzer-2012FF
Java 2 2 0 更新于 2020-12-18
京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、
1 2 1 更新于 2022-03-30
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译
1 2 0 更新于 2022-06-13
1. 分词:由于企业描述是文本信息,需要对文本信息进行特征提取。文本分词可采用Jieba分词: https://github.com/fxsjy/jieba http://blog.csdn.net/FontThrone/article/details/72782499
1 2 0 更新于 2022-03-06

推荐博客

...