仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为870
搜索工具
中文词库/词典,可用于NLP项目、分词等场景。
1 4 2 更新于 2023-03-17
solr中文分词插件,jieba-solr
Java 2 4 2 更新于 2020-12-19
基于springboot、websocket的简易聊天室,并分词使用echarts进行词频可视化展示,新人练手向
Java 1 4 2 更新于 2022-07-07
基于Lucene索引+IkAnalyzer分词器+WebService实现搜索引擎服务
Java 3 2 2 更新于 2022-06-13
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
1 3 2 更新于 2021-04-12
一个简单的相似度比对核心。将一片文章拆分一句一句的跟另一篇进行比对,分词使用盘古分词。支持重写比对方法实现自己的比对。
C# 1 0 2 更新于 2022-05-30
Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading。本站是superword在Github的镜像站点,仅做备份使用。
Java 4 4 2 更新于 2022-07-06
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
1 4 2 更新于 2022-05-13
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译
1 3 2 更新于 2022-06-13
移植 HanLP 中的摘要功能到 .Net 平台,分词改用 jieba.Net。
C# 1 0 2 更新于 2020-12-19
pscws 中文分词扩展
PHP 1 2 2 更新于 2022-01-13

推荐博客

...