仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为923
搜索工具
一个简单的相似度比对核心。将一片文章拆分一句一句的跟另一篇进行比对,分词使用盘古分词。支持重写比对方法实现自己的比对。
C# 1 0 2 更新于 2022-05-30
Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading。本站是superword在Github的镜像站点,仅做备份使用。
Java 4 4 2 更新于 2022-07-06
通过web服务器对word分词的资源进行集中统一管理。本站是word_web在Github的镜像站点,仅做备份使用。
Java 6 6 2 更新于 2023-03-06
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译
1 3 2 更新于 2022-06-13
此组件可用项目初期的小功能上进行基础构建工作和帮助工作:中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记,汉字转拼音、简繁体转换、bloomfilter、指纹去重、SimHash文章相似度计算、词贡献统计。
Java 1 4 2 更新于 2023-02-13
自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁
Java 1 1 2 更新于 2022-11-01
移植 HanLP 中的摘要功能到 .Net 平台,分词改用 jieba.Net。
C# 1 0 2 更新于 2020-12-19
分词测试
C# 1 3 2 更新于 2023-11-17
SVM Neuro Matching C#机器学习 LibSVM支持向量机 神经网络 匹配 中文文本分词分类聚类
C# 2 5 2 更新于 2024-01-05
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 27 2 更新于 2022-01-31
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
Java 0 1 2 更新于 2021-04-21

推荐博客

...