找到相关仓库约为886个
搜索工具
排序方式:
最多stars
缅甸语分词工具。A Rule-based Syllable Segmentation of Myanmar Text
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
此组件可用项目初期的小功能上进行基础构建工作和帮助工作:中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记,汉字转拼音、简繁体转换、bloomfilter、指纹去重、SimHash文章相似度计算、词贡献统计。
PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成词库载入,因此内
《基于微服务架构的自然语言分词展示管理系统》(使用JeecgBoot低代码开发平台,2022-03-01发布,v-3.1.0版本,微服务架构)
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
推荐博客
...