仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为886
搜索工具
结巴分词(java版)
Java 1 0 1 更新于 2021-12-20
自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool)
1 1 1 更新于 2021-12-07
ik分词器插件
1 0 1 更新于 2022-06-15
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
2 0 1 更新于 2022-07-19
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 1 1 更新于 2022-06-21
整理一些比较全的停用词,用于 Lucene 、Solr 等搜索引擎的 分词器使用
Java 1 0 1 更新于 2020-12-19
以新闻列表页为起点,包含从新闻列表页中解析出详情页url、下载详情页、解析详情页、分词、分类的整个处理过程
Java 2 0 1 更新于 2020-12-19
基于Universal Transformer + CRF 的中文分词和词性标注
1 1 1 更新于 2022-04-05
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
1 0 1 更新于 2021-03-09
拼音匹配,具备分词、缩写、多音字匹配能力 forked from
1 1 1 更新于 2021-06-29
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java 2 7 1 更新于 2022-08-11

推荐博客

...