仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为988
搜索工具
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 11 37 10 更新于 2024-03-14
使用office进行分词,可对中文泰文及其他文字进行分词
C# 1 0 0 更新于 2020-12-19
模仿结巴分词的HMM模式的NodeJs环境的分词工具, 词典数据来自 结巴分词, 感谢 结巴分词.
TypeScript 1 1 0 更新于 2021-04-04
调用了中科院的分词程序,打算做一个分词的工具jar
Java 2 1 0 更新于 2020-12-19
该项目已经更换,在码云上不在更新,请更换地址如下。
Python 26 61 8 更新于 2023-08-09
基于 python pkuseg 对定值单的名名称进行分词匹配
Python 1 0 0 更新于 2020-12-19
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 27 2 更新于 2022-01-31
一个轻量级,基于词库的分词引擎,包含基本的分词,和混淆字处理等功能。但目前由于缺乏语义理解,分词后的词汇含义会有些不同。
Java 1 1 1 更新于 2024-04-10
SpringBoot项目利用结巴分词做关键词提取
Java 1 1 0 更新于 2022-03-28
百度分词
Java 1 0 0 更新于 2022-04-17

推荐博客

...