一个轻量级,基于词库的分词引擎,包含基本的分词,和混淆字处理等功能。但目前由于缺乏语义理解,分词后的词汇含义会有些不同。
Java
1
0
0
更新于 2020-12-18
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
通过web服务器对word分词的资源进行集中统一管理。本站是word_web在Github的镜像站点,仅做备份使用。
Java
6
6
2
更新于 2023-03-06
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
Java
4
5
0
更新于 2022-07-20
对词语级别的分词,实现RNN分类标题
Python
1
0
0
更新于 2023-04-12
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java
2
7
1
更新于 2022-08-11
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python
11
36
9
更新于 2023-09-12
模仿结巴分词的HMM模式的NodeJs环境的分词工具, 词典数据来自 结巴分词, 感谢 结巴分词.
TypeScript
1
1
0
更新于 2021-04-04
使用office进行分词,可对中文泰文及其他文字进行分词。
手动修改的ik分词器
Java
1
0
1
更新于 2021-10-18