仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为748
搜索工具
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java 9 13 8 更新于 2022-06-29
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C 107 342 105 更新于 2022-09-23
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 1 1 更新于 2022-06-21
Elasticsearch的扩展分词词典
1 0 0 更新于 2021-07-26
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
Python 1 1 0 更新于 2021-06-05
通过web服务器对word分词的资源进行集中统一管理。本站是word_web在Github的镜像站点,仅做备份使用。
Java 6 5 1 更新于 2021-10-18
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
Java 4 5 0 更新于 2022-07-20
pscws 中文分词扩展
PHP 1 2 2 更新于 2022-01-13
百度分词
Java 1 0 0 更新于 2022-04-17
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 10 33 9 更新于 2022-04-26

推荐博客

...