仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为11823
搜索工具
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java 2 7 1 更新于 2022-08-11
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 1 1 更新于 2022-06-21
简单中文分词以及flask简易搭建,有许多的不足
Python 1 1 0 更新于 2023-06-01
基于人民日报语料库,实现以下操作:加载语料库进行n-gram词频统计生成词典;用生成的词典生成有意义的语句;对任意输入语句进行正确分词,实现FMM和BMM的分词方法。有GUI界面
Java 1 2 1 更新于 2023-05-05
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl 3 27 0 更新于 2023-12-21
接口描述:接收任意文本,将长段中文切词分开;接口平台:eoLinker-API Shop (apishop.net)
PHP 1 1 1 更新于 2020-12-19
盘古分词组件,Forked from Eaglet
C# 13 38 14 更新于 2024-03-21
PHP 中文工具类,支持汉字转拼音、拼音分词、简繁互转、数字、金额大写;QQ群:17916227。本仓库仅用于存档,不再发布更新日志,请移步 Github:
PHP 62 307 71 更新于 2024-04-23
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包 里面有代码和jar包文件
Java 1 2 0 更新于 2022-03-04
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
Java 4 5 0 更新于 2022-07-20
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 11 37 10 更新于 2024-03-14

推荐博客

...