仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为859
搜索工具
整理一些比较全的停用词,用于 Lucene 、Solr 等搜索引擎的 分词器使用
Java 1 0 1 更新于 2020-12-19
中文词库/词典,可用于NLP项目、分词等场景。
1 3 1 更新于 2022-12-03
基于中文基础词库,并结合自定义词库进行分词的系统。
PHP 2 10 1 更新于 2022-12-02
以新闻列表页为起点,包含从新闻列表页中解析出详情页url、下载详情页、解析详情页、分词、分类的整个处理过程
Java 2 0 1 更新于 2020-12-19
基于Universal Transformer + CRF 的中文分词和词性标注
1 1 1 更新于 2022-04-05
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
1 0 1 更新于 2021-03-09
拼音匹配,具备分词、缩写、多音字匹配能力 forked from
1 1 1 更新于 2021-06-29
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java 2 7 1 更新于 2022-08-11
接口描述:接收任意文本,将长段中文切词分开;接口平台:eoLinker-API Shop (apishop.net)
PHP 1 1 1 更新于 2020-12-19
使用了solr分词服务、redis缓存、zookeeper分布式、sso单点登录技术等,并使用nginx做图片服务器。
Java 1 0 1 更新于 2022-09-14
分词实验
Python 2 4 1 更新于 2021-06-11

推荐博客

...