仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为839
搜索工具
发现、、情感倾向性
1 4 3 更新于 2020-12-20
是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(标记化)、part-of-speech tagging(性标注)、named-entit
Go 4 5 3 更新于 2020-07-14
PHPAnalysis程序使用居于unicode的库,使用反向匹配模式,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量中,由于边边完成库载入,因此内容越
3 4 1 更新于 2020-12-19
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized
Java 1 1 0 更新于 2021-12-21
基于ik-analyzer器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java 1 17 4 更新于 2021-12-21
中文析(LAC) 中文(Word Segmentation)是将连续的自然语言文本,切出具有语义合理性和完整性的汇序列的过程
C++ 4 24 5 更新于 2021-10-20
一个轻量级,基于库的引擎,包含基本的,和混淆字处理等功能。但目前由于缺乏语义理解,后的汇含义会有些不同。
Java 1 0 0 更新于 2020-12-18
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 19 更新于 2022-07-19
基于人民日报语料库,实现以下操作:加载语料库进行n-gram频统计生成典;用生成的典生成有意义的语句;对任意输入语句进行正确,实现FMM和BMM的方法。有GUI界面
Java 1 0 0 更新于 2022-03-08
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim基于频修正jieba中文误拆(其他什么的也可以)
Python 1 1 0 更新于 2021-06-05
手动修改的ik
Java 1 0 1 更新于 2021-10-18

推荐博客

...