仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为922
搜索工具
结巴分词
Python 1 0 0 更新于 2021-10-22
我打算DIY一个智能家居项目,需要对语句进行中文分词,之前想用jieba做,但是jieba的速度很是无奈,不适合做实时语音信息提取,所以根据分词算法编写了这个工具。
1 0 0 更新于 2020-12-19
php中实现的中文分词算法
PHP 1 1 1 更新于 2023-06-26
基于人民日报语料库,实现以下操作:加载语料库进行n-gram词频统计生成词典;用生成的词典生成有意义的语句;对任意输入语句进行正确分词,实现FMM和BMM的分词方法。有GUI界面
Java 1 2 1 更新于 2023-05-05
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
Python 1 1 0 更新于 2022-12-14
1+elasticsearch6.5.3搭建的企业级搜索平台,支持PB级数据(elasticsearch分布式部署),目前已经支持中文分词,检索关键词高亮操作,如果帮到您,麻烦点下Star,谢谢。
Java 231 1.4k 537 更新于 2024-04-22
分词,中文分词
PHP 2 2 1 更新于 2021-03-30
词法分析:对源文件进行扫描,将源文件的字符归类,划分为一个一个的记号(token)
C 1 1 0 更新于 2023-09-26
IK分词器,主要针对lucene进行支持,版本与lucene版本同步
Java 1 0 0 更新于 2024-03-27
一个分词算分的demo
Java 1 0 0 更新于 2020-12-19
手动修改的ik分词
Java 1 0 2 更新于 2024-03-24

推荐博客

...