仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为886
搜索工具
我打算DIY一个智能家居项目,需要对语句进行中文分词,之前想用jieba做,但是jieba的速度很是无奈,不适合做实时语音信息提取,所以根据分词算法编写了这个工具。
1 0 0 更新于 2020-12-19
基于人民日报语料库,实现以下操作:加载语料库进行n-gram词频统计生成词典;用生成的词典生成有意义的语句;对任意输入语句进行正确分词,实现FMM和BMM的分词方法。有GUI界面
Java 1 2 1 更新于 2023-05-05
基于中文基础词库,并结合自定义词库进行分词的系统。 词库将持续进行更新,但2023年起语义理解为新研究方向。
PHP 2 10 1 更新于 2023-04-06
一个分词算分的demo
Java 1 0 0 更新于 2020-12-19
分词工具分词工具分词工具
1 0 0 更新于 2022-09-20
jieba 分词模块
Python 1 0 0 更新于 2021-07-29
盘古分词源代码备份
C# 2 0 0 更新于 2020-12-19
不用分词统计词频 要求数据量大
1 0 0 更新于 2020-12-19
新词发现、分词、情感倾向性分析
1 4 3 更新于 2020-12-20
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
Python 1 1 0 更新于 2022-12-14
HMM实现分词
1 5 0 更新于 2022-11-03

推荐博客

...