仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为854
搜索工具
实现了IK分词器通过sql数据库的热加载
Java 1 1 0 更新于 2022-03-20
盘古分词
C# 2 1 0 更新于 2020-12-18
"结巴"中文分词的C++版本
C++ 1 1 0 更新于 2020-12-19
comments analyzing toolbox in Chinese 微博评论分析工具, 实现功能: 1.微博评论数据爬取; 2.分词与关键词提取; 3.词云与词频统计; 4.情感分析; 5.主题聚类
1 1 0 更新于 2021-03-28
solr5.x以上版本中文分词
Java 1 1 0 更新于 2020-12-19
基于jieba分词,CGI,以及谷歌的一些开源库实现的简易搜索引擎
C++ 1 1 0 更新于 2020-12-19
FoolNLTK 中文处理工具包 特点 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率
1 1 2 更新于 2021-05-08
基于杨尚川同志的word分词构建,主要测试1自定义停用词,2.同义词标识,3分词结果重新合并或拆分refine。 注:第一次分词运行较慢,因为要加载和初始化。第二次后会很快。
Java 1 1 0 更新于 2021-10-29
结巴分词(java版)
Java 1 1 0 更新于 2022-09-21
"结巴"中文分词的C++版本
2 1 0 更新于 2020-12-19
基于es7.x的ik分词器源代码,添加了"去mysql中热加载词典"的代码逻辑。
Java 1 1 1 更新于 2022-03-30

推荐博客

...