仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为976
搜索工具
一个没有语料字典的中文分词代码
Python 4 5 1 更新于 2020-12-19
中文分词;关键词提取;自动摘要;文本分类
Java 4 6 2 更新于 2023-05-25
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
Java 4 5 0 更新于 2022-07-20
IK-Analyzer分词maven修改版本并且兼容Lucene5.3.x
Java 4 0 1 更新于 2021-05-24
本项目实现为“搞个大新闻”网站后台python脚本部分。 实现了对中国新闻网,凤凰网,新浪新闻网的新闻爬虫 完成了新闻分词,两次TF-ID值计算完成特征提取,DBSCAN数据聚类, 基于内容的个性化推荐等 源码文档中:fenghuangnews.py,xinlangnews
4 11 3 更新于 2022-05-02
es 搜索引擎java api封装,安装es版本为2.3.4 ik分词
Java 4 5 3 更新于 2021-09-14
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
4 49 21 更新于 2024-02-19
基于Lucene索引+IkAnalyzer分词器+WebService实现搜索引擎服务
Java 3 2 2 更新于 2022-06-13
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 8 11 更新于 2023-01-27
中文分词库 IKAnalyzer,基于IK-Analyzer-2012FF修改而来,适用Lucene 5.2.1
Java 3 1 1 更新于 2020-12-19
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl 3 27 0 更新于 2023-12-21

推荐博客

...