仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为860
搜索工具
PHP脚本 shell脚本 对solr搜索引擎进行一键安装,一键配置分词以及数据库jar包,连接数据库创建搜索引擎字段模版
PHP 1 1 1 更新于 2020-12-18
spring boot整合javax.mail,mybatis,elasticsearch以及IK分词器,实现邮件的全字段解析以及全文高亮检索、热词生成、词频统计等等....
1 3 1 更新于 2021-05-25
分布式搜索引擎ElasticsSearch学习,包含es安装,ik分词器安装,拼音分词器安装学习;实现基本操作功能,循寻渐进,沉浸式学习es
1 1 1 更新于 2022-10-10
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
1 0 1 更新于 2022-09-18
一个贴吧的关键词爬虫,可以爬取每个吧的第一页所有帖子内容再进行分词统计频率的工具
JavaScript 1 0 1 更新于 2022-02-04
房新数据中文地址分词
1 1 1 更新于 2022-11-26
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类
1 0 1 更新于 2020-12-19
基于ElasticSearch封装的通用型搜索引擎,方便从外部批量导入数据,指定搜索字段,准精确模式与模糊模式进行中文、简拼混合搜索,未采用IK分词模式
Go 1 0 1 更新于 2023-01-22
中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】
1 2 1 更新于 2022-09-22
务需求:文件分析系统对业务文件进行解析推送到Kafka,需要把kafka的数据进行处理后,推送到ES集群并进行分词处理
Java 1 0 1 更新于 2022-09-08
,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。
1 2 1 更新于 2022-09-02

推荐博客

...