找到相关仓库约为917个
搜索工具
排序方式:
最多forks
,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。
FudanNLP:复旦大学自然语言处理实验室开发的中文自然语言处理工具包,包含信息检索: 文本分类、新闻聚类;中文处理: 中文分词、词性标注、实体名识别、关键词抽取、依存句法分析、时间短语识别;结构化学习: 在线学习、层次分类、聚类。 Github地址:https://github
spring boot整合javax.mail,mybatis,elasticsearch以及IK分词器,实现邮件的全字段解析以及全文高亮检索、热词生成、词频统计等等....
分布式搜索引擎ElasticsSearch学习,包含es安装,ik分词器安装,拼音分词器安装学习;实现基本操作功能,循寻渐进,沉浸式学习es
基于开源hanlp基础上,拆分和优化而形成的自然语言理解组件库,提供拼音转换、简繁体转换、关键字抽取、自动摘要、自动聚类、文本分类、分词等能力
资源列表,我们将对各个资源项进行编译整理。 整理后的内容,将收录在伯乐在线资源频道。可参考已整理的内容: 《Apache OpenNLP:处理类似分词等常见任务的工具》 《Mallet:NLP工具,支持文档分类、聚类、主题建模》
推荐博客
...