找到相关仓库约为859个
搜索工具
排序方式:
最多forks
comments analysing toolbox; 这是一个微博评论分析工具, 实现功能: 1.微博评论数据爬取; 2.分词与关键词提取; 3.词云与词频统计; 4.情感分析; 5.主题聚类
此组件可用项目初期的小功能上进行基础构建工作和帮助工作:中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记,汉字转拼音、简繁体转换、bloomfilter、指纹去重、SimHash文章相似度计算、词贡献统计。
项目框架基于Maven多层级依赖管理,基础框架为SpringBoot ORM框架: Mybatis √ 基于分词搜索框架: Solr K-V缓存:Redis √ RPC:Dubbo √ 服务注册: ZooKeeper √ 作业调度框架: Quartz √
推荐博客
...