找到相关仓库约为892个
搜索工具
排序方式:
最多forks
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
ient、ElasticsearchTemplate 三种java 客户端,包含索引创建 删除、数据增删改查、批量操作,以及分词、高亮查询等。。。
FoolNLTK 中文处理工具包 特点 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率
基于springboot、websocket的简易聊天室,并分词使用echarts进行词频可视化展示,新人练手向
HanLP作者的新书《自然语言处理入门》详细笔记!业界良心之作,书中不是枯燥无味的公式罗列,而是用白话阐述的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。
一个简单的相似度比对核心。将一片文章拆分一句一句的跟另一篇进行比对,分词使用盘古分词。支持重写比对方法实现自己的比对。
推荐博客
...