仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为924
搜索工具
盘古分词(http://pangusegment.codeplex.com/ ),由于老版本不支持最新Lucene.Net 3.0.3,对其进行了升级,可以支持最新的Lucene.Net 3.0.3。
C# 1 0 1 更新于 2020-12-19
拼音匹配,具备分词、缩写、多音字匹配能力 forked from
1 1 1 更新于 2021-06-29
语义匹配API,通过HTTP请求匹配预设语句列表文件中相似的语句。可通过添加字典使匹配更加精确。分词工具使用的是开源分词项目Ansj,感谢分享!
Java 1 0 1 更新于 2022-02-17
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
1 0 1 更新于 2022-04-12
用于医疗大数据处理的文本信息分类模型首先使用分词算法与doc2vec算法计算文本间的相似度,然后使用KNN聚类方法对文本进行有效聚类。将医生的医嘱文本信息转换为0-1标签信息,方便预测模型进行进一步处理。为了限制项目内存消耗数据做过阉割
Python 1 3 1 更新于 2022-03-01
luke7 添加IK Analyzer分词
Java 2 0 1 更新于 2020-12-19
一个完全干净,配置好Ansj分词和DataImport的Solr
JavaScript 2 0 1 更新于 2020-12-19
solr分词器大补贴, 包括IK ANSJ、过滤器,动态加载词库
2 0 1 更新于 2020-12-19
车功能(商品进行添加、删除、修改、查看操作),订单提交。(2)后台功能:商品增删改查和订单管理。(3)商品搜索(搜索内容进行分词,提取关键字,模糊查询)。(4)QQ在线咨询功能。本项目基本实现完整的B2C网站的功能。二、项目部署:本项目使用Eclipse_EE
1 0 1 更新于 2022-02-28
简单的lucenedemo来实现基于ik分词器的全文搜索案例。
Java 1 0 1 更新于 2020-12-19
中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 自然语言处理
1 0 1 更新于 2020-12-19

推荐博客

...