找到相关仓库约为1078个
搜索工具
排序方式:
最多stars
ient、ElasticsearchTemplate 三种java 客户端,包含索引创建 删除、数据增删改查、批量操作,以及分词、高亮查询等。。。
农业领域知识图谱的构建,包括数据爬取(百度百科)、数据分类、利用结构化数据生成三元组、非结构化数据的分句(LTP),分词(jieba),命名实体识别(LTP)、基于主谓关系的关系抽取、基于模板(正则表达式)的关系抽取、基于半监督学习Bootstrapp
SVM Neuro Matching C#机器学习 LibSVM支持向量机 神经网络 匹配 中文文本分词分类聚类
PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。 由于PHPAnalysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成词库载入,因此内
本仓库构建了基于知识图谱的网络空间安全问答系统。系统基于Python实现,网络空间安全知识图谱由neo4j存储。问答模块使用jieba分词的词性标注完成命名实体的提取,使用 TF-IDF 特征提取算法和朴素贝叶斯算法实现问句分类。
Lucene分词 解析收货地址 单省市区 省市区街道收件人详细地址 参考:https://github.com/IOrzo/chineseaddressanalyzer
推荐博客
...