仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为1042
搜索工具
公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。
1 1 3 更新于 2023-07-18
为应用提供全文检索功能,目前的版本(2.x 3.x)基于 Sphinx 0.9.8,支持使用 Python 定义数据源,支持中文分词
C/C++ 3 2 3 更新于 2023-09-12
python3.6-制作一个含有NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词、词性标注、关键词提取、文本分类;由于要打包成exe的关系,我将原本的项目的多个文件的集成到一个python文件(窗体文件)里,只保留了使用这个
Python 2 11 3 更新于 2024-01-19
基于中文分词 敏感词管理 1、词库管理 2、分词函数:高亮文本、敏感词、过滤后文本
Java 1 2 3 更新于 2024-01-17
SpringBoot如何整合Elasticsearch7的IK分词器实战
1 0 3 更新于 2024-03-13
一、地址分词 识别地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等。 二、自定义词库加载 加载自定义词库,人工定向干预地址词库,提升地址分词和关联的准确性。 三、构建中文标准地址库 自动化的地址库工具,可以对低质量的地址分析、修正和建地址库。
Java 2 1 3 更新于 2024-04-25
供了中文分词选项,可对目录内aiml文件进行批量翻译操作。因为内部调用google翻译api,需要再联网条件下才能进行翻译,处理速度也受网络条件影响。另外还集成了ik Analyzer进行中文分词,可通过设置运行参数只进行中文aiml文件的分词操作,此
Java 2 2 2 更新于 2020-12-19
分词
Python 7 13 2 更新于 2021-08-03
啊哈自然语言处理包,提供包括分词、依存句法分析、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。
Java 1 3 2 更新于 2022-01-17
springboot2.2.x 整合es7.4.x 实现ik分词和高亮搜索
Java 1 0 2 更新于 2021-09-13
yii 分词插件
PHP 1 1 2 更新于 2022-03-23

推荐博客

...