仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为748
搜索工具
基于Elasticsearch的搜索引擎方式智能地址解析。支持地址别名匹配,自定义地址分词。支持中英文地址智能解析。支持国家、省、市、区、镇 地址智能匹配,支持中文繁体字地址解析,后续版本将支持多语言地址解析。
Java 6 27 0 更新于 2022-07-28
Chinese analysis plugin which using IK analysis for Elasticsearch
Java 6 9 4 更新于 2021-12-21
数据库模型映射,自动建表, 自动更新表,数据增删改查, FTS全文搜索, 支持自定义fts3,4,5分词器,可拼音分词. sql,fmdb,wcdb,sqlite3,orm,fts,fts3,fts4,fts5
Objective-C 6 24 3 更新于 2022-05-21
"结巴"中文分词的C++版本
C++ 6 11 5 更新于 2022-06-23
聊天机器人,客服机器人 HTML5版 首先从根据录入的聊天内容,进行分词,然后分析(通过分词软件)出关键词,然后在本地sqlite 库 查询关键字,如果没有查询第三方图灵机器人接口。可做简单的客服。采用javascript+php
JavaScript 6 15 6 更新于 2022-04-27
xmnlp 是一个轻量级中文自然语言处理工具,提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首等功能
Python 5 26 6 更新于 2022-07-22
文本分类器集合 一个强大易用的Java文本分类工具包 特色 功能全面 内置信息检索中各种常用的文本预处理方法,如语言感知分词、词干提取、繁简转换、停用词去除、同义词插入、n-gra
Java 5 10 5 更新于 2022-03-14
地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该
Python 5 16 13 更新于 2022-09-12
SpringBoot整合Hadoop,项目功能包括HDFS文件操作、MapReduce分词操作以及案例数据分析,系统推荐,个体价值估算等,进击大数据一小步。
Java 5 35 24 更新于 2022-08-07
爬取微博内容,存库,lda分词,最后结果呈现的综合demo
Java 5 5 4 更新于 2020-12-19
在原来的2012版本上增加在solr中配置智能分词功能!!
Java 4 8 0 更新于 2022-04-18

推荐博客

...