仓库 Issues 博客
语言: 全部
排序: 最多stars
找到相关仓库约为976
搜索工具
Paoding分词器基于Lucene4.x
Java 29 54 28 更新于 2023-08-22
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
Android 21 49 10 更新于 2022-11-15
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
4 49 21 更新于 2024-02-19
SpringBoot整合Hadoop,项目功能包括HDFS文件操作、MapReduce分词操作以及案例数据分析,系统推荐,个体价值估算等,进击大数据一小步。
Java 6 40 29 更新于 2024-01-17
盘古分词组件,Forked from Eaglet
C# 13 38 13 更新于 2024-02-08
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 11 37 9 更新于 2023-11-23
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 20 更新于 2023-06-27
基于Elasticsearch的搜索引擎方式智能地址解析。支持地址别名匹配,自定义地址分词。支持中英文地址智能解析。支持国家、省、市、区、镇 地址智能匹配,支持中文繁体字地址解析,后续版本将支持多语言地址解析。
Java 8 32 0 更新于 2023-12-11
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
Java 6 32 12 更新于 2024-02-21
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
Java 10 28 13 更新于 2023-12-18
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl 3 27 0 更新于 2023-12-21

推荐博客

...