仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为1078
搜索工具
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
4 56 25 更新于 2024-04-25
H5可以使用的汉字转拼音库 实现汉字转拼音 实现汉语单词转拼音 实现汉语句子转拼音,在一定程度解决多音字问题
JavaScript 15 84 23 更新于 2024-02-14
TCC-Tiny C Compiler C语言编译器中文版是一款完整的可以商业使用的全中文开源编译器,可以完美的实现汉语编程,同时也是学习编译原理,编译器开发,链接器开发等少有的完整的编译器的源代码参考对象。在商业使用的时候一定要加上原作者-Fabri
C 8 64 20 更新于 2024-04-10
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 20 更新于 2023-06-27
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 61 16 更新于 2024-04-29
快速中文分词分析word segmentation
Java 14 79 15 更新于 2024-02-21
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java 6 61 15 更新于 2024-04-25
盘古分词组件,Forked from Eaglet
C# 13 39 14 更新于 2024-04-26
地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该
Python 5 17 14 更新于 2023-02-10
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
Java 7 33 14 更新于 2024-04-30
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
Java 10 29 13 更新于 2024-04-01

推荐博客

...