仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为1078
搜索工具
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java 20 61 16 更新于 2024-04-29
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java 18 191 42 更新于 2024-03-17
elasticsearch便捷版本,集成了一些常用的插件
Java 18 36 20 更新于 2023-06-27
H5可以使用的汉字转拼音库 实现汉字转拼音 实现汉语单词转拼音 实现汉语句子转拼音,在一定程度解决多音字问题
JavaScript 15 84 23 更新于 2024-02-14
快速中文分词分析word segmentation
Java 14 79 15 更新于 2024-02-21
盘古分词组件,Forked from Eaglet
C# 13 39 14 更新于 2024-04-26
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java 11 16 4 更新于 2021-12-13
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 11 37 10 更新于 2024-03-14
一个简单易学,支持汉语,拓展性强,跨平台,面向对象的轻量级编程语言 可在linux-x86/-x86_64 ,rasberry,windows-x86/-x64等系统上正常运行
C 10 26 3 更新于 2024-03-02
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
Java 10 29 13 更新于 2024-04-01
逐浪字库专注中文字体研发,领先的字体研发团队,专注汉语基础数据元研究与文明基石拓荒者,我们试图创造一个更加开放自由的文字创作与使用世界,是中文业界首个开放开源字库企业。~
10 56 7 更新于 2023-11-11

推荐博客

...