仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为992
搜索工具
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl 3 27 0 更新于 2023-12-21
词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划
HTML/CSS 3 1 0 更新于 2023-08-17
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized
Java 3 3 0 更新于 2023-08-17
为应用提供全文检索功能,目前的版本(2.x 3.x)基于 Sphinx 0.9.8,支持使用 Python 定义数据源,支持中文分词
C/C++ 3 2 3 更新于 2023-09-12
IKAnalyzer.NET 是 IKAnalyzer 中文分词器在 .NET 平台下的实现
C# 3 1 0 更新于 2023-09-12
一、地址分词 识别地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等。 二、自定义词库加载 加载自定义词库,人工定向干预地址词库,提升地址分词和关联的准确性。 三、构建中文标准地址库 自动化的地址库工具,可以对低质量的地址分析、修正和建地址库。
Java 3 3 3 更新于 2024-04-30
solr5版本以上IK分词器 支持扩展词、停用词、同义词热更新
3 1 0 更新于 2021-10-29
elasticsearch-jieba-plugin 是 Jieba 中文分词插件
Java 3 1 2 更新于 2023-08-17
snailseg:Chinese Words Segment Library in Python 简单的中文分词库 在线分词效果展示 https://snailsegdemo.ap
Python 3 0 0 更新于 2023-09-12
"哑哈"中文分词,更快或更准确,由你来定义
Python 3 0 0 更新于 2023-09-12
TextGrocery 是一个基于SVM算法的短文本分类工具,内置了结巴分词,让文本分类变得简单
C/C++ 3 1 0 更新于 2023-09-12

推荐博客

...