仓库 Issues 博客
语言: 全部
排序: 最近更新
找到相关仓库约为912
搜索工具
IK分词器,主要针对lucene进行支持,版本与lucene版本同步
Java 1 0 0 更新于 2023-01-09
分词二开,根据Ik分词得远程词库原理,将远程词库功能加入到此包中
Java 1 0 0 更新于 2023-01-05
分词
1 0 0 更新于 2022-12-30
ParaConc)系列软件中的一款,针对平行语料常见的双语上下对齐语料格式,采取奇偶行分行分引擎标注的方法对英汉、汉英平行语料文本文件进行单个或批量的分词与词性标注,生成标注文本文件。为减小打包软件尺寸,本软件分三个版本分别打包:JIEBA vs NLTK版,PKU vs NLTK版与PYNLPIR
Python 1 0 0 更新于 2022-12-13
沙袋大三课程 信息检索实验 要求做一个自选数据集和中文分词工具的搜索引擎,不涉及爬虫。改了扒来的另一个课设,原先是用英文分词器、检索莎士比亚全集的,换成了中文IK分词器检索江南小说《天之炽》。
1 0 0 更新于 2022-12-13
es 7.5.1 简易搭建elastic,带有中文分词
1 0 0 更新于 2022-11-27
基于HanLP自然语言处理包的elasticsearch分词
Java 35 137 37 更新于 2024-02-05
1.功能单一,只有中文分词功能,没有词性标注及分析等功能 2.分词速度快(词库实现了分块查询,比一般的分词系统上快3-4倍) 3.分词准确率高(实现了管道输出输入,分词过程被划分为多个单独处理的阶段) 4.一键部署,容易使用(可以作为java包直接调用,也可以二次开发,代码开源)
Java 1 2 0 更新于 2023-02-10
MariaDB 全文索引中文分词插件 Jieba Full-Text Parser Plugin 支持Windows版MariaDB
1 0 0 更新于 2022-10-30
springboot+Elasticsearch搜索示例。包含订单搜索(经过线上2亿+订单实践),分词搜索,高亮显示等。
Java 1 0 0 更新于 2022-10-26
医学文本分词标注平台
1 0 0 更新于 2022-10-25

推荐博客

...