仓库 Issues 博客
语言: 全部
排序: 最近更新
找到相关仓库约为748
搜索工具
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
C++ 38 202 37 更新于 2022-10-01
ik分词改写,加入mysql分词读写
1 0 0 更新于 2022-06-07
Go中文分词 词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划。 支持普通和搜索引擎两种分词模式,支持用户词典、词性标注,可运行JSON RPC服务。 分词速度单线程9MB/s,goroutin
Go 1 0 0 更新于 2022-06-01
用于爬虫,进行预处理,进行分词,文档向量化,文本挖掘,以及可视化分析
1 0 0 更新于 2022-05-29
demo java 后端项目,Spring Boot,MyBatis,Elastic Search,Lucene,Jieba分词等。Justin课堂配套的实战项目。
Java 1 0 0 更新于 2022-05-25
《基于微服务架构的自然语言分词展示管理系统》(使用JeecgBoot低代码开发平台,2022-03-01发布,v-3.1.0版本,微服务架构)
Java 1 4 0 更新于 2022-05-26
中文词库/词典,可用于NLP项目、分词等场景。
1 3 0 更新于 2022-08-25
草蟒中文分词库——结巴(jieba中文版)
Python 1 0 0 更新于 2022-05-20
基于中文基础词库,并结合自定义词库进行分词的系统。
PHP 2 9 1 更新于 2022-09-13
基于AC自动机(Aho-Corasick algorithm)实现的关键词、敏感词、非法词、停用词等匹配替换工具,支持结果分词,忽略大小写,替换文本等功能。适用于在文章中查找关键词;过滤聊天、评论、留言中的敏感词等。
1 0 0 更新于 2022-04-26
基于AC自动机(Aho-Corasick algorithm)实现的关键词、敏感词、非法词、停用词等匹配替换工具,支持结果分词,忽略大小写,替换文本等功能。适用于在文章中查找关键词;过滤聊天、评论、留言中的敏感词等。
1 0 0 更新于 2022-04-26

推荐博客

...