仓库 Issues 博客
语言: 全部
排序: 最近更新
找到相关仓库约为979
搜索工具
草蟒中文分词库——结巴(jieba中文版)
Python 1 0 0 更新于 2022-05-20
基于中文基础词库,并结合自定义词库进行分词的系统。 词库将持续进行更新,但2023年起语义理解为新研究方向。
PHP 2 10 1 更新于 2023-04-06
基于AC自动机(Aho-Corasick algorithm)实现的关键词、敏感词、非法词、停用词等匹配替换工具,支持结果分词,忽略大小写,替换文本等功能。适用于在文章中查找关键词;过滤聊天、评论、留言中的敏感词等。
1 0 0 更新于 2022-04-26
基于AC自动机(Aho-Corasick algorithm)实现的关键词、敏感词、非法词、停用词等匹配替换工具,支持结果分词,忽略大小写,替换文本等功能。适用于在文章中查找关键词;过滤聊天、评论、留言中的敏感词等。
1 0 0 更新于 2022-04-26
百度分词词库查询系统
1 0 0 更新于 2022-04-20
百度分词
Java 1 0 0 更新于 2022-04-17
SpringBoot整合Hadoop,项目功能包括HDFS文件操作、MapReduce分词操作以及案例数据分析,系统推荐,个体价值估算等,进击大数据一小步。
Java 6 40 29 更新于 2024-01-17
选择一本喜欢的小说,对该小说进行分析。比如分析该小说的分词,词频,词性,小说人物出场次数排序,小说中食物排序(这个得有,我喜欢吃),小说人物关系等等。
Python 1 3 0 更新于 2023-06-26
SpringBoot如何整合Elasticsearch7的IK分词器实战
1 0 2 更新于 2022-08-24
中文分词,最大匹配算法、HMM
1 1 1 更新于 2023-04-07
基于人民日报语料库,实现以下操作:加载语料库进行n-gram词频统计生成词典;用生成的词典生成有意义的语句;对任意输入语句进行正确分词,实现FMM和BMM的分词方法。有GUI界面
Java 1 2 1 更新于 2023-05-05

推荐博客

...