仓库 Issues 博客
语言: 全部
排序: 最近更新
找到相关仓库约为1052
搜索工具
黄维在2023秋季写(9.25)写的一个统计微信消息记录做数据分析的项目,可以用来做“话痨榜“之类的,或者分词做词频分析,很好玩,文件中有示意图
1 0 0 更新于 2023-09-25
中英文分词工具包
Java 1 0 0 更新于 2023-09-19
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C 109 368 115 更新于 2024-04-22
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、e
Java 502 2.2k 624 更新于 2024-04-29
RoundCube Webmail是一个基于浏览器,支持多国语言的IMAP客户端,操作界面看起像一个桌面应用程序
PHP 3 6 1 更新于 2024-01-27
根据一段文字 分词api 分出核心词
1 0 0 更新于 2023-09-11
html 文档实现不同网站的站内搜索,对 html 文档完成去标签化 根据去标签化后的文档,进行分词、权重计算,建立正排索引与倒排索引,用于搜索 对搜索关键词进行分词,根据相关度对搜索结果排序,并以Json字符串形式返回结果 实现了文档记录、竞价排名、去掉暂停词的功能
C++ 1 0 0 更新于 2023-09-11
es相关demo, 插件, 分词等等
Java 1 0 0 更新于 2023-09-17
电报聊天记录搜索机器人,支持中日韩等多国语言。
1 0 0 更新于 2023-08-16
PC_UIKit是一个基于Duilib开发的Windows界面库。在原有功能的基础上,修复了若干Bug、扩充已有控件属性;并增加DPI适配、多国语言支持、亚克力模糊效果支持和新增数十种控件类型。
C++ 3 14 9 更新于 2024-02-05
基于PSCWS4的中文分词工具
PHP 1 1 0 更新于 2023-08-22

推荐博客

...