仓库 Issues 博客
语言: 全部
排序: 最多forks
找到相关仓库约为1042
搜索工具
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
Java 10 29 13 更新于 2024-04-01
基于springboot的在线答题系统,使用HanLP分词分词,结合mysql自带的全文搜索功能实现问题的全文搜索
Java 1 14 12 更新于 2022-03-09
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
C++ 3 8 11 更新于 2023-01-27
Kentico CMS 是一个企业级 Web 内容管理系统和客户体验管理系统,它提供了一整套的功能,内置多国语言支持,用于在内部或云中基于Microsoft ASP.NET平台构建网站、Intranet、社区站点和电子商务解决方案。它支持移动网站、SE
C# 9 22 10 更新于 2023-11-24
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
Android 21 49 10 更新于 2022-11-15
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 11 37 10 更新于 2024-03-14
基于结巴分词java版实现(https://github.com/huaban/jieba-analysis)进行的改进,以适用于词频统计
Java 1 8 10 更新于 2022-07-19
elasticsearch的ik分词器动态扩展词库
Java 7 18 10 更新于 2024-01-31
PC_UIKit是一个基于Duilib开发的Windows界面库。在原有功能的基础上,修复了若干Bug、扩充已有控件属性;并增加DPI适配、多国语言支持、亚克力模糊效果支持和新增数十种控件类型。
C++ 3 14 9 更新于 2024-02-05
Java开源项目cws_evaluation:中文分词分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java 9 13 8 更新于 2022-06-29
基于springboot+netty+websocket+分词+uniapp开发的高性能可扩展的chatgpt小程序H5
Java 1 21 8 更新于 2024-04-26

推荐博客

...