找到相关仓库约为1042个
搜索工具
排序方式:
最多forks
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
sphinx结合结巴分词,在 https://github.com/frankee/sphinx-jieba 基础上解决了安装出错问题
Kentico CMS 是一个企业级 Web 内容管理系统和客户体验管理系统,它提供了一整套的功能,内置多国语言支持,用于在内部或云中基于Microsoft ASP.NET平台构建网站、Intranet、社区站点和电子商务解决方案。它支持移动网站、SE
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
基于结巴分词java版实现(https://github.com/huaban/jieba-analysis)进行的改进,以适用于词频统计
PC_UIKit是一个基于Duilib开发的Windows界面库。在原有功能的基础上,修复了若干Bug、扩充已有控件属性;并增加DPI适配、多国语言支持、亚克力模糊效果支持和新增数十种控件类型。
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
基于springboot+netty+websocket+分词+uniapp开发的高性能可扩展的chatgpt小程序H5
推荐博客
...