找到相关仓库约为1053个
搜索工具
排序方式:
最多watches
北京邮电大学机器学习创新实践课程大作业,实现了类 jieba 库的中文分词与标记算法以及 TextRank 关键词提取算法
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
tarter便可开始你的项目。封装了数据库操作、认证授权、单点登录、文档操作、工作流、统一支付、WebSocket/Sse、分词敏感词过滤、钉钉通知、微信SDK等各种开箱即用的Starter。还有中间件(如Es、Mq、Flink等)、各场景下应用解决方案的代码示例。
国内流行的多国语言内容管理系统(Tmaic CMS)多端全媒体解决方案,国内首创多语言内容解决方案,Tmaic CMS 系统基于PHP7.X开发,具有很强的可扩展性,并且完全开放源代码。让Tmaic CMS系统拥有简单易用、灵活扩展特性之外更安全、高效
scseg中文分词,是基于mmseg的简单分词组件 Feature 支持pinyin分词 支持用户自定义词典 支持单位合并 支持汉字数字识别 Install pip install
MySQL 结巴中文分词插件 SqlJieba 『关键词』 MySQL, 插件(Plugin), 中文分词, 结巴分词(Jieba), 全文检索(Full-Text), SqlJ
FoolNLTK 中文处理工具包 特点 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率
推荐博客
...