仓库 Issues 博客
语言: 全部
排序: 最近更新
找到相关仓库约为979
搜索工具
从零开始训练语言模型分词器,并对 LLaMA 进行中文扩充
Python 1 0 0 更新于 2024-02-23
tarter便可开始你的项目。封装了数据库操作、认证授权、单点登录、文档操作、工作流、统一支付、WebSocket/Sse、分词敏感词过滤、钉钉通知、微信SDK等各种开箱即用的Starter。还有中间件(如Es、Mq、Flink等)、各场景下应用解决方案的代码示例。
Java 3 110 21 更新于 2024-02-23
分词窗口
1 0 0 更新于 2024-02-23
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java 5 54 11 更新于 2024-02-26
一个简单快速的分词、命名实体识别工具
1 1 0 更新于 2024-02-22
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
Java 6 32 12 更新于 2024-02-26
基于springboot+netty+websocket+分词+uniapp开发的高性能可扩展的chatgpt小程序H5
Java 1 18 7 更新于 2024-02-19
作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo等功能...
Java 867 4.2k 1.5k 更新于 2024-02-23
基于fastapi 集成分词
1 0 0 更新于 2024-01-25
普通话 IPA 转换器,为中文文本标注普通话发音的国际音标,可选 11 种版本。 | A tool to add Putonghua pronunciations in IPA form on Chinese texts
TypeScript 1 0 0 更新于 2024-01-22

推荐博客

...