仓库 Issues 博客
语言: 全部
排序: 最近更新
找到相关仓库约为917
搜索工具
作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo等功能...
Java 870 4.3k 1.5k 更新于 2024-03-21
到HttpServletResponse流中3、查询顺丰物流信息4、获取请求人的ip地址5、站内信(websocket)6、分词、查重、相似度(SimHash、Segment)7、文档加水印 8、POI 5.2.3 解析doc、docx内容
Java 1 1 0 更新于 2024-03-18
分词窗口
1 0 0 更新于 2024-03-17
ik分词
1 0 0 更新于 2024-03-17
tarter便可开始你的项目。封装了数据库操作、认证授权、单点登录、文档操作、工作流、统一支付、WebSocket/Sse、分词敏感词过滤、钉钉通知、微信SDK等各种开箱即用的Starter。还有中间件(如Es、Mq、Flink等)、各场景下应用解决方案的代码示例。
Java 3 123 21 更新于 2024-03-17
分词器-java
1 0 0 更新于 2024-03-13
北京邮电大学机器学习创新实践课程大作业,实现了类 jieba 库的中文分词与标记算法以及 TextRank 关键词提取算法
Python 3 0 0 更新于 2024-03-03
newbee-mall-pro是newbee-mall商城的pro版本实现了推荐系统、生产可用的秒杀、优惠卷专区,滑块验证码,支付宝支付,中文分词检索等高级功能
2 7 4 更新于 2024-03-18
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java 6 57 12 更新于 2024-02-27
从零开始训练语言模型分词器,并对 LLaMA 进行中文扩充
Python 1 0 0 更新于 2024-02-23
一个简单快速的分词、命名实体识别工具
1 1 0 更新于 2024-02-22

推荐博客

...