找到相关仓库约为11444个
搜索工具
排序方式:
最多forks
中国最大的API接口管理平台,3.x开源发行版,支持多国语言[英语、简体中文、繁体中文]
基于 PHP 和 word2vec 的分类器,用于文章、新闻等内容自动分类,项目包含样本训练、识别代码,分词组件用的是 PhpAnalysis,简单灵活。欢迎大家一起优化并完善。
经过百度,就发现了这个项目,项目作者Omar AL Zabir,但2009就没更新了,网上有两篇中文件介绍文章都过时了,好在源码很简单,所以花了点时间看了一下,按自己的理解加了一些中文注释。 原项目地址:https://code.google.com/p/aspectf/。
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
OPT(Omni-Perception Pre-Trainer)是全场景感知预训练模型的简称,中文名字叫紫东太初,是中科院自动化和华为联合研发的多模态预训练模型,本仓是紫东太初十亿参数级别模型的MindSpore版本代码,包含预训练模型及多个下游任务模型。
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
推荐博客
...