找到相关仓库约为899个
搜索工具
排序方式:
最近更新
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo等功能...
电信运营商用户基站停留数据统计 3.基于物品的协同过滤实现 4.测试mahout推荐算法API 5.使用自定义的分片策略和庖丁分词进行中文分析 6.PeopleRank算法并行化实现-mr的矩阵计算 7.简单实现sql的统计、groupby和join 8
implemented the common operations in NLP domain (实现NLP中各种常规操作,如分词、句法、命名实体识别、语义话题模型、爬虫、ElasticSearch和Faiss向量检索,huggingface-transformers完成各种任务,2023)
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
FastText_Shop是一个基于FastText和结巴分词的短文本分类工具,特点是高效易用,同时支持中文和英文语料。使用方法、灵感来自并且和TextGrocery基本相同。
推荐博客
...