仓库 Issues 博客
语言: 全部
排序: 最多watches
找到相关仓库约为917
搜索工具
快速中文分词分析word segmentation
Java 14 79 15 更新于 2024-02-21
盘古分词组件,Forked from Eaglet
C# 13 38 14 更新于 2024-03-21
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java 11 16 4 更新于 2021-12-13
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
Python 11 37 10 更新于 2024-03-14
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
Java 10 28 13 更新于 2023-12-18
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java 9 15 7 更新于 2020-12-19
Java开源项目cws_evaluation:中文分词分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java 9 13 8 更新于 2022-06-29
个人毕设所做项目-“基于词典的中文微博细粒度情感分析系统的设计与实现”,简称WEA,后台主要用到网络爬虫,NLPIR中文分词,XML解析,情感分析算法,图片转换,前端是采用div+css网页布局,利用AJAX,JavaScript以及Highchart
Java 9 17 7 更新于 2022-11-06
简易分词软件
C 8 10 3 更新于 2024-02-20
基于Elasticsearch的搜索引擎方式智能地址解析。支持地址别名匹配,自定义地址分词。支持中英文地址智能解析。支持国家、省、市、区、镇 地址智能匹配,支持中文繁体字地址解析,后续版本将支持多语言地址解析。
Java 8 34 0 更新于 2024-03-04
xmnlp 是一个轻量级中文自然语言处理工具,提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首等功能
Python 7 26 7 更新于 2023-11-21

推荐博客

...