仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为924
搜索工具
使用office进行分词,可对中文泰文及其他文字进行分词
C# 1 0 0 更新于 2020-12-19
调用了中科院的分词程序,打算做一个分词的工具jar
Java 2 1 0 更新于 2020-12-19
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 27 2 更新于 2022-01-31
基于 python pkuseg 对定值单的名名称进行分词匹配
Python 1 0 0 更新于 2020-12-19
一个轻量级,基于词库的分词引擎,包含基本的分词,和混淆字处理等功能。但目前由于缺乏语义理解,分词后的词汇含义会有些不同。
Java 1 1 1 更新于 2024-04-10
1+elasticsearch6.5.3搭建的企业级搜索平台,支持PB级数据(elasticsearch分布式部署),目前已经支持中文分词,检索关键词高亮操作,如果帮到您,麻烦点下Star,谢谢。
Java 231 1.4k 537 更新于 2024-04-22
SpringBoot项目利用结巴分词做关键词提取
Java 1 1 0 更新于 2022-03-28
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java 3 7 3 更新于 2024-04-24
百度分词
Java 1 0 0 更新于 2022-04-17
作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo,嵌套,父子类型等功能...
Java 877 4.4k 1.5k 更新于 2024-04-29
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
Python 1 1 0 更新于 2022-12-14

推荐博客

...