找到相关仓库约为922个
搜索工具
排序方式:
最近更新
Java文档项目 ---> SpringBoot + SpringMVC + Ansj分词技术 + 正排倒排索引 html + css +js
demo java 后端项目,Spring Boot,MyBatis,Elastic Search,Lucene,Jieba分词等。Justin课堂配套的实战项目。
目,使用2个经典案例(百度地图找房+文章内容搜索),演示es常用的功能及代码原生写法和简化写法(easy-es)~支持高亮,分词,Geo等功能
ParaConc)系列软件中的一款,针对平行语料常见的双语上下对齐语料格式,采取奇偶行分行分引擎标注的方法对英汉、汉英平行语料文本文件进行单个或批量的分词与词性标注,生成标注文本文件。为减小打包软件尺寸,本软件分三个版本分别打包:JIEBA vs NLTK版,PKU vs NLTK版与PYNLPIR
沙袋大三课程 信息检索实验 要求做一个自选数据集和中文分词工具的搜索引擎,不涉及爬虫。改了扒来的另一个课设,原先是用英文分词器、检索莎士比亚全集的,换成了中文IK分词器检索江南小说《天之炽》。
1.功能单一,只有中文分词功能,没有词性标注及分析等功能 2.分词速度快(词库实现了分块查询,比一般的分词系统上快3-4倍) 3.分词准确率高(实现了管道输出输入,分词过程被划分为多个单独处理的阶段) 4.一键部署,容易使用(可以作为java包直接调用,也可以二次开发,代码开源)
推荐博客
...