找到相关仓库约为962个
搜索工具
排序方式:
最近更新
沙袋大三课程 信息检索实验 要求做一个自选数据集和中文分词工具的搜索引擎,不涉及爬虫。改了扒来的另一个课设,原先是用英文分词器、检索莎士比亚全集的,换成了中文IK分词器检索江南小说《天之炽》。
Platform Technology of Big Data
这是基于最新的语音识别技术实现的声控计算器(语音输入计算器)。 不用动手,不用找按键,怎么说就怎么算。 准确率高:长表达式99%,短表达式98%。目前只支持普通话。 直接显示历史计算过程,并用数学公式的方式直观显示,轻松核对。 简单操作,强大功能,支持任意复杂表达式的计算。 支持带四则
1.功能单一,只有中文分词功能,没有词性标注及分析等功能 2.分词速度快(词库实现了分块查询,比一般的分词系统上快3-4倍) 3.分词准确率高(实现了管道输出输入,分词过程被划分为多个单独处理的阶段) 4.一键部署,容易使用(可以作为java包直接调用,也可以二次开发,代码开源)
MariaDB 全文索引中文分词插件 Jieba Full-Text Parser Plugin 支持Windows版MariaDB
springboot+Elasticsearch搜索示例。包含订单搜索(经过线上2亿+订单实践),分词搜索,高亮显示等。
个模块:索引模块:扫描本地的Java文档,分析内容构建正排、倒排索引(使用Ansj进行分词);搜索模块:根据输入的关键词,基于倒排索引进行检索,合并相关文档,设置分词的权值,返回检索结果;前端模块:编写简单页面,输入关键字点击搜索,展示搜索结果,点击标题展示文档详情。
推荐博客
...