仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为1078
搜索工具
目标:符系技术路线的汉语实现---H语言; 本案以node.js宿主环境为例,尝试建立汉语版的符系系统“词典”(即:系统预设的中文关键词、符号)示范,详见readme文件声明。
JavaScript 1 0 0 更新于 2023-03-25
分词,中文分词
PHP 2 2 1 更新于 2021-03-30
中文词法分析(LAC) 中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程
C++ 7 27 4 更新于 2023-09-12
词法分析:对源文件进行扫描,将源文件的字符归类,划分为一个一个的记号(token)
C 1 1 0 更新于 2023-09-26
一个分词算分的demo
Java 1 0 0 更新于 2020-12-19
手动修改的ik分词
Java 1 0 2 更新于 2024-03-24
IK分词器,主要针对lucene进行支持,版本与lucene版本同步
Java 1 0 0 更新于 2024-03-27
盘古分词源代码备份
C# 2 0 0 更新于 2020-12-19
Springboot2.1+Solr7.5搭建的企业级搜索平台,项目目前支持文档内容和数据库检索,已经集成分词技术。支持文档内容检索类型包含:pdf、doc、docx、ppt、pptx、txt、log等 数据库已支持MySQL增量自动建立索引,如果帮到您,麻烦点下Star,谢谢。
Java 223 1.4k 448 更新于 2024-04-27
PHP 中文工具类,支持汉字转拼音、拼音分词、简繁互转、数字、金额大写;QQ群:17916227。本仓库仅用于存档,不再发布更新日志,请移步 Github:
PHP 62 307 71 更新于 2024-04-23
jieba 分词模块
Python 1 0 0 更新于 2021-07-29

推荐博客

...