仓库 Issues 博客
语言: 全部
排序: 最佳匹配
找到相关仓库约为11836
搜索工具
结巴中文分词
1 0 0 更新于 2021-08-01
结巴中文分词
1 0 0 更新于 2021-07-02
结巴中文分词
1 0 0 更新于 2021-04-06
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1 0 0 更新于 2020-12-19
ik中文分词
1 0 0 更新于 2022-05-16
沙袋大三课程 信息检索实验 要求做一个自选数据集和中文分词工具的搜索引擎,不涉及爬虫。改了扒来的另一个课设,原先是用英文分词器、检索莎士比亚全集的,换成了中文IK分词器检索江南小说《天之炽》。
1 0 0 更新于 2022-12-13
对词语级别的分词,实现RNN分类标题
Python 1 0 0 更新于 2023-04-12
从零开始训练语言模型分词器,并对 LLaMA 进行中文扩充
Python 1 0 0 更新于 2024-02-23
财务金额转换,中文转阿拉伯数字,阿拉伯数字转中文,数字转换,中文数字,金额大写
JavaScript 1 2 0 更新于 2023-12-03
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
Java 10 29 13 更新于 2024-04-01

推荐博客

...