找到相关仓库约为11836个
搜索工具
排序方式:
最佳匹配
沙袋大三课程 信息检索实验 要求做一个自选数据集和中文分词工具的搜索引擎,不涉及爬虫。改了扒来的另一个课设,原先是用英文分词器、检索莎士比亚全集的,换成了中文IK分词器检索江南小说《天之炽》。
财务金额转换,中文转阿拉伯数字,阿拉伯数字转中文,数字转换,中文数字,金额大写
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
推荐博客
...