找到相关仓库约为1078个
搜索工具
排序方式:
最近更新
本项目主要是基于中文医学文献标题、摘要等语料库通过数据清洗、分词、基于N-gram模型计算子词互信息、左右邻接熵、词频、关联置信度等参数并对各个参数组合进行消融分析
爬取某东商品评价,对评价进行数据处理,分词,概率、词云图可视化,用朴素贝叶斯和支持向量机进行分类训练,可以预测文本内容和文件内容并保存为csv文件
逐浪字库专注中文字体研发,领先的字体研发团队,专注汉语基础数据元研究与文明基石拓荒者,我们试图创造一个更加开放自由的文字创作与使用世界,是中文业界首个开放开源字库企业。~
推荐博客
...