找到相关仓库约为917个
搜索工具
排序方式:
最近更新
本项目主要是基于中文医学文献标题、摘要等语料库通过数据清洗、分词、基于N-gram模型计算子词互信息、左右邻接熵、词频、关联置信度等参数并对各个参数组合进行消融分析
爬取某东商品评价,对评价进行数据处理,分词,概率、词云图可视化,用朴素贝叶斯和支持向量机进行分类训练,可以预测文本内容和文件内容并保存为csv文件
Lucene分词 解析收货地址 单省市区 省市区街道收件人详细地址 参考:https://github.com/IOrzo/chineseaddressanalyzer
本仓库构建了基于知识图谱的网络空间安全问答系统。系统基于Python实现,网络空间安全知识图谱由neo4j存储。问答模块使用jieba分词的词性标注完成命名实体的提取,使用 TF-IDF 特征提取算法和朴素贝叶斯算法实现问句分类。
推荐博客
...