找到相关仓库约为258个
搜索工具
排序方式:
最佳匹配
多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
一个好用的数据查重引擎。包含了数据建模,清洗算法设计,查重,结构导出等功能。查重的算法中对数据每个属性均可以设定权重和灵活选择比对算法。使用的中文分词引擎对较长中文句子进行分司和比对。
使用seqtoseq神经网络用于特定领域中的精确中文分词Python
推荐博客
...