找到相关仓库约为839个
搜索工具
排序方式:
最佳匹配
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
Go中文分词 词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划。 支持普通和搜索引擎两种分词模式,支持用户词典、词性标注,可运行JSON RPC服务。 分词速度单线程9MB/s,goroutin
isearch提供分词和建立索引功能,可自定义中文词库,可满足复杂查询需求,支持包括字段检索、向量检索、字段排序、布尔搜索、范围检索、地理位置(POI、AOI)查询等功能。
python版本:领域细分的中文分词工具,简单易用,跟现有开源工具相比提高了分词的准确率。
推荐博客
...