找到相关仓库约为859个
搜索工具
排序方式:
最近更新
中文爬虫的代码,需不断维护(故只是个selenium+chromedriver+demo,欢迎白嫖); 主要是使用gensim分词基于词频修正jieba中文分词误拆分(其他什么的分词也可以)
使用lucene来构建全站搜索,分词使用IK ### 1.集成Lucene ### 2.构建索引 ### 3.实现搜索 ### 4.搜索关键字高亮 ### 5.实现分页搜索
中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
库MongoDB则用来存放json格式的格式化数据,应用可视化工具Echarts辅助绘制关系图实现知识关系可视化,利用LTP分词模型和相似词典相结合实现知识查询,设计并完成了《骆越演义》知识可视化系统。
推荐博客
...