Gitee 搜索 - Gitee.com

the pinyin of the entry. jcseg.loadpinyin = 1 ``` 已经开启了加载拼音，但是分词结果没有拼音，搜索的时候也搜索不到，怎么情况？

狮子的魂/jcseg #ICN7H 已关闭 2 更新于 2017-05-10

网上能搜到的大部分文章都是过期和不正确的，用的是很老版本的 Sphinx + Coreseek 插件。老版本的 Sphinx 不支持中文分词，于是有国人做了一个插件来支持，这个方案主要问题在于，coreseek 已经凉了很久了某份fork的最后更新是 7 years

Discuz/DiscuzX #I3RE2H 开启中 53 更新于 2022-04-18

true, 编译 jar 包; 2. jcseg.properties 中 jcseg.loadpinyin = 1; 3. 在分词结果中, 也能看到有拼音的结果, "长春/ns/chang chun/null/"; 4. 在搜索中, 我测试 "chang

狮子的魂/jcseg #I9MC2 已关闭 15 更新于 2017-05-10

他方式可以较为显著地提升词性分析的速度？我目前采用的是在保证句子不被切断的前提下将文章尽可能切割成500字符一下的分段，在分词结束后再重新拼接。如果开启多进程的话，更多分段和较少分段应该如何取舍呢？

PaddlePaddle/PaddleHub #I4C90K 已关闭 2 更新于 2021-09-29

.png "微信图片_20210617220807.png") elasticsearch搜索内容和结果完全没有关联，可能是分词器的问题，请介绍一下elasticsearch服务器的正确配置 ![输入图片说明](https://images.gitee

JPressProjects/jpress #I3W1ZG 已关闭 1 更新于 2021-06-23

您好作者，对于将jcseg作为elasticsearch的分词器，想实现中文简体和繁体的相互检索，可行的方法是什么呢？希望您能给些思路啊，看介绍说jcseg有简体和繁体的转换工具什么的没有找到啊。

同义词高亮异常解决方案

狮子的魂/jcseg #IMBLD 已关闭 12 更新于 2019-09-09

t恤男会被拆分成 t恤/n t恤衫/n 男/f 不想要 t恤衫/n 这个，改怎么配置，或者用哪种分词模式呢？

狮子的魂/jcseg #ID3EH 已关闭 2 更新于 2017-05-10

php 5.2.9 版本。换回 friso 1.6.0 使用 robbe 1.6.0 加载就一切正常。顺便感谢作者，这个分词工具真心不错！

狮子的魂/friso #I56TC 已关闭 16 更新于 2017-05-10

我使用了这个库，我需要分词检索我表中的一个title字段，然后拿出来之后根据state和createtime进行排序，最后发现查询出来的数据只有我所操作的这三个字段，其他字段全部空 ![截图1](https://images.gitee.com/upl

懒得勤快/Masuit.LuceneEFCore.SearchEngine #I128U7 已关闭 1 更新于 2020-04-15

非常感谢您将自己的项目开源。您的《Jcseg-开发帮助文档》中第9页中“3.创建 ASegment 或者 ISegment 分词实例:”条目下"(1). 不带 Input(构造方法一):"项中的示例代码"Asegment seg = ..."应为"IS

狮子的魂/jcseg #I6570 已关闭 2 更新于 2017-05-10

com/PaddlePaddle/Paddle/issues/8047): 使用paddlepaddle进行机器翻译训练,使用的语料是中英文语料,已分词已对齐引用训练集直接更改的.cache/paddle/wmt/wmt14.tgz里的内容,其他代码参数未修改,在开始程序后出现AssertionError错误

User

PaddlePaddle/Paddle #I3DMNY 已关闭 3 更新于 2021-03-26

推荐博客