Skip to content

[ 搜索结果重复 ] 同一个句子在搜索结果中多次出现 #3393

Closed Answered by Mister-Hope
luciffer118 asked this question in Q&A
Discussion options

You must be logged in to vote

客户端搜索本来能力就有限。

我们以一个著名的 “南京市长江大桥” 来举例子,客户端搜索不像搜索引擎有语义识别能力,它不知道当搜索结果不包含南京市长江大桥时,核心词是 “南京市 长江大桥”还是“南京市长 江大桥”,因此在构建期间,所有你可能用到的分词组合,都会被录入。

这包含第二个例子售电站,分词软件认为它包含售电和电站两个词组,因此 售电 站点(售电站点的分词结果) 电站 等词都是有效的。

如果你想进一步优化这些搜索结果,你可以为 nodejs-jieba 额外添加“售电站”词汇加入字典,也可以调节 BM25 参数,对搜索词的权重和匹配进行优化。https://mister-hope.github.io/slimsearch/interfaces/BM25Params.html

Replies: 1 comment 2 replies

Comment options

You must be logged in to vote
2 replies
@Mister-Hope
Comment options

@Mister-Hope
Comment options

Answer selected by Mister-Hope
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Category
Q&A
Labels
None yet
2 participants