[ 搜索结果重复 ] 同一个句子在搜索结果中多次出现 #3393
-
Beta Was this translation helpful? Give feedback.
Answered by
Mister-Hope
Sep 5, 2023
Replies: 1 comment 2 replies
-
客户端搜索本来能力就有限。 我们以一个著名的 “南京市长江大桥” 来举例子,客户端搜索不像搜索引擎有语义识别能力,它不知道当搜索结果不包含南京市长江大桥时,核心词是 “南京市 长江大桥”还是“南京市长 江大桥”,因此在构建期间,所有你可能用到的分词组合,都会被录入。 这包含第二个例子售电站,分词软件认为它包含售电和电站两个词组,因此 如果你想进一步优化这些搜索结果,你可以为 nodejs-jieba 额外添加“售电站”词汇加入字典,也可以调节 BM25 参数,对搜索词的权重和匹配进行优化。https://mister-hope.github.io/slimsearch/interfaces/BM25Params.html |
Beta Was this translation helpful? Give feedback.
2 replies
Answer selected by
Mister-Hope
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
客户端搜索本来能力就有限。
我们以一个著名的 “南京市长江大桥” 来举例子,客户端搜索不像搜索引擎有语义识别能力,它不知道当搜索结果不包含南京市长江大桥时,核心词是 “南京市 长江大桥”还是“南京市长 江大桥”,因此在构建期间,所有你可能用到的分词组合,都会被录入。
这包含第二个例子售电站,分词软件认为它包含售电和电站两个词组,因此
售电
站
站点
(售电站点的分词结果)售
电站
等词都是有效的。如果你想进一步优化这些搜索结果,你可以为 nodejs-jieba 额外添加“售电站”词汇加入字典,也可以调节 BM25 参数,对搜索词的权重和匹配进行优化。https://mister-hope.github.io/slimsearch/interfaces/BM25Params.html