天天看点

SolrCloud同一shard的不同replica返回结果评分不一致

最近Solr Cloud发生了这样一种现象,使用同一个key反复多次查询,发现查询返回的结果会发生变化,一开始感觉问题应该是出现在多个replica主从不同步上,后来发现core admin中,同一个shard的replica的numDocs的值是一致的,难道不是因为主从不一致导致的?

使用shards参数分别查询同一个shard的各个replica,结果发现,返回的numFound是一致的,但是document的顺序不同,如果加上sort参数对id强制排序,返回的结果顺序便一致了,可见是打分出了问题。返回值加上score字段后,发现分值确实差了许多。

想想之前在看core admin中显示的numDocs虽然一致,但是maxDoc差了很多,难道是这货导致的问题?

在查询中加上了debug参数,发现打分时计算idf时直接使用的是maxDoc,导致最终的评分差异。

但是这种情况不知如何修复,optimize可以收拾索引文件,但不知会不会修复maxDoc,抱着试一试的态度,进行了optimize后,maxDoc的值和numDocs变得一致了。问题随之解决。但是虽然同一个document打分相同了,但是相同分值的顺序仍然不同。

有时间看看optimize都做了什么。

继续阅读