對于string類型,比如在你的core/conf/manage-schema檔案中,配置一個字段類型為string類型,如果查詢符合“我是中國人”的資料,它就認為“我是中國人”是一個詞語。
但是如果你将該字段設定成了分詞,即配置成了text_ik類型,就可能比對“我”、“中國人”、“中國”、“中”、“人”帶有這些字的該字段資料都可能被查詢到。這就是分詞帶來的結果。具體要按照各自的業務來配置是否分詞,分詞對于大文本字段設定是合理的,但是對于小字段,設定分詞是沒必要的,甚至有相反的結果。比如你的某一個叫姓名的字段設定了分詞,還不如設定string,查詢時模糊比對效果最好,(模糊比對就是查詢條件兩邊加上*),當然也要看自己業務需求是什麼。
這裡以dkdz為例,設定之前,在solr用戶端檢視是如下結果:
不好意思,我圖貼錯了,下邊的3處應該是dkdz,不是dkbm!!
配置分詞如下:

配置之後,在solr用戶端的core admin中,reload該core,再次檢視,變成如下頁面:
如果變成了上邊這種結果,就說明分詞成功了。對于分詞後的字段,如果在查詢結果上有歧義,最好是來到solr用戶端的上邊位置,看下你的條件是不是因為分詞,給分成了不是你想要的那種結果。
下一篇寫,分詞添加自定義擴充詞庫