天天看點

php 比較字元串或文章的相似度

這是轉載的,不知道多少年前的文章,有些對于現在版本的php會出現相反的結果,使用的同學要自己去驗證哦

php預設有個函數similar_text()用于計算字元串之間的相似度,該函數也可以計算兩個字元串的相似度(以百分比計)。不過這個函數感覺對中文計算很不準确比如:

這兩個新聞标題其實都是一樣的,如果使用similar_text()相似對結果為:42,即隻相似42%,是以這個感覺很不靠譜,今天剛好收集到一段php代碼也是用于比較兩個字元串的相似度,直接貼出代碼:

同樣輸出結果為:0.90322580645161,明顯準确的多。