天天看點

白話空間統計之:空間自相關

白話空間統計之:空間自相關

空間自相關,肯定是空間統計裡面第一個攔路虎了,很多人遇上了這個高大上的詞彙,立刻就發現,這五個字我好像都認識,但是到底說了啥?不知道。

如果翻開各種教材,從統計學到數學到實體學,各種解釋都擺出了一副“老子就是高大上學霸,屌絲學渣勿擾”的樣子,這個東西真得就那麼難麼?蝦神我就不信了,是以:I have a dream,就是寫出一個最接地氣的空間統計解釋來。(好大的宏願,阿彌陀佛老天保佑,别吹炸了。)

首先,要明白一下空間自相關這個神奇的概念,不得不先說一個神奇的人物。他就是号稱“近代地理學界的牛頓”的Waldo Tobler(金都 托布勒)教授。

Waldo教授1930年生于瑞士,1961年在美國華盛頓大學獲得博士學位,這一年也是風起雲湧的一年,當今美利堅大統領奧巴馬同學就是1961年出生的。

似乎是老天爺見實體已經有了三大定律,而地理學一個也沒有,于是在1969年(也有說1970年)的時候,上帝一揮手,讓Waldo教授照亮地理學的天空吧。是以那一年,他發表了史稱“地理學第一定律”的“Tobler’s First Law”(簡稱TFL),即為“all attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant ones”翻譯成大白話,就是:任何事情呢,都是有關系,隻不過靠得越近,關系就越緊密。

正如牛頓的三大定律開創了經典力學體系,地理學的第一定律也為計量革命提供了理論基礎,從此,空間分析和空間統計領域再也離不開這個定律了。

正如明代學者茅無儀評價孫子兵法“前孫子者,孫子不遺;後孫子者,不能遺孫子”,TFL也在地理學界做到了前者不遺,後者不能遺的境界。

依照定律,空間中的每一個事務,都是有聯系的,近的事務之間的聯系緊密程度,要高于距離遠的事務之間的聯系程度。所謂的聯系緊密程度,自然也可以說,兩個事務會在某一方面,有相似的地方。

那麼空間自相關這個概念就被帶出來了。

什麼是空間自相關呢?首先我們來看看下面一個例子:

時間:課間操。

地點:學校操場。

當廣播響起來的時候,所有學生都一路狂奔沖向操場(遲到要挨罰的),是以,校長在樓上,看見的應該是這樣的一個場面:

白話空間統計之:空間自相關

怎是一個亂字了得,那麼這就是所謂的“随機分布”,誰也不知道,哪個學生是哪個班的。

随着體育老師的密碼,慢慢得變成了下面這個場面:

白話空間統計之:空間自相關

學生整整齊齊的占成了隊列,每個人前後左右的距離都是一樣,這個就是所謂的“均勻分布”,在這種均勻分布的情況下,照樣沒辦法看出學生之間的關系。

5分鐘後,廣播體操結束,同樣随着體育老師的一聲密碼,解散,學生們就變成了下面這個樣子:

白話空間統計之:空間自相關

OK,現在就很明顯的看出,不同的學生,自己就組成了自己的一個個小團體,這就是所謂的聚類。

那麼你作為校長,自然會在腦中腦補,為什麼這幾個學生會自然的聚在一起呢?肯定是共同的愛好或者共同的目的,至于這個團體,有哪些共同的愛好和共同目的,就是學生之間的某種特征了,比如學習好的會自動湊在一起;或者是喜歡打球的,會湊在一起。

這種,每個學生,與他周圍的學生之間,一般有一些共有的某種特征。理論上,如果有一個帶有這種特征的學生出現在操場上,那麼他身邊出現的,就有很大可能與他有同樣的特征,而且他們之間會産生潛在的依賴性。比如喜歡打球的學生,一個人肯定沒辦法打,是以自然需要有共同愛好的小夥伴在旁邊。

這種潛在的(因為沒有很明顯的表現出來,是以肯定是潛在的)的互相依賴性,就是所謂的“空間自相關”。

繼續閱讀