天天看點

統計學術思想R案例網絡收集和介紹

統計學術思想R案例網絡收集和介紹

作者:樊瑞珍

文章來源:統計模組化與R軟體

名稱:卡方檢驗

目标描述:卡方檢驗在R語言中的運用(案例)

卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

R語言下進行分層卡方檢驗方法和過程如下:

t.test t檢驗

wilcox.test wilcox檢驗

prop.test

binom.test 貝努力試驗檢驗

chisq.test 卡方檢驗

fish.test fisher精确檢驗

ks.test 科爾莫哥羅夫-斯米爾諾夫檢驗

shapiro.test shapio-wilk正态分布檢驗

pp.test. phillips-perron檢驗

quada.test quade檢驗

friedman.test friedman秩和檢驗

 R是用于統計分析、繪圖的語言和操作環境。R是屬于GNU系統的一個自由、免費、源代碼開放的軟體,它是一個用于統計計算和統計制圖的優秀工具。

R語言 卡方檢驗

預覽:

3、t.test(x,y) 表示對兩個變量x,y做兩樣本均數的成組t檢驗

4、t.test(x~group) 表示group為分組變量,x為數值變量,做t檢驗,此時x和y應該在同一個資料集中。

5、 t.test(x[group==1],x[group==2]) 表示對group=1和2時的x做t檢驗 方差分析:利用lm()函數

如果一個資料集dd中,x是數值變量,g是分組變量,運作:lm(dd$x~dd$g) ,這樣實際是拟合一個線性模型,x為應變量,g為自變量。預設的輸出很少,隻有g和截據的系數,采用summary()函數可以輸出較多資訊。即:summary(lm(dd$x~dd$g)) 這樣将會輸出常見方差分析所需要輸出的全部資訊,諸位一試便知。

這裡提示了R的一個特性:預設的輸出往往是很少的,其實有很多的結果被儲存在背後,需要用語句提取出來的。

秩和檢驗: wilcox.test()函數和kruskal.test()函數

wilcox.test(x) 表示對x做均數為0的符号秩和檢驗

kruskal.test(x,g) 表示x為數值變量而g為分組變量,做秩和檢驗

卡方檢驗:chisq.test()

對于如下四格表資料:12 5

24 11

首先建立四格表:matrix(c(12,24,5,11),crow=2)->data

說明:data中存儲了四格表資料,也就是一個矩陣。c(12,24,5,11)是一個向量,crow=2表示有兩行,請注意行列的順序:即先排“列”資料,再排“行”資料。

然後進行卡方檢驗:chisq.test(data)

對于四格表卡方,預設的用Yates連續性校正。如果用:chisq.test(data,correct=FLASE),則不進行Yates校正。如果理論數過小,則輸出時會提示卡方檢驗可能不正确,此時就需要用fisher精确機率法:fisher.test(data)。

線性相關

采用cor()函數可以計算兩變量的線性相關系數;采用cor.test()函數可以計算相關系數比進行假設檢驗、提供相關系數可信區間。

例如:c(12,15,13,16,21,22,14)->x

c(25,56,45,15,32,16,45)->y

cor.test(x,y) 即可對x和y進行線性相關分析,計算兩者的相關系數并進行假設檢驗。 線性回歸:

lm()函數可以拟合一般線性模型。例如:lm(y~x+z) 便是拟合應變量為y,自變量為x和z的回歸方程。直接使用lm(y~x+z) 隻能輸出x和z的回歸系數,用summary(lm(y~x+z)),即外部套上summary函數,可以輸出線性回歸分析的大部分内容。summary(lm(y~x+z+x*z)) 則是考慮了x和z的互動作用了。

R中能夠實作各種常用統計分析,這,一般成熟的統計軟體都是具有的。

R,作為s+的一個克隆,其實是S語言的一個程式設計環境。

R中一切都是對象。

R中的功能主要是以函數的形式實作。使用者可以修改(重載)這些函數,也可以開發新的函數。 R有很多package,實作各種功能,可以在R的站點cran中下載下傳安裝各種package以擴充功能。

案例:

R軟體入門教程---卡方檢驗

 使用chisq.test方法)

如資料如下:

 A   B

 甲 15   12

 乙 23   12

 丙 24   21

程式如下:

         matrix(c(15,23,24,12,12,21),nc=2)->x  ―――――――建立兩維表nc指列數

         chisq.test(x,correct=TRUE) ――――――――――――correct表示是否矯正

 結果如下:

          Pearson's Chi-squared test

data:  x

X-squared = 1.3229, df = 2, p-value = 0.5161

本篇來源于 www.stathome.cn

 原文連結:http://www.stathome.cn/html/S-plus_R/Rrumen/2009/0604/474.html

轉載于:https://www.cnblogs.com/zwz123456/articles/7086972.html