統計學術思想R案例網絡收集和介紹
作者:樊瑞珍
文章來源:統計模組化與R軟體
名稱:卡方檢驗
目标描述:卡方檢驗在R語言中的運用(案例)
卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。
R語言下進行分層卡方檢驗方法和過程如下:
t.test t檢驗
wilcox.test wilcox檢驗
prop.test
binom.test 貝努力試驗檢驗
chisq.test 卡方檢驗
fish.test fisher精确檢驗
ks.test 科爾莫哥羅夫-斯米爾諾夫檢驗
shapiro.test shapio-wilk正态分布檢驗
pp.test. phillips-perron檢驗
quada.test quade檢驗
friedman.test friedman秩和檢驗
R是用于統計分析、繪圖的語言和操作環境。R是屬于GNU系統的一個自由、免費、源代碼開放的軟體,它是一個用于統計計算和統計制圖的優秀工具。
R語言 卡方檢驗
預覽:
3、t.test(x,y) 表示對兩個變量x,y做兩樣本均數的成組t檢驗
4、t.test(x~group) 表示group為分組變量,x為數值變量,做t檢驗,此時x和y應該在同一個資料集中。
5、 t.test(x[group==1],x[group==2]) 表示對group=1和2時的x做t檢驗 方差分析:利用lm()函數
如果一個資料集dd中,x是數值變量,g是分組變量,運作:lm(dd$x~dd$g) ,這樣實際是拟合一個線性模型,x為應變量,g為自變量。預設的輸出很少,隻有g和截據的系數,采用summary()函數可以輸出較多資訊。即:summary(lm(dd$x~dd$g)) 這樣将會輸出常見方差分析所需要輸出的全部資訊,諸位一試便知。
這裡提示了R的一個特性:預設的輸出往往是很少的,其實有很多的結果被儲存在背後,需要用語句提取出來的。
秩和檢驗: wilcox.test()函數和kruskal.test()函數
wilcox.test(x) 表示對x做均數為0的符号秩和檢驗
kruskal.test(x,g) 表示x為數值變量而g為分組變量,做秩和檢驗
卡方檢驗:chisq.test()
對于如下四格表資料:12 5
24 11
首先建立四格表:matrix(c(12,24,5,11),crow=2)->data
說明:data中存儲了四格表資料,也就是一個矩陣。c(12,24,5,11)是一個向量,crow=2表示有兩行,請注意行列的順序:即先排“列”資料,再排“行”資料。
然後進行卡方檢驗:chisq.test(data)
對于四格表卡方,預設的用Yates連續性校正。如果用:chisq.test(data,correct=FLASE),則不進行Yates校正。如果理論數過小,則輸出時會提示卡方檢驗可能不正确,此時就需要用fisher精确機率法:fisher.test(data)。
線性相關
采用cor()函數可以計算兩變量的線性相關系數;采用cor.test()函數可以計算相關系數比進行假設檢驗、提供相關系數可信區間。
例如:c(12,15,13,16,21,22,14)->x
c(25,56,45,15,32,16,45)->y
cor.test(x,y) 即可對x和y進行線性相關分析,計算兩者的相關系數并進行假設檢驗。 線性回歸:
lm()函數可以拟合一般線性模型。例如:lm(y~x+z) 便是拟合應變量為y,自變量為x和z的回歸方程。直接使用lm(y~x+z) 隻能輸出x和z的回歸系數,用summary(lm(y~x+z)),即外部套上summary函數,可以輸出線性回歸分析的大部分内容。summary(lm(y~x+z+x*z)) 則是考慮了x和z的互動作用了。
結
R中能夠實作各種常用統計分析,這,一般成熟的統計軟體都是具有的。
R,作為s+的一個克隆,其實是S語言的一個程式設計環境。
R中一切都是對象。
R中的功能主要是以函數的形式實作。使用者可以修改(重載)這些函數,也可以開發新的函數。 R有很多package,實作各種功能,可以在R的站點cran中下載下傳安裝各種package以擴充功能。
案例:
R軟體入門教程---卡方檢驗
使用chisq.test方法)
如資料如下:
A B
甲 15 12
乙 23 12
丙 24 21
程式如下:
matrix(c(15,23,24,12,12,21),nc=2)->x ―――――――建立兩維表nc指列數
chisq.test(x,correct=TRUE) ――――――――――――correct表示是否矯正
結果如下:
Pearson's Chi-squared test
data: x
X-squared = 1.3229, df = 2, p-value = 0.5161
本篇來源于 www.stathome.cn
原文連結:http://www.stathome.cn/html/S-plus_R/Rrumen/2009/0604/474.html
轉載于:https://www.cnblogs.com/zwz123456/articles/7086972.html