統計學術思想R案例網絡收集和介紹

作者：樊瑞珍

文章來源：統計模組化與R軟體

名稱:卡方檢驗

目标描述:卡方檢驗在R語言中的運用(案例)

卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度，實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小，卡方值越大，越不符合；卡方值越小，偏差越小，越趨于符合，若兩個值完全相等時，卡方值就為0，表明理論值完全符合。

R語言下進行分層卡方檢驗方法和過程如下：

t.test t檢驗

wilcox.test wilcox檢驗

prop.test

binom.test 貝努力試驗檢驗

chisq.test 卡方檢驗

fish.test fisher精确檢驗

ks.test 科爾莫哥羅夫-斯米爾諾夫檢驗

shapiro.test shapio-wilk正态分布檢驗

pp.test. phillips-perron檢驗

quada.test quade檢驗

friedman.test friedman秩和檢驗

R是用于統計分析、繪圖的語言和操作環境。R是屬于GNU系統的一個自由、免費、源代碼開放的軟體，它是一個用于統計計算和統計制圖的優秀工具。

R語言卡方檢驗

預覽：

3、t.test(x,y) 表示對兩個變量x，y做兩樣本均數的成組t檢驗

4、t.test(x~group) 表示group為分組變量，x為數值變量，做t檢驗，此時x和y應該在同一個資料集中。

5、 t.test(x[group==1],x[group==2]) 表示對group＝1和2時的x做t檢驗方差分析：利用lm()函數

如果一個資料集dd中，x是數值變量，g是分組變量，運作：lm(dd$x~dd$g) ，這樣實際是拟合一個線性模型，x為應變量，g為自變量。預設的輸出很少，隻有g和截據的系數，采用summary()函數可以輸出較多資訊。即：summary(lm(dd$x~dd$g)) 這樣将會輸出常見方差分析所需要輸出的全部資訊，諸位一試便知。

這裡提示了R的一個特性：預設的輸出往往是很少的，其實有很多的結果被儲存在背後，需要用語句提取出來的。

秩和檢驗： wilcox.test()函數和kruskal.test()函數

wilcox.test(x) 表示對x做均數為0的符号秩和檢驗

kruskal.test(x,g) 表示x為數值變量而g為分組變量，做秩和檢驗

卡方檢驗：chisq.test()

對于如下四格表資料：12 5

24 11

首先建立四格表：matrix(c(12,24,5,11),crow=2)->data

說明：data中存儲了四格表資料，也就是一個矩陣。c(12,24,5,11)是一個向量，crow=2表示有兩行，請注意行列的順序：即先排“列”資料，再排“行”資料。

然後進行卡方檢驗：chisq.test(data)

對于四格表卡方，預設的用Yates連續性校正。如果用：chisq.test(data,correct=FLASE)，則不進行Yates校正。如果理論數過小，則輸出時會提示卡方檢驗可能不正确，此時就需要用fisher精确機率法：fisher.test(data)。

線性相關

采用cor（）函數可以計算兩變量的線性相關系數；采用cor.test()函數可以計算相關系數比進行假設檢驗、提供相關系數可信區間。

例如：c(12,15,13,16,21,22,14)->x

c(25,56,45,15,32,16,45)->y

cor.test(x,y) 即可對x和y進行線性相關分析，計算兩者的相關系數并進行假設檢驗。線性回歸：

lm()函數可以拟合一般線性模型。例如：lm(y~x+z) 便是拟合應變量為y，自變量為x和z的回歸方程。直接使用lm(y~x+z) 隻能輸出x和z的回歸系數，用summary(lm(y~x+z))，即外部套上summary函數，可以輸出線性回歸分析的大部分内容。summary(lm(y~x+z+x*z)) 則是考慮了x和z的互動作用了。

結

R中能夠實作各種常用統計分析，這，一般成熟的統計軟體都是具有的。

R，作為s+的一個克隆，其實是S語言的一個程式設計環境。

R中一切都是對象。

R中的功能主要是以函數的形式實作。使用者可以修改（重載）這些函數，也可以開發新的函數。 R有很多package，實作各種功能，可以在R的站點cran中下載下傳安裝各種package以擴充功能。

案例:

R軟體入門教程---卡方檢驗

使用chisq.test方法）

如資料如下：

A B

甲 15 12

乙 23 12

丙 24 21

程式如下：

matrix(c(15,23,24,12,12,21),nc=2)->x ―――――――建立兩維表nc指列數

chisq.test(x,correct=TRUE) ――――――――――――correct表示是否矯正

結果如下：

Pearson's Chi-squared test

data: x

X-squared = 1.3229, df = 2, p-value = 0.5161

本篇來源于 www.stathome.cn

原文連結：http://www.stathome.cn/html/S-plus_R/Rrumen/2009/0604/474.html

轉載于:https://www.cnblogs.com/zwz123456/articles/7086972.html

統計學術思想R案例網絡收集和介紹

繼續閱讀

字元串功能實作

Python TensorFlow循環神經網絡RNN-LSTM神經網絡預測股票市場價格時間序列和MSE評估準确性

【算法提高班】貪婪政策

《貪婪的動态規劃》

分治法實作求解最大子數組

UVA 10154:Weights and Measures Weights and Measures

Matlab随機波動率SV、GARCH用MCMC馬爾可夫鍊蒙特卡羅方法分析匯率時間序列

Lagrange插值的R語言實作

Linux Kernel Development　學習

動态規劃、最小費用流例題 — nyoj_712 探尋寶藏

R語言-相關性分析函數

拓端tecdat|R語言彈性網絡Elastic Net正則化懲罰回歸模型交叉驗證可視化

計算機開路人阿蘭·圖靈

基礎算法之二分查找

poj3249

PAT 1089 Insert or Merge[難]