常用的統計函數如表5-3所示,其中許多函數都擁有可以影響輸出結果的可選參數。舉例
來說:
y<- mean(x)
提供了對象x中元素的算術平均數,而:
y<-mean(x,trim=0.05,na.rm=TRUE)
則提供了截尾平均數,即丢棄了最大5%和最小5%的資料和所有缺失值後的算術平均數。請使用
help()了解以上每個函數和其參數的用法。
mean(x) 平均數
mean(c(1,2,3,4))傳回值為2.5
median(x) 中位數
median(c(1,2,3,4))傳回值為2.5
sd(x) 标準差
sd(c(1,2,3,4))傳回值為1.29
var(x) 方差
var(c(1,2,3,4))傳回值為1.67
mad(x) 絕對中位差(median absolute deviation)
mad(c(1,2,3,4))傳回值為1.48
quantile(x,probs) 求分位數。其中x為待求分位數的數值型向量,probs為一個由[0,1]之間的機率值組成
的數值向量
# 求x的30%和84%分位點
y <- quantile(x, c(.3,.84))
range(x) 求值域
x <- c(1,2,3,4)
range(x)傳回值為c(1,4)
diff(range(x))傳回值為3
sum(x) 求和
sum(c(1,2,3,4))傳回值為10
diff(x, lag=n) 滞後差分,lag用以指定滞後幾項。預設的lag值為1
x<- c(1, 5, 23, 29)
diff(x)傳回值為c(4, 18, 6)
min(x) 求最小值
min(c(1,2,3,4))傳回值為1
max(x) 求最大值
max(c(1,2,3,4))傳回值為4
scale(x,center=TRUE,
scale=TRUE)