R语言学习-基础篇1

###第一周：R基础

rm(list = ls()) #ctr+L

###矩阵相乘，函数diag()

a=matrix(1:12,nrow=3,ncol=4)

b=matrix(1:12,nrow=4,ncol=3)

a%*%b

a=matrix(1:16,nrow=4,ncol=4)

diag(a)#返回对角线元素

diag(diag(a))

diag(4)#对角线为1的单位矩阵

###矩阵求逆，函数rnorm(),solve()

a=matrix(rnorm(16),4,4)#产生4*4的随机数

solve(a)#矩阵求逆！！！！(逆矩阵)

b=c(1:4)

solve(a,b)#求方程的解

##矩阵的特征值、特征向量eigen()

a=diag(4)+1

a.e=eigen(a,symmetric = T)

a.e

a.e$vectors%*%diag(a.e$values)%*%t(a.e$vectors)####??????

###数组

x=c(1:6)

is.vector(x)#x是一个向量吗。

is.array(x)#x不是数组

dim(x)<-c(2,3)#增加维数，x变为数组

is.matrix(x)#x也是一个矩阵

####数据框，与矩阵的区别，矩阵每个元素都是数字(数组也类似），矩阵形式，但每列可以是不同的类型

x1=c(1,2,3,4,5,6,7,8,9,10)

length(x1)

x2=c(1,2,3,4,5,6,10,7,8,9)

length(x2)

x=data.frame(x1,x2)#向量组合成为数据框，可以是不同类型，数组或字符，x1与x2长度相等

(x=data.frame('重量'=x1,'运费'=x2))#替换列头

#画散点图，函数plot()

plot(x)

#读文本文件数据，先设置工作目录，把文本文件放于该目录下

x=read.csv("F:\\R语言\\data.csv")

#读剪贴板(文本或Excel数据可通过剪贴板操作)

y=read.table("clipboard",header = F)#header=T表示不读列头

#Excel文件(方法一：另存为空格分隔(就是原先的空格变为，）的prn文本格式再读)

w=read.table("F:\\R语言\\data.prn",header = T)

#方法2：安装RODBC包，再通过ODBC读

install.packages("RODBC")

library(RODBC)#装载包

z<-odbcConnectExcel("F:\\R语言\\student.xls")

(w<-sqlFetch(z,"Sheet1"))

#####循坏语句（for语句）

a=0

for(i in 1:59){a[i]=i*2+3} #格式for(循坏变量 in 遍历范围){循坏体(向量a里的第i个元素=啥，将i按指定的规律赋值)}

for(i in 1:59){a[i]=i*2+3;b[i]=i*5-4}

b=0

b#(与a、b的初始值无关，但是要有初始值)

##while语句

a[1]=5

i=1

while(a[i]<121){i=i+1;a[i]=a[i-1]+2}##满足这个条件便开始循坏

###source()函数，print()函数

source("F:\\R语言\\learningR.R")##运行脚本语言

print(x)#在监控台来显示结果

######综合性例子,模拟产生统计专业同学的名单（学号区分），记录数学分析，线性代数，概率统计三科成绩，然后进行统计分析

num=seq(2120170400,2120170400)#seq()函数产生向量，产生100个不同的学号

num

#用runif和rnorm

#产生100个均匀分布的随机数,上限是100，下限是80，产生的向量可能会有小数点，用round()函数四舍五入

x1<-round(runif(100,min=80,max=100))

x2=round(rnorm(100,mean = 80,sd=7))#均值为80，标准差为7,正态分布

x3=round(rnorm(100,mean = 83,sd=18))#均值为83，标准差为18

x3[which(x3>100)]=100#先找到大于100的数的下标，再将此下标对应的值赋值为100

##合成数据框并保存到硬盘

#data.frame()

#write.table()

x=data.frame(num,x1,x2,x3)

write.table(x,file = "F:\\R语言\\mark.txt",col.names = F,row.names = F,sep = " ")#将x数据框写入到文件指定的地方

##计算各科的平均分mean(),collMeans(),apply()

mean(x)###运行为NA

colMeans(x)##对列求平均值,会对学号也求平均值

colMeans(x)[c("x1","x2","x3")]#不显示列

apply(x,2,mean)#表示对x数据框作2（列）求mean操作，--1（行操作）

###求各科最高最低分

apply(x, 2, max)#对列求最高分

apply(x,2,min)#对列求最低分

##求每个人的总分

sum=apply(x[c("x1","x2","x3")],1,sum)

x=data.frame(num,x1,x2,x3,sum)

R语言学习-基础篇1

继续阅读

生物信息学入门使用 GEO基因芯片数据进行差异表达分析（DEG）——Limma 算法数据代码结果解读

为什么选择R语言为什么选择R语言

Aspera/FTP下载SRA/fastq文件后根据样本信息进行批量重命名

bam格式转换为Fastq/Fasta格式bam格式转换为Fastq/Fasta格式

非参数统计分析

R语言实战 - 基本统计分析（1）- 描述性统计分析

跟着Cell学单细胞转录组分析(十二):转录因子分析

R语言|绘制三维图

数据的归一化（Normalization）、标准化（Standardization）

R语言| 中介效应分析，Mediation包和BruceR包，循环Process函数

【R语言】GARCH模型的应用一、数据来源二、数据分析三、模型建立四、模型优化五、结论六、实现代码七、参考资料

Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

Matlab随机波动率SV、GARCH用MCMC马尔可夫链蒙特卡罗方法分析汇率时间序列

Lagrange插值的R语言实现

R语言-相关性分析函数

拓端tecdat|R语言弹性网络Elastic Net正则化惩罚回归模型交叉验证可视化