还是要说一句抱歉,花花的课程安排的恰到好处,难度适中,也可以让我们这些初学者认识R及其软件,同时也可以进行一些简单基础的命令。我昨天没有按时完成作业,下班了现在立刻回归到课程中补完自己欠下的,我自己还是十分重视本次培训的,希望不要被嫌弃就好。。。。
R中重要的数据类型
本次课程提到了两个重要的数据类型,向量,数据框。
向量
我对于向量
的理解,就是向量可以是一连串的数字组成的组合
如
> x<-c(1,2,3)
> x
[1] 1 2 3
这里的x就是一个向量,当然除了一串数字组合是向量以外,也可以是由字符串组成,向量其中单个的字符串(chr
)、数字,我们都可以称元素
,构成向量的基本单元
其中还有一个元素构成的名为标量
的名词
总结一下,单个的数字、字符串可以作为独立的元素按照一定顺序,组成向量(使用字符串时,每个字符串注意使用“”),同时单个元素也可以独立构成一个标量
赋值
在R中赋值时使用< -
,代替=
进行赋值,可以理解,< -
就像一个箭头,所代表的含义自然是好理解的,将等式右侧的向量、标量指向左侧的字符。
x<-c(1,2,3)
x
x<-1:10
x
x <- seq(1,10,by=0.5)
x
x <- rep(1:3,times=2)
x
在以上的代码中,反复给“x”赋值,每次赋值后,前一次的赋值就会被后面的赋值所覆盖代替,当自己运行代码量十分大时,建议反复使用确认自己当前的变量到底是谁,同时对于数据的类型
和 数据结构
都应充分了解,这两个所涉及的函数分别是、。
当自己赋值给变量后如何查看,文中花花介绍了一种方法,可以通过RStudio的环境变量框中可以双击自己刚赋值的变量名,如果变量是data.frame
,可以看到两个变化,在控制台可以看到view(a)
的代码,
在命令输入栏中会看到如图
也可以直接在命令输入栏中直接输入变量名,再点击
RUN
or crtl+enter
运行,也可以查看自己的变量。有了自己构建的向量后,可以尝试从中提取数据
1.根据位置
2.根据数值
数据框
在R中表格改名叫数据框
在开始进行数据框的操作前,一定确保自己创建了一个.Rproj
的工作目录,将花花给的数据粘到新建的.txt
文件中,将其转移到自己的工作目录。
然后利用函数
read.table
,read.csv
等函数进行本地文件的读取,注意在读取时,每个函数有自己的参数需要修改
read.table(file = "huahua.txt",sep = "\t",header = T)
sep参数:需要根据去查看原始的数据 数据见如果是空格相隔开,有可能是使用空格键也有可能是使用Tab键进行隔开,空格的话就可以设置sep = " "
,如果是Tab键隔开可以设置sep = "\t"
,r如果是read.csv
,其元素之间采用,
进行分隔,就可以设置参数sep = ","
。
header参数:有些数据框有自己的表头,比如进行GEO数据分析时,我们得到的表达矩阵的表头是数据的样本编号,这个给是需要将这些编号作为数据框的表头的,设置时为header = T
,注意要用大写T或者Truth,在R语言中,大小写是必须区分的,包括括号、逗号等符号都要改成英文状态下的样子。
后续还包括
- 设置行名和列名
花花在给变量X
赋值时,将变量改成了大写x,这里就一个小小的坑,不仔细看的话,会在后续查看变量名时,将X
写成x
,然后后就会看到x not found
的提示啦。当然本次课程最后,花花提出的问题也是这个原因,我自己复制了以后运行同样的报错,发现还是变量大小写的问题,一定要保证变量的一致性,具体到大小写上都要仔细,或者使用容易辨别的命名方式。 -
数据框的导出
其实导出这里的参数设置我还不明白,需要自己看说明或者求助。
-
变量的保存与重新加载
-
提取元素
这里就要靠记忆了。