r语言怎么看数据类型（r语言如何查看数据） - 杂七乱八

今天给各位分享r语言怎么看数据类型的知识，其中也会对r语言如何查看数据进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、R语言系列之1------数据类型
2、R语言基础之第一部分 5种数据对象类型
3、R语言数据对象类型
4、关于R语言的数据类型和数据结构的如何区分
5、《R语言实战》自学笔记22-数据整理
6、R语言mode() str() class()辨析

R语言系列之1------数据类型

最近身体状况不太好的我，已经懒惰到不太想用脑子思考问题了，但也总不能什么事情都不做就这样蹉跎岁月吧，于是想着把自己之前的知识总结总结。今天就先把R语言的知识总结总结吧。

R语言是一个应用非常广泛的并且免费的用于统计计算和作图的计算机语言，无论什么和数据分析有关的行业，基本都会用到R。R 环境由一组数据操作，计算和图形展示的工具构成。它的特色在于：1.有效的数据处理和保存机制；2.完整的数组和矩阵计算操作符；3.连贯而又完整的数据分析工具；4.图形工具可以对数据直接进行分析和展示，同时可用于多种图形设备；5.它是一种相当完善，简洁而又高效的程序设计语言(也就是‘S’)。

基本的数据类型：

向量有一些基本运算：

求三角函数的值：sin(x)，cos(x)，tan(x)

向量开根号：sqrt(x)

求向量的和：sum(x)

向量的最大值和最小值：max(x) 和min(x)。

向量的范围： range (x)

向量的长度： length(x)

向量的均值： mean(x)

向量的方差： var(x)

向量的标准差：sd(x)

向量的累乘： prod(x)

数组可以看作是带有多个下标类型相同的元素集合，如数值型。

维度向量（dimension vector）是一个正整数向量。如果它的长度为k，那么该数组就是k-维的，例如矩阵是2-维数组。

数组只允许单一类型的值出现。

在R中数组用array()函数建立。

矩阵是一个2维的数组，一般用matrix()来构建一个矩阵，array()也可以创建一个2维数组（矩阵）。

例子：定义一个从1到20，行数为4，列数为5的矩阵。

向量的合并：

也可以用cbind()和rbind()函数将相同长度的向量接合成矩阵。

t()可以将矩阵进行转置，或用aperm()代替。

同样矩阵也可以做合并，同样是用rbind和cbind。

rbind和cbind,除能合并等长的向量外，还能合并数据框和矩阵。

矩阵工具：1).函数nrow(A) 和ncol(A) 将会分别返回矩阵A 的行数和列数.2).colnames(A);rownames(A)会分别返回矩阵A 的列名和行名。3).将一个数组强制转换成简单向量的标准方法是用函数as.vector()，或用c()。

因子（factor）是一个对等长的其他向量元素进行分类（分组）的向量对象。 R同时提供有序（ordered）和无序（unordered）因子。有序意味着以字母排序。

函数factor()引入因子。

函数levels()表示因子的水平。

有序因子：函数ordered() 用来创建有序因子。在其他方面，函数ordered() 和factor() 基本完全一样。大多数情况下，有序和无序因子的唯一差别在于前者显示的时候反应了各水平的顺序。

7.1. R 的列表（list）是一个以对象的有序集合构成的对象。列表中包含的对象又称为它的分量（components）。

7.2. 分量可以是不同的模式或类型，如一个列表可以同时包括数值向量，逻辑向量，矩阵，复向量，字符数组，函数等等。

7.3. 列表的建立采用list()函数，列表通过[[index/name]]进行访问。

8.1. 数据框（data frame）是一个属于“data.frame” 类的列表。

8.2. 数据框常常会被看作是一个由不同模式和属性的列构成的矩阵。它能以矩阵形式出现，行列可以通过矩阵的索引习惯访问。

8.3. 用data.frame()函数构建数据框。

R语言基础之第一部分 5种数据对象类型

前记：

正文：

第一部分： 5种数据对象类型

1.1 向量（vector）

1.2 矩阵（matrix）

向量+维度属性(nrow ncol)

1.3 数组（array）

与矩阵相似，但维度可大于2（说白了元素都是数维度随便设）

1.4 列表（list）

可以包含不同类型

1.5 因子（factor）

整数向量+标签

1.6 缺失值（missing value）

NA：各种类型的缺失值

NAN：数值型的缺失值

NAN 属于 NA

is.na 和 is.nan 判断向量中是否有缺失值

1.7 数据框（data.frame）

存储表格数据，视为各元素长度相同的列表

1.8 日期与时间（date, time）

日期

时间

POSIXct 整数常用于存入数据框

POSIXIt 列表还包括年月日等信息

后续请参考：

R语言基础之第二部分 : 操纵数据取子集

R语言基础之第三部分：重要函数 apply族函数的使用

R语言基础之第四部分 : 排序

R语言基础之第五部分 : 总结数据信息

R语言数据对象类型

在R中尽量使用 - 进行赋值， - 更标准。在R中使用 = 进行赋值可能会出现错误（有些函数会将其解释为判断）——因为R起源于S语言，S语言的定义如此。

模式-使用mode()可以查看对象的数据类型

长度-使用length()可以查看对象的长度

标量可以是数字、字符、逻辑值等。

结果

向量可以由单个或多个值组成，多值的向量只能由相同类型的值组成，有一维和多维向量。

向量用于存储数值型、字符型、逻辑型数据

is.na()判断是否为缺失值，返回一个逻辑性向量

将自变量连接成一个字符串。

一般的使用形式是paste (..., sep = " ", collapse = NULL)， ... 表示想要连接的不同自变量，sep表示不同自变量之间添加的符号，collapse打开之后表示将整个自变量变成一个单一的变量

对对象进行重复

在统计学中，按照变量值是否连续把变量分为连续变量与离散变量两种。分类变量是说明事物类别的一个名称，其取值是分类数据。变量值是定性的，表现为互不相容的类别或属性。因子就是一类分类离散变量。

因子是带有水平（level）的向量。

factor()函数一般形式为：

可以用来筛选因子的level

Table()函数对应的就是统计学中的列联表，是一种记录频数的方法。对于因子向量，可用函数table()来统计各类数据的频率。Table()的结果是一个带元素名的向量，元素名为因子水平，元素值为该水平的出现频率。

tapply()是对向量中的数据进行分组处理，而非对整体数据进行处理。函数一般形式为：

gl()函数可以方便地产生因子，函数一般形式为：

矩阵是一个二维数组，只是每个元素都拥有相同的数据类型（数值型、字符型或逻辑型）。注意与数据框的差别，数据框不同列的数据类型可以不同。

函数matrix ()是构造矩阵（二维数组）的函数，其构造形式为：

数组与矩阵类似，但是维度可以大于2。数组有一个特征属性叫做维数向量(dim属性)，维数向量是一个元素取正整数值的向量，其长度是数组的维数，比如维数向量有两个元素时数组为二维数组(矩阵)。维数向量的每一个元素指定了该下标的上界，下标的下界总为1。

R软件可以用array()函数直接构造数组，其构造形式为:

数据框与矩阵类似，为二维，其数据框中各列的数据类型可以不同，但是长度必须一样。数据框在生物数据中用得比较多，是非常重要的一类数据类型。

数据框与矩阵不同的是数据框不同的列可以是不同的数据类型，并且数据框假定每列是一个变量，每行是一个观测值。

作为数据框变量的向量、因子或矩阵必须具有相同的长度（行数）。数据框可以用data.frame()函数生成，其用法与list()函数相同。

data.frame(col1,col2,col3.....)其中列向量col1,col2等可以是任何类型的向量

列表可以储存不同类型的数据，是一些对象的有序集合。它的元素也由序号(下标)区分，但是各元素的类型可以是任意对象，不同元素不必是同一类型。元素本身允许是其他复杂数据类型。比如一个列表的元素也允许是一个列表。

R软件中利用函数list()构造列表，一般语法为：

Lst-list(name_1=object_1,…, name_1=object_m)

其中name是列表元素的名称；object_i(i=1,…,m)是列表元素的对象。

unlist()函数：将list函数拉直成一个向量

关于R语言的数据类型和数据结构的如何区分

注意区分：数据类型和数据组成类型（数据结构）

数据类型：整型、浮点型、字符型、布尔型（不同的语言不同的叫法）

数据结构：向量(c())、矩阵(matrix())、数组(array())、列表(list())

注意：这里把数据框单拿出来讲（因为它比较特殊）

接下来通过一个实例讲解一下 S4数据结构。这是我采用clusterProfiler做KEGG富集分析时的一个结果，其采用 S4数据结构形式存放：

《R语言实战》自学笔记22-数据整理

数据准备

向一个数值型向量中添加一个字符串会将此向量中的所有元素转换为字符型。

is.datatype()用于判断数据类型，返回值为TRUE或FALSE，常见类型包括数值型numeric、字符型character、逻辑型logical、数据框data.frame等。 as.datatype()可将数据类型进行转化。

查看数据类型：mode(), class(), typeof(), storage.mode()

逻辑值转换成数值时，TRUE转换成1，FALSE转换成0。

函数：order(x,decreasing=F,na.last=NA)

x是要排序的数据，可以是数据框也可以是向量，decreasing=F是默认升序，在排序变量前加一个减号可得到降序排序结果，na.last =NA表示将NA元素移到最后，否则，将NA放在第一个。

函数：cbind(A, B) ，不需要指定一个公共索引对数据框进行合并。

cbind：根据列进行合并，即叠加所有列，m列的矩阵与n列的矩阵cbind()最后变成m+n列，合并前提：cbind(a, c)中矩阵a、c的行数必需相符。

merge(A, B) ：横向合并两个数据框（数据集），在多数情况下，两个数据框是通过一个或多个共有变量进行联结的（即一种内联结，inner join）。

rbind(A, B) ：纵向合并两个数据框（数据集），两个数据框必须拥有相同的变量，不过它们的顺序不必一定相同。

rbind：根据行进行合并，就是行的叠加，m行的矩阵与n行的矩阵rbind()最后变成m+n行，合并前提：rbind(a, c)中矩阵a、c的列数必需相符。

函数：dataframe[row indices, column indices] dataframe为要索引的数据框，[]中，前面的是行，后面是列。

在某一列或行的下标之前加一个减号（-）就会剔除那一列或行。

subset(x, subset, select, drop = FALSE, ...)

x是要进行操作的数据框，subset是对数据的某些字段进行操作，select是选取要显示的字段。

sample(x, size, replace = FALSE, prob = NULL)

x表示所要抽样数据，size表示抽样元素个数，replace为T表示采取有重复的抽样，prob用于指定抽样的概率。

参考资料：

R语言mode() str() class()辨析

1、mode()会输出一个R对象的基本数据类型（模式）

R可以处理的数据类型（types）（也叫模式（modes））包括数值型、字符型、布尔型、复数型（虚数）和原生型（字节）。

2、str()函数会输出一个R对象的结构

基本的数据结构（向量、矩阵、数组、数据框、因子、列表）

3、class()查看某对象的类型

class：是一种抽象类型，或者理解为一种数据结构（数据框，因子，列表）

他主要是用来给泛型函数（参考java中泛型的概念）识别参数用。

patientID - c(1, 2, 3, 4)

age - c(25, 34, 28, 52)

diabetes - c("Type1","Type2","Type1","Type1")

status - c("Poor","Improved","Excellent","Poor")

patientdata - data.frame(patientID, age, diabetes,status)

r语言怎么看数据类型（r语言如何查看数据）,r语言怎么看数据类型,信息,文章,java,第1张

r语言怎么看数据类型的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于r语言如何查看数据、r语言怎么看数据类型的信息别忘了在本站进行查找喔。

源码村长

分享到：