R语言显示数据集结构-CFANZ编程社区

R语言显示数据集结构

R语言是一种广泛应用于数据分析和统计建模的编程语言。在进行数据分析的过程中，了解数据集的结构非常重要。R语言提供了多种方法来显示和分析数据集的结构，帮助我们更好地理解数据。

数据集

在本文中，我们将使用一个名为iris的经典数据集作为示例。iris数据集包含了150个观察值和5个变量，其中包括花萼长度、花萼宽度、花瓣长度、花瓣宽度和花的品种。我们将使用这个数据集来演示如何显示数据集的结构。

首先，我们需要加载iris数据集。R语言内置了一些常用的数据集，我们可以直接使用data()函数加载这些数据集。

data(iris)

数据集的结构

要了解数据集的结构，我们可以使用以下几种方法：

`str()`函数

str()函数用于显示对象的结构和摘要信息。对于数据集来说，它会显示每个变量的名称、类型和前几个观察值的值。

str(iris)

输出结果如下：

'data.frame':	150 obs. of  5 variables:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
 $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
 $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

从上面的输出结果可以看出，iris数据集是一个data.frame对象，有150个观察值和5个变量。其中，Sepal.Length、Sepal.Width、Petal.Length和Petal.Width是数值类型的变量，Species是一个因子类型的变量。

`summary()`函数

summary()函数用于显示数据集的摘要统计信息。对于数值型变量，它会显示最小值、最大值、均值、中位数等统计量；对于因子型变量，它会显示每个水平的频数。

summary(iris)

输出结果如下：

  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species  
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100   setosa    :50  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300   versicolor:50  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300   virginica :50  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199                  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800                  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500

`head()`函数

head()函数用于显示数据集的前几行观察值。默认情况下，它会显示前6行观察值。

head(iris)

输出结果如下：

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0

R语言显示数据集结构

R语言显示数据集结构

数据集

数据集的结构

str()函数

summary()函数

head()函数

`str()`函数

`summary()`函数

`head()`函数