3 Estructura de datos

3.1 Vectores

Ejemplos de creación de vectores

## [1]  1  4  6  8 10

Cambiando un elemento del vector

## [1]  1  4 12  8 10

Generando un vector de secuencia de números

## [1] 0.00 0.25 0.50 0.75 1.00

Calculando la suma y estadísticas descriptivas del vector

## [1] 35
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       1       4       8       7      10      12

Sumando vectores

## [1]  1.00  4.25 12.50  8.75 11.00

3.2 Matrices

Se tiene el siguiente ejemplo que ilustra cómo se crean matrices

##      [,1] [,2] [,3]
## [1,]    9    3    5
## [2,]    2    4    6

El argumento data especifica los números que van en la matrix, ncol el número de columnas y nrow el número de filas

Tarea 6: Ponga los números del 31 al 60 en un vector llamado P y luego este vector pongalo en una matriz de 6 filas y 5 columnas llamada Q. Ayuda: use la funsión seq

La operación en matrices es similar a la operación en vectores

Por ejemplo, para seleccionar un elemento de una matriz, se procede como sigue

## [1] 3

Para seleccionar toda una fila de una matriz

## [1] 2 4 6

Para calcular la media de todos los elementos de una matriz

## [1] 4.833333

El cálculo de la media de una fila de una matriz

## [1] 5.666667

3.3 Data frames

Un data frame es la estructura de datos donde se guarda la información y es la estructura más común para guardar la base de datos

La estructura de un data frame es una matriz en que las filas corresponde a las observaciones o la unidad de observación, mientras que las columnas son las variables o vectores y se reportan los nombres de cada variable

Para crear un data frame con tres observaciones y tres variables

##    x  y  z
## 1 11 19 10
## 2 12 20  9
## 3 14 21  7

La media de una variable o columna se puede calcular con las siguientes opciones

## [1] 8.666667
## [1] 8.666667

Tarea 7: Crear un script donde se construyan tres vectores de 100 números aleatorios de una distribución normal con media 3.5 y desviación estándar de 2.1. Llame a estos vectores x1, x2 y x3. Construya un data frame llamado D con tres columnas con los nombres a, b y c, donde la primera columna es x1, la segunda es x1+x2 y la tercera es x1+x2+x3. Haga un plot de a, calcule la media y la desviación estándar de b, calcule el mínimo, máximo y mediana de c, haga un histograma de las tres variables e interpreterlos. Vuelva a correr el script

3.4 Listas

Otra estructura básica es el objeto list. La principal ventaja de este tipo de objetos es que las columnas no tienen la misma longitud, como en las matrices y data frames

Las listas se crean de la siguiente forma

## $one
## [1] 1
## 
## $two
## [1] 1 2
## 
## $five
## [1] 0.00 0.25 0.50 0.75 1.00