10.2 Conjuntos de dados

10.2.1 Air quality (Qualidade do ar)

O banco de dados datasets::airquality traz medições diárias da qualidade do ar em Nova York, de maio a setembro de 1973. Os dados foram obtidos do Departamento de Conservação do Estado de Nova York (dados de ozônio) e do Serviço Nacional de Meteorologia (dados meteorológicos) dos EUA.

str(airquality)
## 'data.frame':    153 obs. of  6 variables:
##  $ Ozone  : int  41 36 12 18 NA 28 23 19 8 NA ...
##  $ Solar.R: int  190 118 149 313 NA NA 299 99 19 194 ...
##  $ Wind   : num  7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...
##  $ Temp   : int  67 72 74 62 56 66 65 59 61 69 ...
##  $ Month  : int  5 5 5 5 5 5 5 5 5 5 ...
##  $ Day    : int  1 2 3 4 5 6 7 8 9 10 ...

10.2.2 Cars (Carros)

Os dados de datasets::cars fornecem a velocidade (em milhas por hora/mph) de 50 carros e as respectivas distâncias percorridas (em pés/ft) até a parada completa do veículo, registrados na década de 1920 e apresentados por (Ezekiel 1930).

str(cars)
## 'data.frame':    50 obs. of  2 variables:
##  $ speed: num  4 4 7 7 8 9 10 10 10 11 ...
##  $ dist : num  2 10 4 22 16 10 18 26 34 17 ...

Pode-se converter mph para km/h multiplicando a velocidade em mph por 1.60934. Da mesma forma converte-se pés para metros dividindo-se a distância em pés por 3.281.

carros <- cars
carros$speed <- cars$speed*1.600934
carros$dist <- cars$dist/3.281
str(carros)
## 'data.frame':    50 obs. of  2 variables:
##  $ speed: num  6.4 6.4 11.2 11.2 12.8 ...
##  $ dist : num  0.61 3.05 1.22 6.71 4.88 ...

10.2.3 Iris (Lírio)

O banco de dados datasets::iris foi originalmente publicado por (Anderson 1935), popularizado por (R. A. Fisher 1936). Consiste de medidas, em centímetros, das variáveis ‘comprimento’ e ‘largura’ da sépala e da pétala para 50 flores de cada uma das 3 espécies de lírio: ‘setosa’, ‘versicolor’ e ‘virginica’.

str(iris)
## 'data.frame':    150 obs. of  5 variables:
##  $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
##  $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
##  $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
##  $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
##  $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

Referências

Anderson, Edgar. 1935. “The Irises of the Gaspe Peninsula.” Bull. Am. Iris Soc. 59: 2–5.
Ezekiel, Mordecai. 1930. “Methods of Correlation Analysis.” https://ia801506.us.archive.org/5/items/in.ernet.dli.2015.263278/2015.263278.Methods-Of.pdf.
———. 1936. “The Use of Multiple Measurements in Taxonomic Problems.” Annals of Eugenics 7 (2): 179–88. http://rcs.chemometrics.ru/Tutorials/classification/Fisher.pdf.