3.2 Gráficos multivariados
Recomenda-se a leitura da seção de Visualização de Estatística Básica.
3.2.2 Correlograma
Adaptado de http://www.r-graph-gallery.com/97-correlation-ellipses/.
# Bibliotecas
library(ellipse)
library(RColorBrewer)
# Usando o famoso banco de dados 'mtcars'
R <- cor(mtcars[,-c(8,9)])
# Painel de 100 cores com Rcolor Brewer
my_colors <- brewer.pal(5, "Spectral")
my_colors <- colorRampPalette(my_colors)(100)
# Ordenando a matriz de correlação
ord <- order(R[1, ])
R_ord <- R[ord, ord]
plotcorr(R_ord , col=my_colors[R_ord*50+50] , mar=c(1,1,1,1))
Adaptado de http://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html#Correlogram.
# Bibliotecas
library(ggplot2)
library(ggcorrplot)
# Matriz de correlação
data(mtcars)
R <- round(cor(mtcars[,-c(8,9)]), 1)
# Gráfico
ggcorrplot(R, hc.order = TRUE,
type = 'lower',
lab = TRUE,
lab_size = 3,
method = 'circle',
colors = c('tomato2', 'white', 'springgreen3'),
title = 'Correlograma de mtcars',
ggtheme = theme_bw)
Exercício 3.4 Considere o banco de dados iris
.
a. Obtenha as medidas-resumo média e matriz de covariância das variáveis numéricas.
b. Apresente os resultados de forma gráfica.
\(\\\)
3.2.3 Gráfico qui
Gráficos qui (N. I. Fisher and Switzer 1985), (N. I. Fisher and Switzer 2001) fornecem um método para diagnosticar dependência multivariada entre \(Y\) variáveis.
Exemplo 3.5 Considere os gráficos a seguir, inspirados no exemplo da documentação de asbio::chi.plot
.
library(asbio)
library(mvtnorm)
# X simulado com correlação 0.9
set.seed(1); X <- mvtnorm::rmvnorm(100, mean = c(15,18),
sigma = matrix(c(2^2, 0.9*2*3.2,
0.9*2*3.2, 3.2^2), nrow = 2))
# Y simulado com correlação 0
set.seed(2); Y <- mvtnorm::rmvnorm(100, mean = c(15,18),
sigma = matrix(c(2^2, 0,
0, 3.2^2), nrow = 2))
# gráficos
par(mfrow=c(2,2))
plot(X[,1], X[,2], main = 'Correlação 0.9')
asbio::chi.plot(X[,1], X[,2], main = 'Pontos acima das bandas')
plot(Y[,1], Y[,2], main = 'Correlação 0')
asbio::chi.plot(Y[,1], Y[,2], main = 'Pontos dentro das bandas')
Exercício 3.5 Considere os dados do Exemplo 3.5.
a. Por que os elementos da diagonal principal de \(\Sigma\) estão elevados ao quadrado?
b. A partir da Eq. (3.21) verifique por que a diagonal secundária da matriz \(\Sigma\) de \(X\) é dada por 0.9*2*3.2
.
c. Crie uma variável \(Z\) com correlação -0.7 e analise seu gráfico qui.
3.2.4 The Grand Tour
(Asimov 1985) apresenta o Grand Tour, método para visualizar dados estatísticos multivariados por meio de projeções ortogonais em uma sequência de subespaços bidimensionais. Exemplos de aplicação podem ser encontrados no pacote Pursuit
de (Ossani and Cirillo 2021), detalhado na Seção 8.4.