3.2 Gráficos multivariados

Recomenda-se a leitura da seção de Visualização de Estatística Básica.

3.2.1 Matriz de dispersão

pairs(mtcars[,-c(8,9)])  # desconsiderando vs e am

3.2.2 Correlograma

Adaptado de http://www.r-graph-gallery.com/97-correlation-ellipses/.

# Bibliotecas
library(ellipse)
library(RColorBrewer)

# Usando o famoso banco de dados 'mtcars'
R <- cor(mtcars[,-c(8,9)])

# Painel de 100 cores com Rcolor Brewer
my_colors <- brewer.pal(5, "Spectral")
my_colors <- colorRampPalette(my_colors)(100)

# Ordenando a matriz de correlação
ord <- order(R[1, ])
R_ord <- R[ord, ord]
plotcorr(R_ord , col=my_colors[R_ord*50+50] , mar=c(1,1,1,1))

Adaptado de http://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html#Correlogram.

# Bibliotecas
library(ggplot2)
library(ggcorrplot)

# Matriz de correlação
data(mtcars)
R <- round(cor(mtcars[,-c(8,9)]), 1)

# Gráfico
ggcorrplot(R, hc.order = TRUE,
           type = 'lower',
           lab = TRUE,
           lab_size = 3,
           method = 'circle',
           colors = c('tomato2', 'white', 'springgreen3'),
           title = 'Correlograma de mtcars',
           ggtheme = theme_bw)

Exercício 3.4 Considere o banco de dados iris. a. Obtenha as medidas-resumo média e matriz de covariância das variáveis numéricas. b. Apresente os resultados de forma gráfica. \(\\\)

3.2.3 Gráfico qui

Gráficos qui (N. I. Fisher and Switzer 1985), (N. I. Fisher and Switzer 2001) fornecem um método para diagnosticar dependência multivariada entre \(Y\) variáveis.

Exemplo 3.5 Considere os gráficos a seguir, inspirados no exemplo da documentação de asbio::chi.plot.

library(asbio)
library(mvtnorm)
# X simulado com correlação 0.9
set.seed(1); X <- mvtnorm::rmvnorm(100, mean = c(15,18), 
                                   sigma = matrix(c(2^2, 0.9*2*3.2,
                                                    0.9*2*3.2, 3.2^2), nrow = 2))
# Y simulado com correlação 0
set.seed(2); Y <- mvtnorm::rmvnorm(100, mean = c(15,18), 
                                   sigma = matrix(c(2^2, 0,
                                                    0, 3.2^2), nrow = 2))
# gráficos
par(mfrow=c(2,2))
plot(X[,1], X[,2], main = 'Correlação 0.9')
asbio::chi.plot(X[,1], X[,2], main = 'Pontos acima das bandas')

plot(Y[,1], Y[,2], main = 'Correlação 0')
asbio::chi.plot(Y[,1], Y[,2], main = 'Pontos dentro das bandas')

Exercício 3.5 Considere os dados do Exemplo 3.5.
a. Por que os elementos da diagonal principal de \(\Sigma\) estão elevados ao quadrado?
b. A partir da Eq. (3.21) verifique por que a diagonal secundária da matriz \(\Sigma\) de \(X\) é dada por 0.9*2*3.2.
c. Crie uma variável \(Z\) com correlação -0.7 e analise seu gráfico qui.

3.2.4 The Grand Tour

(Asimov 1985) apresenta o Grand Tour, método para visualizar dados estatísticos multivariados por meio de projeções ortogonais em uma sequência de subespaços bidimensionais. Exemplos de aplicação podem ser encontrados no pacote Pursuit de (Ossani and Cirillo 2021), detalhado na Seção 8.4.

Referências

Asimov, Daniel. 1985. “The Grand Tour: A Tool for Viewing Multidimensional Data.” SIAM Journal on Scientific and Statistical Computing 6 (1): 128–43. https://doi.org/10.1137/0906011.
Fisher, N. I., and P. Switzer. 1985. “Chi-Plots for Assessing Dependence.” Biometrika 72 (2): 253–65. https://www.jstor.org/stable/2336078.
———. 2001. “Graphical Assessment of Dependence: Is a Picture Worth 100 Tests?” The American Statistician 55 (3): 233–39. https://doi.org/10.1198/000313001317098248.
Ossani, Paulo Cesar, and Marcelo Angelo Cirillo. 2021. Projection Pursuit. https://CRAN.R-project.org/package=Pursuit.