11.4 Exercícios

Exercício 11.7 Leia:
(a) a documentação da função fviz_nbclust.
(b) https://www.datanovia.com/en/lessons/determining-the-optimal-number-of-clusters-3-must-know-methods.
(c) A Seção e. Graphical Output Concerning Each Clustering, pg. 83-88 de (Rousseeuw and Kaufman 1990).
\(\\\)

Exercício 11.8 Considere novamente o conjunto de dados pib.
(a) Verifique as sugestões do número ótimo de grupos com os diferente métodos disponíveis na função fviz_nbclust.
(b) Crie o grupamento que considerar mais adequado aos dados e apresente com a função fviz_cluster.
(c) Compare os resultados com o Exercício 11.2. \(\\\)

Exercício 11.9 Considere o conjunto de dados drinks, discutido no Capítulo ??.
(a) Calcule as distâncias de Manhattan, euclidiana e de Minkowski com \(p=3\).
(b) Obtenha os modelos hierárquicos utilizando as três distâncias do item (a). Você nota alguma diferença?
(c) Obtenha a seleção inicial dos centróides a partir de proposta de (Hartigan 1975) apresentada na Equação (11.6). Sugestão: escreva uma função que dependa dos dados e de \(k\), realizando alguma correção que considerar relevante.
(d) Calcule os centróides dos grupos obtidos no item (c).
(e) Calcule a \(VQI\) dos grupos obtidos no item (c) a partir da Eq. (11.4).
(f) Calcule a \(SQT\) dos grupos obtidos no item (c) a partir da Eq. (11.5).
(g) Verifique as sugestões do número ótimo de grupos com os diferente métodos disponíveis na função fviz_nbclust.
(h) Crie o grupamento que considerar mais adequado aos dados e apresente com a função fviz_cluster.

dat <- read.table('https://filipezabala.com/data/drinks.txt', header = T, sep = '\t')

Exercício 11.10 Considere o banco de dados sobre eficiência energética didcutido no Exemplo 5.2.
(a) Calcule as distâncias de Manhattan, euclidiana e de Minkowski com \(p=3\).
(b) Obtenha os modelos hierárquicos utilizando as três distâncias do item (a). (PODE DEMORAR!)
(c) Verifique as sugestões do número ótimo de grupos com os diferente métodos disponíveis na função fviz_nbclust.
(d) Crie o grupamento que considerar mais adequado aos dados e apresente com a função fviz_cluster.

library(readxl)
url1 <- 'http://archive.ics.uci.edu/ml/machine-learning-databases/00242/ENB2012_data.xlsx'
download.file(url1, 'temp.xlsx', mode = 'wb')
dat <- read_excel('temp.xlsx')

Referências

Hartigan, John A. 1975. Clustering Algorithms. John Wiley & Sons, Inc.
Rousseeuw, Peter J, and L Kaufman. 1990. “Finding Groups in Data.” Hoboken: Wiley Online Library. https://onlinelibrary.wiley.com/doi/pdf/10.1002/9780470316801.