10.4 Exercícios
Exercício 10.7 Leia:
(a) a documentação da função fviz_nbclust
.
(b) https://www.datanovia.com/en/lessons/determining-the-optimal-number-of-clusters-3-must-know-methods.
(c) A Seção e. Graphical Output Concerning Each Clustering, pg. 83-88 de (Rousseeuw and Kaufman 1990).
\(\\\)
Exercício 10.8 Considere novamente o conjunto de dados pib
.
(a) Verifique as sugestões do número ótimo de grupos com os diferente métodos disponíveis na função fviz_nbclust
.
(b) Crie o grupamento que considerar mais adequado aos dados e apresente com a função fviz_cluster
.
(c) Compare os resultados com o Exercício 10.2.
\(\\\)
Exercício 10.9 Considere o conjunto de dados drinks
, discutido no Capítulo 9.5.
(a) Calcule as distâncias de Manhattan, euclidiana e de Minkowski com \(p=3\).
(b) Obtenha os modelos hierárquicos utilizando as três distâncias do item (a). Você nota alguma diferença?
(c) Obtenha a seleção inicial dos centróides a partir de proposta de (Hartigan 1975) apresentada na Equação (10.6). Sugestão: escreva uma função que dependa dos dados e de \(k\), realizando alguma correção que considerar relevante.
(d) Calcule os centróides dos grupos obtidos no item (c).
(e) Calcule a \(VQI\) dos grupos obtidos no item (c) a partir da Eq. (10.4).
(f) Calcule a \(SQT\) dos grupos obtidos no item (c) a partir da Eq. (10.5).
(g) Verifique as sugestões do número ótimo de grupos com os diferente métodos disponíveis na função fviz_nbclust
.
(h) Crie o grupamento que considerar mais adequado aos dados e apresente com a função fviz_cluster
.
Exercício 10.10 Considere o banco de dados sobre eficiência energética didcutido no Exemplo 5.2.
(a) Calcule as distâncias de Manhattan, euclidiana e de Minkowski com \(p=3\).
(b) Obtenha os modelos hierárquicos utilizando as três distâncias do item (a). (PODE DEMORAR!)
(c) Verifique as sugestões do número ótimo de grupos com os diferente métodos disponíveis na função fviz_nbclust
.
(d) Crie o grupamento que considerar mais adequado aos dados e apresente com a função fviz_cluster
.