11.2 Métodos hierárquicos

Como o nome sugere, os métodos hierárquicos buscam uma estrutura hierárquica dos grupos. Esta estrutura geralmente se dá em forma de árvore, onde os objetos são apresentados individualmente como um grupo unitário (folha/leaf) que se aglomeram por similaridade em grupos maiores (nós/nodes) ligados por um grande grupo que une todos elementos (raiz/root). Os passos para realizar um agrupamento hierárquico aglomerativo estão descritos a seguir.

ALGORITMO DE AGRUPAMENTO HIERÁRQUICO AGLOMERATIVO

PASSO 1 Padronizar os dados, geralmente com o uso da função scale.

PASSO 2 Calcular a (dis)similaridade entre cada par de objetos no conjunto de dados.

PASSO 3 Usar a função de ligação para agrupar os objetos na árvore a partir das informações de distância obtidas na passo 1.

PASSO 4 Apresentar o gráfico da árvore hierárquica em grupos (dendrograma), criando uma partição dos dados.

Exemplo 11.1 O conjunto de dados USArrests contém estatísticas sobre detenções por 100,000 residentes por agressão, homicídio e violação em cada um dos 50 estados dos EUA em 1973. Também é fornecida a percentagem da população que vive em áreas urbanas. Veja (Census 1975) e (McNeil 1977).

# 1. padronizando os dados
USArrest.scale <- scale(USArrests)
# 2. calculando distâncias (utilizando o padrão: euclidean)
dUSA <- stats::dist(USArrest.scale)
# 3. aplicando a função de ligação (utilizando o padrão: complete)
hc <- hclust(dUSA)
# 4. apresentando o gráfico
plot(hc)

11.2.1 Função stats::hclust

Segundo a documentação, a função stats::hclust “realiza uma análise hierárquica de cluster usando um conjunto de diferenças para os \(n\) objetos que estão sendo agrupados. Inicialmente, cada objeto é atribuído ao seu próprio cluster e então o algoritmo prossegue iterativamente, em cada estágio unindo os dois clusters mais semelhantes, continuando até que haja apenas um único cluster. Em cada estágio, as distâncias entre os clusters são recalculadas pela fórmula de atualização de dissimilaridade de Lance-Williams de acordo com o método de agrupamento específico que está sendo usado.

Vários métodos de cluster diferentes são fornecidos. O método de variância mínima de Ward visa encontrar aglomerados esféricos compactos. O método de ligação completa encontra clusters semelhantes. O método de ligação única (que está intimamente relacionado à árvore geradora mínima) adota uma estratégia de agrupamento de “amigos de amigos”. Os outros métodos podem ser considerados como visando clusters com características em algum lugar entre os métodos de link único e completo. Observe, no entanto, que os métodos “mediana” e “centróide” não levam a uma medida de distância monótona ou, equivalentemente, os dendrogramas resultantes podem ter as chamadas inversões ou reversões que são difíceis de interpretar, mas observe as tricotomias em (Legendre and Legendre 2012).

Dois algoritmos diferentes são encontrados na literatura para agrupamento de Ward. A opção “ward.D” não implementa o critério de agrupamento de (Ward Jr 1963), enquanto a opção “ward.D2” implementa esse critério (Murtagh and Legendre 2014). Com este último, as diferenças são elevadas ao quadrado antes da atualização do cluster.

Nas exibições hierárquicas de cluster, é necessária uma decisão em cada fusão para especificar qual subárvore deve ficar à esquerda e qual deve ficar à direita. Como, para n observações, há \(n−1\) mesclagens, existem \(2^{n-1}\) ordenações possíveis para as folhas em uma árvore de cluster, ou dendrograma. O algoritmo usado em hclust é ordenar a subárvore de modo que o cluster mais compacto fique à esquerda (a última mesclagem, ou seja, a mais recente, da subárvore esquerda tem um valor inferior ao da última mesclagem da subárvore direita). As observações únicas são os agrupamentos mais compactos possíveis, e as fusões envolvendo duas observações as colocam em ordem pelo seu número de sequência de observação.

11.2.1.1 Distâncias cofenéticas

Any classification or partition can be fully described by a cophenetic matrix. This matrix is used for comparing different classifications of the same objects. (Legendre and Legendre 2012, 312)

Os valores no eixo \(y\), intitulados height, são as chamadas distâncias cofenéticas propostas por (Sokal and Rohlf 1962). O nome vem da área da Biologia chamada fenética, que estuda métodos de classificação por similaridade fenotípica. Seu cálculo não é complexo, mas pode ser trabalhoso; assim, será considerada a função stats::cophenetic para a obtenção de tais distâncias. Quanto maior for seu valor, mais dissimilar são os elementos comparados. Correlação elevada entre as distâncias calculadas e as distâncias cofenéticas sugere um bom agrupamento.

# Calcula a matriz de distâncias cofenéticas
coph <- cophenetic(hc)
sort(unique(coph))
##    [1] 0.2058539 0.3502188 0.4287712 0.4940832 0.5303259 0.5303259 0.5353893 0.5935343 0.6457158
##   [10] 0.6457158 0.7038309 0.7108812 0.7389936 0.7722224 0.7781298 0.7865674 0.7977642 0.8286936
##   [19] 0.8286936 0.8412900 0.8412900 0.8412900 0.8412900 0.8412900 0.8412900 0.8457697 0.8457697
##   [28] 0.9824857 0.9971035 0.9971035 1.0122252 1.0354597 1.0354597 1.0709720 1.0800988 1.0800988
##   [37] 1.0918624 1.0918624 1.0918624 1.1314351 1.1314351 1.1314351 1.1314351 1.1826891 1.1826891
##   [46] 1.1968261 1.2117356 1.2117356 1.2117356 1.2502752 1.2502752 1.2716808 1.2716808 1.2716808
##   [55] 1.2716808 1.3329504 1.3329504 1.3329504 1.3329504 1.3329504 1.3329504 1.3329504 1.3329504
##   [64] 1.3329504 1.3988595 1.3988595 1.4668378 1.4668378 1.6230495 1.6230495 1.6230495 1.6448574
##   [73] 1.6448574 1.6448574 1.6448574 1.6448574 1.6448574 1.6448574 1.6448574 1.6448574 1.6448574
##   [82] 1.6448574 1.6448574 1.6585736 1.6585736 1.6585736 1.6585736 1.6585736 1.6585736 1.6585736
##   [91] 1.6585736 1.6585736 1.6585736 1.8537984 1.8537984 1.8537984 1.8537984 1.8537984 1.8537984
##  [100] 1.8537984 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801
##  [109] 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801 1.8649801
##  [118] 1.8649801 1.8649801 1.8649801 1.8649801 2.2630242 2.2630242 2.2630242 2.2630242 2.2630242
##  [127] 2.2630242 2.2630242 2.2630242 2.2630242 2.2630242 2.2630242 2.2630242 2.2952287 2.2952287
##  [136] 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287
##  [145] 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287 2.2952287
##  [154] 2.2952287 2.2952287 2.2952287 2.2952287 2.3374653 2.3374653 2.3374653 2.3374653 2.3374653
##  [163] 2.3374653 2.3374653 2.3374653 2.3374653 2.3374653 2.3374653 2.3374653 2.4458600 2.4458600
##  [172] 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600
##  [181] 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600 2.4458600
##  [190] 2.4458600 2.4458600 2.4458600 2.4458600 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807
##  [199] 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807
##  [208] 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807
##  [217] 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807
##  [226] 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 2.4748807 3.0883430
##  [235] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [244] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [253] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [262] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [271] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [280] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [289] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [298] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [307] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [316] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430
##  [325] 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.0883430 3.2554326 3.2554326
##  [334] 3.2554326 3.2554326 3.2554326 3.2554326 3.2554326 4.4005416 4.4005416 4.4005416 4.4005416
##  [343] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [352] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [361] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [370] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [379] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [388] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [397] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [406] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [415] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [424] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [433] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [442] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [451] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [460] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [469] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [478] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [487] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [496] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [505] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [514] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [523] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [532] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416
##  [541] 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4005416 4.4200736
##  [550] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [559] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [568] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [577] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [586] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [595] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [604] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [613] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [622] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736
##  [631] 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 4.4200736 6.0766416 6.0766416 6.0766416
##  [640] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [649] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [658] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [667] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [676] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [685] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [694] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [703] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [712] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [721] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [730] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [739] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [748] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [757] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [766] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [775] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [784] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [793] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [802] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [811] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [820] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [829] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [838] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [847] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [856] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [865] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [874] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [883] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [892] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [901] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [910] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [919] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [928] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [937] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [946] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [955] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [964] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [973] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [982] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
##  [991] 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416 6.0766416
## [1000] 6.0766416
##  [ reached getOption("max.print") -- omitted 225 entries ]
# Correlação entre as distâncias cofenéticas e as distâncias originais (maior, melhor)
cor(coph,dUSA)
## [1] 0.6979437

11.2.2 Biblioteca factoextra

É possível melhorar a visualização do dendrograma utilizando a função factoextra::fviz_dend.

library(factoextra)
fviz_dend(hc, cex = 0.6)  # fonte com 60% do tamanho

Pode-se utilizar a função fviz_dend para colorir um número arbitrário de grupos. Note que os grupamentos são obtidos de cima pra baixo, dependente dos valores de height (distâncias cofenéticas).

fviz_dend(hc, k = 2,  # 2 grupos
          cex = 0.6,  # tamanho do texto/rótulo (label)
          rect = TRUE # adiciona retângulos ao redor dos grupos
)

fviz_dend(hc, k = 3,  # 3 grupos
          cex = 0.6,  # tamanho do texto/rótulo (label)
          rect = TRUE # adiciona retângulos ao redor dos grupos
)

fviz_dend(hc, k = 4,  # 4 grupos
          cex = 0.6,  # tamanho do texto/rótulo (label)
          rect = TRUE # adiciona retângulos ao redor dos grupos
)

Exercício 11.3 Considere novamente o conjunto de dados pib. Crie dendrogramas com a função fviz_dend utilizando:
(a) dados originais e padronizados;
(b) diferentes distâncias;
(c) diferentes números de grupos.

Exercício 11.4 (E. L. Thorndike 1939, 156) apresenta uma tabela com a pountuação em uma escala de critérios com 10 itens para 7 cidades. As variáveis de critério estão descritas a seguir e podem ser obtidas diretamente do arquivo city-thorn.csv.

V1: Taxa de mortalidade infantil reversa
V2: Despesas com recreação
V3: Valor de escolas, parques, etc.
V4: Propriedade menos dívida
V5: Despesas com escolas
V6: Graduados do ensino médio
V7: Circulação da biblioteca
V8: Proporção de jovens de 16 e 17 anos na escola
V9: Telefones
V10: Casas com fiação elétrica

A partir dos dados fornecidos, crie um dendrograma segmentando as cidades em 4 grupos .

city <- read.csv('https://filipezabala.com/data/city-thorn.csv')

Referências

Ah-Pine, Julien, and Xinyu Wang. 2016. “Similarity Based Hierarchical Clustering with an Application to Text Collections.” In Advances in Intelligent Data Analysis XV: 15th International Symposium, IDA 2016, Stockholm, Sweden, October 13-15, 2016, Proceedings 15, 320–31. Springer. https://hal.science/hal-01504678/document.
Census, United States. Bureau of the. 1975. Statistical Abstract of the United States, 1975. Hoover’s. https://books.google.ch/books?id=zl9qAAAAMAAJ&pg=PA20#v=onepage&q&f=false.
Legendre, Pierre, and Louis Legendre. 2012. Numerical Ecology. Elsevier. https://ds.amu.edu.et/xmlui/bitstream/handle/123456789/6874/Numerical%20Ecology.pdf.
McNeil, Donald R. 1977. “Interactive Data Analysis: A Practical Primer.” (No Title). https://archive.org/details/interactivedataa0000mcne.
Murtagh, Fionn, and Pedro Contreras. 2011. “Methods of Hierarchical Clustering.” CoRR abs/1105.0121. http://arxiv.org/abs/1105.0121.
Murtagh, Fionn, and Pierre Legendre. 2014. “Ward’s Hierarchical Agglomerative Clustering Method: Which Algorithms Implement Ward’s Criterion?” Journal of Classification 31: 274–95. https://link.springer.com/content/pdf/10.1007/s00357-014-9161-z.pdf.
Sokal, Robert R, and F James Rohlf. 1962. “The Comparison of Dendrograms by Objective Methods.” Taxon, 33–40. https://www.jstor.org/stable/pdf/1217208.pdf.
Thorndike, Edward Lee. 1939. Your City. Harcourt Brace College Publishers.
Ward Jr, Joe H. 1963. “Hierarchical Grouping to Optimize an Objective Function.” Journal of the American Statistical Association 58 (301): 236–44. https://www.proquest.com/openview/c1f3e8829e8351e9c2a1c5e51778c6cf/1?pq-origsite=gscholar&cbl=18750&diss=y.