2.5 Outras medidas

2.5.1 Assimetria (ou Obliquidade)

Assimetria é uma medida que avalia a assimetria de uma distribuição de frequência. Existem diversas definições na literatura, das quais apresentam-se três alternativas. \[\begin{equation} g_1 = \dfrac{m_3}{m_2^{3/2}} = \dfrac{\frac{1}{n} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^3}{\left[ \frac{1}{n} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^2 \right]^{3/2}} \tag{2.41} \end{equation}\]

\[\begin{equation} b_1 = g_{1} \left( \dfrac{n-1}{n} \right)^{3/2} = \dfrac{m_3}{s^3} = \dfrac{\frac{1}{n} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^3 }{\left[ \frac{1}{n-1} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^2 \right]^{3/2}} \tag{2.42} \end{equation}\]

\[\begin{eqnarray} G_1 = g_{1} \sqrt{\dfrac{n(n-1)}{n-2}} = b_{1} \dfrac{n^2}{(n-1)(n-2)} \tag{2.43} \end{eqnarray}\]

Exemplo 2.90 Assimetria na distribuição normal.

# Gerando 100 valores N(0,1) com semente fixa
set.seed(1); x <- rnorm(100)
# Definição clássica de assimetria, Eq. (2.41)
e1071::skewness(x, type = 1)
## [1] -0.0722319
# Utilizada no SAS, SPSS e Excel, Eq. (2.43)
e1071::skewness(x, type = 2)
## [1] -0.07333656
# Padrão do R, MINITAB e BMDP, Eq. (2.42)
e1071::skewness(x, type = 3)
## [1] -0.07115113

Exemplo 2.91 Em Python.

import numpy as np
from scipy.stats import skew

# Define a semente para reprodutibilidade
np.random.seed(1)

# Gerando 100 valores de uma distribuição normal padrão
x = np.random.normal(size=100)

# Assimetria tipo 1 (definição clássica)
skewness_type1 = skew(x, bias=False)
print(skewness_type1)

# Assimetria tipo 2 (usada em SAS, SPSS e Excel)
skewness_type2 = skew(x,bias=False)*np.sqrt(len(x)*(len(x)-1))/(len(x)-2)
print(skewness_type2)

# Assimetria tipo 3 (padrão do R, usada em MINITAB e BMDP)
skewness_type3 = skew(x,bias=False)*np.sqrt(len(x)*(len(x)-1))/(len(x)-2)*((len(x)-1)/len(x))**(3/2)
print(skewness_type3)

Exemplo 2.92 Assimetria na distribuição qui-quadrado

# Gerando 100 valores X^2(1) com semente fixa
set.seed(1); x <- rchisq(100,1)
# Definição clássica de assimetria, Eq. (2.41)
e1071::skewness(x, type = 1)
## [1] 3.01709
# Utilizada no SAS, SPSS e Excel, Eq. (2.43)
e1071::skewness(x, type = 2)
## [1] 3.063232
# Padrão do R, utilizada no MINITAB e BMDP, Eq. (2.42)
e1071::skewness(x, type = 3)
## [1] 2.971947

Exemplo 2.93 Em Python.

import numpy as np
from scipy.stats import skew

# Define a semente para reprodutibilidade
np.random.seed(1)

# Gerando 100 valores de uma distribuição qui-quadrado com 1 gl
x = np.random.chisquare(df=1, size=100)

# Assimetria tipo 1 (definição clássica)
skewness_type1 = skew(x, bias=False)
print(skewness_type1)

# Assimetria tipo 2 (usada em SAS, SPSS e Excel)
skewness_type2 = skew(x,bias=False)*np.sqrt(len(x)*(len(x)-1))/(len(x)-2)
print(skewness_type2)

# Assimetria tipo 3 (padrão do R, usada em MINITAB e BMDP)
skewness_type3 = skew(x,bias=False)*np.sqrt(len(x)*(len(x)-1))/(len(x)-2)*((len(x)-1)/len(x))**(3/2)
print(skewness_type3)

2.5.2 Curtose

A curtose é uma medida de achatamento de uma distribuição de frequência. Assim como na assimetria, das diversas definições de curtose apresentam-se três alternativas.

\[\begin{eqnarray} g_2 = \dfrac{m_4}{m_2^{2}} - 3 = \dfrac{\frac{1}{n} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^4}{\left[ \frac{1}{n} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^2 \right]^{2}} - 3 \tag{2.44} \end{eqnarray}\]

\[\begin{eqnarray} b_2 = (g_2 + 3) \left( 1 - \dfrac{1}{n} \right)^{2} - 3 = \dfrac{m_4}{s^4} - 3 = \dfrac{\frac{1}{n} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^4 }{\left[ \frac{1}{n-1} \sum_{i=1}^{n} (x_{i} - \bar{x}_n)^2 \right]^{2}} - 3 \tag{2.45} \end{eqnarray}\]

\[\begin{eqnarray} G_2 = \dfrac{ \left[ (n+1) g_2 + 6 \right] (n-1)}{(n-2)(n-3)} \tag{2.46} \end{eqnarray}\]

Exemplo 2.94 Curtose na distribuição normal.

# Gerando 100 valores N(0,1) com semente fixa
set.seed(1); x <- rnorm(100)
# Definição clássica de curtose, Eq. (2.44)
e1071::kurtosis(x, type = 1)
## [1] 0.007653206
# Usada no SAS, SPSS e Excel, Eq. (2.46)
e1071::kurtosis(x, type = 2)
## [1] 0.07053697
# Padrão do R, MINITAB e BMDP, Eq. (2.45)
e1071::kurtosis(x, type = 3)
## [1] -0.05219909

Exemplo 2.95 Em Python.

import numpy as np
from scipy.stats import kurtosis

# Define a semente para reprodutibilidade
np.random.seed(1)

# Gerando 100 valores de uma distribuição normal padrão
x = np.random.normal(size=100)

# Curtose tipo 1 (definição clássica)
kurtosis_type1 = kurtosis(x, bias=False, fisher=False)
print(kurtosis_type1)

# Curtose tipo 2 (usada em SAS, SPSS e Excel)
kurtosis_type2 = kurtosis(x,bias=False,fisher=True)*(len(x)-1)/((len(x)-2)*(len(x)-3))*(len(x)+1)+3
print(kurtosis_type2)

# Curtose tipo 3 (padrão do R, usada em MINITAB e BMDP)
kurtosis_type3 =  kurtosis(x,bias=False,fisher=True)*(len(x)+1)*(len(x)-1)/((len(x)-2)*(len(x)-3)) 
print(kurtosis_type3)

Exemplo 2.96 Curtose na distribuição qui-quadrado.

# Gerando 100 valores X^2(1) com semente fixa
set.seed(1); x <- rchisq(100,1)
# Definição clássica de curtose, Eq. (2.44)
e1071::kurtosis(x, type = 1)
## [1] 9.918662
# Usada no SAS, SPSS e Excel, Eq. (2.46)
e1071::kurtosis(x, type = 2)
## [1] 10.49555
# Padrão do R, MINITAB e BMDP, Eq. (2.45)
e1071::kurtosis(x, type = 3)
## [1] 9.661581

Exemplo 2.97 Em Python.

import numpy as np
from scipy.stats import kurtosis

# Define a semente para reprodutibilidade
np.random.seed(1)

# Gerando 100 valores de uma distribuição qui-quadrado com 1 gl
x = np.random.chisquare(df=1, size=100)

# Curtose tipo 1 (definição clássica)
kurtosis_type1 = kurtosis(x,bias=False,fisher=False)
print(kurtosis_type1)

# Curtose tipo 2 (usada em SAS, SPSS e Excel)
kurtosis_type2 = kurtosis(x,bias=False,fisher=True)*(len(x)-1)/((len(x)-2)*(len(x)-3))*(len(x)+1)+3
print(kurtosis_type2)

# Curtose tipo 3 (padrão do R, usada em MINITAB e BMDP)
kurtosis_type3 = kurtosis(x,bias=False,fisher=True)*(len(x)+1)*(len(x)-1)/((len(x)-2)*(len(x)-3))
print(kurtosis_type3)

2.5.3 Índice de Theil

Os índices \(T\) e \(L\) de Theil são propostos por (Theil 1967).

2.5.3.1 \(T\) de Theil

(Theil 1967, 95) propõe na Eq. (1.9)14

\[\begin{equation} T = \sum_{i=1}^{N} \frac{y_i}{\sum_{j=1}^{N} y_j} \log \frac{\frac{y_i}{\sum_{j=1}^{N} y_j}}{\frac{1}{N}} \tag{2.47} \end{equation}\]

  • \(N\): total de pessoas na população ou amostra.
  • \(y_i\): renda do sujeito \(i=1,\ldots,N\).
  • \(\sum_{j=1}^{N} y_j\): renda total da população ou amostra.
  • \(\log\): logaritmo na base natural \(e \approx 2.718282\).
  • \(0 \le T \le \log N\).

(Haughton and Khandker 2009) definem o índice \(T\) em função da média geral \(\bar{y}\).

\[\begin{equation} T = \frac{1}{N} \sum_{i=1}^{N} \frac{y_i}{\bar{y}} \log \frac{y_i}{\bar{y}} \\ \tag{2.48} \end{equation}\]

pois \[\sum_{j=1}^{N} y_j = N\bar{y}\] e \[\frac{\frac{y_i}{\sum_{j=1}^{N} y_j}}{\frac{1}{N}} = \frac{y_i}{\bar{y}}.\]

Ainda conforme Eq. (1.9) de (Theil 1967, 95), o índice \(T\) de Theil é decomponível em uma parcela entre (between) grupos \(T_B\) e uma parcela intra (within) grupo \(T_W\)

\[\begin{equation} T = T_B + T_W \tag{2.49} \end{equation}\]

onde

\[\begin{equation} T_B = \sum_{g=1}^G \frac{N_g}{N} \frac{\bar{y}_g}{\bar{y}} \log \frac{\bar{y}_g}{\bar{y}} \tag{2.50} \end{equation}\]

pois \[\frac{\sum_{k=1}^{N_g} y_k}{\sum_{j=1}^{N} y_j} = \frac{N_g}{N} \, \frac{\bar{y}_g}{\bar{y}}\]

  • \(N_g\): número de pessoas do grupo \(g=1,\ldots,G\).
  • \(\bar{y}_g\): média do grupo \(g=1,\ldots,G\).
  • \(\bar{y}\): média geral.

\[\begin{equation} T_W = \sum_{g=1}^G \left( \frac{\sum_{k=1}^{N_g} y_k}{\sum_{j=1}^{N} y_j} \right) \left( \sum_{k=1}^{N_g} \frac{\frac{y_k}{\sum_{j=1}^{N} y_j}}{\frac{\sum_{k=1}^{N_g} y_k}{\sum_{j=1}^{N} y_j}} \log \frac{\frac{\frac{y_k}{\sum_{j=1}^{N} y_j}}{\frac{\sum_{k=1}^{N_g} y_k}{\sum_{j=1}^{N} y_j}}}{\frac{1}{N_g}} \right) \\ \tag{2.51} \end{equation}\]

Como \[\frac{\frac{y_k}{\sum_{j=1}^{N} y_j}}{\frac{\sum_{k=1}^{N_g} y_k}{\sum_{j=1}^{N} y_j}} = \frac{y_k}{\sum_{k=1}^{N_g} y_k} \] pode-se simplificar a Eq. (5), resultando em

\[\begin{equation} T_W = \frac{1}{N} \sum_{g=1}^G \frac{\bar{y}_g}{\bar{y}} \left( \sum_{k=1}^{N_g} \frac{y_k}{\bar{y}_g} \log \frac{y_k}{\bar{y}_g} \right) \tag{2.52} \end{equation}\]

References

Haughton, Jonathan, and Shahidur R Khandker. 2009. Handbook on Poverty+inequality. World Bank Publications. https://documents1.worldbank.org/curated/en/488081468157174849/pdf/483380PUB0Pove101OFFICIAL0USE0ONLY1.pdf.
Theil, Henri. 1967. Economics and Information Theory. North-Holland Publishing Company - Amsterdan, Rand McNally & Company - Chicago. https://archive.org/details/economicsinforma0000thei.

  1. A equação original de (Theil 1967, 95) é \(T=\sum_{i=1}^{N} y_i \log \frac{y_i}{1/N}\), onde \(y_i\) indica a proporção da renda do sujeito \(i\), i.e., \(y_i=\frac{\text{renda do sujeito } i}{\text{total da renda}}\).↩︎