8.2 Capítulo 2
Solução. 2.2
a. Quantitativa discreta
b. Quantitativa contínua
c. Quantitativa discreta
d. Quantitativa contínua
e. Qualitativa nominal
f. Qualitativa ordinal
g. Qualitativa nominal
h. Quantitativa contínua
i. Quantitativa contínua
j. Qualitativa ordinal
k. Quantitativa contínua
l. Qualitativa nominal
m. Quantitativa contínua
Solução. 2.3
## [1] -4 1 3 5 7 9 10
## [1] 5
Exemplo 8.1 Em Python.
import numpy as np
x = np.array([10, -4, 5, 7, 1, 3, 9])
# a) Ordenando o array
sx = np.sort(x)
print(sx) # Output: [-4 1 3 5 7 9 10]
# b) Acessando o quarto elemento (mediana)
mediana = sx[3] # Lembre-se que a indexação em Python começa em 0
print(mediana) # Output: 5
Solução. 2.4
h <- read.table('https://filipezabala.com/data/hospital.txt', header = T)
# a.
base::sort(h$children)
## [1] 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [53] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 5 6
## [1] 1.51 1.52 1.53 1.54 1.55 1.55 1.56 1.56 1.56 1.56 1.57 1.57 1.58 1.58 1.58 1.58 1.58 1.59 1.59 1.59 1.59
## [22] 1.59 1.59 1.59 1.59 1.60 1.60 1.60 1.60 1.60 1.60 1.60 1.60 1.61 1.61 1.61 1.61 1.61 1.61 1.61 1.62 1.62
## [43] 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.63 1.63 1.63 1.63 1.63 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.64
## [64] 1.64 1.64 1.64 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.66 1.66 1.66 1.66 1.66 1.66 1.66 1.67
## [85] 1.67 1.67 1.68 1.68 1.68 1.68 1.68 1.69 1.69 1.69 1.70 1.70 1.70 1.72 1.73 1.74
## [1] 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [53] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 5 6
## [1] 1.51 1.52 1.53 1.54 1.55 1.55 1.56 1.56 1.56 1.56 1.57 1.57 1.58 1.58 1.58 1.58 1.58 1.59 1.59 1.59 1.59
## [22] 1.59 1.59 1.59 1.59 1.60 1.60 1.60 1.60 1.60 1.60 1.60 1.60 1.61 1.61 1.61 1.61 1.61 1.61 1.61 1.62 1.62
## [43] 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.63 1.63 1.63 1.63 1.63 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.64
## [64] 1.64 1.64 1.64 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.66 1.66 1.66 1.66 1.66 1.66 1.66 1.67
## [85] 1.67 1.67 1.68 1.68 1.68 1.68 1.68 1.69 1.69 1.69 1.70 1.70 1.70 1.72 1.73 1.74
## [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18]
## children 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1
## [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26] [,27] [,28] [,29] [,30] [,31] [,32] [,33] [,34]
## children 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## [,35] [,36] [,37] [,38] [,39] [,40] [,41] [,42] [,43] [,44] [,45] [,46] [,47] [,48] [,49] [,50]
## children 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2
## [,51] [,52] [,53] [,54] [,55] [,56] [,57] [,58] [,59] [,60] [,61] [,62] [,63] [,64] [,65] [,66]
## children 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [,67] [,68] [,69] [,70] [,71] [,72] [,73] [,74] [,75] [,76] [,77] [,78] [,79] [,80] [,81] [,82]
## children 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3
## [,83] [,84] [,85] [,86] [,87] [,88] [,89] [,90] [,91] [,92] [,93] [,94] [,95] [,96] [,97] [,98]
## children 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4
## [,99] [,100]
## children 5 6
## [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18]
## height 1.51 1.52 1.53 1.54 1.55 1.55 1.56 1.56 1.56 1.56 1.57 1.57 1.58 1.58 1.58 1.58 1.58 1.59
## [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26] [,27] [,28] [,29] [,30] [,31] [,32] [,33] [,34] [,35]
## height 1.59 1.59 1.59 1.59 1.59 1.59 1.59 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.61 1.61
## [,36] [,37] [,38] [,39] [,40] [,41] [,42] [,43] [,44] [,45] [,46] [,47] [,48] [,49] [,50] [,51] [,52]
## height 1.61 1.61 1.61 1.61 1.61 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.62 1.63 1.63
## [,53] [,54] [,55] [,56] [,57] [,58] [,59] [,60] [,61] [,62] [,63] [,64] [,65] [,66] [,67] [,68] [,69]
## height 1.63 1.63 1.63 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.64 1.65 1.65 1.65
## [,70] [,71] [,72] [,73] [,74] [,75] [,76] [,77] [,78] [,79] [,80] [,81] [,82] [,83] [,84] [,85] [,86]
## height 1.65 1.65 1.65 1.65 1.65 1.65 1.65 1.66 1.66 1.66 1.66 1.66 1.66 1.66 1.67 1.67 1.67
## [,87] [,88] [,89] [,90] [,91] [,92] [,93] [,94] [,95] [,96] [,97] [,98] [,99] [,100]
## height 1.68 1.68 1.68 1.68 1.68 1.69 1.69 1.69 1.7 1.7 1.7 1.72 1.73 1.74
Exemplo 8.2 Em Python.
import pandas as pd
# Carregando os dados
h = pd.read_csv('https://filipezabala.com/data/hospital.txt', sep='\t')
# a. Ordenando as colunas
children_sorted = np.sort(h['children'])
height_sorted = np.sort(h['height'])
print("children_sorted:")
print(children_sorted)
print("\nheight_sorted:")
print(height_sorted)
# b. Ordenando os índices e aplicando às colunas
children_order = h['children'][h['children'].argsort()].values
height_order = h['height'][h['height'].argsort()].values
print("\nchildren_order:")
print(children_order)
print("\nheight_order:")
print(height_order)
# c. Ordenando o DataFrame e selecionando a coluna
children_arranged = h[['children']].sort_values(by='children').T.values
height_arranged = h[['height']].sort_values(by='height').T.values
print("\nchildren_arranged:")
print(children_arranged)
print("\nheight_arranged:")
print(height_arranged)
Solução. 2.5
- Quantitativa discreta.
- \(f_3 = 50-(17+10+8+5+1)=9\). 9 peças possuem 2 defeitos.
- \(f_{r_{3}} = 9/50 = 0.18\). 18% das peças possuem 2 defeitos.
- \(F_4 = 44\). 44 peças têm até 3 defeitos.
- \(F_{r_{5}} = 49/50 = 0.98\). 98% das peças tem até 4 defeitos.
Solução. 2.9
Mediana: metade (\(1/2=50\%\)) dos valores estão abaixo e a outra metade acima de 1.625.
Tercil 1: um terço (\(1/3=33.3\%\)) dos valores estão abaixo e dois terços (\(2/3=66.7\%\)) estão acima de 1.61.
Tercil 2: dois terços (\(2/3=66.7\%\)) dos valores estão abaixo e um terço (\(1/3=33.3\%\)) está acima de 1.65.
Quartil 1: um quarto (\(1/4=25\%\)) dos valores estão abaixo e três quartos (\(3/4=75\%\)) estão acima de 1.598.
Quartil 2: Equivalente à mediana.
Quartil 3: três quartos (\(3/4=75\%\)) dos valores estão abaixo e um quarto (\(1/4=25\%\)) está acima de 1.650.
Decil 1: um décimo (\(1/10=10\%\)) dos valores estão abaixo e nove décimos (\(9/10=90\%\)) estão acima de 1.569.
…
Solução. 2.10
- Por definição, a mediana é o valor que limita à sua esquerda 50% dos valores ordenados, tal como aqueles à direita. O mesmo ocorre com o segundo quartil, que divide dois quartos (\(2/4=50\%\)) tanto à sua equerda quanto à direita, sendo portanto equivalente à mediana.
- Sim, bastando limitar 50% dos valores à esquerda e à direita.
- Algumas sugestões: \(k=5\) quintil, \(k=6\) sextil, \(k=7\) septil, \(k=8\) octil, \(k=9\) eneil, \(k=11\) undecil, \(k=12\) dodecil.
- \(k-1\).
Solução. 2.11
h <- read.csv('https://filipezabala.com/data/hospital.csv')
quantile(h$children, probs = seq(0, 1, 1/2)) # Mediana
## 0% 50% 100%
## 0 2 6
## 0% 33.33333% 66.66667% 100%
## 0 1 2 6
## 0% 25% 50% 75% 100%
## 0 1 2 3 6
## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
## 0 0 1 1 2 2 2 3 3 4 6
Exemplo 8.3 Em Python.
import pandas as pd
import numpy as np
# Carregando os dados
h = pd.read_csv('https://filipezabala.com/data/hospital.csv')
# Mediana
print(np.quantile(h['children'], q=1/2)) # Output: 2.0
# Tercis
print(np.quantile(h['children'], q=[0, 1/3, 2/3, 1]))
# Quartis
print(np.quantile(h['children'], q=[0, 1/4, 2/4, 3/4, 1]))
# Decis
print(np.quantile(h['children'], q=np.arange(0, 1.1, 0.1)))