12.15 Modelos ARCH
ARCH - Autoregressive Conditional Heteroscedasticity
Muitos modelos econométricos apresentam variância inconstante ao longo do tempo, chamada heterocedasticidade. Algumas séries apresentam fases de baixa volatilidade seguidas de períodos de alta volatilidade. Neste contexto (Engle 1982) propõe o modelo ARCH (Autoregressive Conditional Heteroscedasticity), que permite modelar a variância condicional de uma série em função dos quadrados dos retornos passados.
Suponha que queiramos estimar um modelo estacionário ARMA \(y_t = \alpha_0 + \alpha_1 y_{t-1} + \varepsilon_t\), com \(\varepsilon \sim N(0,1)\) para prever \(y_{t+1}\). A previsão condicional dado o conjunto de informações \(\Psi_t\) de \(y_{t+1}\) é \[\begin{equation} E[y_{t+1}] = \alpha_0 + \alpha_1 y_{t} \tag{12.5} \end{equation}\]
Se utilizarmos a média condicional para prever \(y_{t+1}\), a variância do erro de previsão condicional é \[\begin{align} Var[y_{t+1}|y_t] &= E_{t}[(y_{t+1} - \alpha_0 - \alpha_1 y_{t})^2] \\ &= E_{t}[\varepsilon_{t+1}^2] \\ &= \sigma^2 \tag{12.37} \end{align}\]
Porém, se utilizarmos previsões não condicionais, elas serão sempre a média de long termo (longrun) da sequência \({y_t}\), que é igual a \(\alpha_0/(1-\alpha_1)\). A variância do erro de previsão não condicional é \[\begin{align} Var[y_{t+1}] &= E{[(y_{t+1} - \alpha_0/(1-\alpha_1)]^2]} \\ &= E[(\varepsilon_{t+1} + \alpha_1\varepsilon_{t})^2 + \alpha_{1}^2\varepsilon_{t-1} + \alpha_{1}^3\varepsilon_{t-2} + \cdots)^2] \\ &= \frac{\sigma}{1-\alpha_{1}^2} \tag{12.38} \end{align}\]
Uma vez que \((1−\alpha_1^2)^{-1} > 1\), a previsão não condicional tem variância superior quando comparada à previsão condicional. Na Figura X podemos observar o comportamento de \((1−\alpha_1^2)^{-1} >1\). \(\alpha_1 = 1\) e \(\alpha_1 = -1\) são assíntotas, e nota-se que \((1−\alpha_1^2)^{-1} > 1\) ocorre quando \(\alpha_1\) pertence ao intervalo \((−1,0) \cup (0,1)\). Quando \(\alpha_1 = 0\), temos \((1−\alpha_1^2)^{-1} = 1\). Fora deste intervalo \((1−\alpha_1^2)^{-1}\) é infinito ou negativo, sendo descartados desta análise. Desta forma, as previsões condicionais são preferíveis
f <- function(x){
x0 <- (1-x^2)^(-1)
return(x0)
}
curve(f, -10, 10, col = 'blue')
abline(v = -1)
abline(v = 1)
O modelo ARCH(\(p\)) pode ser expresso por
\[\begin{equation} y_t = x_t\beta + \sqrt{h_t} + \varepsilon_t \tag{12.39} \end{equation}\]
\[\begin{equation} y_t|\Psi_{t-1} \sim N(x_t\beta, h_t) \tag{12.40} \end{equation}\]
\[\begin{equation} h_t = \alpha_0 + \alpha_1 \varepsilon_{t-1}^2 + \cdots + \alpha_p \varepsilon_{t-p}^2 \tag{12.41} \end{equation}\]
onde \(t=1,\ldots=T\), \(p\) é a ordem do processo, \(x_t\beta\) é uma combinação linear de variáveis exógenas e endógenas defasadas incluídas no conjunto de informação \(\Psi_{t-1}\), com \(\beta\) sendo um vetor de parâmetros desconhecidos, \(\varepsilon_t \sim N(0,1)\), \(\alpha_0 \ge 0\) e \(\alpha_i >0\), \(i=1,2,\ldots,p\). Se \(\beta\) for um vetor de zeros, \(h_t\) pode ser apresentado como
\[\begin{equation} h_t = \alpha_0 + \alpha_1 y_{t-1}^2 + \cdots + \alpha_p y_{t-p}^2 \tag{12.42} \end{equation}\]
O modelo de regressão ARCH é obtido assumindo-se que a média de \(y_t\) é dada como \(x_t \beta\). No caso linear de ordem \(p\), a verossimilhança é dada por
\[\begin{align} \log f(y_1,\ldots,y_T|y_0;\theta) &= \sum_{t=1}^{T} \log f(\Psi_{t-1};\theta) \\ &= -\frac{1}{2} \sum_{t=1}^{T} \log h_t -\frac{1}{2} \sum_{t=1}^{T} \frac{\varepsilon_t^2}{h_t} \tag{12.43} \end{align}\]
onde \(T\) é o tamanho da amostra e \(\theta\) denota os parâmetros que indexam o modelo, neste caso \((\alpha_0,\alpha_1,\ldots,\alpha_p)'\). Se \(\beta\) for um vetor de zeros, podemos substituir \(\varepsilon_t^2\) por \(y_t^2\) em (12.43). Para mais detalhes recomenda-se (Engle 1982) e (Shephard 1996).
GARCH - Generalized Autoregressive Conditional Heteroscedasticity
(Bollerslev 1986) estendeu o trabalho original de Engle, propondo o modelo GARCH (Generalized Autoregressive Conditional Heteroscedasticity), que permite que a variância condicional não dependa somente dos quadrados dos retornos passados, mas também da própria variância passada.
## $rmse_mean
## norm std snorm
## sGARCH 1.113379 1.045369 1.272296
## gjrGARCH 1.151870 1.038645 1.623864
##
## $mae_mean
## norm std snorm
## sGARCH 0.8594862 0.9034807 1.054201
## gjrGARCH 0.9126863 0.8668975 1.388192
##
## $forecast_mean
## sGARCH-norm sGARCH-std sGARCH-snorm gjrGARCH-norm gjrGARCH-std gjrGARCH-snorm
## T+1 -0.1631376 -0.7854731 0.02056801 -0.1014411 -0.5980168 0.4094100
## T+2 -0.4796430 -1.1315649 -0.21838991 -0.4015534 -0.9135921 0.2723867
## T+3 -0.5738695 -1.2026308 -0.28331920 -0.4914912 -0.9800718 0.2341156
## T+4 -0.6019215 -1.2172233 -0.30096168 -0.5184438 -0.9940766 0.2234264
## T+5 -0.6102728 -1.2202197 -0.30575547 -0.5265210 -0.9970268 0.2204408
##
## $forecast_sigma
## sGARCH-norm sGARCH-std sGARCH-snorm gjrGARCH-norm gjrGARCH-std gjrGARCH-snorm
## T+1 8.031030 10.20896 8.102188 7.105533 10.85916 7.317519
## T+2 8.041064 10.35602 8.112886 7.100658 10.81166 7.316905
## T+3 8.051075 10.50087 8.123558 7.095828 10.76437 7.316290
## T+4 8.061064 10.64362 8.134206 7.091044 10.71729 7.315677
## T+5 8.071030 10.78433 8.144829 7.086306 10.67041 7.315064
https://github.com/scogli/Autogarch/ https://repositorio.iscte-iul.pt/bitstream/10071/23882/1/master_ricardo_leal_correia.pdf https://dl.acm.org/doi/book/10.5555/AAI29096260 https://stats.stackexchange.com/questions/20586/automated-parameter-selection-for-a-garch-model-in-a-similar-manner-to-the-fore