12.18 Redução de dimensionalidade em séries temporais
Sufficient Dimension Reduction is a powerful tool to extract the core information hidden in the high-dimensional data, for the purpose of classifying or predicting one or several response variables. (Li 2018,xix)
Segundo (Li 2018,xix), “[a] extração de informações é baseada na noção de suficiência, o que significa que um conjunto de funções dos preditores fornece todas as informações necessárias para entender a resposta, de modo que o restante dos preditores pode ser ignorado sem perda de informações”. O autora ainda lembra que o conceito de suficiência é derivad da independência condicional, “um conceito estatístico que desempenha o papel central nesta teoria”.
(Bolla and Szabados 2021) fornecem “uma breve visão geral da teoria de séries temporais fracamente estacionárias multidimensionais (multivariadas), com ênfase na redução de dimensão e previsão”.
12.18.1 ForeCA
Conforme (Goerg 2013), Forecastable Component Analysis é uma “técnica de redução de dimensão para sinais temporalmente dependentes”, baseada em uma medida de previsibilidade. Segundo o autor, o método “encontra uma transformação ótima para separar uma série temporal multivariada em um espaço de ruído branco previsível e ortogonal”.
(Goerg 2020) apresenta a biblioteca ForeCA
, que implementa o método de Forecastable Component Analysis, “incluindo algoritmos principais e funções auxiliares (resumo, plotagem, etc.) para aplicar ‘ForeCA’ a dados de séries temporais multivariadas”. Ainda segundo a documentação, “[a]o contrário de outros métodos populares de redução de dados, como PCA ou ICA”, a biblioteca ForeCA
“considera explicitamente a dependência de tempo e busca o sinal mais ‘previsível’. A medida de previsibilidade é baseada na entropia de Shannon da densidade espectral do sinal transformado”.
Exercício 12.39 Veja