Redução de dimensionalidade em dados de clima com uso de Stacked Autoencoders.
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Durante as últimas décadas, as bases de dados vêm crescendo exponencialmente. Esse aumento não ocorre somente na quantidade de amostras de dados, mas também em relação à quantidade de características que descrevem as variáveis, deixando os datasets cada vez mais massivos. Devido a isso, torna-se necessária uma simplificação desses conjuntos de dados por meio de uma redução nessas dimensionalidades. Os dados climáticos são exemplos de dados que, geralmente, possuem muitas amostras e características envolvidas. Estes fatores acarretam uma alta dimensionalidade e, por sua vez, esse cenário afeta o custo computacional e a capacidade preditiva, prejudicando a busca por padrões e descoberta de conhecimento. Além disso, a redução de dimensionalidade irá beneficiar a visualização e o armazenamento de grandes conjuntos de dados climáticos. Desse modo, este trabalho propôs utilizar uma Rede Neural Artificial (RNA) com arquitetura Autoencoder (AE), especificamente um tipo chamado de Stacked Autoencoder (SAE), para realizar a compressão de dados climáticos de entrada, criando uma representação compacta e de menor dimensão. Após isso, com a capacidade do AE de reconstruir os dados de entrada a partir dessa representação latente, verificou-se que a redução de dimensionalidade é boa o suficiente para reconstruir os dados. Estes dados reconstruídos foram avaliados por meio do erro quadrático médio (EQM), obtendo-se um valor de 0.01605. Com esse resultado, é possível confirmar que a RNA cumpriu sua função de reduzir a base de dados climáticos.