Redução de dimensionalidade em dados de clima com uso de Stacked Autoencoders.

dc.contributor.advisorDoutor Ciniro Aparecido Leite Nametala
dc.contributor.authorSilva, Kevenn Henrique de Paula
dc.date.accessioned2024-07-08T12:06:57Z
dc.date.available2024-07-08T12:06:57Z
dc.date.issued2023-12-11
dc.description.abstractDurante as últimas décadas, as bases de dados vêm crescendo exponencialmente. Esse aumento não ocorre somente na quantidade de amostras de dados, mas também em relação à quantidade de características que descrevem as variáveis, deixando os datasets cada vez mais massivos. Devido a isso, torna-se necessária uma simplificação desses conjuntos de dados por meio de uma redução nessas dimensionalidades. Os dados climáticos são exemplos de dados que, geralmente, possuem muitas amostras e características envolvidas. Estes fatores acarretam uma alta dimensionalidade e, por sua vez, esse cenário afeta o custo computacional e a capacidade preditiva, prejudicando a busca por padrões e descoberta de conhecimento. Além disso, a redução de dimensionalidade irá beneficiar a visualização e o armazenamento de grandes conjuntos de dados climáticos. Desse modo, este trabalho propôs utilizar uma Rede Neural Artificial (RNA) com arquitetura Autoencoder (AE), especificamente um tipo chamado de Stacked Autoencoder (SAE), para realizar a compressão de dados climáticos de entrada, criando uma representação compacta e de menor dimensão. Após isso, com a capacidade do AE de reconstruir os dados de entrada a partir dessa representação latente, verificou-se que a redução de dimensionalidade é boa o suficiente para reconstruir os dados. Estes dados reconstruídos foram avaliados por meio do erro quadrático médio (EQM), obtendo-se um valor de 0.01605. Com esse resultado, é possível confirmar que a RNA cumpriu sua função de reduzir a base de dados climáticos.
dc.description.abstract1Over the past few decades, databases have been growing exponentially. This increase is not only in terms of the quantity of data samples but also in the number of features describing the variables, making datasets increasingly massive. Due to this, it becomes necessary to simplify these data sets by reducing their dimensionality. Climatic data are examples of data that often have many samples and involved characteristics. These factors result in high dimensionality, which, in turn, affects computational cost and predictive capacity, hindering the search for patterns and knowledge discovery. Furthermore, dimensionality reduction will benefit the visualization and storage of large climatic data sets. Thus, this work aims to use an Artificial Neural Network (ANN) with an Autoencoder (AE) architecture, specifically a type called a Stacked Autoencoder (SAE), to compress input climatic data, creating a compact and lower-dimensional representation. After that, with the AE’s ability to reconstruct the input data from this latent representation, it was found that the dimensionality reduction is good enough to reconstruct the data. These reconstructed data were evaluated using the mean squared error (MSE), resulting in a value of 0.01605. With this result, it is possible to confirm that the ANN fulfills its role of reducing the climatic data set.
dc.identifier.urihttp://hdl.handle.net/20.500.14387/1754
dc.language.isoPortuguês
dc.publisher.campiBambuí
dc.publisher.countryBrasil
dc.publisher.institutionInstituto Federal de Educação Ciência e Tecnologia de Minas Gerais
dc.rightsAcesso aberto
dc.subject.keywordAutoencoders
dc.subject.keywordRedução de dimensionalidade
dc.subject.keywordDados climáticos
dc.titleRedução de dimensionalidade em dados de clima com uso de Stacked Autoencoders.
dc.typeTrabalho de Conclusão de Curso
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
2023_TCC_Monografia_KevennHenriqueDePaulaSilva.pdf
Tamanho:
14.41 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.79 KB
Formato:
Item-specific license agreed to upon submission
Descrição: