Redução de dimensionalidade em dados de clima com uso de Stacked Autoencoders.
dc.contributor.advisor | Doutor Ciniro Aparecido Leite Nametala | |
dc.contributor.author | Silva, Kevenn Henrique de Paula | |
dc.date.accessioned | 2024-07-08T12:06:57Z | |
dc.date.available | 2024-07-08T12:06:57Z | |
dc.date.issued | 2023-12-11 | |
dc.description.abstract | Durante as últimas décadas, as bases de dados vêm crescendo exponencialmente. Esse aumento não ocorre somente na quantidade de amostras de dados, mas também em relação à quantidade de características que descrevem as variáveis, deixando os datasets cada vez mais massivos. Devido a isso, torna-se necessária uma simplificação desses conjuntos de dados por meio de uma redução nessas dimensionalidades. Os dados climáticos são exemplos de dados que, geralmente, possuem muitas amostras e características envolvidas. Estes fatores acarretam uma alta dimensionalidade e, por sua vez, esse cenário afeta o custo computacional e a capacidade preditiva, prejudicando a busca por padrões e descoberta de conhecimento. Além disso, a redução de dimensionalidade irá beneficiar a visualização e o armazenamento de grandes conjuntos de dados climáticos. Desse modo, este trabalho propôs utilizar uma Rede Neural Artificial (RNA) com arquitetura Autoencoder (AE), especificamente um tipo chamado de Stacked Autoencoder (SAE), para realizar a compressão de dados climáticos de entrada, criando uma representação compacta e de menor dimensão. Após isso, com a capacidade do AE de reconstruir os dados de entrada a partir dessa representação latente, verificou-se que a redução de dimensionalidade é boa o suficiente para reconstruir os dados. Estes dados reconstruídos foram avaliados por meio do erro quadrático médio (EQM), obtendo-se um valor de 0.01605. Com esse resultado, é possível confirmar que a RNA cumpriu sua função de reduzir a base de dados climáticos. | |
dc.description.abstract1 | Over the past few decades, databases have been growing exponentially. This increase is not only in terms of the quantity of data samples but also in the number of features describing the variables, making datasets increasingly massive. Due to this, it becomes necessary to simplify these data sets by reducing their dimensionality. Climatic data are examples of data that often have many samples and involved characteristics. These factors result in high dimensionality, which, in turn, affects computational cost and predictive capacity, hindering the search for patterns and knowledge discovery. Furthermore, dimensionality reduction will benefit the visualization and storage of large climatic data sets. Thus, this work aims to use an Artificial Neural Network (ANN) with an Autoencoder (AE) architecture, specifically a type called a Stacked Autoencoder (SAE), to compress input climatic data, creating a compact and lower-dimensional representation. After that, with the AE’s ability to reconstruct the input data from this latent representation, it was found that the dimensionality reduction is good enough to reconstruct the data. These reconstructed data were evaluated using the mean squared error (MSE), resulting in a value of 0.01605. With this result, it is possible to confirm that the ANN fulfills its role of reducing the climatic data set. | |
dc.identifier.uri | http://hdl.handle.net/20.500.14387/1754 | |
dc.language.iso | Português | |
dc.publisher.campi | Bambuí | |
dc.publisher.country | Brasil | |
dc.publisher.institution | Instituto Federal de Educação Ciência e Tecnologia de Minas Gerais | |
dc.rights | Acesso aberto | |
dc.subject.keyword | Autoencoders | |
dc.subject.keyword | Redução de dimensionalidade | |
dc.subject.keyword | Dados climáticos | |
dc.title | Redução de dimensionalidade em dados de clima com uso de Stacked Autoencoders. | |
dc.type | Trabalho de Conclusão de Curso |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- 2023_TCC_Monografia_KevennHenriqueDePaulaSilva.pdf
- Tamanho:
- 14.41 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.79 KB
- Formato:
- Item-specific license agreed to upon submission
- Descrição: