Uso de índices espectrais na estimativa da produtividade do cafeeiro por meio de técnicas de aprendizado de máquina
| dc.contributor.advisor | Miranda, Jonathan da Rocha | |
| dc.contributor.author | Almeida, Ilana de Castro | |
| dc.date.accessioned | 2026-03-04T18:38:50Z | |
| dc.date.created | 2026-02-10 | |
| dc.description | A cultura do café (Coffea arabica L.) apresenta alta variabilidade espacial e temporal, o que torna a estimativa de safra um desafio complexo frente ao fenômeno da bienalidade e das variações edafoclimáticas. O uso de sensoriamento remoto associado ao aprendizado de máquina surge como uma alternativa promissora para contornar a ineficiência das amostragens manuais. O objetivo deste trabalho foi estimar a variabilidade espacial da produtividade de uma lavoura cafeeira utilizando índices espectrais derivados de imagens orbitais de alta resolução integrados ao algoritmo Random Forest (RF). O estudo foi conduzido no município de São João Evangelista - MG, em uma lavoura da cultivar Arara (três anos de idade). A coleta de dados de produtividade ocorreu em 100 plantas georreferenciadas por meio de derriça manual. Imagens multiespectrais do satélite CBERS-4A (sensor WPM) foram adquiridas em setembro de 2024 (período de pré-florada) e submetidas à fusão de imagens (pansharpening) para obtenção de resolução espacial de 2 metros, contornando ruídos e a mistura espectral das entrelinhas. Foram calculados os índices NDVI, SAVI, NDWI e VARI. Para a modelagem preditiva, empregou-se o algoritmo RF validado pelo método Leave-One-Out Cross-Validation (LOOCV). Os resultados demonstraram alta variabilidade produtiva na área (CV de 51,77%), associada à altitude e à dinâmica de estabelecimento inicial do estande. Índices baseados no infravermelho próximo (NDVI e SAVI) mostraram forte coerência espacial com a produtividade, enquanto o VARI (restrito ao visível) não apresentou capacidade de discriminação entre as zonas de manejo. O modelo RF alcançou um coeficiente de determinação (R²) de 0,61 e um Erro Médio Absoluto (MAE) de 0,51 L planta−1 (~6,3 sc ha−1). O NDWI destacou-se como a variável preditora de maior importância. Conclui-se que o uso de imagens de alta resolução no período de pré-florada, aliado ao algoritmo Random Forest, é uma ferramenta robusta e eficaz para a previsão antecipada da safra cafeeira, fornecendo mapas detalhados que viabilizam a transição para a agricultura de precisão por meio de adubações em taxa variável e podas sítio-específicas. | |
| dc.description.abstract | Coffee cultivation (Coffea arabica L.) exhibits high spatial and temporal variability, making yield estimation a complex challenge due to the biennial bearing phenomenon and edaphoclimatic variations. The use of remote sensing associated with machine learning emerges as a promising alternative to overcome the inefficiency of manual sampling. The objective of this study was to estimate the spatial variability of coffee yield using spectral indices derived from high-resolution orbital imagery integrated with the Random Forest (RF) algorithm. The study was conducted in São João Evangelista - MG, in a three-year-old plantation of the Arara cultivar. Yield data were collected from 100 georeferenced plants through manual stripping. Multispectral images from the CBERS-4A satellite (WPM sensor) were acquired in September 2024 (pre-flowering period) and subjected to pansharpening to obtain a spatial resolution of 2 meters, mitigating noise and spectral mixing from the inter-rows. NDVI, SAVI, NDWI, and VARI indices were calculated. For predictive modeling, the RF algorithm was employed and validated using the Leave-One-Out Cross-Validation (LOOCV) method. The results demonstrated high yield variability in the area (CV of 51.77%), associated with altitude and initial stand establishment dynamics. Indices based on the near-infrared (NDVI and SAVI) showed strong spatial coherence with yield, while VARI (restricted to the visible spectrum) lacked the ability to discriminate between management zones. The RF model achieved a coefficient of determination (R²) of 0.61 and a Mean Absolute Error (MAE) of 0.51 L plant⁻¹ (~6.3 bags ha⁻¹). NDWI stood out as the most important predictor variable. It is concluded that the use of high-resolution imagery during the pre-flowering period, combined with the Random Forest algorithm, is a robust and effective tool for early coffee yield forecasting, providing detailed maps that enable the transition to precision agriculture through variable rate fertilization and site-specific pruning. | |
| dc.identifier.advisorOrcid | 0000-0002-9236-1369 | |
| dc.identifier.authorOrcid | 0009-0009-0110-4980 | |
| dc.identifier.uri | https://hdl.handle.net/20.500.14387/2986 | |
| dc.publisher.campi | São João Evangelista | |
| dc.publisher.country | Brasil | |
| dc.publisher.institution | Instituto Federal de Minas Gerais | |
| dc.rights | Acesso aberto | |
| dc.subject.cnpq | Ciências Agrárias | |
| dc.subject.keywords | Coffea arábica | |
| dc.subject.keywords | Sensoriamento remoto | |
| dc.subject.keywords | Agricultura de precisão | |
| dc.subject.keywords | Índices de vegetação | |
| dc.subject.keywords | Previsão de safra | |
| dc.title | Uso de índices espectrais na estimativa da produtividade do cafeeiro por meio de técnicas de aprendizado de máquina | |
| dc.type | Trabalho de Conclusão de Curso |
