Revisão da demanda regional por vagas de TI no Brasil: uma análise comparativa de modelos de aprendizado de máquina
| dc.contributor.author | Batista Lima, Danilo | |
| dc.contributor.author | Yasmin de Araujo Moreira, Isabelle | |
| dc.date.accessioned | 2026-02-04T13:42:32Z | |
| dc.date.created | 2025-11-27 | |
| dc.description | Este estudo desenvolve e compara modelos de aprendizado de máquina para a previsão da demanda regional por vagas no setor de Tecnologia da Informação (TI) no Brasil. A partir de um conjunto de dados com mais de 66 mil anúncios de emprego, extraídos do LinkedIn via web scraping e estruturados como séries temporais diárias, a análise abrange as cinco macrorregiões brasileiras e uma categoria específica para vagas remotas. Foram avaliados comparativamente três algoritmos de machine learning para previsão, sendo eles Support Vector Regression (SVR), redes neurais feedforward do tipo MLP (Multi-Layer Perceptron) e redes neurais Long Short-Term Memory (LSTM). O desempenho dos modelos, treinados individualmente por região, foi aferido por meio das métricas MAE (Mean Absolute Error) e MDA (Mean Directional Accuracy). Os resultados demonstram que o modelo feedforward obteve a melhor performance, apesar do modelo SVR ter obtido resultados parecidos. De acordo com os dados, as vagas remotas, somadas às das regiões Sudeste e Sul, representam mais de 90% do total, evidenciando a menor oferta nas demais regiões. Dessa forma, este trabalho demonstra a viabilidade da metodologia para a captura de padrões de demanda regionais, oferecendo um panorama quantitativo robusto do comportamento do setor de TI brasileiro por região e modalidade de trabalho. | |
| dc.description.abstract | This study develops and compares machine learning models for forecasting regional demand for jobs in the Information Technology (IT) sector in Brazil. Using a dataset of over 66,000 job postings extracted from LinkedIn via web scraping and structured as daily time series, the analysis covers the five Brazilian macro-regions and a specific category for remote jobs. Three machine learning algorithms for forecasting were comparatively evaluated: Support Vector Regression (SVR), feedforward neural networks of the MLP (Multi-Layer Perceptron) type, and Long Short-Term Memory (LSTM) neural networks. The performance of the models, trained individually by region, was measured using the MAE (Mean Absolute Error) and MDA (Mean Directional Accuracy) metrics. The results demonstrate that the feedforward model obtained the best performance, although the SVR model obtained similar results. According to the data, remote job openings, combined with those in the Southeast and South regions, represent more than 90% of the total, highlighting the lower supply in other regions. Therefore, this work demonstrates the viability of the methodology for capturing regional demand patterns, offering a robust quantitative overview of the behavior of the Brazilian IT sector by region and work modality. | |
| dc.description.sponsorship | CNPq | |
| dc.identifier.authorOrcid | 0009-0004-3459-0923 | |
| dc.identifier.authorOrcid | 0009-0004-1412-2196 | |
| dc.identifier.issn | 2357-8904 | |
| dc.identifier.uri | https://hdl.handle.net/20.500.14387/2884 | |
| dc.language.iso | por | |
| dc.publisher.campi | Sabará | |
| dc.publisher.country | Brasil | |
| dc.publisher.institution | Instituto Federal de Minas Gerais | |
| dc.rights | Acesso aberto | |
| dc.source | https://www.conic-semesp.org.br/anais/files/2025/trabalho-1000013808.pdf?1768950948 | |
| dc.subject.cnpq | Ciências Exatas e da Terra | |
| dc.subject.keywords | Machine learning | |
| dc.subject.keywords | Mercado de Trabalho | |
| dc.subject.keywords | Tecnologia da Informação | |
| dc.subject.keywords | Previsão de séries temporais | |
| dc.title | Revisão da demanda regional por vagas de TI no Brasil: uma análise comparativa de modelos de aprendizado de máquina | |
| dc.type | Artigo de Eventos |
