SÍFILIS ADQUIRIDA NO SUL DO BRASIL: ESTIMATIVA FUTURA DE NOVOS CASOS UTILIZANDO O MODELO DE MEMÓRIA DE CURTO-LONGO PRAZO (LSTM)

Autores

  • Maria Clara da Silva Maia Universidade Federal da Fronteira Sul
  • Antonio Manoel Ferreira Raymundo Universidade Federal da Fronteira Sul
  • Kelly de Almeida Schlager Universidade Federal da Fronteira Sul
  • Lídhia Cainnã de Souza Araújo Universidade Federal da Fronteira Sul
  • Ketlin Angelin Universidade Federal da Fronteira Sul
  • Daiane Conceição de Araujo Universidade Federal da Fronteira Sul
  • Daniela Teixeira Borges Universidade Federal da Fronteira Sul
  • Renata dos Santos Rabello Universidade Federal da Fronteira Sul

Palavras-chave:

Sífilis, Infecções Sexualmente Transmissíveis, Algoritmos de Predição, Planejamento em Saúde

Resumo

Introdução/Objetivo: A sífilis adquirida representa um desafio de saúde pública na Região Sul do Brasil. Nesse contexto, os modelos de predição podem contribuir para o planejamento de seu enfrentamento. Este estudo objetivou estimar os casos de sífilis adquirida na região sul do Brasil por meio do modelo de Memória de Curto-Longo Prazo (LSTM). Métodos: Foram utilizados dados públicos do Sistema de Informação de Agravos de Notificação referentes às notificações de novos casos mensais de sífilis adquirida no Brasil de 2014 a 2023. As variáveis sociodemográficas incluíram sexo, faixa etária e raça/cor. A estacionariedade é testada pelo teste de Dickey-Fuller Aumentado, a tendência pelo teste de Mann-Kendall e a autocorrelação pelo teste de Ljung-Box. O modelo de Memória de Curto-Longo Prazo (LSTM) é um tipo de Rede Neural Recorrente (RNN) utilizada para prever séries temporais. As RNN’s possuem conexões temporais, com cada neurônio recebendo informações da camada anterior e de sua própria ativação passada, permitindo o processamento de dados ao longo do tempo. A validação ocorre pelas métricas erro percentual absoluto médio (MAPE), erro quadrático médio (RMSE) e erro absoluto médio (MAE). O modelo foi implementado em Python com as bibliotecas Keras, Statsmodels e pyMannKendall. Considerou-se p ≤ 0,05 como estatisticamente significativo. Resultados: A série temporal mostrou não estacionaridade (Dickey-Fuller Aumentado, p > 0,05), tendência crescente (Mann-Kendall), autocorrelação (Ljung-Box, p < 0,05) e sazonalidade. O modelo LSTM com 400 neurônios, 100 epochs e loss calculada pelo MAPE demonstrou bom desempenho (RMSE = 512,60; MAPE = 0,10; MAE = 419.29) e ruídos independentes (p = 0,4). As previsões para 2024 e 2025 indicam manutenção de casos elevados, com pico em janeiro de 2024 (4.632 casos) e média de 4.519 casos notificados mensalmente. As análises por raça/cor mostraram tendência de aumento em todas, com estacionaridade positiva para preta, parda e indígena. Homens e mulheres apresentaram séries estacionárias com tendência crescente. Faixas etárias de até 20 anos e 60 anos ou mais foram estacionárias; as demais, não. Todas tiveram tendência de aumento. Nenhuma subcategoria apresentou autocorrelação. Conclusão: O modelo LSTM mostrou-se adequado para estimar os casos notificados de sífilis adquirida na região sul para os próximos 2 anos. Os achados reforçam a importância do uso de modelos preditivos nas estratégias de vigilância epidemiológica.

Downloads

Publicado

24-10-2025

Edição

Seção

Ciências da Saúde - Pesquisa - Campus Passo Fundo