ESTIMATIVA FUTURA DE NOVOS CASOS DE SÍFILIS CONGÊNITA NA REGIÃO SUL DO BRASIL UTILIZANDO O MODELO DE MEMÓRIA DE CURTO-LONGO PRAZO (LSTM)

Autores

  • Maria Clara da Silva Maia Universidade Federal da Fronteira Sul
  • Antonio Manoel Ferreira Raymundo Universidade Federal da Fronteira Sul
  • Kelly de Almeida Schlager Universidade Federal da Fronteira Sul
  • Ketlin Angelin Universidade Federal da Fronteira Sul
  • Lídhia Cainnã de Souza Araújo Universidade Federal da Fronteira Sul
  • Daiane Conceição de Araujo Universidade Federal da Fronteira Sul
  • Daniela Teixeira Borges Universidade Federal da Fronteira Sul
  • Renata dos Santos Rabello Universidade Federal da Fronteira Sul

Palavras-chave:

Sífilis, Infecções Sexualmente Transmissíveis, Planejamento em Saúde, Algoritmos de Predição

Resumo

Introdução/Objetivo: A sífilis é uma infecção sexualmente transmissível, cuja propagação pode ser também vertical. É uma causa de mortalidade fetal, necessitando, portanto, de forte monitoramento epidemiológico. O objetivo deste estudo é estimar casos de sífilis congênita na região sul do Brasil até junho de 2026 utilizando o modelo de Memória de Curto-Longo Prazo (LSTM). Métodos: O modelo de Memória de Curto-Longo Prazo (LSTM) é um tipo de Rede Neural Recorrente (RNN) utilizada para prever séries temporais. As RNN’s possuem conexões temporais, com cada neurônio recebendo informações da camada anterior e de sua própria ativação passada, permitindo o processamento de dados ao longo do tempo. A estacionariedade é testada pelo método de Dickey-Fuller aumentado, a tendência pelo teste de Mann-Kendall e a autocorrelação pelo teste de Ljung-Box. A validação considera o erro percentual absoluto médio (MAPE), o erro quadrático médio (RMSE) e o erro absoluto médio (MAE). Foram analisados dados mensais de sífilis congênita no Brasil de janeiro de 2014 a junho de 2024, disponíveis no Sistema de Informação de Agravos de Notificação, incluindo variáveis de raça, sexo e faixa etária da mãe. A modelagem foi feita em Python, com as bibliotecas Keras, Statsmodels e pyMannKendall. Valores de p ≤ 0,05 foram considerados significativos. Resultados: A série mostrou-se estacionária (p = 0,01), com tendência crescente, presença de autocorrelação (p = 3,3e-57) e sazonalidade. O modelo LSTM com 400 neurônios, 100 epochs e loss calculada pelo MAPE demonstrou bom desempenho preditivo (RMSE = 45,87; MAPE = 0,15; MAE = 38,46) e presença de autocorrelação nos ruídos (p = 0,004). As projeções indicam entre 239 e 296 casos mensais de julho de 2024 a junho de 2026, com pico no final de 2024 e início de 2025. Não houve autocorrelação por raça, gênero ou faixa etária materna. Exceto para mães com até 20 anos. Estacionaridade foi observada apenas na raça preta e tendência de aumento apareceu nas raças preta e amarela. Não houve tendência nem estacionaridade entre os gêneros. Nenhuma faixa etária materna foi estacionária e todas apresentaram tendência de aumento. Conclusão: O modelo LSTM apresentou boa acurácia nas previsões de casos de sífilis congênita na região Sul do Brasil para os próximos dois anos, mesmo com a não independência dos ruídos. Recomenda-se sua aplicação contínua como ferramenta de vigilância epidemiológica.

Downloads

Publicado

24-10-2025

Edição

Seção

Ciências da Saúde - Pesquisa - Campus Passo Fundo