IDENTIFICAÇÃO SISTEMÁTICA DE ARTIGOS CIENTÍFICOS COM REDUZIDO ESFORÇO DO USUÁRIO

  • Matheus Vinícius Todescato Universidade Federal da Fronteira Sul
  • Jean Carlo Hilger
  • Guilherme Dal Bianco
Palavras-chave: Recuperação de Informação, High-recall Information Retriveal, Aprendizado ativo

Resumo

"O crescente volume de dados faz com que informações pertinentes se tornem cada vez mais necessárias e valiosas. Há circunstâncias em que almeja-se a obtenção de todas as informações relevante disponível em um conjunto de dados, o que configura o objeto de investigação da High Recall Information Retrieval (HIRE). A Revisão Sistemática da Literatura (RSL), por exemplo, tem como objetivo identificar o estado-da-arte no desenvolvimento de pesquisas científicas. A RSL depende do usuário para identificar em uma coleção de documentos quais são relevantes, no entanto, em grande coleções tal validação se torna onerosa. Nesse contexto, técnicas são utilizadas para reduzir o número de documentos selecionados para validação do usuário. Idealmente o objetivo desses métodos é disponibilizar somente os documentos relevantes para o usuário e remover todos os não-relevantes. Neste trabalho foi desenvolvido um aprimoramento na geração do treinamento inicial(semente), pois o HIRE depende de informações iniciais para a aprendizagem do padrão de informação requisitada pelo usuário. Dessa forma, foi desenvolvido uma abordagem que combina a seleção ativa documentos informativos com a geração de ranqueamento. A abordagem mostrou-se eficaz a partir de experimentos parciais."

Publicado
07-10-2020