EXTRAÇÃO DE ESQUEMAS DE FONTES HETEROGÊNEAS SEMIESTRUTURADAS

UMA ABORDAGEM PROBABILÍSTICA

  • Natália Banhara Universidade Federal da Fronteira Sul
  • Geomar Schreiner
  • Denio Duarte
Palavras-chave: JSON, extração de esquema, grafo, probabilidade

Resumo

A extração dos esquemas de documentos JSON possibilita restrições e operações. Relevantes pelo contexto de grande quantidade de dados. Levando isso em consideração, desenvolvemos uma ferramenta para a extração com detecção de tagged unions e enums. Essa, programada com a linguagem C++, possui uma estrutura de dados chamada grafo. Por fim, um metamodelo expõe as propriedades desses documentos.

Publicado
29-09-2023
Seção
Ciências Exatas e da Terra