EXTRAÇÃO DE ESQUEMAS DE FONTES HETEROGÊNEAS SEMIESTRUTURADAS

UMA ABORDAGEM PROBABILÍSTICA

Autores/as

  • Natália Banhara Universidade Federal da Fronteira Sul
  • Geomar Schreiner
  • Denio Duarte

Palabras clave:

JSON, extração de esquema, grafo, probabilidade

Resumen

A extração dos esquemas de documentos JSON possibilita restrições e operações. Relevantes pelo contexto de grande quantidade de dados. Levando isso em consideração, desenvolvemos uma ferramenta para a extração com detecção de tagged unions e enums. Essa, programada com a linguagem C++, possui uma estrutura de dados chamada grafo. Por fim, um metamodelo expõe as propriedades desses documentos.

Publicado

29-09-2023

Número

Sección

Ciências Exatas e da Terra