APLICAÇÃO DO APRENDIZADO DE MÁQUINA SOBRE A QUALIDADE DA PRODUÇÃO AGROECOLÓGICA DE LEITE

  • Julia Elisabett Klocoski Bolsonello Universidade Federal da Fronteira Sul
  • Ademir Roberto Freddo Universidade Federal da Fronteira Sul
  • André Lazarin Gallina Universidade Federal da Fronteira Sul
  • Fabiana Elias Universidade Federal da Fronteira Sul
  • Karina Ramirez Starikoff Universidade Federal da Fronteira Sul

Abstract

A bovinocultura de leite no país é caracterizada por pequenas propriedades de base familiar, que carecem de assistência e informações técnicas, o que reflete diretamente em um leite de baixa qualidade. Desse modo, ferramentas que auxiliem na interpretação dos dados, podem favorecer os produtores a produzirem leite de qualidade, de forma sustentável e segura para os consumidores. O aprendizado de máquina é um subcampo da ciência da computação que trabalha com reconhecimento de padrões e teoria da aprendizagem computacional em inteligência artificial na análise de dados. Na mineração de dados são utilizadas técnicas de aprendizado de máquina para descoberta de padrões e extração de conhecimento, entre elas, a técnica de árvores de decisão. O objetivo desta pesquisa é empregar técnicas de aprendizado de máquina, mais especificamente, a técnica de mineração de dados denominada de árvores de decisão, para prever a qualidade do leite no que se refere a contagem de células somáticas (CCS) e contagem bacteriana total (CBT). A metodologia consiste no método KDD (Knowledge Discovery in Databases - KDD) para extrair conhecimento a partir dos dados, que possui as seguintes etapas: seleção de dados (questionário e análises do leite), pré-processamento, transformação e  preparação dos dados (categorização dos dados em leite A, B e C conforme a legislação vigente,  e formato CSV (Comma Separated Values) para entrada dos dados no ambiente R-Studio4), mineração de dados (algoritmo RPART que implementa a árvore de decisão e método CART (Classification and Regression Trees), utilizou-se 70% das bases de dados para treinamento e 30% para testes) e por fim, extração do conhecimento (modelo e padrões gerados nas árvores de decisão  que mais influenciam sobre os valores de CCS e CBT, que por sua vez determinam a qualidade do leite). Em relação aos resultados, a eficiência do modelo para CCS foi de 59,82%, ou seja, a árvore criada foi testada para verificar sua eficácia ou eficiência na classificação do CCS a partir de novos dados que o computador ainda não conhece. A qualidade de leite dos produtores para CCS variou entre A, B e C. Já o modelo ou árvore obtida para CBT a precisão ou eficiência do modelo foi de 72,2%. Isto significa, que sem conhecer o valor do CBT a árvore consegue determinar a qualidade do leite apenas com base nos atributos existentes no modelo. Para o CBT a classificação da qualidade do leite foi apenas B e C. Portanto pode-se concluir que as eficiências dos testes foram baixas devido às poucas entradas de dados e talvez devido a escolha dos atributos. Por esses motivos, para se melhorar os resultados em trabalhos futuros deve-se ter um maior número de dados (questionários) para cruzar com os resultados das análises do leite e, assim, avaliar a qualidade do leite e os fatores que a influenciam. Também deve-se avaliar a relevância dos atributos, bem como realizar novos testes dentro da mineração de dados.

 

Published
24-09-2019