Aplicações Práticas de Mineração de Dados e Algoritmo de Naive Bayes
Por NATÁLIA MARTINS VALDIONES | 23/04/2020 | TecnologiaResumo
Este artigo tem como objetivo apresentar a aplicação de técnicas de mineração de dados e também a utilização do algoritmo de Naive Bayes para apresentar soluções de economia de recursos e tomada de decisões mais assertivas baseada na captação de variáveis aparentemente independentes entre si. Palavras Chave: Mineração de Dados, Naive Bayes.
1. Introdução
O processo de mineração de dados consiste no exercício de extrair de grandes bancos de dados informações consistentes e coerentes capazes de permitir a tomada de decisões futuras. Segundo [1], a mineração de dados explora uma base de dados utilizando algoritmos adequados para obter conhecimento. Muitas vezes a análise desses dados resulta em relacionamentos inesperados, porém coerentes, resumidos e úteis para o usuário de forma que este consiga promover a redução de custos e possivelmente um aumento de receita. De acordo com [1], “as funcionalidades da mineração de dados são usadas para especificar os tipos de informações a serem obtidas nas tarefas de mineração. Em geral, essas tarefas podem ser classificadas em duas categorias: (A) descritivas: caracterizam as propriedades gerais dos dados; e (B) preditivas: fazem inferência a partir dos dados objetivando predições”. Nesse caso, o acesso a diferentes ferramentas de mineração são extremamente importantes, uma vez que muitos usuários ao se depararem com os dados sem nenhum tipo de “lapidação” não fazem idéia de quais conhecimentos tais dados podem trazer. A análise descritiva basicamente é a tabulação da contagem de dados coletados o que nos ajuda a entender o que aconteceu e o porquê aconteceu, enquanto a análise preditiva, como o nome já nos mostra, prevê o possível comportamento do cliente baseado em acontecimentos passados. A predição faz uso de dados e algoritmos estatísticos para realizar análises e obter previsões sobre futuros acontecimentos ou comportamentos, permitindo mais precisão na tomada de decisões. Existem vários algoritmos de classificação que podem ser utilizados nesses casos, como árvore de decisões, k-vizinhos, entre outros, mas neste estudo utilizaremos o algoritmo de Naive Bayes. Neste artigo será apresentada a aplicação de mineração de dados e algoritmo de Naive Bayes em uma situação hipotética próxima da realidade e faremos a análise de seus resultados identificando melhores decisões a serem tomadas.
2. Objetivo
O caso a ser analisado neste artigo traz como cenário um restaurante que deseja prever através de revisão bibliográfica, técnicas de mineração de dados e aplicação do algoritmo de Naive Bayes qual será o prato mais vendido no próximo dia entre os dois pratos principais servidos no restaurante: filet a parmegiana e feijoada, buscando reduzir desperdícios de ingredientes, melhorar a qualidade nos pratos servidos e aumentar a agilidade no atendimento, baseado em variáveis de condições climáticas.