Top Banner
Ferramentas para Mineração de Dados Manoel de Albuquerque Lira Amaro quinta-feira, 6 de dezembro de 12
28

Ferramentas para Mineração de Dados

Dec 05, 2014

Download

Technology

Manoel Amaro

 
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Ferramentas para Mineração de Dados

Ferramentas para Mineração de DadosManoel de Albuquerque Lira Amaro

quinta-feira, 6 de dezembro de 12

Page 2: Ferramentas para Mineração de Dados

Agenda• Introdução

• Weka

• Interface Gráfica

• Arquivos ARFF

• Ferramentas para ARFF

• Exemplos

• Mahout

• Introdução ao Mahout

• Conclusão/Referências

quinta-feira, 6 de dezembro de 12

Page 3: Ferramentas para Mineração de Dados

Introdução

• Softwares:

• Weka

• Mahout

• OpenSource

• Utilizados pela academia

quinta-feira, 6 de dezembro de 12

Page 4: Ferramentas para Mineração de Dados

Weka

• Software de aprendizagem de máquina

• Pré-processamento

• Mineração de Dados

• Escrito em JAVA

quinta-feira, 6 de dezembro de 12

Page 5: Ferramentas para Mineração de Dados

Weka

• Algoritmos de:

• Classificação

• Clusterização

• Regras de Associação

• Permite

• Seleção de Atributos

• Visualização de Dados

quinta-feira, 6 de dezembro de 12

Page 6: Ferramentas para Mineração de Dados

Interface

quinta-feira, 6 de dezembro de 12

Page 7: Ferramentas para Mineração de Dados

Interface

• Simple CLI

• Command Line Interface

• Simples e útil

• Para sistemas sem interface gráfica

• java weka.associations.Appriori -t veiculos.arff

quinta-feira, 6 de dezembro de 12

Page 8: Ferramentas para Mineração de Dados

Explorer

quinta-feira, 6 de dezembro de 12

Page 9: Ferramentas para Mineração de Dados

Entrada de dados

Arquivo ARFFPor uma URLBanco de Dados JDBC

quinta-feira, 6 de dezembro de 12

Page 10: Ferramentas para Mineração de Dados

Arquivo ARFF

• Arquivo de texto com todos os dados, precedido de um cabeçalho

• Semelhante ao CSV

• O cabeçalho define a estrutura dos dados

• Nome, domínio, tipo, etc.

quinta-feira, 6 de dezembro de 12

Page 11: Ferramentas para Mineração de Dados

Arquivo ARFF

• Cabeçalho

• Dados

quinta-feira, 6 de dezembro de 12

Page 12: Ferramentas para Mineração de Dados

Arquivo ARFF

• @relation

• nome do arquivo

• @attribute [nome] [tipo|{valores}]

• Declaração de atributos

• Colunas de uma tabela

quinta-feira, 6 de dezembro de 12

Page 13: Ferramentas para Mineração de Dados

Arquivo ARFF

• @data

• Segue a sequência definida pelos atributos

• Linhas de uma tabela

quinta-feira, 6 de dezembro de 12

Page 14: Ferramentas para Mineração de Dados

Ferramentas para ARFF

• Formato pouco utilizado

• Ferramentas para conversão

• CSV > ARFF (online)

• http://slavnik.fe.uni-lj.si/markot/csv2arff/csv2arff.php

quinta-feira, 6 de dezembro de 12

Page 15: Ferramentas para Mineração de Dados

Ferramentas para ARFF

• Programa em JAVA para conversão

• API do Weka

• Fácil adaptação para outras fontes de dados

quinta-feira, 6 de dezembro de 12

Page 16: Ferramentas para Mineração de Dados

Exemplo 1

• ARFF

• Venda de veículos

• Atributos

• idade, renda, carro

quinta-feira, 6 de dezembro de 12

Page 17: Ferramentas para Mineração de Dados

Exemplo 1

• Classificação

• Base de dados precisa conter:

• Um ou mais atributos preditivos;

• Idade e Renda

• Um atributo especial, denominado atributo classe (ou atributo alvo).

• Carro

quinta-feira, 6 de dezembro de 12

Page 18: Ferramentas para Mineração de Dados

Exemplo 1

quinta-feira, 6 de dezembro de 12

Page 19: Ferramentas para Mineração de Dados

Exemplo 1

quinta-feira, 6 de dezembro de 12

Page 20: Ferramentas para Mineração de Dados

Exemplo 1

quinta-feira, 6 de dezembro de 12

Page 21: Ferramentas para Mineração de Dados

Exemplo 1- Resultados

quinta-feira, 6 de dezembro de 12

Page 22: Ferramentas para Mineração de Dados

Exemplo 2

• Dataset de vendas do supermercado

• Carrinho de compras

• Departamentos do supermercado

quinta-feira, 6 de dezembro de 12

Page 23: Ferramentas para Mineração de Dados

Exemplo 2

• Uso de um algoritmo de associação

• Descobrir relações entre os departamentos, a partir do histórico de compras dos clientes.

quinta-feira, 6 de dezembro de 12

Page 24: Ferramentas para Mineração de Dados

Exemplo 2

quinta-feira, 6 de dezembro de 12

Page 25: Ferramentas para Mineração de Dados

Weka

• Software bem didático

• Alguns papers utilizaram para mineração de dados reais

• Permite integração a aplicações JAVA via API (não tão simples assim)

• Independente de plataforma

• Atualizações frequentes

quinta-feira, 6 de dezembro de 12

Page 26: Ferramentas para Mineração de Dados

Apache Mahout

• Biblioteca para Aprendizagem de Máquina

• Licença OpenSource

• Escalável

• Paradigma Map/Reduce

• Plataforma Hadoop

quinta-feira, 6 de dezembro de 12

Page 27: Ferramentas para Mineração de Dados

Hadoop

quinta-feira, 6 de dezembro de 12