Logotipo INPE

Rafael Santos

rafael.santos@lac.inpe.br
http://www.lac.inpe.br/~rafael.santos

Aplicações (código-fonte)

Get Java Algumas aplicações simples de mineração de dados e tópicos relacionados, todas escritas em Java. Muitas são puramente provas de conceito ou demonstrações de algoritmos, não sendo adequadas para uso intensivo ou em aplicações reais. Somente o código-fonte das classes é apresentado. O código foi escrito para ser legível e facilmente compreensível, e não é otimizado para velocidade ou baixo uso de memória ou mesmo elegância.

É possível que o código dependa de arquivos de dados, bibliotecas ou classes adicionais, verifique os comentários sobre os mesmos cuidadosamente.

Classificador pelo método do paralelepípedo

Uma aplicação em Java que demonstra como o conjunto de dados de iris pode ser classificado pelo algoritmo do paralelepípedo (regras de continência). Mais detalhes estão nos comentários do código.
Esta aplicação usa classes do software Weka.

Classificador pelo método da distância mínima a protótipo

Uma aplicação em Java que demonstra como o conjunto de dados de iris pode ser classificado pelo algoritmo da menor distância a protótipo. Mais detalhes estão nos comentários do código.
Esta aplicação usa classes do software Weka.
Applets (executáveis no navegador)

Get Java Algumas applets que podem ser usadas para geração e exploração de conjuntos de dados, visualização e classificação/agrupamento/mineração de dados (escritas em Java).

Desenho de Classes Uma applet em Java que permite o desenho de distribuições de até dezesseis classes em duas dimensões numéricas. Os dados gerados podem ser copiados e colados em um editor de textos.
CBF Uma applet em Java que permite a criação de conjuntos de dados (séries temporais) do tipo Cylinder, Bell, Funnel. Os dados gerados podem ser copiados e colados em um editor de textos.
Links

Alguns links para aplicações externas. Todas as aplicações listadas são gratuitas e/ou abertas ou tem uma versão gratuita para download.

Não dou suporte técnico para as aplicações listadas aqui. Mais informações devem ser obtidas junto aos desenvolvedores ou a listas de usuários, ou ainda através de mecanismos de busca na Internet.

Data Mining em geral

  • Weka é um dos pacotes mais simples para prototipação de mineração de dados.
  • Rapid Miner (previamente conhecido como YALE) é um pacote mais completo de mineração de dados.
  • MOA - Massive Online Analysis, coleção de algoritmos implementados para tratar com grandes volumes de dados.

Visualização

  • Mondrian permite a visualização de dados através de vários tipos de plotagem, inclusive coordenadas paralelas.
  • Visulab (plug-in para Excel) possibilita a visualização de dados multivariados.
  • OpenDX (disponível para vários sistemas operacionais) é um pacote completo e complexo de visualização de dados.
Valid HTML 4.0 Transitional            Valid CSS!