Logotipo INPE

Rafael Santos

rafael.santos@lac.inpe.br
http://www.lac.inpe.br/~rafael.santos

Sites com Bases de Dados

Links categorizados com dados para download. Veja mais em Datasets for Data Mining and Knowledge Discovery.
Esta lista é bem incompleta, e será melhorada a medida em que for necessário; isto é, por demanda dos alunos da disciplina CAP-359 (Princípios e Aplicações de Mineração de Dados) ou de seminários.

Coleções (Vários tópicos)

O site UCI Machine Learning Repository contém arquivos e referências para diversos tipos de categorias de problemas de mineração de dados.
O site Data Wrangling também lista vários links para coleções de dados disponíveis na WWW.

Séries Temporais

O site UCR Time Series Data Mining Archive contém arquivos, artigos e código relacionado com mineração de séries temporais.
Veja também os links para dados financeiros, logo abaixo.

Dados Financeiros

O site Price Data oferece comercialmente dados detalhados de valores de ações negociadas nos Estados Unidos.
O site Financial Data Finder permite a busca em várias bases de dados relacionadas a finanças e economia.
Existem vários links para serviços de indicadores econômicos em Investorlinks.com.
Bases Artificiais de Dados (duas dimensões numéricas)

Esta seção contém várias bases artificiais de dados. Cada base tem dois atributos, correspondendo às coordenadas X e Y das imagens, e tendo como classes as cores dos pixels das imagens, desta forma as imagens dão uma idéia precisa das distribuições das classes nas bases.
Cada base tem duas variantes, com diferente espalhamento das instâncias das classes no espaço de atributos.

Bases artificiais podem também ser criadas com a applet Desenho de Classes.

As bases de dados estão no formato .arff, usado pelo software Weka, e podem ser usadas para testes simples de algoritmos de classificação e agrupamento.

icon-dataset
(ARFF, 22.9K)
icon-dataset
(ARFF, 22.6K)
icon-dataset
(ARFF, 43.9K)
icon-dataset
(ARFF, 44.6K)
icon-dataset
(ARFF, 43.2K)
icon-dataset
(ARFF, 43.3K)
icon-dataset
(ARFF, 44.4K)
icon-dataset
(ARFF, 44.2K)
icon-dataset
(ARFF, 44.1K)
icon-dataset
(ARFF, 45.0K)
icon-dataset
(ARFF, 44.1K)
icon-dataset
(ARFF, 44.9K)
icon-dataset
(ARFF, 59.6K)
icon-dataset
(ARFF, 60.2K)
icon-dataset
(ARFF, 62.8K)
icon-dataset
(ARFF, 63.7K)
icon-dataset
(ARFF, 60.9K)
icon-dataset
(ARFF, 59.4K)
icon-dataset
(ARFF, 60.8K)
icon-dataset
(ARFF, 60.2K)
icon-dataset
(ARFF, 65.0K)
icon-dataset
(ARFF, 63.4K)
icon-dataset
(ARFF, 87.8K)
icon-dataset
(ARFF, 89.3K)
icon-dataset
(ARFF, 91.8K)
icon-dataset
(ARFF, 91.0K)
icon-dataset
(ARFF, 131.4K)
icon-dataset
(ARFF, 133.6K)
icon-dataset
(ARFF, 80.7K)
icon-dataset
(ARFF, 79.8K)
icon-dataset
(ARFF, 89.1K)
icon-dataset
(ARFF, 90.8K)
icon-dataset
(ARFF, 87.3K)
icon-dataset
(ARFF, 87.9K)
icon-dataset
(ARFF, 98.3K)
icon-dataset
(ARFF, 98.7K)
icon-dataset
(ARFF, 89.8K)
icon-dataset
(ARFF, 89.9K)
icon-dataset
(ARFF, 101.9K)
icon-dataset
(ARFF, 103.7K)
icon-dataset
(ARFF, 29.8K)
icon-dataset
(ARFF, 29.2K)
icon-dataset
(ARFF, 16.3K)
icon-dataset
(ARFF, 17.0K)
icon-dataset
(ARFF, 44.1K)
icon-dataset
(ARFF, 44.4K)
icon-dataset
(ARFF, 30.4K)
icon-dataset
(ARFF, 29.5K)
icon-dataset
(ARFF, 61.1K)
icon-dataset
(ARFF, 63.6K)
icon-dataset
(ARFF, 27.3K)
icon-dataset
(ARFF, 27.6K)
icon-dataset
(ARFF, 27.7K)
icon-dataset
(ARFF, 27.7K)
icon-dataset
(ARFF, 28.3K)
icon-dataset
(ARFF, 27.9K)
icon-dataset
(ARFF, 42.0K)
icon-dataset
(ARFF, 42.2K)
icon-dataset
(ARFF, 57.2K)
icon-dataset
(ARFF, 58.1K)
icon-dataset
(ARFF, 40.3K)
icon-dataset
(ARFF, 39.2K)
icon-dataset
(ARFF, 57.0K)
icon-dataset
(ARFF, 56.0K)
icon-dataset
(ARFF, 79.5K)
icon-dataset
(ARFF, 79.6K)
icon-dataset
(ARFF, 85.6K)
icon-dataset
(ARFF, 84.5K)
icon-dataset
(ARFF, 53.5K)
icon-dataset
(ARFF, 53.2K)
icon-dataset
(ARFF, 18.0K)
icon-dataset
(ARFF, 18.1K)
icon-dataset
(ARFF, 35.6K)
icon-dataset
(ARFF, 35.7K)
icon-dataset
(ARFF, 48.9K)
icon-dataset
(ARFF, 49.1K)
icon-dataset
(ARFF, 49.4K)
icon-dataset
(ARFF, 50.8K)
icon-dataset
(ARFF, 46.0K)
icon-dataset
(ARFF, 48.0K)
icon-dataset
(ARFF, 23.6K)
icon-dataset
(ARFF, 24.6K)
icon-dataset
(ARFF, 21.4K)
icon-dataset
(ARFF, 21.2K)
icon-dataset
(ARFF, 20.8K)
icon-dataset
(ARFF, 21.1K)
icon-dataset
(ARFF, 17.3K)
icon-dataset
(ARFF, 17.8K)
icon-dataset
(ARFF, 37.1K)
icon-dataset
(ARFF, 38.1K)
icon-dataset
(ARFF, 17.9K)
icon-dataset
(ARFF, 18.2K)
icon-dataset
(ARFF, 24.3K)
icon-dataset
(ARFF, 24.8K)
icon-dataset
(ARFF, 46.1K)
icon-dataset
(ARFF, 46.3K)
icon-dataset
(ARFF, 17.3K)
icon-dataset
(ARFF, 17.5K)
icon-dataset
(ARFF, 23.4K)
icon-dataset
(ARFF, 22.8K)
Valid HTML 4.0 Transitional            Valid CSS!