1.3 Bases de dados
Statistics starts with data. (Breiman 2001, 199)
1.3.1 Kaggle
Kaggle é uma comunidade online de analistas de dados. Permite que os usuários encontrem e publiquem bancos de dados, explorem e construam modelos de forma colaborativa e participem de competições para resolver desafios envolvendo dados.
1.3.2 UCI Machine Learning Repository
O Repositório de Aprendizado de Máquina da Universidade da Califórnia Irvine é uma coleção de bancos de dados, teorias de domínio e geradores de dados que são usados pela comunidade de aprendizado de máquina para a análise empírica do aprendizado de máquina algoritmos. Atualmente há mais de 600 conjuntos de dados disponíveis, e é possível visualizar todos os conjuntos de dados por meio de uma interface pesquisável, bastando referenciar o material usado de acordo com a política de citação.
1.3.3 Base dos Dados
Base dos Dados é “uma organização não-governamental sem fins lucrativos e open source que atua para universalizar o acesso a dados de qualidade”. Lembre-se que para usar o BigQuery é preciso ter uma conta Google e associá-la conforme esse passo a passo.