1.3 Dados
Statistics starts with data. (Breiman 2001, 199)
1.3.1 Kaggle
Kaggle é uma comunidade online de analistas de dados. Permite que os usuários encontrem e publiquem bancos de dados, explorem e construam modelos de forma colaborativa e participem de competições para resolver desafios envolvendo dados.
1.3.2 UCI Machine Learning Repository
O Repositório de Aprendizado de Máquina da Universidade da Califórnia Irvine é uma coleção de bancos de dados, teorias de domínio e geradores de dados que são usados pela comunidade de aprendizado de máquina para a análise empírica do aprendizado de máquina algoritmos. Atualmente há mais de 600 conjuntos de dados disponíveis, e é possível visualizar todos os conjuntos de dados por meio de uma interface pesquisável, bastando referenciar o material usado de acordo com a política de citação.
1.3.3 Base dos Dados
Base dos Dados é “uma organização não-governamental sem fins lucrativos e open source que atua para universalizar o acesso a dados de qualidade”. Lembre-se que para usar o BigQuery é preciso ter uma conta Google e associá-la conforme esse passo a passo.
1.3.4 Dados Abertos e Catálogo Nacional de Dados
O Portal Brasileiro de Dados Abertos e Catálogo Nacional de Dados é uma ferramenta que permite encontrar dados publicados pelo governo federal e por governos locais para realizar pesquisas, desenvolver aplicativos e criar novos serviços.