1.3 Bases de dados

Statistics starts with data. (Breiman 2001, 199)

1.3.1 Kaggle

Kaggle é uma comunidade online de analistas de dados. Permite que os usuários encontrem e publiquem bancos de dados, explorem e construam modelos de forma colaborativa e participem de competições para resolver desafios envolvendo dados.

Exercício 1.5 Baixe o banco de dados RAVDESS, preferencialmente via linha de comando.
(a) Aplique as funções do pacote voice.
(b) Compare por ator, sexo, intensidade e emoção.

1.3.2 UCI Machine Learning Repository

O Repositório de Aprendizado de Máquina da Universidade da Califórnia Irvine é uma coleção de bancos de dados, teorias de domínio e geradores de dados que são usados pela comunidade de aprendizado de máquina para a análise empírica do aprendizado de máquina algoritmos. Atualmente há mais de 600 conjuntos de dados disponíveis, e é possível visualizar todos os conjuntos de dados por meio de uma interface pesquisável, bastando referenciar o material usado de acordo com a política de citação.

1.3.3 Base dos Dados

Base dos Dados é “uma organização não-governamental sem fins lucrativos e open source que atua para universalizar o acesso a dados de qualidade”. Lembre-se que para usar o BigQuery é preciso ter uma conta Google e associá-la conforme esse passo a passo.

Referências

Breiman, Leo. 2001. “Statistical Modeling: The Two Cultures.” Statistical Science 16 (3): 199–231. https://projecteuclid.org/journals/statistical-science/volume-16/issue-3/Statistical-Modeling--The-Two-Cultures-with-comments-and-a/10.1214/ss/1009213726.full.