Capítulo 1 Introdução

The object of statistical methods is the reduction of data. (Ronald A. Fisher 1922, 309)

A Estatística reúne ferramentas teóricas e práticas para analisar informações quantitativas, medir incertezas e auxiliar na tomada de decisão. É um componente do Método Científico, e pode ser dividida conforme o esquema da Figura 1.1. Neste material serão abordados fundamentos de análise exploratória de dados, probabilidade, amostragem, inferência sob os prismas clássico e bayesiano e modelos lineares.

Uma possível divisão da Estatística

Figura 1.1: Uma possível divisão da Estatística

 

Exercício 1.1 Veja The Cartoon Guide To Statistics de (Gonick and Smith 1993). Dica de Adilson Medronha em 2024-03-15.

CRISP-DM

O fluxo de trabalho de um projeto de dados costuma ser descrito em algumas etapas básicas.

  1. Entendimento do problema.
  2. Entendimento e preparação dos dados.
  3. Modelagem e avaliação.
  4. Implementação e comunicação.

O CRISP-DM (Cross-Industry Standard Process for Data Mining) é uma metodologia e processo de modelagem de padrão aberto que formaliza as etapas descritas acima (IBM 2011).

References

Fisher, Ronald A. 1922. “On the Mathematical Foundations of Theoretical Statistics.” Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character 222 (594-604): 309–68. https://royalsocietypublishing.org/doi/pdf/10.1098/rsta.1922.0009.
Gonick, Larry, and Woollcott Smith. 1993. The Cartoon Guide to Statistics. New York: Harper Resource. https://archive.org/details/TheCartoonGuideToStatistics/page/n3/mode/2up.
IBM. 2011. IBM SPSS Modeler CRISP-DM Guide. https://inseaddataanalytics.github.io/INSEADAnalytics/CRISP_DM.pdf.