Capítulo 11

Índice

Testando Hipóteses

Cientistas de dados frequentemente se deparam com perguntas de sim-não sobre o mundo. Você já viu alguns exemplos de tais perguntas neste curso:

O chocolate é bom para você?
A água da bomba da Broad Street causou cólera?
As demografias na Califórnia mudaram na última década?

Se iremos responder a perguntas como essas, tudo vai depender dos dados que temos. Dados do censo sobre a Califórnia podem resolver questões sobre demografia com pouca incerteza sobre a resposta. Sabemos que a água da bomba da Broad Street foi contaminada por resíduos de vítimas de cólera, então podemos fazer uma boa suposição sobre se ela causou cólera.

Se o chocolate ou qualquer outro tratamento é bom para você quase certamente terá que ser decidido por especialistas médicos, mas um passo inicial consiste em usar a ciência de dados para analisar dados de estudos e experimentos randomizados.

Neste capítulo, tentaremos responder a essas perguntas de sim-não, baseando nossas conclusões em amostras aleatórias e distribuições empíricas.

← Capítulo 10.4 – Amostragem Aleatória em Python

Capítulo 11.1 – Avaliando um Modelo →