Capítulo 11

Índice

  1. 1. O que é Ciência de Dados?
  2. 2. Causalidade e Experimentos
  3. 3. Progamando em Python
  4. 4. Tipos de Dados
  5. 5. Sequências
  6. 6. Tabelas
  7. 7. Visualização
  8. 8. Funções e Tabelas
  9. 9. Aleatoriedade
  10. 10. Amostragem e Distribuições Empíricas
  11. 11. Testando Hipóteses
  12. 12. Comparando Duas Amostras
  13. 13. Estimação
  14. 14. Por que a Média é Importante
  15. 15. Previsão

Testando Hipóteses

Cientistas de dados frequentemente se deparam com perguntas de sim-não sobre o mundo. Você já viu alguns exemplos de tais perguntas neste curso:

  • O chocolate é bom para você?
  • A água da bomba da Broad Street causou cólera?
  • As demografias na Califórnia mudaram na última década?

Se iremos responder a perguntas como essas, tudo vai depender dos dados que temos. Dados do censo sobre a Califórnia podem resolver questões sobre demografia com pouca incerteza sobre a resposta. Sabemos que a água da bomba da Broad Street foi contaminada por resíduos de vítimas de cólera, então podemos fazer uma boa suposição sobre se ela causou cólera.

Se o chocolate ou qualquer outro tratamento é bom para você quase certamente terá que ser decidido por especialistas médicos, mas um passo inicial consiste em usar a ciência de dados para analisar dados de estudos e experimentos randomizados.

Neste capítulo, tentaremos responder a essas perguntas de sim-não, baseando nossas conclusões em amostras aleatórias e distribuições empíricas.

 

← Capítulo 10.4 – Amostragem Aleatória em Python Capítulo 11.1 – Avaliando um Modelo →