Capítulo 2
Índice
- 1. O que é Ciência de Dados?
- 2. Causalidade e Experimentos
- 3. Progamando em Python
- 4. Tipos de Dados
- 5. Sequências
- 6. Tabelas
- 7. Visualização
- 8. Funções e Tabelas
- 9. Aleatoriedade
- 10. Amostragem e Distribuições Empíricas
- 11. Testando Hipóteses
- 12. Comparando Duas Amostras
- 13. Estimação
- 14. Por que a Média é Importante
- 15. Previsão
Causalidade e Experimentos
“Esses problemas são, e provavelmente sempre serão, entre os segredos inscrutáveis da natureza. Eles pertencem a uma classe de perguntas radicalmente inacessíveis à inteligência humana.” —The Times of London, setembro de 1849, sobre como a cólera é contraída e espalhada
A pena de morte tem um efeito dissuasivo? Chocolate faz bem para você? O que causa câncer de mama?
Todas essas perguntas tentam atribuir uma causa a um efeito. Uma análise cuidadosa dos dados pode ajudar a esclarecer questões como essas. Nesta seção, você aprenderá alguns dos conceitos fundamentais envolvidos no estabelecimento de causalidade.
A observação é fundamental para uma boa ciência. Um estudo observacional é aquele em que os cientistas fazem conclusões com base em dados que observaram, mas não tiveram participação na geração. Na ciência de dados, muitos estudos desse tipo envolvem observações sobre um grupo de indivíduos, um fator de interesse chamado tratamento, e um resultado medido em cada indivíduo.
É mais fácil pensar nos indivíduos como pessoas. Em um estudo sobre se o chocolate faz bem para a saúde, os indivíduos realmente seriam pessoas, o tratamento seria comer chocolate, e o resultado poderia ser uma medida de doenças cardíacas. Mas os indivíduos em estudos observacionais não precisam ser pessoas. Em um estudo sobre se a pena de morte tem um efeito dissuasivo, os indivíduos poderiam ser os 50 estados da união. Uma lei estadual que permite a pena de morte seria o tratamento, e um resultado poderia ser a taxa de homicídios do estado.
A questão fundamental é se o tratamento tem um efeito sobre o resultado. Qualquer relação entre o tratamento e o resultado é chamada de associação. Se o tratamento faz com que o resultado ocorra, então a associação é causal. Causalidade é o cerne de todas as três perguntas feitas no início desta seção. Por exemplo, uma das perguntas foi se o chocolate causa diretamente melhorias na saúde, não apenas se há uma relação entre chocolate e saúde.
O estabelecimento da causalidade muitas vezes ocorre em duas etapas. Primeiro, uma associação é observada. Em seguida, uma análise mais cuidadosa leva a uma decisão sobre causalidade.
| ← Capítulo 1.3.2 – Outro Tipo de Personagem | Capítulo 2.1 – John Snow e a Bomba da Broad Street → |
