Capítulo 2.2

Índice

  1. 1. O que é Ciência de Dados?
  2. 2. Causalidade e Experimentos
  3. 3. Progamando em Python
  4. 4. Tipos de Dados
  5. 5. Sequências
  6. 6. Tabelas
  7. 7. Visualização
  8. 8. Funções e Tabelas
  9. 9. Aleatoriedade
  10. 10. Amostragem e Distribuições Empíricas
  11. 11. Testando Hipóteses
  12. 12. Comparando Duas Amostras
  13. 13. Estimação
  14. 14. Por que a Média é Importante
  15. 15. Previsão

O “Grande Experimento” de Snow

Encorajado pelo que aprendeu em Soho, Snow completou uma análise mais minuciosa. Por algum tempo, ele vinha coletando dados sobre mortes por cólera em uma área de Londres atendida por duas companhias de água. A companhia de água de Lambeth retirava sua água rio acima, de onde o esgoto era descarregado no rio Tâmisa. Sua água era relativamente limpa. Mas a companhia de água de Southwark e Vauxhall (S&V) retirava sua água abaixo do ponto de descarga de esgoto, e assim seu fornecimento estava contaminado.

O mapa abaixo mostra as áreas atendidas pelas duas empresas. Snow concentrou-se na região onde as duas áreas de serviço se sobrepõem.
Outro Mapa de Snow

Snow notou que não havia diferença sistemática entre as pessoas que eram fornecidas pela S&V e aquelas fornecidas pela Lambeth. “Cada empresa fornece tanto ricos quanto pobres, tanto casas grandes quanto pequenas; não há diferença nem na condição nem na ocupação das pessoas que recebem a água das diferentes empresas … não há diferença alguma nas casas ou nas pessoas que recebem o abastecimento das duas Companhias de Água, ou em quaisquer das condições físicas com as quais estão cercadas …”

A única diferença estava no abastecimento de água, “Um grupo consumia água contaminada pelo esgoto de Londres, que poderia conter material de pacientes com cólera, ao passo que o outro grupo recebia água isenta de contaminação.”

Confiante de que seria capaz de chegar a uma conclusão clara, Snow resumiu seus dados na tabela abaixo.

Área de Abastecimento Número de Casas Mortes por cólera Mortes por 10.000 casas
S&V 40.046 1.263 315
Lambeth 26.107 98 37
Restante de Londres 256.423 1.422 59

Os números apontavam acusadoramente para a S&V. A taxa de mortalidade por cólera nas casas da S&V era quase dez vezes maior do que a taxa nas casas fornecidas pela Lambeth.

← Capítulo 2.1 – John Snow e a Bomba da Broad Street Capítulo 2.3 – Estabelecendo Causalidade →