Capítulo 14

Índice

  1. 1. O que é Ciência de Dados?
  2. 2. Causalidade e Experimentos
  3. 3. Progamando em Python
  4. 4. Tipos de Dados
  5. 5. Sequências
  6. 6. Tabelas
  7. 7. Visualização
  8. 8. Funções e Tabelas
  9. 9. Aleatoriedade
  10. 10. Amostragem e Distribuições Empíricas
  11. 11. Testando Hipóteses
  12. 12. Comparando Duas Amostras
  13. 13. Estimação
  14. 14. Por que a Média é Importante
  15. 15. Previsão

from datascience import *
%matplotlib inline
path_data = '../../assets/data/'
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
import numpy as np

 

Porque a média é importante

Neste curso, estudamos diversas estatísticas diferentes, incluindo a distância de variação total, o máximo, a mediana e também a média. Sob suposições claras sobre aleatoriedade, desenhamos distribuições empíricas de todas essas estatísticas. Algumas, como o máximo e a distância de variação total, têm distribuições que são claramente assimétricas em uma direção ou outra. Mas a distribuição empírica da média da amostra quase sempre se mostrou próxima de um formato de sino, independentemente da população sendo estudada.

Se uma propriedade de amostras aleatórias é verdadeira independentemente da população, ela se torna uma ferramenta poderosa para inferência, pois raramente sabemos muito sobre os dados na população inteira. A distribuição da média de uma grande amostra aleatória se enquadra nesta categoria de propriedades. É por isso que as médias de amostras aleatórias são extensivamente usadas na ciência de dados.

Neste capítulo, estudaremos as médias e o que podemos dizer sobre elas com apenas suposições mínimas sobre as populações subjacentes. As perguntas que abordaremos incluem:

  • O que exatamente a média mede?
  • Quão próximos da média estão a maioria dos dados?
  • Como o tamanho da amostra se relaciona com a variabilidade da média da amostra?
  • Por que as distribuições empíricas das médias de amostras aleatórias têm formato de sino?
  • Como podemos usar as médias de amostras de forma eficaz para a inferência?

 

← Capítulo 13.4 – Usando os Intervalos Capítulo 14.1 – Propriedades da Média →