Capítulo 14
Índice
- 1. O que é Ciência de Dados?
- 2. Causalidade e Experimentos
- 3. Progamando em Python
- 4. Tipos de Dados
- 5. Sequências
- 6. Tabelas
- 7. Visualização
- 8. Funções e Tabelas
- 9. Aleatoriedade
- 10. Amostragem e Distribuições Empíricas
- 11. Testando Hipóteses
- 12. Comparando Duas Amostras
- 13. Estimação
- 14. Por que a Média é Importante
- 15. Previsão
from datascience import *
%matplotlib inline
path_data = '../../assets/data/'
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
import numpy as np
Porque a média é importante
Neste curso, estudamos diversas estatísticas diferentes, incluindo a distância de variação total, o máximo, a mediana e também a média. Sob suposições claras sobre aleatoriedade, desenhamos distribuições empíricas de todas essas estatísticas. Algumas, como o máximo e a distância de variação total, têm distribuições que são claramente assimétricas em uma direção ou outra. Mas a distribuição empírica da média da amostra quase sempre se mostrou próxima de um formato de sino, independentemente da população sendo estudada.
Se uma propriedade de amostras aleatórias é verdadeira independentemente da população, ela se torna uma ferramenta poderosa para inferência, pois raramente sabemos muito sobre os dados na população inteira. A distribuição da média de uma grande amostra aleatória se enquadra nesta categoria de propriedades. É por isso que as médias de amostras aleatórias são extensivamente usadas na ciência de dados.
Neste capítulo, estudaremos as médias e o que podemos dizer sobre elas com apenas suposições mínimas sobre as populações subjacentes. As perguntas que abordaremos incluem:
- O que exatamente a média mede?
- Quão próximos da média estão a maioria dos dados?
- Como o tamanho da amostra se relaciona com a variabilidade da média da amostra?
- Por que as distribuições empíricas das médias de amostras aleatórias têm formato de sino?
- Como podemos usar as médias de amostras de forma eficaz para a inferência?
| ← Capítulo 13.4 – Usando os Intervalos | Capítulo 14.1 – Propriedades da Média → |
