Capítulo 5

Índice

  1. 1. O que é Ciência de Dados?
  2. 2. Causalidade e Experimentos
  3. 3. Progamando em Python
  4. 4. Tipos de Dados
  5. 5. Sequências
  6. 6. Tabelas
  7. 7. Visualização
  8. 8. Funções e Tabelas
  9. 9. Aleatoriedade
  10. 10. Amostragem e Distribuições Empíricas
  11. 11. Testando Hipóteses
  12. 12. Comparando Duas Amostras
  13. 13. Estimação
  14. 14. Por que a Média é Importante
  15. 15. Previsão

from datascience import *
path_data = '../../assets/data/'

 

Sequências

Os valores podem ser agrupados em coleções, o que permite aos programadores organizar esses valores e referir-se a todos eles com um único nome. Ao agrupar valores, podemos escrever um código que realiza um cálculo em muitos dados de uma só vez.

Chamar a função make_array em vários valores os coloca em um array, que é um tipo de coleção sequencial. Abaixo, coletamos quatro temperaturas diferentes em um array chamado highs. Estas são as temperaturas médias diárias máximas estimadas sobre toda a terra na Terra (em graus Celsius) para as décadas em torno de 1850, 1900, 1950 e 2000, respectivamente,
expressas como desvios da temperatura média absoluta máxima entre 1951 e 1980, que foi de 14.48 graus.

baseline_high = 14.48
highs = make_array(baseline_high - 0.880, baseline_high - 0.093,
                   baseline_high + 0.105, baseline_high + 0.684)
highs
Out[2]: array([13.6 , 14.387, 14.585, 15.164])

 

Coleções nos permitem passar múltiplos valores para uma função usando um único nome. Por exemplo, a função sum calcula a soma de todos os valores em uma coleção, e a função len calcula o seu comprimento. (Isso é o número de valores que colocamos nela.) Usando-as juntas, podemos calcular a média de uma coleção.

sum(highs)/len(highs)
Out[3]: 14.434000000000001

 

O gráfico completo das temperaturas máximas e mínimas diárias aparece abaixo.

Média de alta temperatura diária

Mean of Daily High Temperature

Média de temperatura baixa diária

Mean of Daily Low Temperature

← Capítulo 4.3 – Comparações Capítulo 5.1 – Arrays →