{"id":451,"date":"2025-07-23T17:55:30","date_gmt":"2025-07-23T21:55:30","guid":{"rendered":"https:\/\/literaciadigital.ufms.br\/?page_id=451"},"modified":"2025-09-29T02:01:07","modified_gmt":"2025-09-29T06:01:07","slug":"7-2","status":"publish","type":"page","link":"https:\/\/literaciadigital.ufms.br\/en\/data8\/7-0\/7-2\/","title":{"rendered":"Cap\u00edtulo 7.2"},"content":{"rendered":"<div style=\"position: relative\">\n<div style=\"float: left;width: 300px;background-color: #f5f5f5;border: 1px solid #ddd;border-radius: 5px;padding: 15px;margin-right: 20px;margin-bottom: 5px;overflow: hidden\">\n<h3 style=\"margin: 0 0 10px 0;padding-bottom: 8px;border-bottom: 1px solid #ddd\">\u00cdndice<\/h3>\n<ol style=\"margin: 0;padding-left: 0;list-style-type: none\">\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/\">1. O que \u00e9 Ci\u00eancia de Dados?<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-1\/\">1.1. Introdu\u00e7\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-1\/1-1\/\">1.1.1. Ferramentas Computacionais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-1\/1-2\/\">1.1.2. T\u00e9cnicas Estat\u00edsticas<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-2\/\">1.2. Por que Ci\u00eancia de Dados?<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-3\/\">1.3. Tra\u00e7ando os Cl\u00e1ssicos<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-3\/3-1\/\">1.3.1. Personagens Liter\u00e1rios<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-3\/3-2\/\">1.3.2. Outro Tipo de Personagem<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/\">2. Causalidade e Experimentos<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-1\/\">2.1. John Snow e a Bomba da Broad Street<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-2\/\">2.2. O &#8220;Grande Experimento&#8221; de Snow<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-3\/\">2.3. Estabelecendo Causalidade<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-4\/\">2.4. Randomiza\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-5\/\">2.5. Notas Finais<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/\">3. Progamando em Python<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-1\/\">3.1. Express\u00f5es<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-2\/\">3.2. Nomes<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-2\/2-1\/\">3.2.1. Exemplo: Taxas de Crescimento<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-3\/\">3.3. Chamadas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-4\/\">3.4. Introdu\u00e7\u00e3o \u00e0s Tabelas<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/\">4. Tipos de Dados<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-1\/\">4.1. N\u00fameros<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-2\/\">4.2. Strings<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-2\/2-1\/\">4.2.1. M\u00e9todos de Strings<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-3\/\">4.3. Compara\u00e7\u00f5es<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/\">5. Sequ\u00eancias<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/5-1\/\">5.1. Arrays<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/5-2\/\">5.2. Ranges<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/5-3\/\">5.3. Mais sobre Arrays<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/\">6. Tabelas<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-1\/\">6.1. Ordenando Linhas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-2\/\">6.2. Selecionando Linhas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-3\/\">6.3. Exemplo: Tend\u00eancias Populacionais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-4\/\">6.4. Examplo: Propor\u00e7\u00f5es de Sexos<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/\">7. Visualiza\u00e7\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-1\/\">7.1. Visualizando Distribui\u00e7\u00f5es<br \/>\nCateg\u00f3ricas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-2\/\">7.2. Visualizando Distribui\u00e7\u00f5es Num\u00e9ricas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-3\/\">7.3. Gr\u00e1ficos Sobrepostos<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/\">8. Fun\u00e7\u00f5es e Tabelas<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-1\/\">8.1. Aplicando Fun\u00e7\u00e3o a uma Coluna<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-2\/\">8.2. Classificando por uma Vari\u00e1vel<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-3\/\">8.3. Classifica\u00e7\u00e3o Cruzada<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-4\/\">8.4. Unindo Tabelas por Colunas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-5\/\">8.5. Compartilhamento de Bicicletas<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/\">9. Aleatoriedade<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-1\/\">9.1. Declara\u00e7\u00f5es Condicionais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-2\/\">9.2. Itera\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-3\/\">9.3. Simula\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-4\/\">9.4. O Problema de Monty Hall<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-5\/\">9.5. Encontrando Probabilidades<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/\">10. Amostragem e Distribui\u00e7\u00f5es Emp\u00edricas<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-1\/\">10.1. Distribui\u00e7\u00f5es Emp\u00edricas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-2\/\">10.2. Amostragem de uma Popula\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-3\/\">10.3. Distribui\u00e7\u00e3o Emp\u00edrica de uma<br \/>\nEstat\u00edstica<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-4\/\">10.4. Amostragem Aleat\u00f3ria em Python <\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/\">11. Testando Hip\u00f3teses<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-1\/\">11.1. Avaliando um Modelo<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-2\/\">11.2. M\u00faltiplas Categorias<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-3\/\">11.3. Decis\u00f5es e Incertezas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-4\/\">11.4. Probabilidades de Erro<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/\">12. Comparando Duas Amostras<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/12-1\/\">12.1. Teste A\/B<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/12-2\/\">12.2. Causalidade<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/12-3\/\">12.3. Esvaziar<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/\">13. Estima\u00e7\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-1\/\">13.1. Percentis<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-2\/\">13.2. O Bootstrap<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-3\/\">13.3. Intervalos de Confian\u00e7a<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-4\/\">13.4. Usando Intervalos de Confian\u00e7a<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/\">14. Por que a M\u00e9dia \u00e9 Importante<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-1\/\">14.1. Propriedades da M\u00e9dia<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-2\/\">14.2. Variabilidade<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-3\/\">14.3. O DP e a Curva Normal<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-4\/\">14.4. Teorema Central do Limite<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-5\/\">14.5. Variabilidade da M\u00e9dia da Amostra<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-6\/\">14.6. Escolhendo um Tamanho de Amostra<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/\">15. Previs\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-1\/\">15.1. Correla\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-2\/\">15.2. Linha de Regress\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-3\/\">15.3. M\u00e9todo dos M\u00ednimos Quadrados<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-4\/\">15.4. Regress\u00e3o de M\u00ednimos Quadrados<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-5\/\">15.5. Diagn\u00f3sticos Visuais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-6\/\">15.6. Diagn\u00f3stico Num\u00e9rico<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<\/div>\n<p><!-- Main Content --><\/p>\n<div style=\"overflow: hidden\">\n<p><!--###########################################################################################################################################################--><\/p>\n<pre><code><span style=\"color: black\">from datascience import *\r\nimport numpy as np\r\npath_data = '..\/..\/..\/assets\/data\/'\r\n%matplotlib inline\r\nimport matplotlib.pyplot as plots\r\nplots.style.use('fivethirtyeight')<\/span><\/code><\/pre>\n<h1 id=\"visualizando-distribui-es-num-ricas\" style=\"text-align: center\">Visualizando Distribui\u00e7\u00f5es Num\u00e9ricas<\/h1>\n<p style=\"text-align: justify\">Muitas das vari\u00e1veis que os cientistas de dados estudam s\u00e3o <em>quantitativas<\/em> ou <em>num\u00e9ricas<\/em>. Seus valores s\u00e3o n\u00fameros nos quais voc\u00ea pode realizar opera\u00e7\u00f5es aritm\u00e9ticas. Exemplos que vimos incluem o n\u00famero de per\u00edodos em cap\u00edtulos de um livro, a quantidade de dinheiro feita por filmes e a idade das pessoas nos Estados Unidos.<\/p>\n<p style=\"text-align: justify\">Os valores de uma vari\u00e1vel categ\u00f3rica podem receber c\u00f3digos num\u00e9ricos, mas isso n\u00e3o torna a vari\u00e1vel quantitativa. No exemplo em que estudamos os dados do Censo divididos por faixa et\u00e1ria, a vari\u00e1vel categ\u00f3rica <code>SEX<\/code> tinha os c\u00f3digos num\u00e9ricos <code>1<\/code> para &#8216;Masculino&#8217;, <code>2<\/code> para &#8216;Feminino&#8217; e <code>0<\/code> para o agregado de ambos os grupos <code>1<\/code> e <code>2<\/code>. Embora 0, 1 e 2 sejam n\u00fameros, neste contexto n\u00e3o faz sentido subtrair 1 de 2, ou tirar a m\u00e9dia de 0, 1 e 2, ou realizar outras opera\u00e7\u00f5es aritm\u00e9ticas nos tr\u00eas valores. <code>SEXO<\/code> \u00e9 uma vari\u00e1vel categ\u00f3rica, mesmo que os valores tenham recebido um c\u00f3digo num\u00e9rico.<\/p>\n<p style=\"text-align: justify\">Para o nosso exemplo principal, vamos voltar a um conjunto de dados que estudamos quando est\u00e1vamos visualizando dados categ\u00f3ricos. \u00c9 a tabela <code>top<\/code>, que consiste em dados dos filmes com maior arrecada\u00e7\u00e3o de todos os tempos nos Estados Unidos (at\u00e9 2017). Para conveni\u00eancia, aqui est\u00e1 a descri\u00e7\u00e3o da tabela novamente.<\/p>\n<p style=\"text-align: justify\">A primeira coluna cont\u00e9m o t\u00edtulo do filme. A segunda coluna cont\u00e9m o nome do est\u00fadio que produziu o filme. A terceira cont\u00e9m a arrecada\u00e7\u00e3o dom\u00e9stica de bilheteria em d\u00f3lares, e a quarta cont\u00e9m o valor bruto que teria sido ganho com a venda de ingressos a pre\u00e7os de 2016. A quinta cont\u00e9m o ano de lan\u00e7amento do filme.<\/p>\n<p>H\u00e1 200 filmes na lista. Aqui est\u00e3o os dez melhores de acordo com a arrecada\u00e7\u00e3o bruta n\u00e3o ajustada na coluna <code>Gross<\/code>.<\/p>\n<pre><code><span style=\"color: black\">top = Table.read_table(path_data + 'top_movies_2017.csv')\r\n# Fa\u00e7a com que os n\u00fameros nas colunas Bruto e Bruto (Ajustado) pare\u00e7am mais bonitos:\r\ntop.set_format([2, 3], NumberFormatter)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">Title<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Studio<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Gross<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Gross (Adjusted)<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Year<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Gone with the Wind<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">MGM<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">198,676,459<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,796,176,700<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1939<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Star Wars<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Fox<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">460,998,007<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,583,483,200<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1977<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">The Sound of Music<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Fox<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">158,671,368<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,266,072,700<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1965<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">E.T.: The Extra-Terrestrial<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Universal<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">435,110,554<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,261,085,000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1982<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Titanic<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Paramount<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">658,672,302<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,204,368,000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1997<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">The Ten Commandments<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Paramount<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">65,500,000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,164,590,000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1956<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Jaws<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Universal<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">260,000,000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,138,620,700<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1975<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Doctor Zhivago<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">MGM<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">111,721,910<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1,103,564,200<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1965<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">The Exorcist<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Warner Brothers<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">232,906,145<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">983,226,600<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1973<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Snow White and the Seven Dwarves<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Disney<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">184,925,486<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">969,010,000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1937<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd;text-align: center;font-style: italic\" colspan=\"5\">&#8230; (190 rows omitted)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Nesta se\u00e7\u00e3o, iremos desenhar gr\u00e1ficos da distribui\u00e7\u00e3o da vari\u00e1vel num\u00e9rica na coluna <code>Gross (Adjusted)<\/code>. Para simplificar, vamos criar uma tabela menor que contenha as informa\u00e7\u00f5es que precisamos. E como n\u00fameros de tr\u00eas d\u00edgitos s\u00e3o mais f\u00e1ceis de trabalhar do que n\u00fameros de nove d\u00edgitos, vamos medir as receitas de <code>Adjusted Gross<\/code> em milh\u00f5es de d\u00f3lares. Observe como <code>np.round<\/code> \u00e9 usado para manter apenas duas casas decimais em cada entrada da coluna.<\/p>\n<pre><code><span style=\"color: black\">millions = top.select(0).with_columns('Adjusted Gross',np.round(top.column(3)\/1e6, 2))\r\nmillions<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">Title<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Adjusted Gross<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Gone with the Wind<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1796.18<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Star Wars<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1583.48<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">The Sound of Music<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1266.07<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">E.T.: The Extra-Terrestrial<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1261.08<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Titanic<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1204.37<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">The Ten Commandments<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1164.59<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Jaws<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1138.62<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Doctor Zhivago<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1103.56<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">The Exorcist<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">983.23<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">Snow White and the Seven Dwarves<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">969.01<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd;text-align: center;font-style: italic\" colspan=\"2\">&#8230; (190 rows omitted)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<h2 id=\"agrupando-os-dados\">Agrupando os Dados<\/h2>\n<p style=\"text-align: justify\">Observe os valores da vari\u00e1vel quantitativa <code>Adjusted Gross<\/code>. Provavelmente haver\u00e1 apenas um filme em cada valor individual, j\u00e1 que os valores est\u00e3o sendo medidos de forma bastante refinada. \u00c9 mais interessante agrupar os valores em intervalos, conhecidos como <em>bins<\/em>, e ver quantos filmes h\u00e1 em cada bin. Esse processo \u00e9 chamado de <em>agrupamento<\/em>.<\/p>\n<p style=\"text-align: justify\">As contagens de indiv\u00edduos (ou seja, linhas) nos bins podem ser calculadas usando o m\u00e9todo <code>bin<\/code>, an\u00e1logo ao m\u00e9todo <code>group<\/code> usado no caso de dados categ\u00f3ricos. O m\u00e9todo <code>bin<\/code> recebe como argumento um r\u00f3tulo de coluna ou \u00edndice e um argumento opcional no qual voc\u00ea pode especificar os bins desejados.<\/p>\n<p style=\"text-align: justify\">O resultado \u00e9 uma tabela de duas colunas que cont\u00e9m o n\u00famero de linhas em cada bin. A primeira coluna lista os pontos de extremidade esquerdos dos bins (mas veja a observa\u00e7\u00e3o sobre o \u00faltimo bin, abaixo).<\/p>\n<p style=\"text-align: justify\">Vamos experimentar o m\u00e9todo e examinar os detalhes da sa\u00edda. Para escolher alguns bins, come\u00e7aremos olhando para os valores mais baixos e mais altos de <code>Adjusted Gross<\/code>.<\/p>\n<pre><code><span style=\"color: black\">adj_gross = millions.column('Adjusted Gross')\r\nmin(adj_gross), max(adj_gross)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[2]:<\/td>\n<td style=\"text-align: left\">(338.41, 1796.18)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Vamos tentar caixas de largura 100, come\u00e7ando em 300 e indo at\u00e9 2.000. Voc\u00ea pode fazer outras escolhas. \u00c9 comum come\u00e7ar com algo que parece razo\u00e1vel e depois ajustar com base nos resultados.<\/p>\n<pre><code><span style=\"color: black\">bin_counts = millions.bin('Adjusted Gross', bins=np.arange(300,2001,100))\r\nbin_counts.show()<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Adjusted Gross count<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">68<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">32<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">600<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">15<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">700<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">7<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">800<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">7<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">900<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">3<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1100<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">3<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1200<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">3<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1600<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1700<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1800<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1900<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">2000<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Vamos examinar a Coluna 0, a coluna <code>bin<\/code>. Esta coluna especifica o ponto de extremidade esquerdo de cada bin, exceto na \u00faltima linha, conforme explicado abaixo.<\/p>\n<p style=\"text-align: justify\">Como os bins dividem a reta num\u00e9rica em intervalos, eles s\u00e3o cont\u00edguos. Portanto, devemos ter cuidado com os valores nos pontos de extremidade. Pela conven\u00e7\u00e3o usual do Python, cada bin, exceto o \u00faltimo, inclui seu ponto de extremidade esquerdo, mas n\u00e3o seu ponto de extremidade direito.<\/p>\n<p style=\"text-align: justify\">Para destacar este ponto, usaremos a nota\u00e7\u00e3o [<em>a, b<\/em>) para nos referirmos ao bin que cont\u00e9m todos os valores que s\u00e3o maiores ou iguais a <em>a<\/em> e estritamente menores que <em>b<\/em>.<\/p>\n<p style=\"text-align: justify\">Para entender a primeira linha da tabela, voc\u00ea precisa olhar tamb\u00e9m para a segunda linha. Essas duas linhas nos dizem que houve 68 filmes no bin [300, 400). Ou seja, 68 filmes tiveram receitas brutas ajustadas de pelo menos 300 milh\u00f5es de d\u00f3lares, mas menos de 400 milh\u00f5es de d\u00f3lares.<\/p>\n<p style=\"text-align: justify\">Em geral, cada elemento na coluna <code>Adjusted Gross count<\/code> conta todos os valores de <code>Adjusted Gross<\/code> que s\u00e3o maiores ou iguais ao valor em <code>bin<\/code>, mas menores que o pr\u00f3ximo valor em <code>bin<\/code>.<\/p>\n<p style=\"text-align: justify\"><strong>O \u00faltimo bin:<\/strong> Observe o valor <code>bin<\/code> 2000 na \u00faltima linha. Esse n\u00e3o \u00e9 o ponto de extremidade esquerdo de nenhum bin. Em vez disso, \u00e9 o ponto de extremidade direito do \u00faltimo bin. Este bin \u00e9 diferente de todos os outros porque tem a forma [a, b]. Ele inclui os dados em <em>ambos<\/em> os pontos de extremidade. Em nosso exemplo, isso n\u00e3o importa porque nenhum filme ganhou 2 bilh\u00f5es de d\u00f3lares (ou seja, 2000 milh\u00f5es). Mas este aspecto do agrupamento \u00e9 importante ter em mente no caso de voc\u00ea querer que os bins terminem exatamente no valor m\u00e1ximo dos dados. Todas as contagens para este \u00faltimo bin aparecem na pen\u00faltima linha, e a contagem para a \u00faltima linha \u00e9 sempre zero.<\/p>\n<p style=\"text-align: justify\">Existem outras maneiras de usar o m\u00e9todo <code>bin<\/code>. Se voc\u00ea n\u00e3o especificar nenhum bin, o padr\u00e3o \u00e9 produzir 10 bins igualmente largos entre os valores m\u00ednimo e m\u00e1ximo dos dados. Isso geralmente \u00e9 \u00fatil para obter uma ideia r\u00e1pida da distribui\u00e7\u00e3o, mas os pontos de extremidade dos bins tendem a ser alarmantes.<\/p>\n<pre><code><span style=\"color: black\">millions.bin('Adjusted Gross').show()<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Adjusted Gross count<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">338.41<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">115<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">484.187<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">50<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">629.964<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">14<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">775.741<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">10<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">921.518<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">3<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1067.3<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">4<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1213.07<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">2<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1358.85<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1504.63<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1650.4<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1796.18<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Voc\u00ea pode especificar v\u00e1rios compartimentos igualmente largos. Por exemplo, a op\u00e7\u00e3o <code>bins=4<\/code> leva a 4 compartimentos igualmente espa\u00e7ados.<\/p>\n<pre><code><span style=\"color: black\">millions.bin('Adjusted Gross', bins=4)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Adjusted Gross count<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">338.41<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">177<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">702.852<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">15<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1067.3<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">6<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1431.74<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">2<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1796.18<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Mas com dados quantitativos, as caixas n\u00e3o precisam ser igualmente largas. Veremos um exemplo de caixas desiguais mais tarde.<\/p>\n<h2 id=\"histograma\">Histograma<\/h2>\n<p style=\"text-align: justify\">Um <em>histograma<\/em> \u00e9 uma visualiza\u00e7\u00e3o da distribui\u00e7\u00e3o de uma vari\u00e1vel quantitativa. Ele se parece muito com um gr\u00e1fico de barras, mas h\u00e1 algumas diferen\u00e7as importantes que examinaremos nesta se\u00e7\u00e3o. Primeiro, vamos apenas desenhar um histograma dos recibos ajustados.<\/p>\n<p style=\"text-align: justify\">O m\u00e9todo <code>hist<\/code> gera um histograma dos valores em uma coluna. O argumento opcional <code>unit<\/code> \u00e9 usado nos r\u00f3tulos dos dois eixos. O histograma abaixo mostra a distribui\u00e7\u00e3o dos valores dos recibos ajustados, em milh\u00f5es de d\u00f3lares de 2016. N\u00e3o especificamos os bins, ent\u00e3o o <code>hist<\/code> cria 10 bins igualmente largos entre os valores m\u00ednimo e m\u00e1ximo dos dados.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', unit=\"Million Dollars\")<\/span><\/code><\/pre>\n<p><img fetchpriority=\"high\" decoding=\"async\" class=\"alignnone size-medium wp-image-460\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-1-300x195.png\" alt=\"\" width=\"300\" height=\"195\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-1-300x195.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-1.png 437w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p style=\"text-align: justify\">Esta figura tem dois eixos num\u00e9ricos. Primeiro daremos uma olhada r\u00e1pida no eixo horizontal e depois examinaremos cuidadosamente o eixo vertical. Por enquanto, apenas observe que <strong>o eixo vertical n\u00e3o representa porcentagens<\/strong>.<\/p>\n<h2 id=\"o-eixo-horizontal\">O Eixo Horizontal<\/h2>\n<p style=\"text-align: justify\">Embora neste conjunto de dados nenhum filme tenha obtido um valor exatamente na borda entre dois bins, <code>hist<\/code> precisa lidar com situa\u00e7\u00f5es em que pode ter havido valores nas bordas. Portanto, <code>hist<\/code> usa a mesma <em>conven\u00e7\u00e3o de pontos finais<\/em> que o m\u00e9todo <code>bin<\/code>. Bins incluem os dados em seu ponto final esquerdo, mas n\u00e3o os dados em seu ponto final direito, exceto para o bin mais \u00e0 direita, que inclui ambos os pontos finais.<\/p>\n<p style=\"text-align: justify\">Podemos ver que existem 10 bins (algumas barras s\u00e3o t\u00e3o baixas que \u00e9 dif\u00edcil de v\u00ea-las), e que todos t\u00eam a mesma largura. Tamb\u00e9m podemos ver que nenhum dos filmes arrecadou menos de 300 milh\u00f5es de d\u00f3lares; isso porque estamos considerando apenas os filmes de maior bilheteria.<\/p>\n<p style=\"text-align: justify\">\u00c9 um pouco mais dif\u00edcil ver exatamente onde est\u00e3o localizadas as extremidades dos bins. Portanto, \u00e9 dif\u00edcil julgar exatamente onde uma barra termina e a pr\u00f3xima come\u00e7a.<\/p>\n<p style=\"text-align: justify\">O argumento opcional <code>bins<\/code> pode ser usado com <code>hist<\/code> para especificar os pontos finais dos bins exatamente como com o m\u00e9todo <code>bin<\/code>. Vamos come\u00e7ar definindo os n\u00fameros em <code>bins<\/code> como 300, 400, 500, e assim por diante, terminando com 2000.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', bins=np.arange(300,2001,100), unit=\"Million Dollars\")<\/span><\/code><\/pre>\n<p><img decoding=\"async\" class=\"alignnone size-medium wp-image-461\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-2-300x191.png\" alt=\"\" width=\"300\" height=\"191\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-2-300x191.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-2.png 447w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>O eixo horizontal desta figura \u00e9 mais f\u00e1cil de ler. Por exemplo, voc\u00ea pode ver exatamente onde est\u00e1 600, mesmo que n\u00e3o esteja rotulado.<\/p>\n<p style=\"text-align: justify\">Um n\u00famero muito pequeno de filmes arrecadou um bilh\u00e3o de d\u00f3lares (1000 milh\u00f5es) ou mais. Isso resulta na figura sendo <em>inclinada para a direita<\/em>, ou, de forma menos formal, tendo <em>uma cauda longa \u00e0 direita<\/em>. Distribui\u00e7\u00f5es de vari\u00e1veis como renda ou aluguel em grandes popula\u00e7\u00f5es tamb\u00e9m frequentemente t\u00eam esse tipo de forma.<\/p>\n<h2 id=\"o-princ-pio-da-rea\">O Princ\u00edpio da \u00c1rea<\/h2>\n<p style=\"text-align: justify\">Ambos os eixos de um histograma s\u00e3o num\u00e9ricos, ent\u00e3o voc\u00ea pode fazer aritm\u00e9tica em ambos. Por exemplo, voc\u00ea pode multiplicar os valores em um ou ambos os eixos por um fator. Para ver como isso poderia afetar a percep\u00e7\u00e3o visual, vamos dar um passo para tr\u00e1s dos histogramas e olhar para um gr\u00e1fico fornecido para este prop\u00f3sito pelo site <a href=\"https:\/\/flowingdata.com\/2012\/03\/16\/new-ipad-battery-size-is-huge\/\">Flowing Data<\/a>. \u00c9 uma compara\u00e7\u00e3o entre os tamanhos de bateria de dois modelos de iPad.<\/p>\n<p><img decoding=\"async\" class=\"wp-image-462 aligncenter\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/ipad_battery-300x168.png\" alt=\"\" width=\"364\" height=\"204\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/ipad_battery-300x168.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/ipad_battery-571x320.png 571w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/ipad_battery.png 576w\" sizes=\"(max-width: 364px) 100vw, 364px\" \/><\/p>\n<p style=\"text-align: justify\">A bateria maior deve ser 70% maior do que a menor. Ent\u00e3o, deveria ser maior, mas n\u00e3o exatamente duas vezes maior. No entanto, a bateria maior na imagem parece quase quatro vezes maior que a menor.<\/p>\n<p style=\"text-align: justify\">O motivo desse problema \u00e9 que o olho percebe a <em>\u00e1rea<\/em> como a medida do tamanho, n\u00e3o apenas a altura ou apenas a largura. Na imagem, ambas as dimens\u00f5es foram aumentadas em 70%, levando a um efeito multiplicativo na \u00e1rea.<\/p>\n<p style=\"text-align: justify\">O princ\u00edpio da \u00e1rea da visualiza\u00e7\u00e3o diz que quando representamos uma magnitude por uma figura que tem duas dimens\u00f5es, como um ret\u00e2ngulo, ent\u00e3o a <em>\u00e1rea<\/em> da figura deve representar a magnitude.<\/p>\n<h2 id=\"o-histograma-principios-gerais-e-calculo\">O Histograma: Princ\u00edpios Gerais e C\u00e1lculo<\/h2>\n<p>Os histogramas seguem o princ\u00edpio da \u00e1rea e t\u00eam duas propriedades definidoras:<\/p>\n<ol>\n<li>Os bins s\u00e3o desenhados em escala e s\u00e3o cont\u00edguos (embora alguns possam estar vazios), porque os valores no eixo horizontal s\u00e3o num\u00e9ricos e, portanto, t\u00eam posi\u00e7\u00f5es fixas na reta num\u00e9rica.<\/li>\n<li>A <b>\u00e1rea<\/b> de cada barra \u00e9 proporcional ao n\u00famero de entradas no bin.<\/li>\n<\/ol>\n<p>A Propriedade 2 \u00e9 a chave para desenhar um histograma, e \u00e9 geralmente alcan\u00e7ada da seguinte forma:<\/p>\n<div style=\"text-align: center;font-family: serif;font-size: 1.5em;margin: 20px 0\">\u00e1rea da barra \u2248 percentual de entradas no bin<\/div>\n<p>Como as \u00e1reas representam percentuais, as alturas representam algo diferente de percentuais. O c\u00e1lculo num\u00e9rico das alturas apenas usa o fato de que a barra \u00e9 um ret\u00e2ngulo:<\/p>\n<div style=\"text-align: center;font-family: serif;font-size: 1.5em;margin: 20px 0\">\u00e1rea da barra = altura da barra \u00d7 largura do bin<\/div>\n<p>e ent\u00e3o<\/p>\n<div style=\"text-align: center;font-family: serif;font-size: 1.5em;margin: 20px 0\">altura da barra \u2248 (\u00e1rea da barra) \/ (largura do bin) \u2248 (percentual de entradas no bin) \/ (largura do bin)<\/div>\n<p>As unidades de altura s\u00e3o &#8220;porcentagem por unidade no eixo horizontal.&#8221; A altura \u00e9 a porcentagem no bin em rela\u00e7\u00e3o \u00e0 largura do bin. Portanto, \u00e9 chamada <i>densidade<\/i> ou <i>concentra\u00e7\u00e3o<\/i>.<\/p>\n<p>Quando desenhado usando este m\u00e9todo, o histograma \u00e9 dito ser desenhado na <i>escala de densidade<\/i>. Nesta escala:<\/p>\n<ul>\n<li>A \u00e1rea de cada barra \u00e9 igual ao percentual de valores de dados que est\u00e3o no bin correspondente.<\/li>\n<li>A \u00e1rea total de todas as barras no histograma \u00e9 100%. Em termos de propor\u00e7\u00f5es, podemos dizer que as \u00e1reas de todas as barras em um histograma &#8220;somam 1&#8221;.<\/li>\n<\/ul>\n<h2 id=\"o-eixo-vertical-escala-de-densidade\">O Eixo Vertical: Escala de Densidade<\/h2>\n<p style=\"text-align: justify\">Como acabamos de ver, a altura de cada barra \u00e9 o percentual de elementos que caem no bin correspondente, em rela\u00e7\u00e3o \u00e0 largura do bin. Agora veremos como o <code>hist<\/code> calculou as alturas de todas as barras do histograma acima.<\/p>\n<p>Aqui est\u00e1 o histograma novamente para facilitar a refer\u00eancia.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', bins=np.arange(300,2001,100), unit=\"Million Dollars\")<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-463\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-3-300x191.png\" alt=\"\" width=\"300\" height=\"191\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-3-300x191.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-3.png 447w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p style=\"text-align: justify\">Lembre-se de que a tabela <code>bin_counts<\/code> possui as contagens em todos os compartimentos do histograma, especificados por <code>bins=np.arange(300, 2000, 100)<\/code>. Lembre-se tamb\u00e9m de que existem 200 filmes no total.<\/p>\n<pre><code><span style=\"color: black\">bin_counts.show(3)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Adjusted Gross count<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">68<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">32<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd;text-align: center;font-style: italic\" colspan=\"2\">&#8230; (15 rows omitted)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">O intervalo [300, 400) cont\u00e9m 68 filmes. Isso representa 34% de todos os filmes:<\/p>\n<div style=\"text-align: center;font-family: serif;font-size: 1.5em;margin: 20px 0\">Percentual = <sup>68<\/sup>\u2044<sub>200<\/sub> \u22c5 100 = 34<\/div>\n<p>A largura do intervalo [300, 400) \u00e9 400 \u2212 300 = 100. Portanto,<\/p>\n<div style=\"text-align: center;font-family: serif;font-size: 1.5em;margin: 20px 0\">Altura = <sup>34<\/sup>\u2044<sub>100<\/sub> = 0.34<\/div>\n<p style=\"text-align: justify\"><strong>Unidades:<\/strong> A altura da barra \u00e9 34% dividida por 100 milh\u00f5es de d\u00f3lares, ent\u00e3o a altura \u00e9 0.34% por milh\u00e3o de d\u00f3lares.<\/p>\n<p style=\"text-align: justify\">A altura da barra <strong>n\u00e3o<\/strong> representa a porcentagem de entradas no intervalo. Ela representa a porcentagem de entradas no intervalo em rela\u00e7\u00e3o \u00e0 quantidade de espa\u00e7o no intervalo. Por isso, a altura mede a lota\u00e7\u00e3o ou densidade. O eixo vertical \u00e9 dito estar na escala de densidade.<\/p>\n<h2 id=\"por-que-n-o-simplesmente-plotar-as-contagens-\">Por que n\u00e3o simplesmente plotar as contagens?<\/h2>\n<p style=\"text-align: justify\">A principal raz\u00e3o para plotar a densidade no eixo vertical em vez de contagens ou porcentagens \u00e9 poder comparar histogramas e aproxim\u00e1-los com curvas suaves onde as propor\u00e7\u00f5es s\u00e3o representadas por \u00e1reas sob a curva.<\/p>\n<p style=\"text-align: justify\">Por exemplo, mais tarde no curso voc\u00ea ver\u00e1 histogramas que s\u00e3o aproximadamente em forma de sino. A figura abaixo mostra tal forma. A \u00e1rea sombreada em dourado acontece de ser 95% da \u00e1rea total sob a curva. Note que isso \u00e9 bastante cr\u00edvel com base nas \u00e1reas que voc\u00ea v\u00ea na figura, mesmo que n\u00e3o haja n\u00fameros nos eixos. \u00c9 por isso que desenhamos histogramas para que as \u00e1reas representem porcentagens.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-464 aligncenter\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/curva_em_forma_de_sino_sombreada-300x176.png\" alt=\"\" width=\"300\" height=\"176\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/curva_em_forma_de_sino_sombreada-300x176.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/curva_em_forma_de_sino_sombreada.png 432w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p style=\"text-align: justify\">Desenhar histogramas na escala de densidade tamb\u00e9m nos permite comparar histogramas que s\u00e3o baseados em conjuntos de dados de tamanhos diferentes ou t\u00eam escolhas diferentes de bins. Nesses casos, nem contagens de bins nem porcentagens podem ser diretamente compar\u00e1veis. Mas se ambos os histogramas forem desenhados na escala de densidade, ent\u00e3o \u00e1reas e densidades s\u00e3o compar\u00e1veis.<\/p>\n<p style=\"text-align: justify\">Se um histograma tiver bins desiguais, ent\u00e3o plotar na escala de densidade \u00e9 um requisito para interpretabilidade. Para algumas vari\u00e1veis, bins desiguais podem ser naturais. Por exemplo, no sistema educacional dos EUA, a escola prim\u00e1ria consiste nos anos 1-5, a escola secund\u00e1ria \u00e9 nos anos 6-8, o ensino m\u00e9dio \u00e9 nos anos 9-12, e um diploma de bacharel requer mais quatro anos. Dados sobre anos de educa\u00e7\u00e3o podem ser agrupados usando esses intervalos. De fato, n\u00e3o importa qual seja a vari\u00e1vel, os bins n\u00e3o precisam ser iguais. \u00c9 bastante comum ter um bin muito amplo em dire\u00e7\u00e3o ao final esquerdo ou direito dos dados, onde n\u00e3o h\u00e1 muitos valores.<\/p>\n<p>Vamos plotar um histograma de receitas brutas ajustadas usando bins desiguais e depois ver o que acontece se plotarmos contagens em vez disso.<\/p>\n<pre><code><span style=\"color: black\">uneven = make_array(300, 350, 400, 500, 1800)\r\nmillions.hist('Adjusted Gross', bins=uneven, unit=\"Million Dollars\")<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-465\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-4-300x195.png\" alt=\"\" width=\"300\" height=\"195\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-4-300x195.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-4.png 437w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>Observe que a barra [400, 500) tem a mesma altura (0,3% por milh\u00e3o de d\u00f3lares) que nos histogramas acima.<\/p>\n<p>As \u00e1reas das outras barras representam as porcentagens nas caixas, como sempre. O m\u00e9todo <code>bin<\/code> nos permite ver as contagens em cada caixa.<\/p>\n<pre><code><span style=\"color: black\">millions.bin('Adjusted Gross', bins=uneven)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Adjusted Gross count<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">14<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">350<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">54<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">72<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1800<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">O bin [300, 350) possui apenas 14 filmes, enquanto o bin [500, 1800] possui 72 filmes. Mas a barra sobre o bin [500, 1800] \u00e9 muito mais curta do que a barra sobre [300, 350). O bin [500, 1800] \u00e9 t\u00e3o amplo que seus 72 filmes s\u00e3o muito menos densamente agrupados do que os 14 filmes no estreito bin [300, 350). Em outras palavras, h\u00e1 menos densidade sobre o intervalo [500, 1800].<\/p>\n<p>Se em vez disso voc\u00ea apenas plotar as contagens usando a op\u00e7\u00e3o <code>normed=False<\/code> como mostrado abaixo, a figura parece completamente diferente e distorce os dados.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', bins=uneven, normed=False)<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-466\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-5-300x197.png\" alt=\"\" width=\"300\" height=\"197\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-5-300x197.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-5.png 433w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p style=\"text-align: justify\">Mesmo que <code>hist<\/code> tenha sido usado, <strong>a figura acima N\u00c3O \u00c9 UM HISTOGRAMA<\/strong>. Exagera de forma enganosa os filmes que arrecadaram pelo menos 500 milh\u00f5es de d\u00f3lares. A altura de cada barra \u00e9 simplesmente plotada no n\u00famero de filmes no bin, sem levar em considera\u00e7\u00e3o a diferen\u00e7a nas larguras dos bins. Nesta figura baseada em contagem, a forma da distribui\u00e7\u00e3o de filmes \u00e9 completamente perdida.<\/p>\n<h2 id=\"tops-planos-e-o-n-vel-de-detalhe\">Tops Planos e o N\u00edvel de Detalhe<\/h2>\n<p>Mesmo que a escala de densidade represente corretamente porcentagens usando \u00e1rea, algum detalhe \u00e9 perdido ao agrupar valores em bins.<\/p>\n<p style=\"text-align: justify\">D\u00ea mais uma olhada no bin [400, 500) na figura abaixo. O topo plano da barra, no n\u00edvel de 0.3% por milh\u00e3o de d\u00f3lares, esconde o fato de que os filmes est\u00e3o um pouco irregularmente distribu\u00eddos por esse bin.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', bins=uneven, unit=\"Million Dollars\")<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-467\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-6-300x195.png\" alt=\"\" width=\"300\" height=\"195\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-6-300x195.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-6.png 437w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>Para ver isso, vamos dividir a caixa [400, 500) em 10 caixas mais estreitas, cada uma com largura de 10 milh\u00f5es de d\u00f3lares.<\/p>\n<pre><code><span style=\"color: black\">some_tiny_bins = make_array(\r\n    300, 350, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 1800)\r\nmillions.hist('Adjusted Gross', bins=some_tiny_bins, unit='Million Dollars')<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-468\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-7-300x195.png\" alt=\"\" width=\"300\" height=\"195\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-7-300x195.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-7.png 437w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p style=\"text-align: justify\">Algumas das barras estreitas s\u00e3o mais altas do que 0,3 e outras s\u00e3o mais baixas. Ao colocar um topo plano no n\u00edvel 0,3 em todo o bin, estamos decidindo ignorar os detalhes mais finos e estamos usando o n\u00edvel plano como uma aproxima\u00e7\u00e3o grosseira. Muitas vezes, embora nem sempre, isso \u00e9 suficiente para entender a forma geral da distribui\u00e7\u00e3o.<\/p>\n<p style=\"text-align: justify\"><strong>A altura como uma aproxima\u00e7\u00e3o grosseira. <\/strong>Essa observa\u00e7\u00e3o nos d\u00e1 uma maneira diferente de pensar sobre a altura. Olhe novamente para o bin [400, 500) nos histogramas anteriores. Como vimos, o bin tem 100 milh\u00f5es de d\u00f3lares de largura e cont\u00e9m 30% dos dados. Portanto, a altura da barra correspondente \u00e9 de 0,3% por milh\u00e3o de d\u00f3lares.<\/p>\n<p style=\"text-align: justify\">Agora, pense no bin como consistindo em 100 bins estreitos, cada um com 1 milh\u00e3o de d\u00f3lares de largura. A altura da barra de &#8220;0,3% por milh\u00e3o de d\u00f3lares&#8221; significa que, como uma aproxima\u00e7\u00e3o grosseira, 0,3% dos filmes est\u00e3o em cada um desses 100 bins estreitos com largura de 1 milh\u00e3o de d\u00f3lares.<\/p>\n<p style=\"text-align: justify\">Temos todo o conjunto de dados que est\u00e1 sendo usado para desenhar os histogramas. Portanto, podemos desenhar os histogramas com o n\u00edvel de detalhe que os dados e nossa paci\u00eancia permitirem. Bins menores levar\u00e3o a uma imagem mais detalhada. No entanto, se voc\u00ea estiver olhando para um histograma em um livro ou em um site e n\u00e3o tiver acesso ao conjunto de dados subjacente, torna-se importante ter uma compreens\u00e3o clara da &#8220;aproxima\u00e7\u00e3o grosseira&#8221; criada pelos topos planos.<\/p>\n<h2 id=\"computando-todas-as-alturas\">Computando Todas as Alturas<\/h2>\n<p style=\"text-align: justify\">N\u00f3s sabemos como encontrar a altura de cada barra do histograma. Vamos usar isso para desenvolver um c\u00f3digo que calcula todas as alturas de uma vez.<\/p>\n<p>Usaremos o histograma abaixo como nosso exemplo. Os bins s\u00e3o especificados no array <code>uneven<\/code>.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', bins=uneven, unit=\"Million Dollars\")<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-469\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-8-300x195.png\" alt=\"\" width=\"300\" height=\"195\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-8-300x195.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-8.png 437w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>Come\u00e7aremos colocando as contagens nas caixas.<\/p>\n<pre><code><span style=\"color: black\">histogram_elements = millions.bin('Adjusted Gross', bins=uneven).relabeled(1, 'count')\r\nhistogram_elements<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">count<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">14<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">350<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">54<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">72<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1800<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Agora podemos adicionar uma coluna contendo a porcentagem em cada compartimento.<\/p>\n<pre><code><span style=\"color: black\">total_count = sum(histogram_elements.column('count'))\r\npercents = np.round(100*histogram_elements.column('count')\/total_count, 2)\r\nhistogram_elements = histogram_elements.with_columns('percent', percents)\r\nhistogram_elements<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">count<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">percent<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">14<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">7.0<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">350<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">54<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">27.0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">30.0<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">72<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">36.0<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1800<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">A coluna 0 cont\u00e9m os extremos esquerdos de todos os bins, exceto seu \u00faltimo elemento, que \u00e9 o extremo direito do \u00faltimo bin. Portanto, podemos usar <code>np.diff<\/code> para encontrar as larguras de todos os bins. Em seguida, adicionaremos as larguras \u00e0 tabela <code>histogram_elements<\/code>, removendo primeiro a \u00faltima linha.<\/p>\n<pre><code><span style=\"color: black\">bin_widths = np.diff(histogram_elements.column('bin'))\r\nnum_bins = histogram_elements.num_rows - 1  # the number of bins\r\nhistogram_elements = histogram_elements.take(\r\n         np.arange(num_bins)).with_columns(\r\n         'width', bin_widths\r\n)\r\nhistogram_elements<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">count<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">percent<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">width<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">14<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">7.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">50<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">350<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">54<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">27.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">50<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">30.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">100<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">72<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">36.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1300<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Finalmente, podemos adicionar uma coluna de alturas.<\/p>\n<pre><code><span style=\"color: black\">heights = np.round(\r\n        histogram_elements.column('percent')\/histogram_elements.column('width'),2)\r\nhistogram_elements = histogram_elements.with_columns('height', heights)\r\nhistogram_elements<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">bin<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">count<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">percent<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">width<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">height<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">14<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">7.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">50<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.14<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">350<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">54<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">27.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">50<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.54<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">400<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">60<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">30.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">100<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.3<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">500<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">72<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">36.0<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">1300<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.03<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Aqui est\u00e1 o histograma novamente por conveni\u00eancia. Compare-o com a tabela acima para confirmar se o c\u00e1lculo das alturas parece bom.<\/p>\n<pre><code><span style=\"color: black\">millions.hist('Adjusted Gross', bins=uneven)<\/span><\/code><\/pre>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-470\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-9-300x195.png\" alt=\"\" width=\"300\" height=\"195\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-9-300x195.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/7-2-9.png 437w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<h2 id=\"diferen-as-entre-gr-ficos-de-barras-e-histogramas\">Diferen\u00e7as entre Gr\u00e1ficos de Barras e Histogramas<\/h2>\n<ul>\n<li style=\"text-align: justify\">Gr\u00e1ficos de barras exibem uma quantidade num\u00e9rica por categoria. Eles s\u00e3o frequentemente usados para exibir as distribui\u00e7\u00f5es de vari\u00e1veis categ\u00f3ricas. Histogramas exibem as distribui\u00e7\u00f5es de vari\u00e1veis quantitativas.<\/li>\n<li style=\"text-align: justify\">Todas as barras em um gr\u00e1fico de barras t\u00eam a mesma largura, e h\u00e1 uma quantidade igual de espa\u00e7o entre barras consecutivas. As barras podem estar em qualquer ordem porque a distribui\u00e7\u00e3o \u00e9 categ\u00f3rica. As barras de um histograma s\u00e3o cont\u00edguas; os bins s\u00e3o desenhados em escala na linha num\u00e9rica.<\/li>\n<li style=\"text-align: justify\">Os comprimentos (ou alturas, se as barras forem desenhadas verticalmente) das barras em um gr\u00e1fico de barras s\u00e3o proporcionais \u00e0 contagem em cada categoria. As alturas das barras em um histograma medem densidades; as <em>\u00e1reas<\/em> das barras em um histograma s\u00e3o proporcionais \u00e0s contagens nos bins.<\/li>\n<\/ul>\n<p><!--###########################################################################################################################################################--><\/p>\n<table width=\"100%\">\n<tbody>\n<tr>\n<td align=\"left\"><a class=\"next-page-link\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-1\/\">\u2190 Cap\u00edtulo 7.1 &#8211; Visualizando Distribui\u00e7\u00f5es Categ\u00f3ricas<\/a><\/td>\n<td align=\"right\"><a class=\"next-page-link\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-3\/\">Cap\u00edtulo 7.3 &#8211; Gr\u00e1ficos Sobrepostos \u2192<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><!--###########################################################################################################################################################--><\/p>\n<\/div>\n<\/div>\n<div style=\"clear: both;height: 1px;margin-top: -1px\"><\/div>\n","protected":false},"excerpt":{"rendered":"<p>\u00cdndice 1. O que \u00e9 Ci\u00eancia de Dados? 1.1. Introdu\u00e7\u00e3o 1.1.1. Ferramentas Computacionais 1.1.2. T\u00e9cnicas Estat\u00edsticas 1.2. Por que Ci\u00eancia de Dados? 1.3. Tra\u00e7ando os Cl\u00e1ssicos 1.3.1. Personagens Liter\u00e1rios 1.3.2. Outro Tipo de Personagem 2. Causalidade e Experimentos 2.1. John Snow e a Bomba da Broad Street 2.2. O &#8220;Grande Experimento&#8221; de Snow 2.3. Estabelecendo [&hellip;]<\/p>\n","protected":false},"author":21894,"featured_media":0,"parent":425,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"page-templates\/full-width.php","meta":{"footnotes":""},"coauthors":[14],"class_list":["post-451","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/451","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/users\/21894"}],"replies":[{"embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/comments?post=451"}],"version-history":[{"count":15,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/451\/revisions"}],"predecessor-version":[{"id":952,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/451\/revisions\/952"}],"up":[{"embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/425"}],"wp:attachment":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/media?parent=451"}],"wp:term":[{"taxonomy":"author","embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/coauthors?post=451"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}