{"id":705,"date":"2025-07-28T20:28:46","date_gmt":"2025-07-29T00:28:46","guid":{"rendered":"https:\/\/literaciadigital.ufms.br\/?page_id=705"},"modified":"2025-10-11T03:31:01","modified_gmt":"2025-10-11T07:31:01","slug":"13-3","status":"publish","type":"page","link":"https:\/\/literaciadigital.ufms.br\/en\/data8\/13-0\/13-3\/","title":{"rendered":"Cap\u00edtulo 13.3"},"content":{"rendered":"<div style=\"position: relative\">\n<div style=\"float: left;width: 300px;background-color: #f5f5f5;border: 1px solid #ddd;border-radius: 5px;padding: 15px;margin-right: 20px;margin-bottom: 5px;overflow: hidden\">\n<h3 style=\"margin: 0 0 10px 0;padding-bottom: 8px;border-bottom: 1px solid #ddd\">\u00cdndice<\/h3>\n<ol style=\"margin: 0;padding-left: 0;list-style-type: none\">\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/\">1. O que \u00e9 Ci\u00eancia de Dados?<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-1\/\">1.1. Introdu\u00e7\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-1\/1-1\/\">1.1.1. Ferramentas Computacionais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-1\/1-2\/\">1.1.2. T\u00e9cnicas Estat\u00edsticas<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-2\/\">1.2. Por que Ci\u00eancia de Dados?<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-3\/\">1.3. Tra\u00e7ando os Cl\u00e1ssicos<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-3\/3-1\/\">1.3.1. Personagens Liter\u00e1rios<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/1-0\/1-3\/3-2\/\">1.3.2. Outro Tipo de Personagem<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/\">2. Causalidade e Experimentos<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-1\/\">2.1. John Snow e a Bomba da Broad Street<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-2\/\">2.2. O &#8220;Grande Experimento&#8221; de Snow<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-3\/\">2.3. Estabelecendo Causalidade<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-4\/\">2.4. Randomiza\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/2-0\/2-5\/\">2.5. Notas Finais<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/\">3. Progamando em Python<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-1\/\">3.1. Express\u00f5es<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-2\/\">3.2. Nomes<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-2\/2-1\/\">3.2.1. Exemplo: Taxas de Crescimento<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-3\/\">3.3. Chamadas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/3-0\/3-4\/\">3.4. Introdu\u00e7\u00e3o \u00e0s Tabelas<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/\">4. Tipos de Dados<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-1\/\">4.1. N\u00fameros<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-2\/\">4.2. Strings<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-2\/2-1\/\">4.2.1. M\u00e9todos de Strings<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/4-0\/4-3\/\">4.3. Compara\u00e7\u00f5es<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/\">5. Sequ\u00eancias<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/5-1\/\">5.1. Arrays<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/5-2\/\">5.2. Ranges<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/5-0\/5-3\/\">5.3. Mais sobre Arrays<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/\">6. Tabelas<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-1\/\">6.1. Ordenando Linhas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-2\/\">6.2. Selecionando Linhas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-3\/\">6.3. Exemplo: Tend\u00eancias Populacionais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/6-0\/6-4\/\">6.4. Examplo: Propor\u00e7\u00f5es de Sexos<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/\">7. Visualiza\u00e7\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-1\/\">7.1. Visualizando Distribui\u00e7\u00f5es<br \/>\nCateg\u00f3ricas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-2\/\">7.2. Visualizando Distribui\u00e7\u00f5es Num\u00e9ricas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/7-0\/7-3\/\">7.3. Gr\u00e1ficos Sobrepostos<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/\">8. Fun\u00e7\u00f5es e Tabelas<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-1\/\">8.1. Aplicando Fun\u00e7\u00e3o a uma Coluna<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-2\/\">8.2. Classificando por uma Vari\u00e1vel<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-3\/\">8.3. Classifica\u00e7\u00e3o Cruzada<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-4\/\">8.4. Unindo Tabelas por Colunas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/8-0\/8-5\/\">8.5. Compartilhamento de Bicicletas<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/\">9. Aleatoriedade<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-1\/\">9.1. Declara\u00e7\u00f5es Condicionais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-2\/\">9.2. Itera\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-3\/\">9.3. Simula\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-4\/\">9.4. O Problema de Monty Hall<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/9-0\/9-5\/\">9.5. Encontrando Probabilidades<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/\">10. Amostragem e Distribui\u00e7\u00f5es Emp\u00edricas<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-1\/\">10.1. Distribui\u00e7\u00f5es Emp\u00edricas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-2\/\">10.2. Amostragem de uma Popula\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-3\/\">10.3. Distribui\u00e7\u00e3o Emp\u00edrica de uma<br \/>\nEstat\u00edstica<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/10-0\/10-4\/\">10.4. Amostragem Aleat\u00f3ria em Python <\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/\">11. Testando Hip\u00f3teses<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-1\/\">11.1. Avaliando um Modelo<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-2\/\">11.2. M\u00faltiplas Categorias<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-3\/\">11.3. Decis\u00f5es e Incertezas<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/11-0\/11-4\/\">11.4. Probabilidades de Erro<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/\">12. Comparando Duas Amostras<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/12-1\/\">12.1. Teste A\/B<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/12-2\/\">12.2. Causalidade<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/12-0\/12-3\/\">12.3. Esvaziar<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/\">13. Estima\u00e7\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-1\/\">13.1. Percentis<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-2\/\">13.2. O Bootstrap<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-3\/\">13.3. Intervalos de Confian\u00e7a<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-4\/\">13.4. Usando Intervalos de Confian\u00e7a<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/\">14. Por que a M\u00e9dia \u00e9 Importante<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-1\/\">14.1. Propriedades da M\u00e9dia<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-2\/\">14.2. Variabilidade<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-3\/\">14.3. O DP e a Curva Normal<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-4\/\">14.4. Teorema Central do Limite<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-5\/\">14.5. Variabilidade da M\u00e9dia da Amostra<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/14-0\/14-6\/\">14.6. Escolhendo um Tamanho de Amostra<\/a><\/li>\n<\/ul>\n<\/li>\n<li style=\"margin-bottom: 5px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/\">15. Previs\u00e3o<\/a>\n<ul style=\"margin: 5px 0 5px 15px;padding-left: 10px;list-style-type: none;border-left: 1px solid #ddd\">\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-1\/\">15.1. Correla\u00e7\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-2\/\">15.2. Linha de Regress\u00e3o<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-3\/\">15.3. M\u00e9todo dos M\u00ednimos Quadrados<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-4\/\">15.4. Regress\u00e3o de M\u00ednimos Quadrados<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-5\/\">15.5. Diagn\u00f3sticos Visuais<\/a><\/li>\n<li style=\"margin-bottom: 3px\"><a style=\"padding: 2px 0\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/15-0\/15-6\/\">15.6. Diagn\u00f3stico Num\u00e9rico<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<\/div>\n<p><!-- Main Content --><\/p>\n<div style=\"overflow: hidden\">\n<p><!--###########################################################################################################################################################--><\/p>\n<pre><code><span style=\"color: black\">from datascience import *\r\n%matplotlib inline\r\npath_data = '..\/..\/..\/assets\/data\/'\r\nimport matplotlib.pyplot as plots\r\nplots.style.use('fivethirtyeight')\r\nimport numpy as np<\/span><\/code><\/pre>\n<p>&nbsp;<\/p>\n<h1 id=\"intervalos-de-confian-a\" style=\"text-align: center\">Intervalos de Confian\u00e7a<\/h1>\n<p style=\"text-align: justify\">Desenvolvemos um m\u00e9todo para estimar um par\u00e2metro usando amostragem aleat\u00f3ria e o bootstrap. Nosso m\u00e9todo produz um intervalo de estimativas para levar em conta a variabilidade aleat\u00f3ria na amostra. Ao fornecer um intervalo de estimativas em vez de apenas uma estimativa, damos a n\u00f3s mesmos uma margem de manobra.<\/p>\n<p style=\"text-align: justify\">No exemplo anterior, vimos que nosso processo de estimativa produziu um bom intervalo em cerca de 95% das vezes, um &#8220;bom&#8221; intervalo sendo aquele que cont\u00e9m o par\u00e2metro. Dizemos que estamos <em>95% confiantes<\/em> de que o processo resulta em um bom intervalo. Nosso intervalo de estimativas \u00e9 chamado de <em>intervalo de confian\u00e7a de 95%<\/em> para o par\u00e2metro, e 95% \u00e9 chamado de <em>n\u00edvel de confian\u00e7a<\/em> do intervalo.<\/p>\n<p style=\"text-align: justify\">O m\u00e9todo \u00e9 chamado de <em>m\u00e9todo percentil bootstrap<\/em> porque o intervalo \u00e9 formado selecionando dois percentis das estimativas bootstrap.<\/p>\n<p style=\"text-align: justify\">A situa\u00e7\u00e3o no exemplo anterior foi um pouco incomum. Porque sab\u00edamos o valor do par\u00e2metro, pudemos verificar se um intervalo era bom ou ruim, e isso, por sua vez, nos ajudou a ver que nosso processo de estimativa capturou o par\u00e2metro em cerca de 95 de cada 100 vezes que o usamos.<\/p>\n<p style=\"text-align: justify\">Mas geralmente, os cientistas de dados n\u00e3o sabem o valor do par\u00e2metro. \u00c9 por isso que eles querem estim\u00e1-lo em primeiro lugar. Nesses casos, eles fornecem um intervalo de estimativas para o par\u00e2metro desconhecido usando m\u00e9todos como o que desenvolvemos. Devido \u00e0 teoria estat\u00edstica e demonstra\u00e7\u00f5es como a que vimos, os cientistas de dados podem confiar que seu processo de gera\u00e7\u00e3o do intervalo resulta em um bom intervalo uma porcentagem conhecida do tempo.<\/p>\n<h2 id=\"estimando-a-mediana-de-uma-popula-o\" style=\"text-align: justify\">Estimando a Mediana de uma Popula\u00e7\u00e3o<\/h2>\n<p style=\"text-align: justify\">Agora usaremos o m\u00e9todo bootstrap para estimar uma mediana populacional desconhecida. Voc\u00ea j\u00e1 encontrou o conjunto de dados antes. Ele vem de uma amostra de rec\u00e9m-nascidos em um grande sistema hospitalar. Vamos trat\u00e1-lo como se fosse uma amostra aleat\u00f3ria simples, embora a amostragem tenha sido feita em v\u00e1rias etapas. <a href=\"https:\/\/www.stat.berkeley.edu\/~statlabs\/\">Stat Labs<\/a> por Deborah Nolan e Terry Speed tem detalhes sobre um conjunto de dados maior do qual este conjunto foi extra\u00eddo.<\/p>\n<p style=\"text-align: justify\">A tabela <code>births<\/code> cont\u00e9m as seguintes vari\u00e1veis para pares m\u00e3e-beb\u00ea: o peso do beb\u00ea ao nascer em on\u00e7as, o n\u00famero de dias gestacionais (o n\u00famero de dias que a m\u00e3e esteve gr\u00e1vida), a idade da m\u00e3e em anos completos, a altura da m\u00e3e em polegadas, o peso durante a gravidez em libras e se a m\u00e3e fumou durante a gravidez.<\/p>\n<pre><code><span style=\"color: black\">births = Table.read_table(path_data + 'baby.csv')<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\">births.show(3)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">Birth Weight<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Gestational Days<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Maternal Age<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Maternal Height<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Maternal Pregnancy Weight<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Maternal Smoker<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">120<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">284<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">27<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">62<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">100<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">False<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">113<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">282<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">33<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">64<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">135<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">False<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">128<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">279<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">28<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">64<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">115<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">True<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">O peso ao nascer \u00e9 um fator importante na sa\u00fade de um rec\u00e9m-nascido. Beb\u00eas menores tendem a precisar de mais cuidados m\u00e9dicos em seus primeiros dias do que os rec\u00e9m-nascidos maiores. Portanto, \u00e9 \u00fatil ter uma estimativa do peso ao nascer antes do nascimento do beb\u00ea. Uma maneira de fazer isso \u00e9 examinar a rela\u00e7\u00e3o entre o peso ao nascer e o n\u00famero de dias gestacionais.<\/p>\n<p style=\"text-align: justify\">Uma medida simples dessa rela\u00e7\u00e3o \u00e9 a raz\u00e3o entre o peso ao nascer e o n\u00famero de dias gestacionais. A tabela <code>ratios<\/code> cont\u00e9m as duas primeiras colunas de <code>baby<\/code>, bem como uma coluna com as raz\u00f5es. A primeira entrada dessa coluna foi calculada da seguinte forma:<\/p>\n<div style=\"font-family: serif;font-size: 2.2em;text-align: center\"><sup>120 ounces<\/sup>\u2044<sub>284 days<\/sub> \u2248 0.4225 ounces per day<\/div>\n<pre><code><span style=\"color: black\">ratios = births.select('Birth Weight', 'Gestational Days').with_columns(\r\n    'Ratio BW:GD', births.column('Birth Weight')\/births.column('Gestational Days')\r\n)<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\">ratios<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">Birth Weight<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Gestational Days<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Ratio BW:GD<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">120<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">284<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.422535<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">113<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">282<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.400709<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">128<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">279<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.458781<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">108<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">282<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.382979<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">136<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">286<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.475524<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">138<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">244<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.565574<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">132<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">245<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.538776<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">120<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">289<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.415225<\/td>\n<\/tr>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">143<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">299<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.478261<\/td>\n<\/tr>\n<tr style=\"background-color: #f8f8f8\">\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">140<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">351<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.39886<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Aqui est\u00e1 um histograma das propor\u00e7\u00f5es.<\/p>\n<pre><code><span style=\"color: black\">ratios.select('Ratio BW:GD').hist()<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img fetchpriority=\"high\" decoding=\"async\" class=\"alignnone size-full wp-image-706\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-1.png\" alt=\"\" width=\"446\" height=\"284\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-1.png 446w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-1-300x191.png 300w\" sizes=\"(max-width: 446px) 100vw, 446px\" \/><\/p>\n<p style=\"text-align: justify\">\u00c0 primeira vista, o histograma parece bastante sim\u00e9trico, com a densidade m\u00e1xima no intervalo de 0,4 on\u00e7as por dia a 0,45 on\u00e7as por dia. Mas um olhar mais atento revela que algumas das propor\u00e7\u00f5es eram bastante grandes em compara\u00e7\u00e3o. O valor m\u00e1ximo da propor\u00e7\u00e3o era pouco mais de 0,78 on\u00e7as por dia, quase o dobro do valor t\u00edpico.<\/p>\n<pre><code><span style=\"color: black\">ratios.sort('Ratio BW:GD', descending=True).take(0)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-collapse: collapse;width: auto;margin-left: 1em\" border=\"1\">\n<thead>\n<tr style=\"background-color: #f0f0f0;border-bottom: 2px solid #ddd\">\n<th style=\"text-align: left;padding: 4px 8px\">Birth Weight<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Gestational Days<\/th>\n<th style=\"text-align: left;padding: 4px 8px\">Ratio BW:GD<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">116<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">148<\/td>\n<td style=\"padding: 4px 8px;border: 1px solid #ddd\">0.783784<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">A mediana d\u00e1 uma ideia da propor\u00e7\u00e3o t\u00edpica porque n\u00e3o \u00e9 afetada pelas propor\u00e7\u00f5es muito grandes ou muito pequenas. A propor\u00e7\u00e3o m\u00e9dia na amostra \u00e9 de cerca de 0,429 on\u00e7as por dia.<\/p>\n<pre><code><span style=\"color: black\">percentile(50, ratios.column(2))<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[1]:<\/td>\n<td style=\"text-align: left\">0.42907801418439717<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Mas qual era a mediana na popula\u00e7\u00e3o? N\u00e3o sabemos, ent\u00e3o vamos estim\u00e1-la.<\/p>\n<p style=\"text-align: justify\">Nosso m\u00e9todo ser\u00e1 exatamente o mesmo da se\u00e7\u00e3o anterior. Vamos aplicar o bootstrap na amostra 5.000 vezes, resultando em 5.000 estimativas da mediana. Nosso intervalo de confian\u00e7a de 95% ser\u00e1 os &#8220;95% centrais&#8221; de todas as nossas estimativas.<\/p>\n<h3 id=\"construindo-um-intervalo-de-confian-a-bootstrap\" style=\"text-align: justify\">Construindo um Intervalo de Confian\u00e7a Bootstrap<\/h3>\n<p style=\"text-align: justify\">Come\u00e7aremos definindo uma fun\u00e7\u00e3o <code>one_bootstrap_median<\/code>. Ela aplicar\u00e1 o bootstrap na amostra e retornar\u00e1 uma mediana da raz\u00e3o na amostra bootstrap.<\/p>\n<pre><code><span style=\"color: black\">def one_bootstrap_median():\r\n    resample = ratios.sample()\r\n    return percentile(50, resample.column('Ratio BW:GD'))<\/span><\/code><\/pre>\n<p style=\"text-align: justify\">Execute a c\u00e9lula abaixo para ver como as propor\u00e7\u00f5es inicializadas variam. Lembre-se de que cada uma delas \u00e9 uma estimativa da propor\u00e7\u00e3o desconhecida na popula\u00e7\u00e3o.<\/p>\n<pre><code><span style=\"color: black\">one_bootstrap_median()<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[2]:<\/td>\n<td style=\"text-align: left\">0.43010752688172044<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Agora podemos usar um loop <code>for<\/code> para gerar 5.000 medianas inicializadas.<\/p>\n<pre><code><span style=\"color: black\"># Gere medianas de 5.000 amostras de bootstrap\r\nnum_repetitions = 5000\r\nbstrap_medians = make_array()\r\nfor i in np.arange(num_repetitions):\r\n    bstrap_medians = np.append(bstrap_medians, one_bootstrap_median())<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\"># Obtenha os pontos finais do intervalo de confian\u00e7a de 95%\r\nleft = percentile(2.5, bstrap_medians)\r\nright = percentile(97.5, bstrap_medians)\r\n\r\nmake_array(left, right)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[3]:<\/td>\n<td style=\"text-align: left\">array([0.42545455, 0.43272727])<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">O intervalo de confian\u00e7a de 95% vai de cerca de 0,425 on\u00e7as por dia a cerca de 0,433 on\u00e7as por dia. Estamos estimando que a mediana da raz\u00e3o &#8220;peso ao nascer para dias de gesta\u00e7\u00e3o&#8221; na popula\u00e7\u00e3o est\u00e1 em algum lugar no intervalo de 0,425 on\u00e7as por dia a 0,433 on\u00e7as por dia.<\/p>\n<p style=\"text-align: justify\">A estimativa de 0,429 baseada na amostra original est\u00e1, por acaso, exatamente no meio do intervalo, embora isso n\u00e3o precise ser verdade em geral.<\/p>\n<p style=\"text-align: justify\">Para visualizar nossos resultados, vamos desenhar o histograma emp\u00edrico de nossas medianas de bootstrap e colocar o intervalo de confian\u00e7a no eixo horizontal.<\/p>\n<pre><code><span style=\"color: black\">resampled_medians = Table().with_columns(\r\n    'Bootstrap Sample Median', bstrap_medians\r\n)\r\nresampled_medians.hist(bins=15)\r\nplots.plot([left, right], [0, 0], color='yellow', lw=8);<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img decoding=\"async\" class=\"alignnone size-full wp-image-707\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-2.png\" alt=\"\" width=\"460\" height=\"319\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-2.png 460w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-2-300x208.png 300w\" sizes=\"(max-width: 460px) 100vw, 460px\" \/><\/p>\n<p style=\"text-align: justify\">Este histograma e intervalo se assemelham aos que desenhamos na se\u00e7\u00e3o anterior, com uma grande diferen\u00e7a \u2013 n\u00e3o h\u00e1 ponto verde mostrando onde est\u00e1 o par\u00e2metro. N\u00e3o sabemos onde esse ponto deveria estar, ou se est\u00e1 no intervalo.<\/p>\n<p style=\"text-align: justify\">Temos apenas um intervalo de estimativas. \u00c9 um intervalo de confian\u00e7a de 95% das estimativas, porque o processo que o gera produz um bom intervalo cerca de 95% das vezes. Isso certamente \u00e9 melhor do que adivinhar a raz\u00e3o aleatoriamente!<\/p>\n<p style=\"text-align: justify\">Tenha em mente que este intervalo \u00e9 um intervalo de confian\u00e7a aproximado de 95%. Existem muitas aproxima\u00e7\u00f5es envolvidas em seu c\u00e1lculo. A aproxima\u00e7\u00e3o n\u00e3o \u00e9 ruim, mas n\u00e3o \u00e9 exata.<\/p>\n<h2 id=\"estimando-uma-m-dia-populacional\" style=\"text-align: justify\">Estimando uma M\u00e9dia Populacional<\/h2>\n<p style=\"text-align: justify\">O que fizemos para as medianas tamb\u00e9m pode ser feito para as m\u00e9dias. Suponha que queremos estimar a idade m\u00e9dia das m\u00e3es na popula\u00e7\u00e3o. Uma estimativa natural \u00e9 a idade m\u00e9dia das m\u00e3es na amostra. Aqui est\u00e1 a distribui\u00e7\u00e3o de suas idades, e sua idade m\u00e9dia que foi cerca de 27,2 anos.<\/p>\n<pre><code><span style=\"color: black\">births.select('Maternal Age').hist()<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img decoding=\"async\" class=\"alignnone size-full wp-image-708\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-3.png\" alt=\"\" width=\"424\" height=\"284\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-3.png 424w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-3-300x201.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-3-350x233.png 350w\" sizes=\"(max-width: 424px) 100vw, 424px\" \/><\/p>\n<pre><code><span style=\"color: black\">np.average(births.column('Maternal Age'))<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[4]:<\/td>\n<td style=\"text-align: left\">27.228279386712096<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Qual era a idade m\u00e9dia das m\u00e3es da popula\u00e7\u00e3o? N\u00e3o sabemos o valor deste par\u00e2metro.<\/p>\n<p style=\"text-align: justify\">Vamos estimar o par\u00e2metro desconhecido pelo m\u00e9todo bootstrap. Para fazer isso, adaptaremos o c\u00f3digo de <code>bootstrap_median<\/code> para definir a fun\u00e7\u00e3o <code>bootstrap_mean<\/code>. O c\u00f3digo \u00e9 o mesmo, exceto que as estat\u00edsticas s\u00e3o m\u00e9dias (ou seja, m\u00e9dias) em vez de medianas, e s\u00e3o coletados em uma matriz chamada <code>bstrap_means<\/code> em vez de <code>bstrap_medians<\/code>.<\/p>\n<pre><code><span style=\"color: black\">def one_bootstrap_mean():\r\n    resample = births.sample()\r\n    return np.average(resample.column('Maternal Age'))<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\"># Gere m\u00e9dias a partir de 5.000 amostras de bootstrap\r\nnum_repetitions = 5000\r\nbstrap_means = make_array()\r\nfor i in np.arange(num_repetitions):\r\n    bstrap_means = np.append(bstrap_means, one_bootstrap_mean())<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\"># Obtenha os pontos finais do intervalo de confian\u00e7a de 95%\r\nleft = percentile(2.5, bstrap_means)\r\nright = percentile(97.5, bstrap_means)\r\n\r\nmake_array(left, right)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[5]:<\/td>\n<td style=\"text-align: left\">array([26.90630324, 27.55962521])<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">O intervalo de confian\u00e7a de 95% vai de cerca de 26,9 anos a cerca de 27,6 anos. Ou seja, estamos estimando que a idade m\u00e9dia das m\u00e3es na popula\u00e7\u00e3o est\u00e1 em algum lugar no intervalo de 26,9 anos a 27,6 anos.<\/p>\n<p style=\"text-align: justify\">Observe como os dois extremos est\u00e3o pr\u00f3ximos \u00e0 m\u00e9dia de cerca de 27,2 anos na amostra original. O tamanho da amostra \u00e9 muito grande \u2013 1.174 m\u00e3es \u2013 e, portanto, as m\u00e9dias das amostras n\u00e3o variam muito. Vamos explorar essa observa\u00e7\u00e3o mais detalhadamente no pr\u00f3ximo cap\u00edtulo.<\/p>\n<p style=\"text-align: justify\">O histograma emp\u00edrico das 5.000 idades m\u00e9dias de bootstrap \u00e9 mostrado abaixo, junto com o intervalo de confian\u00e7a de 95% para a idade m\u00e9dia da popula\u00e7\u00e3o.<\/p>\n<pre><code><span style=\"color: black\">resampled_means = Table().with_columns(\r\n    'Bootstrap Sample Mean', bstrap_means\r\n)\r\nresampled_means.hist(bins=15)\r\nplots.plot([left, right], [0, 0], color='yellow', lw=8);<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-709\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-4.png\" alt=\"\" width=\"442\" height=\"284\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-4.png 442w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-4-300x193.png 300w\" sizes=\"(max-width: 442px) 100vw, 442px\" \/><\/p>\n<p style=\"text-align: justify\">Mais uma vez, a m\u00e9dia da amostra original (27,23 anos) est\u00e1 pr\u00f3xima do centro do intervalo. Isso n\u00e3o \u00e9 muito surpreendente, porque cada amostra inicializada \u00e9 extra\u00edda da mesma amostra original. As m\u00e9dias das amostras inicializadas s\u00e3o distribu\u00eddas aproximadamente simetricamente em ambos os lados da m\u00e9dia da amostra da qual foram extra\u00eddos.<\/p>\n<p style=\"text-align: justify\">Observe tamb\u00e9m que o histograma emp\u00edrico das m\u00e9dias reamostradas tem aproximadamente um formato de sino sim\u00e9trico, embora o histograma das idades amostradas n\u00e3o fosse nada sim\u00e9trico:<\/p>\n<pre><code><span style=\"color: black\">births.select('Maternal Age').hist()<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-710\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-5.png\" alt=\"\" width=\"424\" height=\"284\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-5.png 424w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-5-300x201.png 300w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-5-350x233.png 350w\" sizes=\"(max-width: 424px) 100vw, 424px\" \/><\/p>\n<p style=\"text-align: justify\">Isso \u00e9 uma consequ\u00eancia do Teorema do Limite Central da probabilidade e da estat\u00edstica. Nas se\u00e7\u00f5es posteriores, veremos o que o teorema diz.<\/p>\n<h2 id=\"um-intervalo-de-confian-a-de-80-\" style=\"text-align: justify\">Um intervalo de confian\u00e7a de 80%<\/h2>\n<p style=\"text-align: justify\">Voc\u00ea pode usar as m\u00e9dias amostrais bootstrapped para construir um intervalo de qualquer n\u00edvel de confian\u00e7a. Por exemplo, para construir um intervalo de confian\u00e7a de 80% para a idade m\u00e9dia da popula\u00e7\u00e3o, voc\u00ea pegaria os &#8220;80% m\u00e9dios&#8221; da amostra reamostrada. significa. Portanto, voc\u00ea desejaria 10% da distribui\u00e7\u00e3o em cada uma das duas caudas e, portanto, os pontos finais seriam os percentis 10 e 90 das m\u00e9dias reamostradas.<\/p>\n<pre><code><span style=\"color: black\">left_80 = percentile(10, bstrap_means)\r\nright_80 = percentile(90, bstrap_means)\r\nmake_array(left_80, right_80)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[6]:<\/td>\n<td style=\"text-align: left\">array([27.01277683, 27.44293015])<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<pre><code><span style=\"color: black\">resampled_means.hist(bins=15)\r\nplots.plot([left_80, right_80], [0, 0], color='yellow', lw=8);<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-711\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-6.png\" alt=\"\" width=\"442\" height=\"284\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-6.png 442w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-6-300x193.png 300w\" sizes=\"(max-width: 442px) 100vw, 442px\" \/><\/p>\n<p style=\"text-align: justify\">Este intervalo de confian\u00e7a de 80% \u00e9 muito mais curto do que o intervalo de confian\u00e7a de 95%. Ele vai apenas de cerca de 27,0 anos a cerca de 27,4 anos. Embora esse seja um conjunto estreito de estimativas, voc\u00ea sabe que esse processo produz um bom intervalo apenas cerca de 80% das vezes.<\/p>\n<p style=\"text-align: justify\">O processo anterior produziu um intervalo mais amplo, mas t\u00ednhamos mais confian\u00e7a no processo que o gerou.<\/p>\n<p style=\"text-align: justify\">Para obter um intervalo de confian\u00e7a estreito em um alto n\u00edvel de confian\u00e7a, voc\u00ea ter\u00e1 que come\u00e7ar com uma amostra maior. Veremos por que no pr\u00f3ximo cap\u00edtulo.<\/p>\n<h2 id=\"estimando-uma-propor-o-populacional\" style=\"text-align: justify\">Estimando uma Propor\u00e7\u00e3o Populacional<\/h2>\n<p style=\"text-align: justify\">Na amostra, 39% das m\u00e3es fumaram durante a gravidez.<\/p>\n<pre><code><span style=\"color: black\">births.where('Maternal Smoker', are.equal_to(True)).num_rows \/ births.num_rows<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[7]:<\/td>\n<td style=\"text-align: left\">0.3909710391822828<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Lembre-se de que uma propor\u00e7\u00e3o \u00e9 uma m\u00e9dia de zeros e uns. Portanto, a propor\u00e7\u00e3o de m\u00e3es que fumavam tamb\u00e9m poderia ser calculada usando opera\u00e7\u00f5es de array como segue.<\/p>\n<pre><code><span style=\"color: black\">smoking = births.column('Maternal Smoker')\r\nnp.count_nonzero(smoking) \/ len(smoking)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[8]:<\/td>\n<td style=\"text-align: left\">0.3909710391822828<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">Qual a percentagem de m\u00e3es na popula\u00e7\u00e3o que fumaram durante a gravidez? Este \u00e9 um par\u00e2metro desconhecido que podemos estimar atrav\u00e9s de um intervalo de confian\u00e7a de bootstrap. Os passos s\u00e3o an\u00e1logos aos que tomamos para estimar a mediana e a m\u00e9dia da popula\u00e7\u00e3o.<\/p>\n<p style=\"text-align: justify\">Em um processo que agora \u00e9 familiar, come\u00e7aremos definindo uma fun\u00e7\u00e3o <code>one_bootstrap_proportion<\/code> que inicializa a amostra e retorna a propor\u00e7\u00e3o de fumantes na amostra inicializada. Em seguida, chamaremos a fun\u00e7\u00e3o v\u00e1rias vezes usando um loop <code>for<\/code> e obteremos o percentil 2,5 e o percentil 97,5 das propor\u00e7\u00f5es bootstrapped.<\/p>\n<pre><code><span style=\"color: black\">def one_bootstrap_proportion():\r\n    resample = births.sample()\r\n    smoking = resample.column('Maternal Smoker')\r\n    return np.count_nonzero(smoking) \/ len(smoking)<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\"># Gere propor\u00e7\u00f5es a partir de 5.000 amostras de bootstrap\r\nbstrap_proportions = make_array()\r\nnum_repetitions = 5000\r\nfor i in np.arange(num_repetitions):\r\n    bstrap_proportions = np.append(bstrap_proportions, one_bootstrap_proportion())<\/span><\/code><\/pre>\n<pre><code><span style=\"color: black\"># Obtenha os pontos finais do intervalo de confian\u00e7a de 95%\r\nleft = percentile(2.5, bstrap_proportions)\r\nright = percentile(97.5, bstrap_proportions)\r\n\r\nmake_array(left, right)<\/span><\/code><\/pre>\n<table style=\"font-family: monospace;border-spacing: 0;border-collapse: collapse;width: auto;margin-left: 1em\">\n<tbody>\n<tr>\n<td style=\"text-align: right;color: #888;padding-right: 0.5em\">Out[9]:<\/td>\n<td style=\"text-align: left\">array([0.36286201, 0.41908007])<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p style=\"text-align: justify\">O intervalo de confian\u00e7a vai de cerca de 36% para cerca de 42%.<\/p>\n<pre><code><span style=\"color: black\">resampled_proportions = Table().with_columns(\r\n    'Bootstrap Sample Proportion', bstrap_proportions\r\n)\r\nresampled_proportions.hist(bins=15)\r\nplots.plot([left, right], [0, 0], color='yellow', lw=8);<\/span><\/code><\/pre>\n<p style=\"text-align: justify\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-712\" src=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-7.png\" alt=\"\" width=\"451\" height=\"284\" srcset=\"https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-7.png 451w, https:\/\/literaciadigital.ufms.br\/files\/2025\/07\/13-3-7-300x189.png 300w\" sizes=\"(max-width: 451px) 100vw, 451px\" \/><\/p>\n<h2 id=\"cuidados-ao-usar-o-m-todo-percentil-de-bootstrap\" style=\"text-align: justify\">Cuidados ao Usar o M\u00e9todo Percentil de Bootstrap<\/h2>\n<p style=\"text-align: justify\">O bootstrap \u00e9 um m\u00e9todo elegante e poderoso. Antes de us\u00e1-lo, \u00e9 importante ter em mente alguns pontos.<\/p>\n<ul>\n<li style=\"text-align: justify\">Comece com uma amostra aleat\u00f3ria grande. Se n\u00e3o o fizer, o m\u00e9todo pode n\u00e3o funcionar. Seu sucesso \u00e9 baseado em grandes amostras aleat\u00f3rias (e, portanto, tamb\u00e9m em reamostras da amostra) que se assemelham \u00e0 popula\u00e7\u00e3o. A Lei das M\u00e9dias diz que isso \u00e9 prov\u00e1vel, desde que a amostra aleat\u00f3ria seja grande.<\/li>\n<li style=\"text-align: justify\">Para aproximar a distribui\u00e7\u00e3o de probabilidade de uma estat\u00edstica, \u00e9 uma boa ideia replicar o procedimento de reamostragem tantas vezes quanto poss\u00edvel. Algumas milhares de replica\u00e7\u00f5es resultar\u00e3o em aproxima\u00e7\u00f5es decentes da distribui\u00e7\u00e3o da mediana da amostra, especialmente se a distribui\u00e7\u00e3o da popula\u00e7\u00e3o tiver um pico e for bastante sim\u00e9trica. Usamos 5.000 replica\u00e7\u00f5es em nossos exemplos, mas recomendar\u00edamos 10.000 em geral.<\/li>\n<li>\n<p style=\"text-align: justify\">O m\u00e9todo percentil de bootstrap funciona bem para estimar a mediana ou m\u00e9dia populacional com base em uma grande amostra aleat\u00f3ria. No entanto, tem limita\u00e7\u00f5es, como todos os m\u00e9todos de estimativa. Por exemplo, <em>n\u00e3o<\/em> se espera que funcione bem nas seguintes situa\u00e7\u00f5es.<\/p>\n<ul>\n<li style=\"text-align: justify\">O objetivo \u00e9 estimar o valor m\u00ednimo ou m\u00e1ximo na popula\u00e7\u00e3o, ou um percentil muito baixo ou muito alto, ou par\u00e2metros que s\u00e3o fortemente influenciados por elementos raros da popula\u00e7\u00e3o.<\/li>\n<li style=\"text-align: justify\">A distribui\u00e7\u00e3o de probabilidade da estat\u00edstica n\u00e3o \u00e9 aproximadamente em forma de sino.<\/li>\n<li style=\"text-align: justify\">A amostra original \u00e9 muito pequena, digamos menos de 10 ou 15.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<p><!--###########################################################################################################################################################--><\/p>\n<table width=\"100%\">\n<tbody>\n<tr>\n<td align=\"left\"><a class=\"next-page-link\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-2\/\">\u2190 Cap\u00edtulo 13.2 &#8211; Bootstrap<\/a><\/td>\n<td align=\"right\"><a class=\"next-page-link\" href=\"https:\/\/literaciadigital.ufms.br\/data8\/13-0\/13-4\/\">Cap\u00edtulo 13.4 &#8211; Usando os Intervalos \u2192<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><!--###########################################################################################################################################################--><\/p>\n<\/div>\n<\/div>\n<div style=\"clear: both;height: 1px;margin-top: -1px\"><\/div>\n","protected":false},"excerpt":{"rendered":"<p>\u00cdndice 1. O que \u00e9 Ci\u00eancia de Dados? 1.1. Introdu\u00e7\u00e3o 1.1.1. Ferramentas Computacionais 1.1.2. T\u00e9cnicas Estat\u00edsticas 1.2. Por que Ci\u00eancia de Dados? 1.3. Tra\u00e7ando os Cl\u00e1ssicos 1.3.1. Personagens Liter\u00e1rios 1.3.2. Outro Tipo de Personagem 2. Causalidade e Experimentos 2.1. John Snow e a Bomba da Broad Street 2.2. O &#8220;Grande Experimento&#8221; de Snow 2.3. Estabelecendo [&hellip;]<\/p>\n","protected":false},"author":21894,"featured_media":0,"parent":687,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"page-templates\/full-width.php","meta":{"footnotes":""},"coauthors":[14],"class_list":["post-705","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/705","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/users\/21894"}],"replies":[{"embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/comments?post=705"}],"version-history":[{"count":3,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/705\/revisions"}],"predecessor-version":[{"id":1048,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/705\/revisions\/1048"}],"up":[{"embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/pages\/687"}],"wp:attachment":[{"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/media?parent=705"}],"wp:term":[{"taxonomy":"author","embeddable":true,"href":"https:\/\/literaciadigital.ufms.br\/en\/wp-json\/wp\/v2\/coauthors?post=705"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}