Recursos didáticos auxiliares (Casos para aulas)

 

 

Dados, mentiras e equívocos
Os cuidados no uso da Estatística
 

Tópicos explorados: Uso de Estatísticas, Medidas, Inferência.

Adriano Leal Bruni
albruni@minhasaulas.com.br

O uso da Estatística requer que tenhamos uma série de cuidados em relação aos potenciais equívocos associados ao seu uso. Analise as informações apresentadas no texto a seguir e responda ao que se pede.

O que é a Estatística?

Disponível em: <http://www.educ.fc.ul.pt/icm/icm2003/icm24/introducao.htm>. Acesso em 08 ago. 2008.


Mais correntemente, Estatística significa enumeração ou informação numérica habitualmente contida em tabelas ou gráficos. Quando se fala em Estatística pensa-se em censos, inventários, amostras ou médias. Em sentido restrito tudo isso se pode considerar uma Estatística.

Num sentido mais lato, Estatística é a ciência que se ocupa da recolha e tratamento de informação. Tem como objectivo analisar os dados recolhidos, descrevendo-os e organizando-os para posterior interpretação e eventual utilização na previsão de acontecimentos futuros.

A Estatística divide-se em dois ramos distintos: a Estatística Descritiva, responsável pelo estudo das características de uma dada população; e a Estatística Indutiva, que generaliza um conjunto de resultados, tendo por base uma amostra de uma dada população ou universo, enunciando a(s) consequente(s) lei(s).

Evolução histórica da Estatística

As necessidades que exigiam o conhecimento numérico dos recursos disponíveis começaram a surgir quando as sociedades primitivas se organizaram. Os Estados, desde tempos remotos, precisaram conhecer determinadas características da população, efectuar a sua contagem e saber a sua composição ou os seus rendimentos.

Para que os governantes das grandes civilizações antigas tivessem conhecimento dos bens que o Estado possuía e como estavam distribuídos pelos habitantes, realizaram-se as primeiras estatísticas, nomeadamente para determinarem leis sobre impostos e números de homens disponíveis para combater. Estas estatísticas, eram frequentemente limitadas à população adulta masculina.

O primeiro dado disponível sobre um levantamento estatístico foi referido por Heródoto, que afirmava ter-se efectuado em 3050 a. C. um estudo das riquezas da população do Egipto com a finalidade de averiguar quais os recursos humanos e económicos disponíveis para a construção das pirâmides.

Há também notícia de que no ano 2238 a. C. se realizou um levantamento estatístico com fins industriais e comerciais ordenado pelo imperador chinês Yao.

Existem indícios, que constam da Bíblia, relativamente a recenseamentos feitos por Moisés (1490 a.C.).

Outra estatística referida pelos investigadores foi feita no ano 1400 a. C., quando Ramsés II mandou realizar um levantamento das terras do Egipto.

Também os romanos faziam o recenseamento dos cidadãos e dos bens. Eram os censores, magistrados romanos, que asseguravam o censo dos cidadãos.

Uma das convenções da História é ligar a datação (a.C. ou d.C.) ao recenseamento populacional ordenado pelo imperador César Augusto.

As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que eram propriedade da Igreja, são algumas das estatísticas importantes de que há referências desde a queda do império romano.

Guilherme, O Conquistador, que reinou entre 1066 e 1087, ordenou que se fizesse um levantamento estatístico da Inglaterra. Este levantamento deveria incluir informações sobre terras, proprietários, uso da terra, animais... e serviria de base, também, para o cálculo de impostos.

Para responder ao desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar, apresentar, interpretar os dados recolhidos foram para os censos e são para a Estatística um aspecto essencial do método utilizado. Mas, um longo caminho havia de ser percorrido até aos dias de hoje.

Até ao início do séc. XVII, a Estatística limitou-se ao estudo dos assuntos de Estado. Usada pelas autoridades políticas na inventariação ou arrolamento dos recursos disponíveis, a Estatística limitava-se a uma simples técnica de contagem, traduzindo numericamente fatos ou fenômenos observados,  fase da Estatística Descritiva.

No séc. XVII, com os aritméticos políticos, nomeadamente John Graunt (1620-1674) e Sir William Petty (1623-1687), inicia-se em Inglaterra uma nova fase de desenvolvimento da Estatística, virada para a análise dos fenômenos observados,  fase da Estatística Analítica.

John Graunt, comerciante londrino, pessoa engenhosa e estudiosa, tinha o hábito de se levantar cedo para estudar, antes da abertura da sua loja, inspirado nas tábuas de mortalidade que semanalmente se publicavam na sua paróquia, publicou, em 1660, um trabalho estatístico sobre a mortalidade dos habitantes de Londres, procurando dar interpretações sociais às listas de tempos de vida. Sir William Petty, baseado neste trabalho, escreveu um livro de largo sucesso, divulgando a nova ciência da Aritmética Política.

Em 1692, o astrónomo Edmund Halley (1658-1744), famoso pela descoberta do cometa de órbita elíptica que se aproxima da Terra de 75 em 75 anos, baseando-se também em listas de nascimento e falecimento, foi o percursor das actuais tabelas de mortalidade, base das anuidades dos seguros de vida.

O desenvolvimento do Cálculo das Probabilidades surge também no século XVII. A ligação das probabilidades com os conhecimentos estatísticos veio dar uma nova dimensão à Estatística, que progressivamente se foi tornando um instrumento científico poderoso e indispensável. Considera-se assim uma nova fase, a terceira, em que se começa a fazer inferência estatística: quando a partir de observações se procurou deduzir relações causais, entre variáveis, realizando-se previsões a partir daquelas relações.

A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem ao alemão Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik, do grego statizein; outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento que dela tiravam os políticos e o Estado.

A partir do século XVIII são vários os nomes que se destacaram na história da evolução da estatística, tais como Quételet (1796-1874), Galton (1822-1911), Karl Pearson (1857-1936), Weldon (1860-1906), Ronald Fisher (1890-1962).

Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantem esta ligação, como todos os Estados e a sociedade em geral dependem cada vez mais dela. Por isso, em todos os Estados existe um Departamento ou Instituto Nacional de Estatística.

Na atualidade, a Estatística já não se limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicação alargou-se à análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia, Educação, etc., e ainda a domínios aparentemente desligados, como estrutura de linguagem e estudo de formas literárias.

 

Quando a Estatística nos engana

A Estatística é muito freqüentemente pretexto para anedotas e caricaturas. Mas, tal como na primeira metade do século XX se pretendeu responsabilizar os físicos atômicos e nucleares pelas decisões políticas da utilização destes conhecimentos para efeitos de guerra, é a utilização abusiva e não a própria Estatística que gera absurdos e enganos freqüentes.

Uma acusação que freqüentemente se faz à Estatística é a de induzir em erro, não só porque apresenta dados obtidos por procedimentos que podem ser questionados no seu rigor, mas também porque, apesar de serem corretos e obtidos por métodos válidos, esses dados podem ser apresentados de maneira a induzir confusão a quem não está especialmente familiarizado com esta linguagem. Desta forma, parece de extrema importância a capacidade de se detectar este tipo de confusões e, conseqüentemente, é imprescindível conhecê-las. Por outro lado, a análise e a procura de erros, desenvolvem a capacidade de observação e fomentam o sentido crítico.

Diz-se que dois tipos de estudos superiores deveriam contemplar na formação dos alunos o treino de como mentir bem: Estatística e Direito. Um estatístico deve, por um lado, saber detectar erros e abusos da análise estatística. Por outro lado, dada a importância da publicidade nos dias de hoje, deve também dominar a arte de torturar os dados de modo a que estes confessem o que se pretende.

Apresentamos, seguidamente, alguns exemplos de como a Estatística nos pode induzir em erro.

 

Amostras inadequadas

Uma primeira mentira estatística apresentada por Darrel Huff no seu livro How to lie with statistics consistiu no caso de uma sondagem aos britânicos para averiguar o grau de familiaridade com o sistema métrico. Uma sondagem efetuada pela Gallup concluía que 33% dos britânicos, mesmo com formação universitária, não fazia a menor idéia do que era o sistema métrico; em contrapartida, uma sondagem feita por um certo jornal de domingo, garantia, espantosamente, que 98% dos mesmos britânicos conhecia o sistema métrico.

Era demasiada diferença para que algo não estivesse muitíssimo errado. Estava identificada uma primeira classe de erros na recolha de informação: as amostragens não representativas. É que, enquanto a Gallup procurou cuidadosamente entrevistar um conjunto representativo de toda a população britânica, contemplando idades, níveis de instrução, sexo, diferente zonas geográficas, etc., o jornal, por razões de economia, decidiu publicar um cupão nas suas páginas e limitou-se a esperar as respostas espontâneas dos leitores.



É freqüente, em televisão, solicitar aos espectadores que telefonem a dar a sua opinião relativamente a um determinado assunto. Num programa colocaram, a todo o território português, as seguintes questões:

1. Deve haver pagamento de matrículas no ensino superior público?

2. Os hipermercados devem fechar aos domingos?

3. Deveríamos voltar a ter uma monarquia em Portugal?

Obtiveram-se estes resultados:

1. 50%-Sim, 50%-Não

2. 50%-Sim, 50%-Não

3. 93%-Sim, 7%-Não.

A apresentadora afirmou que 50% dos telespectadores achavam que deveria haver pagamento de matrículas no ensino superior público. Estará esta afirmação correta? Não necessariamente, pois não se sabe quem vota, pode até ter apenas havido dois votantes entre milhares de telespectadores, o que não é uma amostra válida.

As frases publicitárias do gênero "8 em cada 10 pessoas prefere o detergente X" podem muito bem ser baseadas em amostras de 10 pessoas cuidadosamente selecionadas para dar aquele resultado.

 

Relatividade dos conceitos

Um outro erro corrente, involuntário ou deliberado, consiste no uso ambíguo de conceitos como o de média. Suponhamos que na Musgueira os salários médios (média aritmética) são de 70 000$00 e que, por uma muito hipotética e conveniente coincidência, um qualquer milionário teria comprado uma quinta no perímetro autárquico da Musgueira. Tanto bastaria, naturalmente, para que alguém pudesse refazer as contas dos vencimentos médios na Musgueira, que eventualmente subiriam para níveis invejáveis, por ventura ao nível de vencimentos de administradores de grandes empresas. E, se neste tipo de exemplos, as fontes de ilegitimidade são facilmente detectáveis, noutros, menos caricaturados, as manipulações são mais subterrâneas e difíceis de detectar.

 

Também a apresentação de percentagens sem clarificar a base de referência pode ser fortemente enganadora. Frases como houve uma melhoria de 100% nos nossos serviços� procuram transmitir a idéia de qualidade, quando melhorar 100% sobre um serviço de péssima qualidade não é lá grande coisa.

 

Variáveis enganadoras

Se quisermos investigar se determinados insetos são mais atraídos por umas cores que por outras, colocando armadilhas com funis de diversa cores em diversos pontos de árvores onde se encontram esses insetos, sem haver o cuidado de colocar as armadilhas de um modo aleatório e de proceder a experiências repetidas, com um planejamento apropriado, chegamos ao fim e não sabemos se o que atrai os insetos é a cor ou a exposição ao sol, a temperatura ou os diferentes odores que a coloração diferente dá às várias armadilhas.

 

Exatidão

No século XVI, o alemão Weirus fazia a seguinte afirmação estatística: na terra vivem 7405926 demônios, divididos em 72 batalhões, cada um dos quais comandado por um príncipe ou capitão. Embora muita gente da época do Weirus aceitasse os cálculos deste como bastante aproximados, parece que Weirus pretendia ridicularizar as pessoas que não utilizam adequadamente os dados estatísticos. Contudo, noutras afirmações estatísticas, não é tão fácil descobrir as falsidades que elas possuem e haverá um interesse, mais claro e intencional, em enganar e confundir as pessoas que as lêem, do que o nosso especialista em demônios.

 

Da imprensa diária recolhemos as seguintes notícias:

Durante a última quadra de Natal consumiram-se no país 4749683 Kg de açúcar.

67,129% dos consumidores de refresco preferiram a marca Joi Laranja.

No ano passado os alunos do 10º ano do Ensino Secundário de Portugal, sofreram ao longo do ano um total de 17347821 provas de avaliação sumativa.

A exagerada precisão que se pretende dar aos dados relativos aos três exemplos, torna suspeita a sua autenticidade. Apesar dos dados estatísticos poderem ser corretos, a aproximação até às milésimas ou até ao último quilo de açúcar levanta dúvidas sobre o sistema de recolha de dados, induzindo a pensar que, o que se pretende na realidade com tal precisão, é dar a sensação de que foram obtidos através de uma fonte séria e bem documentada.

Uso de conjunções e de diferentes tipos de expressões

Surpreendente! Finalmente a solução para os seus problemas capilares: de todos os compradores do tônico capilar JUBA DE LEÃO, apenas 3% ficaram insatisfeitos e pediram o reembolso do dinheiro.

Este problema é um exemplo da utilização proveitosa da conjunção "e". O anúncio pode ser totalmente correto, mas dá a impressão de que só existiram 3% de insatisfeitos, quando na realidade, essa percentagem reflete o número de pessoas que, para além de estarem satisfeitas também efetuaram a respectiva reclamação.

A empresa de automóveis DEVORA ESTRADAS publicou um anúncio nos seguintes termos: mais de 95% dos carros vendidos em Portugal, desde há vinte anos, ainda estão em circulação.

A maneira como o anúncio aparece redigido, dá a sensação de existirem muitos automóveis daquele modelo (com 20 anos de idade) ainda a trabalharem. O que se passa é que a distribuição do número de automóveis não tem de ser uniforme. Poderia acontecer que quase todos os automóveis tivessem no máximo 5 anos. Inclusivamente, se o modelo em causa tivesse começado a ser fabricado há um ano, a afirmação publicitária estaria certa.

Considere a informação estatística seguinte: "Os alunos do Ensino Secundário que se interessam por Estatística são apenas 37% do total." A forma como aparece a informação estatística é um exemplo da combinação entre valores precisos e termos vagos, que necessitam uma maior concretização. Efetivamente, o valor 37% contrasta com o termo «interesse», que é genérico e indefinido.

Representação gráfica

É preciso ter particular atenção às representações gráficas, há vários tipos de erros:

- erros nas escalas através de intervalos desiguais;

- erros nas escalas através de deformação;

- não começar no zero e não o indicar;

- eliminação de dados especialmente reveladores;

- pictogramas com figuras não equivalentes.

 

Perguntas:

a) O que é a Estatística?

b) Quais os cuidados que precisamos ter no uso da Estatística?

 

      

Comentário do autor para professores e alunos:

Os livros Estatística Aplicada à Gestão Empresarial e Estatística para Concursos discutem o uso e a aplicação das Estatística, destacando a importância dos cuidados necessários à interpretação das suas medidas e gráficos.

 

 

Referências:

Informações complementares podem ser vistas nos links:

http://www.educ.fc.ul.pt/icm/icm2003/icm24/introducao.htm