Se o dados não me obedecem, danem-se os dados

Tirar conclusões de eventos isolados é bom para criar manchetes, mas não serve de nada quando se quer analisar uma realidade. Por isso, em economia, sempre trabalhamos com dados agregados, e tomamos muito cuidado com correlações espúrias e relações de causalidade.

Nesse sentido, é até compreensível que os responsáveis pelo Fórum Brasileiro de Segurança Pública tomem cuidado ao relacionar o aumento do número de armas em poder da população com a diminuição do número de assassinatos desde 2019, conforme podemos observar no gráfico de seu último anuário.

De fato, pode ser que haja outros fatores que levaram a essa redução, que teria ocorrido APESAR do aumento do número de armas em circulação. Ou seja, o sucesso das políticas de segurança pública foram tão retumbantes a partir de 2019, que conseguiram remar na direção certa mesmo com um forte vento contrário.

Até aqui, a boa prática no exercício da análise estatística. No entanto, começamos a desconfiar das intenções do pesquisador quando este toma carona em eventos isolados para defender a sua tese, como é o caso dessa matéria.

Imaginemos o inverso: e se o número de assassinatos tivesse se elevado ao invés de cair? O mesmo cuidado de separar correlação de causalidade teria sido tomado? O aumento de armas em circulação seria tomado como mais um fator para explicar a criminalidade, ou como O fator único?

São questões retóricas, claro. O que mostra que o que eu penso vem antes dos dados. E se os dados não ornam com o que eu penso, danem-se os dados.

Quem se importa com os dados?

A reportagem do Valor Econômico pretendia chamar a atenção para um suposto aumento da atitude crítica dos mais pobres em relação à polícia. O único problema é que os dados não conversam com a tese.

A questão é que antes (2014), pobres e ricos tinham uma percepção semelhante em relação à polícia. Agora, os pobres têm uma percepção mais crítica se comparados com os mais ricos. O ponto é que, para que a manchete estivesse correta (“população de baixa renda começa a enxergar forças policiais de forma mais crítica”), a comparação correta deveria ser contra a percepção dos mesmos pobres no período anterior. Quando fazemos essa comparação, constatamos, na verdade, uma ligeira melhora: em 2014, 46% dos pobres tinham visão negativa da polícia, contra 40% hoje.

Ocorre que essa melhora foi muito maior entre os mais ricos. Então, a manchete correta deveria ser: ”imagem da polícia melhora substancialmente entre os mais ricos, e menos entre os mais pobres”. Ou seja, houve uma melhora generalizada, mais concentrada entre os mais ricos. O ridículo da manchete escolhida é que se a imagem da polícia não tivesse melhorado, não haveria notícia.

O fato é que a imagem da polícia melhorou nos últimos 8 anos, mais entre os mais ricos, menos entre os mais pobres, mas melhorou para todos. Esses são os dados. Mas quem se importa com os dados?

Menos narrativa, mais jornalismo

Meu amigo Carlos Alberto Di Franco escreve artigo no Estadão criticando seus colegas jornalistas por criarem narrativas anti-governo ao invés de se aterem aos fatos. Para tanto, cita uma série de dados econômicos supostamente objetivos, levantados pelo também jornalista José Fucs, para corroborar a sua tese, a de que não estamos caminhando para o abismo.

Parafraseando a piada, perco o amigo mas não perco a crítica. O que vai nesse artigo não passa de narrativa bolsonarista. Escrevi acima “supostamente objetivos” para qualificar os dados apresentados no artigo porque não existe isso de “dados objetivos”. Existem os dados e sua interpretação dentro de um contexto. Infelizmente, da forma como foram apresentados, não passam de narrativa. Vejamos.

Crescimento: os dados de crescimento de 2021 são apresentados como prova de que o país está indo de vento e popa, calando a boca dos críticos. Nada mais fora do contexto. Há várias formas de se interpretar esse número, e analisá-lo a seco da forma como foi feito é a única que lhe empresta algum mérito. O número é baixo comparado com o que se esperava no início do segundo semestre do ano passado, é baixo se comparado com o crescimento de outros emergentes e é baixo se analisarmos o conjunto dos anos 2020-2021. O artigo continua, afirmando que o crescimento vai “surpreender” esse ano. Bem, se crescer 1% já será uma surpresa positiva, ainda que seja um número ridiculamente baixo. Os números mostram que esse governo não conseguiu tirar o país do baixo crescimento econômico. Os números são catastróficos? Não, apenas medíocres.

Inflação: a queda da inflação programada para esse ano é destacada para mostrar que a tese dos catastrofistas de plantão não se sustenta. Sim, verdade, ainda que os 5,6% citados já estejam ultrapassados pelos choques produzidos pela guerra na Ucrânia. Mas, como eu disse, há formas e formas de mostrar os números. Por exemplo, eu poderia dizer que já faz 6 meses que a inflação está rodando acima de 10% ao mês, ao passo que, no governo Dilma, a inflação rodou acima de 10% somente durante quatro meses. Objetivo? Sim. Quer dizer alguma coisa? Não. O fato é que as pessoas estão sentindo a carestia no bolso, e não há narrativa que dê jeito nisso.

Contas Públicas: talvez seja este o item em que mais brilha a narrativa bolsonarista. Afinal, produzimos superávit primário em 2021 contra todas as expectativas! Como se esse número não tivesse sido alcançado na base de um congelamento de salários insustentável no tempo e uma inflação bem acima das expectativas, que inflou as receitas no ano. O número em si é positivo, mas falta muito contexto para entendê-lo. Curiosamente, este é o único item para o qual não se arrisca uma previsão para este ano. Sem falar no bombardeamento do teto de gastos.

Em uma coisa o meu amigo Di Franco tem razão: não é nenhuma catástrofe, nada comparável aos piores anos do governo Dilma Rousseff. Mas também não se trata de nada de que se possa ter orgulho. Minha sugestão é, em uma próxima vez, se quiser defender este governo de maneira objetiva, destacar as realizações microeconômicas, com a aprovação de diversos marcos regulatórios que irão, ao longo do tempo, aumentar a produtividade do país. Se for para citar números macroeconômicos fora do contexto, Lula tem números muito melhores para apresentar.

A mágica dos números

Já comentei aqui algumas vezes a mágica que se pode fazer com números. Basta mudar a escala, e um número pequeno parece grande e vice-versa. Foram exemplos o número de óbitos por Covid na Índia em determinado momento (um óbito a cada 3 segundos, o que não significava nada para um país como a Índia), ou o desmatamento de centenas de campo de futebol na Amazônia, o que também não significa muita coisa.

Pois bem. Notinha do Estadão usa esse velho truque para passar a impressão de que o livro de Guilherme Boulos está bombando de vender. “Um livro a cada 2 minutos”, de fato, parece um ritmo alucinante. Nesse ritmo, seriam 260 mil livros por ano, o que faria de Boulos um dos maiores best sellers do mercado editorial brasileiro.

A pegadinha está nas palavras “na primeira hora”. Foram 30 livros na primeira hora. Dito dessa maneira, não parece lá muito impressionante. Eu mesmo devo ter vendido algo parecido na primeira hora depois de ter anunciado meu livro aqui no Facebook e nos meus grupos de WhatsApp. A primeira hora é dos amigos que têm piedade do autor e compram não somente para si, mas para presentear os parentes. Na verdade, o primeiro dia é o melhor dia de vendas para o livro de um autor desconhecido. O teste de fogo é do segundo dia em diante. É sintomático que o jornalista não tenha sequer mencionado as vendas do primeiro dia, mas somente as da primeira hora, e usando um truque manjado.

A única eleição de destaque de Boulos foi a última pela prefeitura de São Paulo, quando chegou ao segundo turno contra Bruno Covas. Perdeu por 60 a 40, mas não pela falta de apoio de jornalistas como o autor da nota, que não medem esforços para inflar a bola do novo queridinho das esquerdas. Nem que, para isso, tenha que usar truques manjados de estatística.

O que importa é a estatística, o resto é narrativa

Duas histórias opostas me chamaram a atenção para a questão da vacinação infantil. A primeira refere-se à morte por parada cardíaca de uma criança, supostamente causada pela vacina contra Covid-19.

A segunda, em matéria do Estadão do dia 04/02, apresenta a história de uma criança supostamente vítima da Covid-19. 

Notem que coloquei a palavra “supostamente” nas duas causas de morte, o que já nos serve como porta de entrada para este artigo.

A palavra “supostamente” admite que um determinado fato seja possível, mas não se compromete com ele. Admite a possibilidade, mas relativamente remota, colocando uma sombra de suspeição sobre o fato. E cada um, desde o seu particular ponto de vista, ficará ou não revoltado com o uso da palavra. No exemplo acima, aqueles que acham que a vacina é um perigo, verão como um absurdo o uso da palavra “supostamente” para o óbvio fato de que a criança de Lençóis Paulistas morreu por causa da vacina, ao passo que avaliarão como adequado o uso da palavra ao qualificar a morte por Covid. Afinal, muitos morrem COM Covid e não DE Covid. E vice-versa, os que são favoráveis à vacina verão o “supostamente” bem colocado ao se referir à morte da criança de Lençóis Paulistas, pois o laudo médico garantiu que esta não foi a causa, ao passo que não aceitarão a palavra ao se referir à morte por Covid, pois esta também foi atestada pelo médico.

Não quero aqui, propositalmente, entrar na discussão científica deste ou daquele caso particular. Meu ponto é outro: essa discussão é irrelevante, ainda que ocupe o lugar principal no debate público. O que verdadeiramente importa é a estatística.

Os economistas geralmente são taxados de insensíveis e pouco empáticos, por teoricamente focarem-se somente nos grandes agregados e modelos gerais, e desprezarem as pessoas, suas histórias e sofrimentos particulares. E é verdade, ainda que isso não tenha nada a ver com empatia, mas somente com metodologia de trabalho.

É relativamente comum, em reportagens sobre grandes tragédias ou crimes, as vítimas reclamarem que não são cuidadas pelo governo, que viraram apenas uma estatística. Verdade. Cada ser humano importa e não deveria ser tratado como uma estatística fria. Mas a dura realidade é que se CADA ser humano é especial, segue-se que TODOS os seres humanos são especiais. E como não há recursos suficientes para tratar CADA ser humano de maneira especial, o que resta aos governos é tratar o CONJUNTO dos seres humanos da melhor maneira possível. E, para isso, não há outra maneira, a não ser tratar cada ser humano em particular como uma estatística. Quando isso não acontece, ocorre o que nós chamamos de PRIVILÉGIO. Como não há recursos para tratar a todos como especiais, alguns são escolhidos da multidão por critérios nem sempre transparentes.

Mas acredito que a aplicação de estatísticas para a elaboração de políticas públicas seja algo bem aceito, de bom senso. O que eu gostaria de demonstrar neste artigo é que a estatística é também a melhor forma de tomar decisões em nossa vida particular. Deveríamos admitir que não somos assim tão especiais quando se trata de fenômenos aleatórios. Nesse sentido, somos sim uma estatística.

Quando os economistas projetam cenários econômicos, costumam atribuir-lhes probabilidades. O cenário X tem 40% de chance de se concretizar, o Y 35% e o Z, 25%. Ocorre que, passado o tempo, apenas um desses cenários se concretizará, quando então a sua probabilidade passa a ser de 100%, enquanto as probabilidades dos outros cenários tornam-se zero. Aquele cenário que se concretizou “virou estatística”, que vai alimentar a confecção de novos cenários.

É neste ponto que a nossa mente nos trai. Uma história concreta faz com que aquela estatística (a probabilidade que se tornou 100%) ganhe uma chance em nossa mente muito maior do que realmente tem. Não é à toa que qualquer reportagem sempre traz uma história concreta, tornando a tese do repórter muito mais crível. Afinal, estatísticas são frias, histórias são quentes. Ocorre que as histórias magnificam a probabilidade de aquele fenômeno ocorrer conosco.

É bem estabelecido pela literatura acadêmica que a nossa mente lida com probabilidades de acordo com o viés de cada um. Em geral, eventos positivos, como ganhar a Mega Sena, assumem uma probabilidade muito maior na nossa mente do que realmente têm, ao passo que damos a eventos negativos, como ter um ataque do coração ou ser atropelado, probabilidade muito menor do que realmente têm. O viés político também influencia: anti-vacinas darão muito maior peso a estatísticas de mortes por vacinas do que mortes por Covid, ao passo que “coronalovers” farão o inverso.

O que deveríamos fazer para minimizar o erro de avaliação é simplesmente esquecer as histórias concretas e focar nas estatísticas. Se temos um amigo que tomou três doses da vacina e, mesmo assim, morreu de Covid, deveríamos transmitir os nossos mais profundos sentimentos à família, mas esquecer essa história particular para tirar conclusões. A história pode ser tocante, mas qual a estatística por trás? Essa é a questão relevante.

O que a estatística nos diz, por exemplo, sobre a vacinação de crianças, o exemplo usado no início deste artigo? No geral, de acordo com este estudo, publicado na Nature, a chance de uma pessoa qualquer desenvolver miocardite relacionada com a vacina da Pfizer é de 0,3-5,0 por 100.000 pessoas vacinadas (como referência, há 1-10 casos/100.000 de miocardite globalmente por ano). E isso não é morte, somente uma fração desse número vem a óbito. Por outro lado, a incidência de miocardite associada à Covid é cerca de 100 vezes maior, 1.000-1.400 para cada 100 mil pessoas. Ou seja, segundo este estudo, é 100 vezes mais provável desenvolver miocardite por Covid do que pela vacina.

No entanto, para crianças as conclusões não são tão preto no branco, mesmo porque, ainda estamos muito no início da vacinação nesta faixa etária globalmente. Este estudo, por exemplo, conclui que meninos entre 12-15 anos de idade e sem comorbidades, têm mais chance de desenvolver miocardite com a vacina da Pfizer do que com a Covid. Já com comorbidades, a chance é maior com a Covid. Talvez por isso, alguns países (ex.: Reino Unido) tenham indicado a vacinação infantil com vacinas de tecnologia mRNA apenas para crianças com comorbidades. No entanto, outros países (ex.: EUA, Canadá) recomendam a mesma vacina para todas as crianças. Ou seja, não há ainda um consenso científico aqui, talvez por falta de estudos conclusivos. Não encontrei estudo que focasse especificamente em crianças (confesso que não gastei muito tempo procurando).

O fato é que o cenário de óbito ou de sequela grave é muito raro em crianças sem comorbidades, tanto naquelas vacinadas (por causa da vacina) quanto nas não vacinadas (por causa da Covid). Por isso, qualquer evento, em si muito raro, é tratado como “o” caso que demonstra a tese.

Note que não estou negando que existam crianças que morram por causa da vacina ou de Covid. O que estou afirmando é que estes eventos não deveriam importar nada para a nossa decisão. O que importa é a estatística, o resto é narrativa.

Correlação não é causalidade

Tem um troço em estatística que é difícil pra diabo de detectar: causalidade. Medir a correlação entre fenômenos é relativamente fácil, coisa que qualquer estudante de colegial é capaz de fazer. O problema é definir, em uma correlação, qual fenômeno causa o outro, se é que existe alguma causalidade.

Essa dificuldade não impediu, no entanto, que o bravo pesquisador cravasse, sob o olhar bovino do repórter, a causalidade entre o desmatamento e a pobreza. Com base na correlação entre um indicador de qualidade de vida, o IPS, e os municípios que mais desmataram, o pesquisador chegou à brilhante conclusão de que o desmatamento GEROU a pobreza. Gostaria de ver os testes de Granger que permitiram essa conclusão. Acho melhor esperar sentado.

Com a mesma sem cerimônia, eu poderia propor o inverso: a pobreza gera o desmatamento. Provavelmente não conseguiria provar também, mas, pelo menos, acho que minha hipótese faz mais sentido. Na verdade, cada um pode achar qualquer coisa, há estatísticas para corroborar qualquer agenda. O que importa, no final do dia, é a narrativa. A ciência que se lasque.

Estatísticas distorcidas

Outro dia foi “a maior criação de empregos com carteira assinada para um mês de agosto desde 2010 segundo o CAGED”.

Anteontem foi “o maior volume de vendas no varejo para um mês de agosto desde o ano 2000”.

Ontem foi “a maior inflação para o mês de setembro desde 2003”.

Claro, cada lado político vai usar essas informações para puxar a narrativa para o seu lado. Mas a verdade verdadeira é que esses números não significam absolutamente nada.

A pandemia representou um choque de grandes proporções na economia global. Foi como se um meteoro tivesse atingido a Terra. Depois de um choque dessa magnitude, é só natural que as medidas de atividade econômica fiquem completamente fora dos eixos. Grandes depressões seguidas de grandes recuperações, preços doidos nos mercados, desorientação geral. As coisas vão levar meses, senão anos, para voltarem ao leito normal. Por enquanto, essas comparações só servem para criar manchetes bombásticas e cevar narrativas políticas. De resto, são inúteis.

Em busca de uma narrativa

Em jornalismo existe uma lei que diz que, se você procurar bem, sempre existirá uma estatística que rende uma boa manchete. Este é o caso aqui. Diante da relativa estabilidade do número de mortes causadas por policiais, a reportagem encontrou uma estatística útil: o número de mortes causadas pela Rota dobrou de 2018 para 2019. Prato cheio.

Desde o velho bordão de Maluf (“vou colocar a Rota na rua!”) até filmes como Tropa de Elite, esses batalhões especiais têm seus nomes ligados à eficiência no combate à criminalidade com o uso da violência extrema. Quer coisa melhor do que uma estatística que prove isso?

Mas, como dizia o saudoso Roberto Campos, estatísticas são como biquínis: mostram tudo mas escondem o essencial.

Em primeiro lugar, a reportagem apresenta um bonito infográfico mostrando a evolução do número de mortes pela Rota de 2018 para 2019: 51 para 101.

Vamos combinar que, para dar essa informação, não precisava de um gráfico, né? Mas o problema é outro: e os outros anos? Certamente esses dados existem. Por que não informar ao público? Ficamos sem saber se este número de 2019 é de fato um ponto fora da curva ou faz parte de uma média que vem prevalecendo nos últimos anos. Ficamos na dúvida se a reportagem escondeu esses dados porque não ornam com a versão, ou se foi um simples “esquecimento”.

O ouvidor das policiais tem uma explicação para essa “explosão de mortes”: por ser uma “tropa de elite”, a Rota seria mais sensível ao discurso de que “bandido bom é bandido morto”.

Hein?!? O que tem a ver o cy com as calças? Por que cargas d’água os outros batalhões seriam menos sensíveis a esse discurso? Non sense. Mas o bravo ouvidor não parou por aí. Culpou também o “discurso conservador que permeia o Estado e o País”.

Bem, seria assim se assim fosse. Podemos observar no gráfico que houve um salto da letalidade policial de 2013 para 2014 de uma média de 500 a 600 para uma média de 800 a 900. O número de 2019 não destoa da média desde 2014.

A pergunta que obviamente não foi feita ao ouvidor (mesmo porque jornalista está mais preocupado em lacrar do que em informar) é porque este tal “pensamento conservador” começou a fazer estragos especificamente em 2014, quando o país ainda vivia uma “normalidade democrática” (contém ironia).

Bem, ontem foi o último dia do tal ouvidor. Foi substituído por outro, escolhido de uma lista tríplice pelo governador João Doria. Este novo ouvidor, ao que parece, foi elogiado pelo responsável pelo grupo de advogados “Prerrogativas”, aquele que defende o direito pela impunidade de quem pode pagar bons advogados. Ao que parece, poderemos continuar contando com explicações sociológicas convincentes para a letalidade policial.

A estatística que me interessa

Quer ver como dois fatos estatísticos incontroversos podem levar a uma conclusão sem pé nem cabeça?

Fato 1: Os Estados da Amazônia tiveram crescimento de registro de armas de fogo de 54,6% de 2017 para 2018, enquanto no restante do País esse crescimento foi de “somente” 39%.

Fato 2: os Estados da Amazônia apresentaram crescimento de 1% nos assassinatos no mesmo período, enquanto no restante do País houve redução de 15% nesses mesmos crimes.

PORTANTO: como houve crescimento maior das armas na Amazônia, o crescimento dos crimes se deu por causa do aumento das armas de fogo. C.Q.D.

Nem vou aqui entrar no mérito de uma regressão estatística com dois pontos. Isso seria muito elaborado. A coisa é pior.

Não ocorre ao diretor do Fórum do Segurança Pública e nem ao jornalista que houve DIMINUIÇÃO de crimes no restante do País com concomitante AUMENTO de registro de armas. Se conclusão houvesse seria a inversa, pois ocorreu uma diminuição significativa de mortes. Na Amazônia, o aumento de 1% é estatisticamente irrelevante.

É claro que, confrontados com esse raciocínio óbvio, o diretor do Fórum e o jornalista rapidamente argumentariam (corretamente) com a insuficiência de dados estatísticos para concluir alguma coisa.

Mais e mais se confirma a definição de Estatística: é a ciência que serve para provar a MINHA tese.

PS: crescimento de 39% nos registros de arma de fogo no País em apenas um ano? Tá certo esse número? Parece meio exagerado, mas não chequei.

Explicações simplistas

Você é convidado a escrever uma breve análise sobre alguma notícia recém-saída do forno. São só cerca de 150 palavras, então você precisa caprichar bem, porque são os seus 15 minutos de fama. Daí, você comete essas duas “análises” publicadas hoje no Estadão.

Na primeira, o título leva a crer que a economia explica a queda da violência. Afinal, de 2017 para cá, a economia se recuperou de dois anos de recessão. Só pode ser piada. Até o próprio autor não acredita muito no que afirmou, pois faz a ressalva de que os crimes continuam caindo em 2019, com um cenário de estagnação. Como se 2019 estivesse muito diferente de 2017 e 2018. É do balacobaco. Observando o gráfico abaixo, vemos que durante a década passada, com crescimento econômico muito maior, não houve queda significativa da violência, a não ser no ano de 2004, que comentaremos a seguir. Pelo contrário, a violência continuou a subir até 2014, ano do início da recessão. Então, as conclusões não conversam com os dados.

A segunda “análise” se refere ao Estatuto do Desarmamento, baixado por Lula em dezembro de 2003. De fato, os crimes em 2004 apresentaram uma queda significativa, mas depois, aos poucos, voltaram a subir, ultrapassando o pico anterior em 2012, continuando a subir a partir daí. Com o mesmíssimo Estatuto em vigor. Portanto, parece pouco lógico que o Estatuto tenha tido efeito permanente sobre a violência, se é que houve algum. Para tirar alguma conclusão, seria necessário ter estatísticas sobre assassinatos realizados com armas legais e não legais. Desconfio que a imensa maioria é resultado de ação com armas não legais, que não são alcançadas pelo Estatuto. Mas é só uma desconfiança, não há dados para concluir nada. A favor do segundo artigo, pelo menos o autor reconhece que houve iniciativas virtuosas que podem ter levado ao resultado alcançado.

Essas duas análises só demonstram o quanto se pode distorcer dados para corroborar qualquer narrativa. Uma análise mais cuidadosa (e não precisa ser lá muito cuidadosa, como vimos acima) mostra que tudo não passa de uso de correlações espúrias para provar teses pré-concebidas.

A grande verdade é que não há uma explicação simplista para a queda do número de assassinatos no ano passado, como “a economia” ou “o estatuto do desarmamento”. Deve ter sido uma conjugação de fatores, muitos deles fora do campo de visão dos analistas. Mas sempre haverá demanda por explicações simplistas, pois o ser humano é um bicho em busca de explicações, que não suporta o “aleatório”. Enquanto for assim, as narrativas continuarão vivas e em boa forma.