Amor por Certezas

distgaussiana_risco

Nassim Nicholas Taleb, no fim de “A lógica do Cisne Negro: O impacto do altamente improvável”, resume e repete os argumentos feitos previamente ao longo do livro.

Medidas de incerteza baseadas na curva na forma de sino simplesmente desconsideram a possibilidade, e também o impacto, de grandes saltos ou descontinuidades e, por isso, não são aplicáveis a variáveis extremas. Utilizá-las é como concentrar-se na grama e não observar as árvores gigantescas. Apesar de grandes desvios imprevisíveis serem raros, eles não podem ser desconsiderados como outliers porque, cumulativamente, seu impacto é dramático demais.

A forma gaussiana tradicional de se ver o mundo começa através do foco no ordinário e depois lida com exceções ou supostos outliers como se fossem ancilares. Mas existe um segundo modo, que toma o experimental como ponto de partida e trata o ordinário como subordinado.

Taleb enfatizou que existem duas variedades de aleatoriedade, qualitativamente diferentes, como ar e água. Uma não se importa com extremos; a outra é gravemente impactada por eles. Uma não gera Cisnes Negros, a outra, sim. As técnicas usadas para discutir um gás não podem ser as mesmas que usaríamos para discutir um líquido. E, se pudessem, não poderíamos chamar a abordagem de “uma aproximação”. Um gás não “se aproxima” de um líquido.

Podemos fazer bom uso da abordagem gaussiana em variáveis para as quais exista uma razão racional para que a maior não esteja longe demais da média. Se a gravidade puxar os números para baixo ou se existir limitações físicas que impeçam observações muito grandes, acabamos sob o domínio da média.

Se existirem forças de equilíbrio fortes que atraiam as coisas de volta com bastante rapidez, depois que as condições divirjam do equilíbrio, então, mais uma vez, pode-se usar a abordagem gaussiana. Do contrário, pode esquecer. É por isso que boa parte da Economia é baseada na noção de equilíbrio: entre outros benefícios, ela permite que fenômenos econômicos sejam tratados como se fossem gaussianos.

Repare que Taleb não está dizendo que o tipo de aleatoriedade sob dominância da média não permita alguns extremos. Mas ela nos diz que eles são tão raros que não desempenham um papel significativo no total. O efeito de tais extremos é pequeno demais e diminui à medida que a população aumenta.

Para ser um pouco mais técnico, se tivermos uma variedade de gigantes e de anões, ou seja, observações a muitas ordens de magnitude de distância entre si, ainda poderíamos estar sob dominância da média. Como? Vamos presumir que tenhamos uma amostragem da população.  A maior observação de todas as pessoas pode não estar tão longe da média. A média sempre conterá ambos os tipos, gigantes e anões, de forma que nenhum deles deverá ser raro demais — a menos que tenhamos um megagigante ou um microanão em ocasiões muito raras. Isso seria o domínio da média com uma unidade de desvio grande.

Repare novamente no seguinte princípio: quanto mais raro for o evento, maior será o erro na estimativa de sua probabilidade — mesmo quando a curva na forma de sino gaussiana for utilizada.

Taleb mostra como a curva na forma de sino gaussiana extrai a aleatoriedade da vida — que é o motivo de sua popularidade. Gostamos dela porque ela permite a existência de certezas! Como? Por meio do cálculo de médias!

A aleatoriedade gaussiana é domável pelo cálculo de médias. Operadores de cassino compreendem bem esse fato, que é o motivo pelo qual nunca (se fizerem as coisas direito) perdem dinheiro. Eles simplesmente não deixam que um jogador faça uma aposta gigantesca, preferindo, em vez disso, que muitos jogadores façam séries de apostas de tamanho limitado. Quando se tem muitos apostadores, nenhum jogador isolado exercerá um impacto mais que diminuto sobre o total.

A consequência disso é que variações em torno da média da curva na forma de sino gaussiana, também chamadas de “erros”, não são verdadeiramente preocupantes. Elas são pequenas e perdem a força. São flutuações domesticadas em torno da média.

Logo, à medida que o tamanho da amostragem aumenta, a média observada apresenta-se com cada vez menos dispersão — como se pode ver, a distribuição fica cada vez mais estreita. Isso, resumidamente, é como tudo funciona na Teoria da Estatística (ou deveria funcionar). Sob a dominância da média, a incerteza desaparece. Isso ilustra a banal “lei dos grandes números”.

Se algum dia você teve aulas (chatas) de Estatística na faculdade, não entendia muito o que empolgava tanto o professor e perguntava-se o que “desvio-padrão” significava, não há nada com que se preocupar. A noção do desvio padrão é insignificante fora do mundo acadêmico que resume tudo à média.

Desvios padrões não existem fora da curva gaussiana, ou, se existem, não têm importância e tampouco explicam muita coisa. Mas ainda fica pior. A família gaussiana (que inclui diversos amigos e parentes, como a Lei de Poisson) é a única classe de distribuições que, para ser descrita, basta apenas o desvio padrão (e a média). Não se precisa de mais nada. A curva na forma de sino satisfaz o reducionismo dos iludidos.

Existem outras ideias que possuem pouca ou nenhuma importância fora da curva na forma de sino gaussiana: correlação e, pior ainda, regressão. Mas elas estão profundamente incrustadas em nossos métodos; é difícil ter uma conversa de negócios sem ouvir a palavra correlação.

Para ver o quanto a correlação pode ser insignificante fora da dominância da média, escolha uma série histórica envolvendo duas variáveis que são patentemente extremas, como os mercados de títulos e de ações, ou preços de dois títulos, ou duas variáveis como, por exemplo, mudanças nas vendas de livros infantis nos Estados Unidos e a produção de fertilizantes na China; ou preços de imóveis na cidade de Nova York e os lucros do mercado de ações da Mongólia.

Meça a correlação entre os pares de variáveis em subperíodos diferentes, como, por exemplo, para 1994, 1995, 1996 etc. A medição da correlação provavelmente exibirá uma instabilidade grave; dependerá do período para a qual foi computada. Ainda assim, as pessoas falam sobre correlação como se fosse algo real, tornando-a tangível, investindo-a com uma propriedade física, reificando-a.

A mesma ilusão de concretude afeta o que chamamos de desvio-padrão. Escolha qualquer série de preços ou de valores históricos. Divida-a em subsegmentos e meça seu desvio-padrão. Surpreso? Cada amostragem apresentará um desvio-padrão diferente. Então, por que as pessoas falam sobre desvio-padrão? Vai entender.

Repare aqui que, como com a falácia narrativa, quando se olha para dados passados e calcula-se uma única correlação ou um único desvio-padrão, tal instabilidade não é percebida. Tem gente que acredita que a Estatística é uma “ciência”, nunca uma fraude

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s