A caixa desconhecida

Rookie

Para completar a trilogia dos posts sobre entropia (Abaixo de zero e Quantos times de futebol tem no Brasil?), preciso me explicar sobre o que disse anteriormente. Em meu primeiro post a respeito, mencionei a seguinte frase, falando sobre a mistura de dois estados:

A entropia indica quão bem feita é essa mistura, sendo máxima quando todas as configurações do sistema, todas as combinações de bolinhas em cima e embaixo, são possíveis e igualmente prováveis, ou seja, desordem completa, não posso afirmar nada sobre o estado atual do sistema, ele pode ser qualquer coisa.“.

Essa frase causou estranheza em alguns, que comentaram como pode uma situação em que eu sei tanto sobre o sistema (que todas as configurações possíveis são igualmente prováveis) ser também aquela que maximiza minha ignorância sobre o sistema. Vou tentar explicar o que quis dizer com isso, através de um problema que me foi proposto no último karaokê a que fui.

Imagine-se diante de duas caixas. Ambas possuem bolas de bilhar em seu interior, pretas e vermelhas, e seu objetivo é colocar a mão na caixa e, sem olhar, tirar uma bola preta. A primeira caixa é aberta e mostram a você que ela possui exatamente a mesma quantidade de bolas pretas e brancas. A segunda caixa, contudo, está completamente fechada e coberta, não é possível saber absolutamente nada sobre ela. A pergunta é: qual caixa você escolhe para jogar o jogo em que o objetivo é tirar a bola preta?

Escolha de caixas para tirar bola preta.

Escolha de caixas para tirar bola preta.

Colocar essa pergunta e colher respostas é um interessante experimento sobre a aversão ao risco, uma característica inata dos seres humanos de preferirem o conhecido ao desconhecido, ainda que o conhecido não seja lá tão bom. A resposta convencional que recebo, e a que ouvi da maior parte de meus colegas naquela noite de cantoria de música brega, é escolher a caixa conhecida. Ainda, na minha vez de responder, não hesitei: as caixas são completamente equivalentes.

Apesar da certeza de ter 50% de chance de ganhar o jogo na caixa da direita, eu tenho que ser coerente com a teoria de probabilidades na escolha. Na ausência de qualquer outra informação, eu não tenho razão para supor que a caixa da esquerda vá me favorecer ou me prejudicar, a única alternativa honesta é assumir que essas duas probabilidades são iguais, em uma hipótese de que o universo não é nem bonzinho nem sacana comigo. A caixa da direita, ainda que eu tenha bastante informação sobre ela, é absolutamente equivalente à caixa desconhecida quando o que quero é tirar uma bola preta!

Mas isso precisa de mais explicação. Não basta dizer que na ausência de informação a configuração mais provável é de 50%-50%, assim como dizer que Deus pode existir e não existir, então a probabilidade de existência ou não do divino é de 50%-50%; ou, ainda, considerando as três maiores religiões monoteístas do mundo, a chance de cada uma delas estar certa é de um terço. Tais considerações são absurdas, mas para as bolas na caixa ela é correta, porque, diferentemente da teologia, eu posso definir o que chamamos de espaço amostral da caixa.

Sabemos que a caixa tem um tamanho finito. Assim, podemos encontrar apenas $N$ bolas na caixa. Ao colocarmos em uma tabela todas as configurações possíveis de proporções de cores de bolas na caixa, percebemos que o número de configurações em que as vermelhas são mais prováveis que as pretas é igual ao número de situações em que elas são menos prováveis. Neste caso o espaço amostral está muito bem definido (diferentemente de meus problemas com o divino), então eu devo, para seu intelectualmente honesto, dizer que todas são equiprováveis.

Isso explica o que disse no post sobre a entropia. Em um sistema de máxima entropia, onde todas as configurações possíveis são iguais, eu tenho a maior “ignorância” sobre o sistema. Essa ignorância não é relativa à proporção de bolas ou às probabilidades associadas aos estados, essas eu conheço bem, a ignorância está no fato de que, em máxima entropia, sei tanto sobre o estado que o sistema estará como se não soubesse nada a respeito dele. Nesse sentido, entropia máxima é ignorância máxima.

Eu certamente não extingui o assunto, entropia é um assunto complicado demais. Ainda, espero que com esses três posts você tenha avançado um pouco mais na compreensão desse conceito, nascido nas máquinas térmicas do século XIX, que descreve tanto o número de configurações possíveis quanto nossa ignorância sobre um sistema, passando pela definição de temperatura e pela importância de times de futebol Brasil afora.

Uma ideia sobre “A caixa desconhecida

  1. Denis

    Oi Ricardo,

    encontrei seu blog meio que por acaso há umas duas semanas e desde então venho me divertindo o lendo em ordem cronológica reversa.

    Sobre este post em particular, acho que você está confundindo dois tipos de incertezas de caráteres completamente distintos: a incerteza física (ou aleatória), que diz respeito às frequências relativas de um evento, e a incerteza epistêmica (ou Knightiana), que diz respeito a sua ignorância quanto à incerteza física. Essa distinção é o cerne da disputa entre estatísticos frequentistas e Bayesianos. Esse exemplo das duas caixas (ou um muito parecido) é um famoso paradoxo em que os axiomas de Von Neumann e Savage para probabilidades subjetivas “racionais” falham (e para consertá-lo deve-se assumir que as frequencias relativas dos eventos são sempre conhecidas quando se elicita probabilidades subjetivas, excluindo seu raciocínio sobre a caixa da esquerda da teoria de probabilidades subjetivas tradicional). A ideia de maximizar entropia diante de ignorância epistêmica (como no caso da caixa com proporções desconhecidas) é controversa, e seu principal problema é que inferências sobre esse principio não são comutativas; grosso modo, se vc assumir algo sobre as proporções e depois maximizar entropia difere de maximizar entropia e depois assumir algo sobre as proporções, o que é indesejável quando se pensa em um cálculo de crenças (mas isso também acontece com maximização de verosimilhança, então talvez não seja tão problemático assim). Eu particularmente acho máxima entropia interessante na maioria das aplicações, mas não usaria este princípio se tivesse modelando o sistema de proteção de um reator nuclear (onde eu preferiria supor que a natureza joga contra mim). Acho que talvez uma terminologia melhor seria usar o termo “aleatoriedade” para as incertezas físicas que você descreve nos posts anteriores da série e “ignôrancia” para desconhecimento de frequencias/proporções. Eu concordo com a ideia que se você sabe que uma coisa acontece com 50% de chance, então você sabe bastante é me soa estranho chamar isso de ignorância completa ou máxima.

    Responder

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *