Arquivo do autor:Ricardo Marino

Sobre Ricardo Marino

Físico, estatístico, brasileiro, um pouco francês, falador, curioso, aperta a pasta de dente pelo meio e começa a comer coxinha pela base, que é o único lado certo de fazê-lo.

Estudo indica

Rookie

Esses dias, cheguei a uma notícia que me traz aquele arrependimento de não ter, ao decorrer da vida, juntado uma coletânea das melhores matérias começadas ou terminadas por “estudo indica”. Já vi de tudo, desde estudo indicando o aumento dos preços de guarda-chuva quando chove a pesquisas apontando que o turismo será a indústria mais beneficiada na Copa do Mundo. Essa notícia, no entanto, chocou-me mais que as outras, é ela, da UOL: Estudantes que usam Twitter têm notas melhores e são mais comprometidos, aponta estudo.

A primeira coisa que aprendemos em uma aula de estatística é o lema, que levamos para nossa vida, correlação não implica causalidade. Arrisco dizer que a maior parte das torturas a que a estatística é submetida na mídia vêm dessa confusão, achar que porque duas coisas acontecem juntas, ou parecem acontecer juntas, então uma causa a outra, é o famoso achar que o Sol nasce porque o galo canta. Esse estudo não é diferente.

Somos levados a entender, pela matéria, que o Twitter é algo bom para os estudos. Segundo a autora da pesquisa: “Caroline chegou à conclusão de que o formato ‘tempo real’ do microblog permite que estudantes possam escrever de forma concisa, fazer pesquisas com resultados atualizados e, eventualmente, se comunicando diretamente com autores e pesquisadores.”. Esqueceram de avisar a essa senhora que os adolescentes não estão produzindo poesia moderna fixa a 140 caracteres, as pesquisas atualizadas feitas dificilmente versam sobre temas escolares (para isso se usa Google e Wikipédia) e se o abismo entre um pesquisador e o público já é grande, não são 140 caracteres que ajudarão.

Se precisasse opinar, seguiria Saramago nessa. Quando perguntado se, agora que tinha um blog, faria um Twitter, o escritor não hesitou: “Nem sequer é para mim uma tentação de neófito. Os tais 140 caracteres reflectem algo que já conhecíamos: a tendência para o monossílabo como forma de comunicação. De degrau em degrau, vamos descendo até o grunhido.”. Um pouco drástico, mas me parece mais realista que o Twitter como novo mecanismo literário da juventude.

Ainda, o que me choca não é a ingenuidade panglossiana do estudo, mas a inferência de que se duas coisas vão juntas, uma certamente causa a outra. Uma explicação mais simples, e mais honesta, seria argumentar que alunos que usam Twitter de forma regular têm mais acesso à internet, mais interesse em ter esse acesso, acabam sendo expostos a mais conteúdo e costumam, como em um pacote, ser capazes de aprofundar seus interesses e seus estudos em seus interesses. O Twitter nada tem a ver com isso, e a notícia é propositalmente sensacionalista e enganosa. Causa-me espécie esse tipo de reportagem e o uso que ela faz de estatística.

Não apenas ela, costumamos, de maneiras mais ou menos sutis, associar correlação em causalidade no cotidiano. Desde usar aquela cueca da sorte em dia de final de campeonato a coisas mais sérias, como proibir seu filho de se divertir com um jogo porque o maníaco que atirou e matou cinco jogava o jogo, ou como o absurdo de justificar preconceitos dizendo que todas as vezes em que foi assaltado foram por pessoas de uma raça específica, ou que se vestiam de tal forma. O raciocínio por inferência é natural ao ser humano, devemos nos policiar para que esse instinto não se torne superstição, preconceito, ingenuidade ou, simplesmente, a crença de que o sol nasce porque o galo canta.

Para encerrar, deixo-lhes alguns gráficos para provar estudos muito mais relevantes. Todos nos quais correlação e causalidade são, comicamente, subvertidas e comparadas.

Estudo indica: o número de piratas em atividade pode afetar diretamente o aquecimento global. Salve o planeta, torne-se um pirata.

Estudo indica: comer chocolates aumenta suas chances de ganhar um prêmio Nobel. (Usei esse gráfico como exemplo cômico. Para meu horror, ele foi base de um artigo sério da BBC após a publicação desse post! Eles até colocam no final que correlação não implica causalidade, mas para quem lê os primeiros parágrafos, o jogo está perdido.)

Estudo indica: a qualidade do Rock afeta diretamente a produção de petróleo de um país.

Crime e castigo

Rookie

Há algum tempo, inspirado em um comentário desse blog, queria escrever algo sobre o fenômeno estatístico conhecido como regressão à média. Desde pequeno fui fascinado pela análise teórica do sermão que recebia de meus pais a cada travessura que aprontava. Quebrei janelas, copos, sujei-me, sujei a casa, nada voluntário, coisa de criança; mas recebia, a cada evento, a devida repreensão de pai ou mãe (ou dos dois, não eram excludentes). Também levava broncas por notas mais baixas, não tantos elogios pelas altas, que eram, afinal, minha obrigação. Achava que as coisas eram daquele jeito, que não poderia ser de outro jeito, até, entrando na faculdade, conversar com um amigo que cursava administração de empresas. Segundo ele, muito mais eficaz que esse método era o inverso, o tal do positive reinforcement, elogiar o que é bom e trabalhar no que está ruim, mostrar ao time vídeos com seus acertos ao invés de erros, meu amigo citava experiências sociológicas e psicológicas bem interessantes para provar seu ponto, mas eu custava a acreditar.

Dizer que a recompensa é o melhor caminho choca nossa experiência. Estamos habituados a ver resultados melhorarem após a repreensão, e muitos dizem que, após o elogio, o elogiado tende a piorar e a decepcionar, como se elogiar estragasse, como se ficar feliz e orgulhoso o tornasse relaxado. O post de hoje serve para desarmar esse argumento, e nossa ideia de que alguém “aprendeu a lição” após uma bronca bem tomada. Vou argumentar que esse fenômeno de fato existe, a piora em relação ao elogio e a melhora em relação à bronca, mas que ele reflete muito mais uma verdade estatística que uma mudança de comportamento.

Vamos imaginar uma criança, Denis, o pimentinha, que, ao decorrer do ano letivo, fará 20 provas. Ele não é o melhor da sala, nem o pior, e estuda um pouco para cada prova, mas não muito. Denis estuda suas matérias para tirar um 7,0, que é uma nota boa em sua opinião. No entanto, algumas vezes a prova é mais fácil, ou mais difícil, então sua nota varia; sua média é constante, mas as flutuações são aproximadamente de dois pontos em sua nota. Ou seja, vamos tratar a nota de Denis como uma variável aleatória de média 7,0 e distribuição normal com variância 1. Dessa forma, a chance de ele tirar acima de 9,0 é de 2,2%, e a chance de tirar abaixo de 5,0 também é de 2,2%, sendo 68,2% a probabilidade de ele tirar entre 6,0 e 8,0.

Esses números podem parecer estranhos, mas esse modelo é um dos mais adequados para representar tarefas humanas, a chamada distribuição gaussiana, ou distribuição normal. Ela diz que teremos um valor esperado (no caso de Denis, 7,0), mas que teremos dias bons e ruins. A maior parte dos dias (68,2%) não será muito longe do valor esperado (entre 6,0 e 8,0), mas alguns, excepcionais (2,2%), podem ser muito bons (acima de 9,0, caiu exatamente o que ele havia estudado!) ou muito ruins (abaixo de 5,0, não caiu quase nada do que ele sabia).

Sua mãe se preocupa com sua educação, e o disciplina como sua mãe a disciplinou. Ela dá um presente a Denis cada vez que ele tira uma nota acima de 9,0, e o castiga cada vez que ele tira uma nota abaixo de 5,0. Vejamos como seriam as notas de Denis em um ano:

O que a mãe de Denis entenderá desse gráfico? Note que toda vez que ela castiga Denis, suas notas tendem a subir, enquanto toda vez que ela o presenteia, ele tende a tirar notas piores! É importante notar que isso nada diz sobre o aprendizado de Denis, eu apenas tirei notas aleatoriamente, dizendo que Denis é um aluno nota 7,0 que tem dias bons e ruins.

Essa ilusão da eficácia do castigo ocorre porque é muito raro ter dois dias ruins seguidos, e a ilusão da ineficácia do elogio é pela também raridade de dois dias excepcionalmente bons. O valor seguinte ao de um dia excepcional tende a ser menos espetacular, ou, como dizemos, tende a regredir à média dos valores.

Note, eu não estou dizendo que o castigo tem eficácia zero no comportamento, ou que o presente também não tem efeito, estou apenas dizendo que o raciocínio de punir e melhorar e não elogiar para não estragar pode ser aplicado até a variáveis aleatórias. Certamente a maneira como uma pessoa é tratada influencia em sua performance, mas uma teoria de castigo e recompensa que pode ser explicada pelo mero acaso, pela estatística, não pode ser tida como uma grande verdade sobre o comportamento humano.

Em outras palavras, imagine-se alguém que considera tirar menos que 5 em um sorteio para o próximo número do bingo algo ruim, e que considera tirar mais que 95 um resultado bom. Você pode, por algum motivo, culpar aquela esfera engradeada que vomita os números pelo resultado, e eu garanto: se você der uma bronca nela após cada resultado menor que 5, ela vai muito provavelmente melhorar bastante na próxima vez. Se você elogiar a cada resultado acima de 95, ela provavelmente irá te decepcionar na próxima bola sorteada.

Não quero, nem pretendo, dizer que broncas são ineficazes, ou que a única resposta possível para educar ou ensinar são elogios, paz e amor. Lanço esse post na polêmica opinião que pede uma revisão de nossos conceitos da eficácia do castigo como aprendizagem. Para que você se pergunte quanto do que você aprendeu veio dos benefícios de um sermão, ou, ainda, quanto de cada melhora que viu após uma bronca foi resultado dessa bronca ou se foi, por puro acaso, um dia melhor que ontem.

Banco Imobiliário

Geek Rookie

Como todos, joguei bastante Banco Imobiliário em minha infância. Sonhava em morar em Morumbi ou Interlagos, tinha medo de algum dia passar perto da Av. Presidente Vargas, e com ele descobri o significado da palavra “revés”. Gostava, ainda que nunca tenha efetivamente terminado uma partida, sempre me solidarizava com os que empobreciam, deixávamos que continuassem, como se capitalismo e misericórdia combinassem, não dava certo.

Mas sempre fui assombrado pela busca pela tática ótima de se jogar esse jogo, se havia alguma. Inspirado em um estudo que li recentemente, dedico esse post a responder a grande pergunta: quais as casas em que mais paramos em uma partida? Assim, saberemos quais cores de propriedades precisamos, a todo custo, comprar ao parar.

Apesar de esse estudo já ter sido feito, não gostei da apresentação, nem da maneira como foi escrito; refaço-o, torcendo para que poucas pessoas achem, desse post, o que achei do estudo.

Para explicar como farei esse cálculo, preciso começar com um caso mais simples de jogo. Se Quico criou o xadrez para principiantes, apresento a vocês o Banco Imobiliário para iniciantes, ou, para criar uma temática, o Banco Imobiliário Zona Leste, referente à zona leste da cidade de São Paulo (figuras de Pedro Vergani, o mesmo que fez o banner do blog e diversas outras figuras desse blog):

Não há grandes surpresas nesse jogo. Usamos uma moeda e tiramos no cara-ou-coroa quantas casas andaremos: cara nos faz andar uma casa, coroa nos faz andar duas casas. Queremos analisar qual a casa mais provável de se cair e, para isso, precisamos trazer artilharia pesada da álgebra linear.

Vou precisar de uma matriz. Adoro matrizes, trabalho com elas e revolto-me com alunos de colegial que desdenham das aulas em que tiveram que aprender a “multiplicar tabelas”. Não os culpo tanto assim, é de fato bem estúpido querer multiplicar uma tabela por outra sem dar uma razão decente para isso, e hoje lhes apresento uma. Vamos criar a matriz estocástica do Banco Imobiliário Zona Leste. As regras para a matriz são: na primeira linha e segunda coluna, por exemplo, colocamos a probabilidade de, estando na primeira casa, cair na segunda casa. Como vocês sabem, essa probabilidade é ½ (tirar cara). A primeira linha dessa matriz será, portanto: 0, ½, ½, 0; ou seja, a chance é zero de ficar no mesmo lugar (você vai se mover), ½ de avançar uma casa (cara), ½ de avançar duas (coroa) e zero de avançar três. A matriz total será:

\[M=\left(\begin{matrix}0&\frac{1}{2}&\frac{1}{2}&0\\ 0&0&\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&0&0&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{2}&0&0\end{matrix}\right)\]

E ela vai nos ajudar a fazer todo o resto. A utilidade de escrevê-la, além de ficar claro e bonitinho, é a seguinte: ela representa na linha $i$ e coluna $j$ as probabilidades de, estando na casa número $i$, ir à casa número $j$ em uma jogada. Se eu quiser a probabilidade de, estando na linha $i$, ir à coluna $j$ em duas jogadas, basta multiplicar a matriz $M$ por ela mesma! Aos que estão enferrujados em multiplicação de matrizes, eis a resposta:

\[{}\left(\begin{matrix}0&\frac{1}{2}&\frac{1}{2}&0\\ 0&0&\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&0&0&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{2}&0&0\end{matrix}\right).\left(\begin{matrix}0&\frac{1}{2}&\frac{1}{2}&0\\ 0&0&\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&0&0&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{2}&0&0\end{matrix}\right)=\left(\begin{matrix}\frac{1}{4}&0&\frac{1}{4}&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{4}&0&\frac{1}{4}\\ \frac{1}{4}&\frac{1}{2}&\frac{1}{4}&0\\ 0&\frac{1}{4}&\frac{1}{2}&\frac{1}{4}\end{matrix}\right){}\]

Ou seja, a chance de, estando na primeira casa, voltar a ela depois de duas jogadas é 14, a chance de estar na terceira casa depois de duas jogadas também é 14 e a chance de estar na quarta casa é ½. Mas o problema não é saber as chances de 2, 3, 10 ou 100 jogadas, queremos saber qual é a mais provável de cairmos em todo o decorrer da partida, o que é um problema diferente, mas que pode ser resolvido com essa matriz. Basta multiplicar essa matriz por ela mesma um número alto, bem alto de vezes, torcer para que ela comece a convergir para uma matriz razoável e dizer que essas serão as probabilidades em “tempo infinito”, ou seja, as chances de se estar naquelas casas depois de ter jogado muitas vezes.

Note, dizer que em um número alto de jogadas eu estarei mais provavelmente na casa X e dizer que terei passado várias vezes por X são afirmações bem diferentes, mas arrisco dizer que representam a mesma coisa, e o nome dessa afirmação é hipótese ergódica. Esse post não tem a menor pretensão de avançar nessas águas, que esse nome fique sendo, por enquanto, apenas um nome bonito para uma teoria.

Mas se elevar uma matriz ao quadrado é difícil, como elevar uma matriz a um número muito grande? Matematicamente falando, vamos elevar $M$ a $n$, o número de jogadas, e depois tomar o limite para $n\to\infty$, ou seja, vamos dizer que $n$ é um número muito, muito grande; o que, para Banco Imobiliário, consiste em uma excelente aproximação.


Parte geek do post, evite se não reconhecer a palavra “autovalor”. A parte rookie continua em seguida.

Os que já fizeram seu curso de álgebra linear conhecem a dica, vamos atrás dos autovalores dessa matriz e elevar esses caras a $ n$, depois mandar $ n$ para infinito e ver no que vai dar. Isso porque, felizmente, se escrevemos uma matriz como $M=UDU^{-1}$, onde $D$ é uma matriz diagonal, elevar $M$ a $n$ é escrever $ UDU^{-1}UDU^{-1}\ldots UDU^{-1}$ um número $ n$ de vezes, notando que os $ U^{-1}U$ do meio se cancelam, isso é o mesmo que $ UD^nU^{-1}$, e elevar uma matriz diagonal a uma potência é simplesmente elevar seus elementos a essa potência.

Posso me colocar várias perguntas como: “e se algum autovalor for maior que 1? A matriz vai explodir!” ou “E se todos forem menores que 1? A matriz vai para zero!” ou ainda: “E se algum for negativo? Como você eleva isso a infinito?!”; mas todas elas são sanadas quando invoco um corolário do poderoso teorema de Perron-Frobenius:

Teorema (de Perron-Frobenius): Entre outras coisas (esse teorema é bem poderoso), uma matriz estocástica como a do banco imobiliário possui o autovalor 1, único (não degenerado), e não há autovalores que, em módulo, sejam maiores que ele. O autovetor associado ao autovalor 1 possui todos os seus componentes de mesmo sinal. Em particular para matrizes como as do Banco Imobiliário, esse valor próprio 1 é o maior de todos os autovalores em módulo.

Eu poderia discutir bastante a razão desses resultados, já que Perron-Frobenius é um canivete suíço, adaptando-se a vários tipos de matrizes não-negativas diferentes. No caso da do Banco Imobiliário temos o fato importante de ser perfeitamente possível estar na casa $ i$ e voltar a ela mesma após um número $ m$ suficientemente grande de jogadas, e também ser possível voltar após $ m+1$ a essa mesma casa. Essa propriedade garante que 1 será o único autovalor de $ M$ no círculo unitário.

Esse corolário não deve surpreender ninguém, pois, se uma matriz estocástica vezes outra matriz estocástica continua uma matriz estocástica (eu teria que demonstrar isso, mas acredite em mim, é verdade), $ M^n$ deve também ser estocástica, então não pode ter autovalores maiores que 1 (que explodiriam se elevados a $ n\to\infty$), também não poderia ter apenas autovalores menores que 1, a matriz toda iria a zero quando elevada a $ n\to\infty$, não sobra tantas alternativas além do resultado de Perron-Frobenius. O que ele nos garante de interessante é a unicidade desse autovalor 1 e o sinal do autovetor associado.

E se você elevar todos os demais autovalores a $ n\to\infty$, eles logo logo vão para zero. Sobra o 1. Reconstruindo a matriz multiplicando por $ U$ e $ U^{-1}$, teremos uma surpresa, $ M^n$ com $ n\to\infty$ possui todas as linhas iguais, cujos componentes são os elementos do autovetor associado a 1. Essa surpresa é consequência da teoria ergódica, mas isso fica para outro post Dessa forma, o que queremos é esse autovetor associado ao autovalor 1.

Fim da parte geek.


O método descrito acima, se aplicado a nosso Banco Imobiliário Zona Leste, nos dará que a probabilidade de cair em todas as casas é a mesma, o que é esperado. Somos tentados a achar que no jogo do Banco Imobiliário ocorre o mesmo, mas esquecemos de elementos fundamentais da dinâmica do jogo, em particular da prisão, que muda tudo. Para explicar o efeito da prisão nas probabilidades das casas, introduzo um novo jogo, o Banco Imobiliário Zona Leste Deluxe:

Jogaremos usando um dado de seis faces. Nesse novo jogo, a matriz não será tão bonita quanto a anterior. A casa “Vá para a prisão” leva diretamente à prisão, quebrando a simetria do jogo e beneficiando as casas logo após a prisão, prejudicando aquelas que vêm antes. A matriz completa desse jogo será:

\[M=\left(\begin{matrix}0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0\\ 0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&\frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}\\ 0&0&1&0&0&0&0&0\\ \frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0&0\end{matrix}\right)\]

Aquela bela simetria da outra matriz já não mais existe, a prisão é a culpada, note a penúltima linha (representando a casa “Vá para a prisão”). Analisando quais serão as probabilidades de se cair em cada uma das casas após um grande número de jogadas usando a técnica da parte geek, ou seja, multiplicando a matriz por ela mesma muitas vezes, teremos:

O que é bem diferente de uma probabilidade uniforme, como no jogo anterior.

Apliquemos tudo isso ao verdadeiro Banco Imobiliário. Seu tabuleiro é mais completo, ele é jogado com dois dados e andamos a soma dos valores tirados, possui casas de sorte-ou-revés, diversas cores e muitas propriedades. Seu tabuleiro, a quem não se lembra, é:

Não vou escrever sua matriz estocástica, não quero cuspir uma tabela de 40 linhas e 40 colunas nesse blog, mas acreditem, fiz as contas. A probabilidade de se encontrar em cada uma das casas é:

Levei também em conta a chance de 1/18 de se encontrar uma carta de ida à prisão nos espaços de sorte-ou-revés, foi o ajuste mais fino que fiz no modelo, para obter esses resultados. Ainda, ele não afeta em grande coisa a análise, pois as casas de sorte-ou-revés estão bem distribuídas no tabuleiro, apenas acentuam o efeito da prisão.

Notem que as casas rosa não são apenas as mais baratas e de pior rentabilidade, são também aquelas, juntamente com as azuis escuras, mais difíceis de atingir no tabuleiro. Interlagos e Morumbi, as tão desejadas laranjas, formam a dupla mais provável de casas para se atingir: são aquelas mais prováveis de encontrar após sair da prisão e, sendo a prisão a casa de longe mais provável, elas herdam um pouco dessa probabilidade.

Não jogo Banco Imobiliário há muito, entendo um pouco a razão. Podemos imaginar razões para a casa mais cara ser a mais provável, ou outras sutilezas descobertas na análise, mas isso é facilmente refutado pelo fato de países diferentes escolherem distribuições diferentes de valores de casa pelo tabuleiro; no jogo francês, a casa mais cara é a menos provável, substituindo o Jardim Paulista de nossa edição. Percebemos, por isso, que não é um jogo feito com tanto cuidado assim. Contudo, talvez se quando eu jogava soubesse um pouco mais sobre matrizes, mais sobre Frobenius, tivesse mais sorte no dado, talvez assim eu tivesse gostado, jogado, ganhado, ou, quem sabe, até mesmo terminado uma partida de Banco Imobiliário.

Quase arte

Rookie

Se você, como eu, possui um leve TOC com simetrias, gosta das coisas em seus devidos lugares, detesta paredes não-perpendiculares pelo dilema de ter que escolher um eixo para alinhar coisas na sala ou, jogando Carcassonne, passa mais tempo arrumando as peças que pensando em sua jogada, esse post não é para você.

Quando eu era mais novo, passei por uma fase “física dos materiais” e me interessei bastante por propriedades eletrônicas de sólidos e cristais. Aprendemos que cristais são agregados de átomos em um padrão que se repete, que se reproduz. Um cristal de sódio e cloro, por exemplo, agrupa-se em uma estrutura periódica cúbica que se repete muitas, muitas vezes até formar um conglomerado colossal de átomos, que chamamos de sal.

Nessa aula de cristais, aprendi que toda estrutura cristalina possui um motif, cuja tradução desconheço. Essa palavra não é exclusiva da física ou da matemática, motif é, grosso modo, um fragmento que comporá uma grande obra, como um tijolo compõe casas. A quinta de Beethoven talvez possua o motif musical mais conhecido, as famosas três notas curtas acompanhadas de uma longa que abrem a sinfonia. Nos cristais é o mesmo, vejamos o motif do sal de cozinha:

Sendo a construção de um cristal feita com a repetição indefinida desse motif. Não apenas nos cristais, encontramos problemas similares a esse quando tentamos comprar azulejo para nossa casa. Durante muito, acreditou-se que redes cristalinas pudessem ser apenas de um entre dezessete tipos, conhecidos como os grupos de papéis de parede. Se você tem um azulejo em sua casa, garanto que ele pertence a um desses dezessete grupos.

Mas note que todas essas redes regulares possuem algo em comum: uma simetria. Redes triangulares possuem simetria de rotações por 120°, as quadradas são invariante por rotações de 90° e as hexagonais, por rotações de 60°. Essas simetrias são características dos cristais e uma boa parte de nossas técnicas de medição consiste em medir essa simetria, da seguinte ideia: você lança luz no cristal (ou elétrons, o importante é lançar algo), veja como o cristal rebate a luz e estuda o perfil formado na saída da luz. Com esse perfil, você entende como o cristal funciona. Um cristal de alumínio possui, por exemplo, simetria hexagonal. Não por menos, seu padrão de difração é algo assim:

No entanto, em 1982, Dan Shechtman faria medições de um composto de alumínio e manganês que lhe daria o seguinte padrão de difração:

diffraction

É difícil entender o quanto esse padrão chocou Shechtman, e como escandalizaria a comunidade da cristalografia. Se o padrão do alumínio era um hexágono, o que é perfeitamente aceitável, esse é um decágono. Em alguns pontos, traçando as linhas certas, percebemos uma simetria pentagonal no desenho. O problema é exatamente esse: a simetria pentagonal (72°) é proibida aos cristais! Você consegue criar um tapete usando quadrados, triângulos e hexágonos, mas jamais pentágonos! Você pode se enganar enfiando um pentágono aqui e ali, mas isso será apenas usar um pentágono para compor seu motif, e esse motif será reproduzido de forma triangular, quadrada ou hexagonal. Shechtman havia descoberto um monstro.

Com medo de sua descoberta, Shechtman levou dois anos para tomar coragem e publicar seus resultados. A comunidade científica estranhou de início, mas a matemática do assunto já havia sido desenvolvida desde 1964, estávamos vendo o primeiro caso de um quasicristal. Apresento-lhes um padrão similar ao do composto estudado por Shechtman, o belíssimo Al-Pd-Mn:

Notem a ausência de um padrão claro de repetição, um motif, e, ainda, uma aparente simetria que se quebra em pontos para ceder a outra simetria em uma dança de padrões pentagonais. Átomos de fato se agrupam assim, por uma razão atomicamente simples: muitas vezes, os compostos desejam fazer cinco ligações eletrônicas, que se repelem mutuamente. Nesse jogo de repulsão, elas forçam um padrão pentagonal e, quando ele não é mais possível (porque não há como cobrir um solo com pentágonos), há a quebra de simetria.

Esse tipo de padrão, ou de quase padrão, não é muito comum em nossa sociedade e nossa arte, mas a história é bem diferente na arte islâmica. Não sou especialista, mas sei que o número cinco não é lá bem visto nas religiões que herdamos, em especial o pentágono ou a estrela de cinco pontas. No mundo árabe, o cinco é um número querido, há cinco orações por dia, cinco meses sagrados no ano, e, em particular, o pentágono ou a estrela não apresentam problema. Não de forma surpreendente, encontramos na arte islâmica criada no período de ouro das civilizações árabes exemplos vastos de quasicristais:

Santuário de Darb-i Imam, em Isfahan

Igualmente interessantes são as propriedades de repetição dos quasicristais. Ainda que eles não possuam motif, possuem regiões que se repetem com alguma frequência. De fato, podemos afirmar que, grosso modo, toda região de diâmetro $R$ se repete em até uma distância de $2R$. Como exemplo, note que essas regiões pentagonais verdes assinaladas se repetem em uma distância ainda menor que seu tamanho:

Mais que isso, as diversas regiões assinaladas demonstram todas uma repetição em algum ponto próximo, dependendo do tamanho da região considerada, nunca estando mais que o dobro de seu tamanho de distância de seu irmão gêmeo mais próximo.

Muitos outros compostos foram descobertos com padrões desse tipo, e suas propriedades e aplicações ainda são um terreno aberto. Infelizmente me desviei desse campo, matrizes me atraem mais que pentágonos, mas não deixo de apreciar esses padrões, quase perfeitos, quase simétricos e totalmente belos.

O princípio do pombal

Rookie

Em física e matemática, é bem comum encontrarmos princípios que parecem óbvios com consequências complicadas. Meu exemplo favorito é a relação conhecida como equação mestra na física estatística que, se lida em português, seria: “o quanto variou é o quanto entrou menos o quanto saiu”. Por mais evidente que isso seja, essa equação toma formas cabulosas em situações não muito complicadas e exige bastante suor para ser resolvida.

Mas o assunto de hoje não é a equação mestra, mas outro princípio, talvez ainda mais simples: o princípio da casa dos pombos, ou princípio do pombal.

Princípio da casa dos pombos: se há mais pombos que casas em um pombal, alguma casa terá mais de um pombo.

Eis uma aplicação desse princípio:

E por mais óbvio que ele pareça, não é nada inútil se lembrar dele como técnica de demonstração de resultados bem interessantes. Um deles, meu favorito, é uma espécie de jogo com sequências. Para ilustrar, imagine uma rua com $n$ casas. Cada casa deve possuir um número, e você pode escolher o número que quiser. Eu afirmo que existe um grupo de casas vizinhas cujos números, somados, resultam em um múltiplo de $n$.

Vejamos um exemplo. Imagine treze casas que possuem os seguintes números: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 e 14. Se houvesse uma casa com o número 13, ela seria sozinha o múltiplo de 13 que quero, isso não me serve de muita coisa. Note que, nessa rua, temos os vizinhos 5, 6, 7 e 8, e 5+6+7+8=26, que é um múltiplo de 13.

Mas podemos pegar sequências mais complicadas, como, por exemplo, um antigo telefone meu: 41921561. Eu tenho certeza absoluta de que existem números vizinhos que, somados, resultam em um múltiplo de oito (que é o tamanho da sequência). Basta caçar um pouco para encontrar que 4+1+9+2=16.

Ou, ainda, tomemos essa permutação de meu RG: 158313734. Cacemos os vizinhos que somados dão um múltiplo de nove, e uma leve busca nos leva a 5+8+3+1+3+7=27. Você certamente pode encontrar combinações mais simples, eu não disse que era única, apenas que existe.

Esse resultado, que é um divertido jogo quando se está profundamente entediado em uma sala de espera ou durante uma viagem de trem, é provado com o princípio do pombal. Para tal, tome sua sequência de tamanho $n$, da forma $a_1,a_2,\ldots a_n$. Pense agora em todas as possíveis sequências com a mesma ordem dessa sua original que começam no $a_1$, ou seja, as sequências:

\[a_1\]

\[a_1,a_2\]

\[a_1,a_2,a_3\]

E assim por diante. Pense agora na soma dos elementos delas. Se alguma dessas somas já dá um múltiplo de $n$, nosso problema está resolvido, então vamos supor o pior dos casos, nenhuma delas é um múltiplo de $n$. Assim, a soma dessas sequências, dividida por $n$, deve dar algum resto, e haverá $n-1$ possibilidades de resto.

Ainda em um exemplo, se minha sequência possuísse quatro elementos, as somas dessas subsequências teriam que ter resto ou 1, ou 2, ou 3. Se o resto fosse zero, seria divisível.

Como você tem $n$ sequências possíveis e apenas $n-1$ restos possíveis, então, pelo princípio do pombal, terá, necessariamente, duas sequências diferentes cuja soma tem o mesmo resto na divisão por $n$. Ora, subtraia uma da outra que você terá uma sequência de vizinhos cuja soma, dividida por $n$, possui resto zero, logo, é divisível!

Para entender melhor, vou aplicar esse raciocínio a uma sequência específica: 1 2 1 3 6. As subsequências possíveis são 1, 1 2, 1 2 1, 1 2 1 3 e 1 2 1 3 6. Suas somas serão, respectivamente, 1, 3, 4, 7 e 13. Note que, dividindo por 5, esses números produzem respectivamente resto 1, 3, 4, 2 e 3. A segunda e a última sequência possuem o mesmo resto! Então tirando a segunda da última teremos os elementos 1 3 6 que, somados, dão 10, um múltiplo de 5.

Não sei se ficou claro, na verdade, acho que ficou confuso, mas vou deixar assim enquanto não encontro maneira melhor de escrever. Provar o princípio do pombal, no entanto, me parece mais difícil que esse resultado que acabei de enunciar, talvez usando algum resultado dessa parte mais fundamental de teoria dos conjuntos, propriedades com bijeções, injeções e sobrejeções, a noção de cardinalidade, teria que pensar um pouco. Por enquanto, fica o resultado das sequências, das casas, e a demonstração dos pombos.