Arquivos da categoria: Rookie

Posts para interessados em ciência.

5 sextas, 5 sábados, 5 domingos

Rookie

Chega.

Já chega.

Por favor, chega de enviar correntes de e-mails me dizendo que Janeiro terá cinco sextas, cinco sábados e cinco domingos. Já não consigo mais receber essas mensagens sem espumar de raiva, por diversos motivos, e tomo meu tempo para escrever esse post, um pouco fora do tema desse blog, para dissertar sobre um de meus combates épicos: o spam mal feito.

Tenho vários combates, todos perfeitamente justificados. Coxinha comida pelo lado errado, e-mail escrito em azul (ou qualquer outra cor além de preto), e-mails @hotmail, gente que vai “guardar mesa” enquanto outra pessoa está na fila, spoilers na internet, gente que conta o final da piada quando eu estou perto de terminar de contar, mensagens-imagens de “boa quinta-feira” no grupo de WhatsApp da família, astrologia, Windows Vista, café solúvel, francês que deseja “bonne année!” em fevereiro, teclados com switch de borracha, notebooks da HP, tomada de três pinos (sou clichê assim), texto “científico” escrito em Word, gente que critica arte moderna dizendo que “fazia pintura mais bonita quando tinha cinco anos”, emissora de televisão que acha que perguntar para gente aleatória na rua o que eles acharam daquilo configura “jornalismo”, qualquer uso de caps lock que não seja para siglas; todos esses eventos são bandeiras que carrego com mais ou menos intensidade. Poucos deles, no entanto, provocam em mim meus instintos mais primitivos quanto spam mal feito, mal pesquisado, mal compartilhado.

E o e-mail das cinco sextas, sábados e domingos é um exemplo primoroso dessa ojeriza que me é evocada. Sim, janeiro 2016 é um mês com essas características, mas isso não é surpreendente ou impressionante porque não só é um evento comum, mas acontece pela simples passagem do tempo que, por definição, é a coisa mais previsível que existe. Podemos fazer uma conta rápida para estimar a frequência com que isso acontece. Para que um mês possua cinco desses dias, basta que comece em uma sexta-feira e tenha 31 dias. As chances de um mês aleatório começar em uma sexta, pela isotropia da semana, são $\frac{1}{7}$. São sete meses no ano com 31 dias (usando os ossos da mão para contar fica fácil), então a chance de um mês ter essas duas características é $\frac{1}{7}\times\frac{7}{12}=\frac{1}{12}$.

Esse evento acontece, em média, uma vez por ano, não uma vez a cada 823 anos, de onde tiraram esse número?! Ele nem funciona! Janeiro de 2839 não terá cinco sexta, cinco sábados e cinco domingos! O primeiro dia de janeiro de 2839 é um sábado, não uma sexta. Se você quer repetição, um número desses seria formado com o produto da duração de todos os ciclos envolvidos nessa repetição. Por exemplo, a semana tem sete dias e ano bissexto acontece uma vez a cada quatro anos, então tenho certeza de que o mês de janeiro de daqui a $4\times 7=28$ anos terá também cinco sextas, cinco sábados e cinco domingos. Isso não funciona sempre porque ano bissexto tem problemas quando o ano é múltiplo de 100 e 400, o que me forçaria a multiplicar por coisa demais, mas isso é um jeito de garantir a periodicidade e é conhecido como teorema de Lagrange. Se você começar uma atividade no domingo e repeti-la de dois em dois dias, depois de sete repetições você voltará a fazê-la no domingo. Se repetir de três em três dias, de quatro em quatro dias, de cinco em cinco dias, não importa; depois de sete repetições você estará sempre no domingo, com certeza absoluta.

O número correto de anos seria um número formado do produto de diversos outros números, cada um correspondente à duração dos ciclos envolvidos nessa periodicidade (semana, ano bissexto). Mas 823 não é apenas o número errado, ele é primo! E não é tão fácil chutar um primo tão alto assim, então parabéns aos criadores do spam, eles conseguiram, por azar, escolher um dos números mais errados possíveis, se existe uma gradação de errado para esse problema.

E o compartilhamento desse spam me causa tanto desgosto porque uma simples volta ao calendário poderia resolver o problema. Esse mesmo evento aconteceu em maio do ano passado, meu aniversário foi em um desses “sábados sagrados dos chineses”. E o que chineses têm a ver com isso? Eles nem usavam o calendário gregoriano!

Por fim, me acalmo. Sei que o combate é vão, que spam são meus gigantes em moinhos de vento, bem como e-mail em azul e a tomada de três pinos, não vencerei. Fica esse desabafo, e esse comentário sobre essa interessante propriedade de repetição de teoria dos grupos. Sei que esse post é inútil, a intersecção de leitores desse blog com quem compartilha esse tipo de abominação é perto de zero, meu alcance é baixo, meu poder evangelístico de apresentar as boas novas de pegar o calendário deste ano e verificar que a mesma coisa acontecerá em julho é pequeno.

A biblioteca de Babel

Rookie

Hoje não tem modelo ou coisa muito complicada, vamos falar de conhecimento, e de um de meus contos favoritos: a biblioteca de Babel. Publicado por Jorge Luis Borges em 1941, esse conto apresente um universo distópico de excesso de informação fascinante. Passando por ele, comento um pouco do propósito desse blog, e do valor da educação convencional e análise crítica e científica em uma era dominada pela consulta imediata a todo conhecimento humano na ponta dos dedos em um celular.

Imagine uma grande biblioteca, grande mesmo. A descrição de Borges é intrincada e interessante, a estrutura da biblioteca é feita de hexágonos intrincados com prateleiras repletas de livros em ordem aparentemente aleatória. A biblioteca contém apenas livros de exatas 410 páginas, com cada página tendo 40 linhas e cada linha contendo 80 símbolos. Para simplificar, esses símbolos são apenas 22 letras, espaço, vírgula e ponto; estamos usando um alfabeto simplificado. Essa biblioteca é única por uma característica curiosa, ela contém todos os livros possíveis de 410 páginas.

Uma representação da biblioteca.

É um projeto ambicioso, mas seguramente podemos dizer que a biblioteca de Babel é finita. Uma conta rápida nos mostra que ela contém $25^{410\times 40\times 80}\approx 10^{1.834.097}$ livros. Em comparação, a maior biblioteca do mundo, a British Library, tem $1.5.10^8$ livros. Em termos de bits, a biblioteca de babel contém aproximadamente $2^{6.092.738}$ bits, ou bytes, não lembro a diferença, mas chega nessa escala de números essas definições são pálidas para descrever a grandeza da biblioteca de Babel.

O conto é muito interessante e descreve o universo dos cidadãos atormentados por esse sonho sadista de um deus cruel criador do maior pesadelo de um bibliotecário. Existem puristas que desejam queimar todos os livros que não fazem sentido para preservar apenas os puros, os sagrados, que contam algo com nexo; ainda que haja intensos argumentos e debates, pois um livro aparentemente sem sentido pode ter nexo, coerência e coesão em alguma língua desconhecida. Talvez seja o trabalho deles descobrir essa língua, mas até que ponto isso não seria, ao mesmo tempo, definir o conteúdo do livro?

Mais do que isso. Nessa biblioteca certamente há um livro relatando exatamente o seu futuro, e o meu, e todos os nossos futuros possíveis que podem ser descritos em 410 páginas. Nessa biblioteca há uma lista de todos os seus romances, suas aventuras, seus desejos, e esse post do blog. Ainda, é uma coleção finita de livros, bastaria você procurar com carinho e você acharia, após algum tempo, todas as respostas que busca, e todas as perguntas que teve.

Não quero lançar spoilers, paro por aqui. A ideia da biblioteca me fascina por motivos diferentes, eu vejo partes de Babel em meu dia a dia como divulgador e como quem se interessa por muitas coisas que não conhece. O maior problema da biblioteca, e talvez sua principal característica, é sua inutilidade completa. Se você quer alugar um livro, digamos “História do Brasil“, de Boris Fausto, dizer título e autor não basta. Não apenas esse livro está na biblioteca, mas todas as $410\times 40\times 80$ variantes com um erro de digitação, ou as variantes com dois erros de digitação, três, quatro, cinco e assim por diante. Para obter o livro “História o Brasil“, você precisaria especificar letra por letra o livro que deseja, ferindo o propósito do aluguel. Em outras palavras, para especificar um livro, você precisa fornecer a mesma informação contida no livro, tornando a obtenção do livro inútil.

E observo Babel na vida real diversas vezes na Internet. Como disse um amigo, quando eu cheguei na Internet era tudo mato. Quinze anos depois, essa soma do conhecimento humano está longe de atingir os padrões de Babel em termos de bits ou bytes, mas está crescendo, tornando-se gigantesca e por vezes lembra os hexágonos da biblioteca do pesadelo. Imagine que você busca algo sobre evolução, vacinas, dietas, curas, física quântica ou sobre a importância das estrelas em nosso dia a dia. Esses temas possuem tanto ruído, tantos “livros com erros de digitação”, que você precisa fornecer mais informação para obter o conhecimento que deseja. Você precisa já saber e conhecer alguns desses temas para navegar nas sugestões de sua consulta, correndo o risco de cair em um dos livros da categoria que os puristas adorariam queimar.

Muita coisa na área científica dessa grande Internet está mal explicada, distorcida, deturpada, por uma mistura de charlatães e leigos bem-intencionados com pouca paciência para aprender ciência como se deve. Meu trabalho, e o seu, é iluminar os bons livros, permitindo que sejam encontrados com menos informação do que eles contêm. É uma cruzada contra o ruído, contra a pseudociência, abrindo caminho nessa internet que ainda tem muito mato para se cortar.

 

Nobel 2015: Oscilações de caráter

Rookie

Edição 06 de outubro de 2015: Esse tópico foi recompensado com o prêmio nobel da física de 2015 aos cientistas Arthur B. McDonald e Takaaki Kajita, absolutamente merecido. Reaproveito esse post de 2012, em um foreshadowing exemplar de minha parte, e mando-o para o dia de hoje. Parabéns à física de partículas, vocês ganham esse round.

A predição e descoberta dos neutrinos na segunda metade do século XX foi uma das grandes conquistas da física de partículas e da astrofísica. Pequenos, rápidos e quase indetectáveis, esses pequenos diabos roubam a energia das explosões de supernovas e bombardeiam outras galáxias, atravessando o espaço em uma velocidade próxima à da luz. A Terra é bombardeada o tempo todo por uma quantidade colossal de neutrinos, felizmente eles interagem muito pouco com a matéria e, até tentando, é difícil detectar um. Os caçadores de neutrinos, em especial o Super Kamiokande – um detector de neutrinos com nome de herói japonês que, não por menos, é parte da Universidade de Tóquio – possuem um trabalho duro. Em 1987, ano da explosão de uma supernova próxima à Terra, nosso planeta foi atingido pela maior onda de neutrinos da era da ciência moderna, detectamos 24.

Interior do Super Kamiokande

E medidas mais precisas do número de neutrinos quase levaram a comunidade física à loucura no final do século XX. A física teórica, aliada a alguns experimentos na Terra, nos dizia exatamente a probabilidade de medir neutrinos, a astrofísica nos dizia a quantidade de neutrinos produzida pelo Sol, era só multiplicar um pelo outro para estimar a quantidade de neutrinos que seríamos capazes de medir na Terra a cada ano. O problema: medíamos muito menos do que deveríamos.

Diversas hipóteses foram levantadas: neutrinos perdidos na atmosfera, detectores que funcionavam mal, nada era o suficiente para explicar a diferença. Claro, a diferença era entre medir 12 e 24, mas, por menor que fossem esses números, um ainda era o dobro do outro; e a física é bem intolerante com teorias que “quase funcionam”.

Pior, essa diferença variava com o ano. Havia uma grande diferença entre o número de neutrinos medidos em julho e em janeiro, mas entre dois janeiros consecutivos a taxa de captação de neutrinos era quase equivalente. Ainda, nos dois casos, o número era praticamente metade do esperado, e isso aumentava o mistério. Coloco um gráfico para entender a diferença entre o recebido e o esperado. As barras em azul escuro são as medidas, as mais coloridas são as esperadas (as cores nas barras teóricas representam o processo pelo qual os neutrinos são emitidos). A parte hachurada representa o erro experimental.

Antes de solucionar o mistério, precisamos entender um pouco sobre o neutrino e sobre as partículas. A maior parte das partículas elementares (os férmions, para ser exato) vêm em três tipos, ou três sabores: leve, médio e pesado. O elétron, por exemplo, é o membro leve da sua família, seus irmãos maiores são o múon (médio) e o tau (pesado). Não ouvimos falar muito dos membros mais pesados da família porque a formação deles é mais rara no universo, sendo mais pesados, eles são mais difíceis de serem “fabricados”. Neutrinos vêm em três tipos, nós definimos esses tipos através do método de formação deles, porque neutrinos sempre se formam em uma reação que envolve alguém da família do elétron. Os neutrinos que saem de uma reação com o elétron são chamados, por falta de criatividade, de “neutrino do elétron”, sendo os outros “neutrino do múon” e “neutrino do tau”. Retirei do site particlezoo uma representação dessas partículas elementares em pelúcia:

No começo dos anos 2000, os físicos decidiram tentar algo diferente. Eles tentariam captar todos os tipos de neutrino, não apenas o do elétron, como vinham fazendo até então. A experiência parecia fadada ao fracasso, porque o Sol só produz neutrinos do elétron, os demais que apareceriam seriam raros demais, vindos de processos exóticos em estrelas longínquas. Para o espanto da comunidade científica, a quantidade de neutrinos do múon que atinge a Terra é quase igual a dos neutrinos do elétron. Usando a soma de todos os tipos de neutrino, aquelas barras “esperado” e “medido” coincidiam!

Mas como explicar isso? A única forma de explicar foi compreender o fenômeno de oscilação de neutrinos. Lembro que as partículas elementares não são como aquelas pelúcias fofinhas, elas não precisam obedecer às regras da física “convencional” e não o fazem. Um neutrino, quando é produzido em uma reação com um elétron, é um neutrino do elétron, mas só naquele momento. Durante seu “voo” até a Terra, ele não é nem neutrino do elétron, nem do múon, nem do tau, ele é um neutrino. Quando nós o capturamos, ele tem uma certa probabilidade de reagir com um elétron e uma certa probabilidade de reagir com um múon, e nisso damos o nome para ele. Mas note que ele não é nenhuma dessas categorias, mas um estágio intermediário entre elas que, quando medimos, “escolhe” qual estado será.

Isso é bem confuso e analogias são difíceis. Qualquer analogia que explica bem a mecânica quântica está errada, mas vou tentar assim mesmo. O neutrino, nesse sentido, é como um cilindro, mas somos apenas capazes de medir objetos de um jeito estranho: imagine que conseguimos pintar o cilindro com tinta e, em um dado momento, colocá-lo em um papel e medirmos a figura que ele “pinta” com a tinta. Em seguida, tentaríamos entender o que é esse objeto através de nossos conhecimentos de figuras planas. Imagine que o cilindro está girando, rodando no ar de forma aleatória. Quando batemos o cilindro no chão e estudando sua mancha, ela tanto poderá ser retangular (a marca do “lado” do cilindro) quanto poderá ser circular (a marca da base do cilindro), tudo depende da posição em que ele estiver rodando. Os neutrinos agem de forma parecida, eles são uma mistura dos três estados (elétron, múon e tau) e, quando os medimos, eles se manifestam de uma forma na experiência. Porque nossa compreensão do neutrino é apenas o que medimos quando ele é produzido ou aniquilado, damos a ele esses nomes; assim como se só fôssemos capazes de medir a mancha diríamos que o cilindro é um objeto que está no estado círculo e no estado retângulo ao mesmo tempo, “escolhendo” um desses estados quando vamos medir sua marca de tinta.

Com isso, o mistério da variação no ano está resolvido. A probabilidade de encontrar um neutrino no estado elétron ou múon varia de acordo com seu tempo de voo, há pontos de sua trajetória em que ser do elétron é mais provável que ser do múon. Mas a Terra gira em torno do Sol e a distância entre nós e o astro rei varia com o ano (estamos mais próximos do Sol em janeiro e mais afastados em julho), não o suficiente para afetar muito o clima, mas essa diferença na distância dá mais tempo de voo aos neutrinos e afeta suas probabilidades, tornando a repartição elétron-múon diferente em cada momento do ano mas, entre um janeiro e outro, o  comportamento deve ser o mesmo.

Vale notar que os experimentos para medir neutrinos, essa “partícula-fantasma”, acontecem desde os anos 60, e dou destaque especial às experiências de Raymond Davis, prêmio Nobel de 2002 por seus experimentos. Davis transformou uma antiga mina de ouro em South Dakota em um grande detector de neutrinos. A medição era feita usando colisões de neutrinos com átomos de cloro, a mina era necessária para isolar o experimento de raios cósmicos que podiam parecer neutrinos, e todo ele era cercado por água, o que garantiria que só neutrinos atingiriam o cloro. A mina podia ficar bem quente em algumas épocas do ano, por isso coloco aqui uma foto de Davis nadando na água de seu experimento.

Raymond Davis Jr. Nobel da física de 2002.

E isso soluciona o mistério dos neutrinos desaparecidos e abre um capítulo interessante para entender a natureza das partículas elementares e esse tal fenômeno de oscilação. Nem tudo é o que parece, em especial os neutrinos, que são, na verdade, uma mistura de tudo o que deles podemos medir.

Continue lendo

A tal da tese

Rookie

Entreguei o manuscrito de tese na madrugada entre sexta e sábado. Foi um grande alívio, e o fim de uma etapa muito feliz de minha formação. Se tudo correr bem, em outubro serei dotô em física e parto, em novembro, para o departamento de sistemas complexos do Instituto Weizmann, em Israel. Isso significa, acima de tudo, que retomo o blog! E no post de hoje, tento comentar um pouco sobre o que foi minha tese.

É complicado falar do meu trabalho aqui, porque criei esse espaço exatamente para falar de coisas distantes de minha pesquisa quando minha pesquisa não estava muito interessante. Correlações entre políticos, aniversários de jogadores de futebol, Banco Imobiliário, cassino de Parrondo, tudo isso é muito legal, mas não enche barriga e não coloca artigo na mesa. Minha tese parece mais chata, mais estranha, mais fora da realidade, mas é ciência sendo feita e precisa de um pouco de contato com o meio para entender seu propósito, sua razão de ser.

Minha tese, no final das contas, fala de um tipo de partícula, férmions. Provavelmente todas as partículas que você lista na sua cabeça, prótons, nêutrons, elétrons, são férmions. Elas têm uma propriedade fundamental, chamada Princípio de Pauli, que diz que dois férmions não podem ser “idênticos”. Se colocados exatamente no mesmo lugar, eles têm que diferir em alguma coisa. Na ausência de opções, os férmions assumem níveis de energia diferentes. Ou seja, é impossível colocar um bocado de férmions juntos em energia bem baixa, você sempre acaba vendo eles se agrupando com mais energia do que deveriam, apenas para preservar esse princípio de Pauli.

Se você jogar um monte de férmions em um vale, eles naturalmente vão rolar para o fundo do vale. Mas eles não podem ficar todos no fundo do vale, então alguns são obrigados a ficar alguns níveis acima do ponto mais baixo do vale. É como se eles se repelissem, como se não quisessem ficar juntos, respeitando o princípio de Pauli. Minha tese é exatamente sobre esse fenômeno de repulsão, e sobre como essa repulsão afeta as flutuações da quantidade de férmions em uma região do vale.

Pode parecer algo meio artificial, mas não é fácil explicar a motivação do negócio em algumas linhas assim. Esse estudo é importante para entender aspectos de sistemas quânticos como intrincamento em escalas maiores que microscópicas, e até dá para checar experimentalmente.

Você define um pequeno intervalo, uma caixinha, e conta quantos férmions caem naquele intervalo. Esse número flutua, e você pode estudar o quanto ele flutua. É bem legal estudar como essa flutuação aumenta ou diminui quando o tamanho do intervalo aumenta. Digamos que esse intervalo seja $I=[-L,L]$. Quando $L$ é bem pequeno, já era sabido que essas flutuações aumentavam com o logaritmo do tamanho do intervalo, então $\mathrm{Var}(N_L)\propto \log L$, sendo $N_L$ o número de férmions na caixa e $\mathrm{Var}(N_L)$ suas flutuações. Quando o intervalo é muito grande, todos os férmions caem dentro dele e não há mais variação, então para $L$ grande $\mathrm{Var}(N_L)\to 0$. De $\log L$ a zero alguma coisa estranha aconteceu, e minha tese responde, pela primeira vez, o que exatamente aconteceu. Embaixo desse paŕagrafo, coloco o gráfico completo dessa transição!

Variância férmionsBonito, não? Esse gráfico é uma das “descobertas” da minha tese, e fico bem feliz com ele. Temos a função teórica azul, que é bem bonita, temos esse comportamento oscilatório dessa parte cinza que damos um zoom e temos a função de como essa linha azul continua depois disso. Tudo deu bastante trabalho, mas o resultado final me deixou bem feliz.

Não espero que você tenha entendido tudo, nem metade, esse post é mais uma catarse, um desabafo do fim de um período muito divertido, interessante e querido da minha vida. Minha tese de doutorado termina e o pós-doutorado começa. A partir de agora, eu vou virar um pesquisador de verdade, as pessoas até vão achar que sou um especialista no assunto. Quero ver até quando, um mês, um ano, cinco anos?, as pessoas vão acreditar em toda essa mentira de que eu sei o que estou fazendo.

Top na balada

Geek Rookie

No post de hoje, vamos resolver um problema grave, clássico e profundo: como escolher o melhor namorado ou namorada para casar, ou como escolher o melhor garoto ou garota na balada para levar para casa aquela noite. Não são problemas simples, mas, como a maior parte dos dilemas pessoais, usando frieza, crueldade e fechando os olhos para os reais problemas sociais envolvidos, podemos tirar conclusões bem interessantes. No post de hoje, vamos deduzir a estratégia para maximizar suas chances de, em uma noite, levar o melhor parceiro possível para seu quarto mostrar sua coleção de discos do Elvis.

Deixo apenas registrado que se você está buscando referências sérias nesse blog sobre como se dar bem em uma balada, deve estar realmente desesperado. Continuemos.

O problema se apresenta da seguinte forma: você pegará na noite de hoje um número $N$ de pessoas. Dentre essas pessoas, você estabelece um ranking de qualidade, seu objetivo é levar a melhor delas para casa porque, convenhamos, você já passou da idade de ficar só dando beijinho em balada. Você encontra uma pessoa, corteja, afeiçoa-se e tem duas opções: ou escolhe essa para levar para casa, ou rejeita. O problema é claro: você corre o risco de estar rejeitando a melhor dentre as $N$. Supondo que você e a pessoa têm um pingo de dignidade, não poderá voltar atrás nessa decisão! Nessa lógica, qual a melhor estratégia para maximizar suas chances de escolher de fato a melhor dentre as $N$ possíveis?

Se achou as contas a seguir chatas e complicadas, tudo bem, eu entendo; você pode pular para o final do post para descobrir a melhor estratégia.

A natureza do seu dilema é a informação incompleta. Cortejando a pessoa número $n$, você tem apenas o ranking dela em relação às que já viu, não tem a menor ideia de como ela se compara às que virão. A primeira pessoa sempre será a melhor até então (e a pior), não parece uma boa estratégia aceitar a primeira que aparece, porque a noite é longa e promete. Por outro lado, se você encontrar a melhor até então na penúltima pessoa, as chances são baixas de encontrar a melhor de todas na última, desprezar a melhor na penúltima parece também uma estratégia ruim. Entre uma recusa quase certeira da primeira e uma aceitação quase certa da penúltima, deve haver algum ponto intermediário em que a estratégia fica a melhor possível.

Vamos calcular esse ponto e determinar qual a melhor estratégia para o problema. Para isso, vamos primeiro modelizar o problema de forma precisa:

  • Você estima que cortejará $N$ pessoas até o final da noite.
  • Uma vez rejeitando a pessoa, não pode voltar atrás.
  • Seu ganho é 1 se você escolher a melhor dentre as $N$ pessoas e 0 se escolher qualquer outra.
  • Se chegar à última, leva a última. Em outras palavras, se a balada começou a miar e são seis da manhã, você leva para casa a pessoa que sobrou, sinto muito. Nisso, convenhamos que o modelo é bem preciso.

Confesso que o modelo tem um problema, a noção de tudo ou nada, de que seu ganho é zero ainda que você leve a segunda melhor, enquanto, convenhamos, não é algo tão ruim. Vamos imaginar que você é extremamente exigente e sentirá que a noite não valeu a pena porque, levando a segunda melhor, pensará apenas na primeira durante a noite toda.

Para resolver o problema, vamos definir duas variáveis. $X_n(1)$ é o seu ganho esperado se na $n$-ésima pessoa entrevistada você encontrar a melhor até então; $X_n(0)$ é seu ganho esperado caso a $n$-ésima entrevistada não seja a melhor vista até então. Em nosso modelo, claro, $X_n(0)=0$, você não espera ganhar nada levando alguém para casa que nem é o melhor dos primeiros $n$ que você já viu, vale mais tentar outras pessoas e correr o risco de encontrar o melhor nos seguintes. Se você encontrar na $n$-ésima a melhor até então, o seu ganho é a chance de a melhor pessoa estar entre as $n$ primeiras. Como a ordem em que você pega as pessoas é aleatória, essa chance é de $n/N$. Assim, $X_n(0) = 0$ e $X_n(1)=n/N$.

Em seguida, definimos o ganho esperado se descartamos a pessoa $n-1$ e passamos para a $n$, chamamos essa variável de $Y_n$. O seu ganho esperado descartando a pessoa $n-1$ depende do que você vai fazer encontrando a pessoa $n$. Se você decidir ficar com a pessoa $n$, seu ganho esperado saltando $n-1$ é o ganho esperado de $n$, ou seja, $X_{n}$. Se você decide saltar também a $n$, então seu ganho esperado será $Y_{n+1}$. Você vai tomar essa decisão baseando-se nesses valores, você deve se perguntar “Quem é maior: $X_{n}$ ou o valor médio de $Y_{n+1}$?”. Comparando esses dois valores, você sabe qual será seu comportamento no próxima pessoa. A fórmula para $Y_n$ será, portanto, definida de forma recursiva:

\[ Y_n = \max \{X_{n},\langle Y_{n+1} \rangle \} \]

Onde $\langle x \rangle$ é a média de $x$, escrita desse jeito com o único objetivo de fazer os estatísticos lendo esse texto terem um pequeno derrame de nervoso.

Esse cálculo recursivo encorpora bem o dilema descrito acima. Perto das últimas escolhas, $X_n$ fica grande se você encontra a melhor pessoa até então e $Y_n$ fica pequeno. No início, contudo, $X_n$ é pequeno e vale mais apostar no futuro do que estacionar no começo. Para que a fórmula recursiva faça sentido, ela precisa ter um ponto de partida. Nisso usamos a última hipótese, o ganho esperado pulando a última casa é o mesmo que o da última casa, ou seja, pular a última não adianta, você leva a última opção se chegar nela: $X_N=Y_N$. Usando a fórmula acima, e com algum malabarismo que não cabe aqui, você consegue deduzir a expressão de $Y_n$:

\[ Y_n = \frac{n}{N}\sum_{k=n}^{N-1} \frac{1}{k} \]

Assim, começa a valer a pena escolher uma pessoa a partir do momento em que $X_n > Y_n$, ou seja, quando estamos na $k$-ésima pessoa e $1>\sum_{k=n}^{N-1} \frac{1}{k}$. A partir desse valor, seu ganho esperado ficando com a melhor pessoa encontrada até agora é maior que o ganho esperado no futuro pulando essa pessoa; logo, é estatisticamente mais interessante levar essa para casa.

Claro que encontrar esse valor de $k$ não é simples, tem que somar fração e isso é chato, tem umas partes que envolvem MMC e isso me dá fadiga. Melhor que somar essas frações seria usar uma boa aproximação para essa soma, que eu conheço bem, é a série harmônica $\sum_k \frac{1}{k}$. Como você deve se lembrar de sua infância, essa soma de 0 a $n$ pode ser aproximada, para grandes valores de $n$, por $\ln n $. Assim, a soma de $n$ até $N-1$ deve ser $\ln (N-1)-\ln(n) = \ln\left(\frac{N-1}{n}\right)$. Como usamos a hipótese de valores grandes de $N$, podemos escrever isso como $\ln\left(\frac{N}{n}\right)$. Assim, devemos parar de pular candidatos quando encontramos o melhor a partir do $n$-ésimo, sendo $n$ o número tal que $\ln\left(\frac{N}{n}\right)<1$, ou seja, $n = \frac{N}{e}$, onde $e$ é o número de Euler $e=2,71828\ldots $.

Percebemos que essa conta nos diz para pularmos os primeiros $\frac{N}{e}$ pretendentes e, após esses, ficar com o primeiro que for melhor que todos os anteriores. Note que $\frac{1}{e}\approx 0.37$. Em outras palavras, a estratégia optimal para encontrar o melhor pretendente da balada para levar para casa é a seguinte: estabeleça um número de pessoas para pegar na balada. Rejeite necessariamente os primeiros 37% delas. Cole na primeira pessoa que aparecer que for melhor que todas as anteriores e leve esta para casa.

O mesmo vale para namorados ou namoradas durante sua juventude. Se quer maximizar suas chances de casar com a melhor opção, estabeleça uma estimativa do número de pessoas com que vai namorar durante sua vida, termine com os primeiros 37% e case com a primeira que aparecer que for melhor que todas as anteriores.

Vamos ver quão bem isso funciona. Para isso, vamos contar a história de Pedro.

Pedro é um garoto que costuma ir a três baladas diferentes. Ele está atrás de garotas, e quer levar a melhor delas para casa. As baladas são diferentes, e a qualidade dos frequentadores tem uma distribuição variada para cada balada. Vejamos quais são elas, usando descrições do site cidadedesaopaulo.com:

  1.  A The History, localizada na Vila Olímpia, tem piso que muda de cor e agrada tanto àqueles que já curtiram os hits dos tempos da brilhantina quanto às novas gerações. Possui um público pouco variado e previsível, a qualidade dos frequentadores será dada por uma distribuição gaussiana.
  2. Localizado no Baixo Augusta, o Beco 203 é reduto dos moderninhos e alternativos que curtem um rock mais soft e festas em que o som é tocado através de fones de ouvido. Atraindo um público mais variado, a distribuição da qualidade de seus frequentadores será dada pela distribuição uniforme.
  3. A Lab, localizada na Rua Augusta, possui em sua programação dias dedicados à música eletrônica. Com um público ligeiramente variado, mas não muito, a qualidade de seus frequentadores está mais concentrada nas piores notas que nas melhores e será modelada pela distribuição exponencial.

Pedro é uma máquina e se dispõe inicialmente a pegar 100 garotas. Ele vai vezes o suficiente às baladas para poder testar diferentes estratégias, e está disposto a tentar todas as possibilidades. A experiência é a seguinte: um dia ele leva a primeira que encontrar para casa. No dia seguinte, ele rejeita a primeira e leva a primeira melhor que as anteriores para casa. Em seguida, rejeita as duas primeiras e leva a primeira melhor que as anteriores que encontrar para casa. Fazendo isso até a centésima vezes o suficiente, ele consegue estimar a taxa de sucesso de cada estratégia. Uma noite é bem sucedida se a que ele levou para casa era a melhor dentre as 100 possíveis. São bastantes opções, vejamos qual a taxa de sucesso de cada uma das estratégias.

top_na_baladaÉ facil acreditar que o valor ideal para a estratégia é 37, ou seja, rejeitar os primeiros 37% e aceitar a primeira opção melhor que todas as anteriores. Note como esse valor independe de como a qualidade das pretendentes está distribuída, seja uniforme ou extremamente concentrada em torno da média, a eficácia de cada estratégia é a mesma.

Falando um pouco mais sério, esse pequeno problema estatístico revela uma matemática internalizada em diversas decisões em nosso cotidiano, a ideia de “assentar”, de escolher uma opção para ser a definitiva. Quando você é jovem, seus namoros são em média curtos, explosivos, cheios de emoções e problemas, a idade vai trazendo mais estabilidade e em um ponto da vida você encontra aquela que acha ser a pessoa certa. Você experimentou o suficiente para identificar uma pessoa melhor que as anteriores e entender que a melhor estratégia é juntar os chinelos com esta; porque, conhecendo as alternativas, você prefere não arriscar e entende que é pouco provável encontrar algo tão melhor nas futuras opções. Casamento é sobre amor, sobre almas gêmeas, some encontrar a pessoa prometida e amada; mas quando você começa a beirar os trinta anos a realidade bate na porta e a estatística, aliada a sua experiência, fala mais alto.

E se você me perguntar se sigo essa estratégia, não vou poder responder. O modelo tem várias hipóteses, várias delas são boas, a maior parte se aplica a minha situação, mas um grande valor de $N$, certamente, não é o caso.