As condições de Tchebychev

Geek

O post de hoje não é nada longo, mas um resultado que já me ajudou muitas vezes e nunca o vi em outro lugar além de no livro do Demidovich. E como todo o resto desse livro, ele não demonstra, então nunca vi uma justificativa para uma palavra específica daquele resultado, que desde sempre me atormenta. Um dos motivos de não ter encontrado, acho, foi o fato de Tchebychev ser escrito cada vez com uma ortografia diferente, de acordo com os caprichos do autor ou editor, o que escrevo é respeitando a grafia da tradução que tive do Demidovich.

Aos que não conhecem o livro, ele é um monstro russo de mais de mil exercícios espalhados pelas matérias de cálculo, é como uma tábua de multiplicação para o cálculo diferencial, um excelente treinamento de Kumon a quem quer ficar rápido nessas coisas. Ainda, nele encontrei um resultado simples e bem interessante, que hoje compartilho convosco.

Integrando funções na mão, sempre podemos nos deparar com a possibilidade de estar tentando realizar o impossível: encontrar uma primitiva a uma função que não possui primitiva. Poucos cursos de cálculos dão a devida atenção a essa diferença: primitivização e integração não são a mesma coisa. Enquanto é famoso o fato de que nem toda função integrável possua primitiva ($e^{-x^2}$ é o exemplo mais clássico), encontrar uma função F que derivada dê f (o processo de primitivização) não garante que a função seja integrável, apesar dos rumores. Esse exemplo no link é um pouco trabalhoso, e bem poderoso, é uma função com primitiva que não é integrável em lugar nenhum, um contra-exemplo bem interessante.

Mas não consigo me lembrar de nenhum teorema que consiga me dizer quando uma função possui ou não primitiva elementar, ou seja, quando vale a pena sair tentando transformações, integrações por partes ou separações de polinômios em uma função que não me dá chance de integrar, que não possui uma primitiva suficientemente simples para ser encontrada com minhas técnicas baratas de cálculo I. E as condições de Tchebychev são o único teorema desse tipo que já vi:

Condições de Tchebychev: Seja a integral:

\[\int x^m(a+bx^n)^pdx\]

Então esta integral pode ser expressa por meio de uma combinação finita de funções elementares somente nos seguintes casos:

  1. Quando $p$ é inteiro.
  2. Quando $\frac{m+1}{n}$ é um número inteiro. Nesse caso, use a substituição $a+bx^n = y^s$, onde $s$ é o denominador de $p$.
  3. Quando $ \frac{m+1}{n}+p$ é um número inteiro. Nesse caso, use a substituição $ ax^{-n}+b = y^s$, onde $s$ é o denominador de $ p$.

A palavra que me intriga nesse resultado é o somente, pois nunca vi teoremas ou lemas com manobras para provar que uma função não possui primitiva elementar, mas isso provavelmente é ignorância minha. Apesar de não conhecer as engrenagens desse teorema, o resultado é bem útil, e salvou-me a vida vez ou outra, possuindo um ar de mistério que, apesar de me incomodar, ainda me encanta um pouco.

Poeira das estrelas

Rookie

Perguntaram em uma entrevista ao grande astrofísico Neil deGrasse Tyson qual ele julgava o fato mais fascinante da ciência. Como bom físico, ele podia escolher de uma vasta gama de coisas impressionantes sobre a natureza e o universo, e decidiu pela grande jóia da astrofísica: a nucleossíntese dos átomos pesados. Esse nome parece impressionante e difícil, mas não conheço nenhum outro fato que seja tão impressionante, belo, poético e impactante quanto descobrir de onde vieram os elementos que compõem cada um de nós e o que nos cerca.

Em termos apenas científicos, não seria desonesto responder ao “de onde viemos” com a palavra “Big Bang”. Isso é verdade, mas é também uma resposta incompleta, o Big Bang produziu, no máximo, átomos de hidrogênio para todo o lado, e somos compostos de muito mais do que isso. A formação dos átomos de hidrogênio no Big Bang é um assunto também fascinante, a maneira como as reações químicas competem com a expansão do universo nesse período primordial é para ser assistida com pipoca, mas fica para outro post. Vamos entender como chegamos dos átomos de hidrogênio, o número 1, aos de urânio, número 92, passando por todos os que conhecemos da tabela periódica (exceto o tecnécio, número 43, que é instável, e isso é outro fato legal sobre a ciência).

Tudo começa há muito tempo atrás, em uma galáxia muito, muito distante, o hidrogênio que por lá havia se concentrou mais do que devia. Gases andam de um lado para o outro no universo, eles se atraem por força gravitacional e se dispersam pelo fenômeno normal de dispersão, como o cheiro de um perfume se dispersa em uma sala quando aberto o frasco. Mas se a concentração é forte o suficiente, sua gravidade vence essa dispersão e ele começa a se acumular, inicia o processo de formação de uma estrela.

O destino dessa estrela dependerá da quantidade de hidrogênio inicial, a menos de patologias (caso ela absorva mais gente, enfim, o espaço é uma selva, muita coisa pode acontecer). Vou descrever o processo de uma estrela bem massiva. O Sol não se enquadra nesse processo, ele irá parar em algum estágio intermediário para seguir algum outro destino, o que descrevo é a sina das estrelas massivas.

Aquele hidrogênio todo começa a se acumular, e o centro dele começa a ganhar pressão, um processo parecido a você apertar uma seringa cheia de ar e perceber que o que há dentro dela atinge uma tal pressão que você não consegue mais apertar. Com a estrela, esse aumento de pressão vem com aumento de temperatura, porque em matéria de volume ela não tem tanta escolha. Isso é resultado daquele $PV = nRT$ do seu colégio, com $P$ alto, $T$ tem que também ser alto. Em termos microscópicos, as partículas do interior da estrela tomam porrada (pressão gravitacional) de todas as que estão fora, elas acabam ganhando velocidade (temperatura) e dão porrada de volta, nada mais justo.

O problema é que a estrela brilha (na verdade, tudo brilha, eu e você brilhamos, mas isso fica para outro post), e esse brilho a faz perder energia. Em termos microscópicos, o hidrogênio em torno dela consegue ir mais perto do centro em algum momento (o que seria uma “queda” do hidrogênio, ele ganha velocidade), ele brilha, manda luz e perde velocidade, então não consegue voltar para a altura que estava. Toda a estrela, nesse processo, fica mais junta, e a pressão gravitacional no centro aumenta, aquele hidrogênio tem que ficar ainda mais quente para segurar todo o entorno da estrela que está mais próximo e batendo com mais vontade.

Temperatura é a velocidade média das partículas. Aquele hidrogênio do centro está tão rápido que, em uma manobra bem colocada, colide de frente com outro hidrogênio e eles formam hélio. Mas não é uma reação amigável, o choque causa uma liberação de energia muito grande. Em outras palavras, o hélio, quando se forma, está em alta velocidade de vibração e bate nos outros hidrogênios, aumentando a temperatura do local e segurando a pressão do resto da estrela. Esse processo acontece com diversos átomos de hidrogênio e logo o centro da estrela é composto de hélio, envolto em uma estrela toda de hidrogênio.

O hélio deve esquentar cada vez mais, para segurar aquela pressão sempre aumentando, pelo mesmo problema de antes. Em um momento, a temperatura do hélio é tão alta que ele pega outro de jeito e forma berílio, que rapidamente vai encontrar outro hélio e formar carbono. O berílio não aparece muito porque ele facilmente vira carbono, mas o carbono dificilmente vira outra coisa. Teremos, com isso, um núcleo de carbono envolto em uma camada de hélio rodeada de hidrogênio, nossa estrela será uma cebola de elementos, com o centro mais pesado que as bordas.

E assim continuaremos, com um centro sempre aquecendo e novos elementos colidindo e se formando. Esse ciclo continua até a formação do ferro (na verdade, acho que vai até o níquel, mas ele rapidamente vira ferro) e teremos uma estrela gigantesca em diversas camadas de elementos como uma cebola, cuja figura fica mais ou menos assim:

Mas se enganam os que acham que nossa fábrica de átomos continuará esse processo até o urânio. A partir do ferro, a fusão de dois elementos não libera mais energia; não há aquela história de colidir dois e aumentar a velocidade. Aos que se lembram da química, dizemos que a partir do ferro a reação de fusão torna-se endotérmica. Com isso, a estrela para por aí, com um grande e crescente núcleo de ferro.

Mas não somente há outros elementos na natureza como você é feito de alguns deles (o zinco e o iodo, por exemplo). Podemos, contudo, já perceber que esse mecanismo explica a grande abundância de elementos mais leves que o ferro na natureza, inclusive a abundância de ferro, e a raridade dos mais pesados, como o ouro, a prata e a platina. O sistema de produção dos elementos mais pesados era um mistério, até proporem que esses elementos são formados na morte das estrelas.

Esse processo não continuaria infinitamente. A temperatura no núcleo de ferro chegaria a valores tão altos que algumas reações impensáveis na nossa realidade começariam a acontecer, uma delas é a união de elétrons com prótons para formar nêutrons. Não é muito famoso o fato de nêutrons não serem caras que, sozinhos, são estáveis, eles levam em média 15 minutos para virarem um próton e um elétron. Mas se a temperatura está muito alta, o processo inverso pode acontecer, e acontece. O problema é que quem segurava a pressão da estrela toda eram os elétrons, eles sumindo, o núcleo colapsa: todo aquele núcleo de ferro é completamente vencido por sua gravidade e se comprime em uma densidade tão impressionante que você conseguiria enfiar uma caminhote em um dedal, ou o Sol em uma bola de 10Km. A única coisa que impede o núcleo de se contrair ainda mais com sua gravidade é a força forte, em outras palavras, a densidade dessa massa é a mesma da densidade do núcleo de um átomo: a maior que é possível atingir.

Então temos isso: um núcleo comprimido ao extremo pela força gravitacional que vai puxar todo o resto da estrela para si. Esse resto, as outras camadas da cebola, será puxado com extrema violência e, assim que a primeira camada colide com o centro, ela é rebatida com praticamente a mesma velocidade, porque o núcleo não pode se comprimir mais e a única opção é ricochetear o que o atinge. Mas essa primeira camada agora está voltando enquanto todas as outras estão vindo, elas irão se colidir possuindo tanto massa quanto velocidades fora de qualquer coisa que possamos imaginar. Tais choques serão tão fortes que poderemos formar todos os demais elementos da tabela periódica depois do ferro, todos resultantes da explosão de uma estrela que, nesse momento, está se tornando uma estrela de nêutrons (apenas aquele núcleo super denso vai sobrar, o resto explodiu e foi embora), essa explosão é conhecida como supernova.

Esse processo todo não é rápido. A estrela passa a maior parte do tempo “queimando” hidrogênio para fabricar hélio, menos tempo passando do hélio para o carbono e assim por diante, o tempo gasto em cada processo depende do tamanho dos átomos, sendo o que leva aos átomos mais pesados mais rápido. E também vale lembrar que o que descrevi é apenas um destino possível da estrela, a maneira como cada uma pode morrer é bem variada, depende da massa e de quem está na vizinhança.

A explosão de uma supernova libera muita matéria e, sendo ela dificilmente isolada, acaba se tornando ingrediente para a formação de novas estrelas. Não por menos, há regiões do espaço conhecidas como “berçário de estrelas”, locais de grande acúmulo de matéria onde a densidade limite é atingida com frequência e estrelas aparecem.

Se essa explosão acontece próxima à Terra, podemos ver com clareza o aparecimento de uma estrela muito brilhante durante três meses. Diversos povos na antiguidade relataram essas estrelas, sua luminosidade era tão intensa que uma noite de lua nova ainda era visível pela luz que essa explosão emitia. A última supernova próxima a Terra foi em 1986, e esses eventos são raros, é difícil haver mais que uma próxima a cada 400 anos.

No entanto, todos os elementos pesados que conhecemos, o ouro, a prata, a platina, o chumbo, o zinco do seu corpo, o cobre, o tungstênio que compõe o filamento de sua lâmpada, o mercúrio do termômetro, o iodo do seu sal, todos eles se formaram da explosão de uma estrela. Os mais leves que o ferro se formaram enquanto ela morria e são apenas liberados nessa explosão. Nisso, as estrelas são fábricas de átomos pesados, o que permite nosso universo de ser composto de mais que hidrogênio, e o que permite nossa existência, compostos desses átomos variados, uma intrincada rede de reações eletroquímicas e, em última análise, poeira das estrelas.

Cabras, Ferraris e probabilidades

Rookie

Ricardo: Hoje contaremos com um post de um convidado especial, e mais entendido que eu no assunto. Pedro Natal é um gaúcho iteano que atravessou comigo a Polytechnique e seguiu para ser mestre em matemática aplicada pela Universidade de Paris. Tem por vícios chá inglês, café forte e propor problemas matemáticos à turma quando nos reunimos em algum KFC. Sem mais, entrego-lhes uma leve discussão sobre cabras e probabilidades.


Embora o título logo acima possa levar a crer que discorreremos sobre uma peça de teatro do absurdo, o assunto principal deste texto é matemática. Mais especificamente: cabras, Ferraris e programas de auditório; não precisamos de mais que um conhecimento básico desses três itens para seguirmos. E, convenhamos, o que há de melhor para aguçar nossos sentidos probabilísticos do que histórias envolvendo Sílvio Santos, ruminantes e carros de corrida?

Suponha que você esteja num programa de auditório estilo Sílvio Santos, e que você deva escolher uma dentre três portas. Uma delas esconde uma Ferrari; as outras duas, simples cabras. Você escolhe, digamos, a de número 1. Nesse momento, antes de revelar o resultado da sua escolha, Sívio Santos $-$ que sabe onde está a Ferrari $-$ abre uma das outras duas portas e revela uma cabra. Ele então pergunta: “Você muda a sua escolha ou continua com a número 1?”.  Em outras palavras, existe alguma vantagem em trocar de porta?

Se essa é a primeira vez que você se depara com esse problema, eu sugiro honestamente que você aproveite para pensar nele antes de ler o próximo parágrafo. A resposta correta é mais interessante do que parece e está longe de ser trivial.

É possível que você tenha chegado à seguinte conclusão: como só restam duas portas, cada uma delas tem 1/2 de chance de conter a Ferrari, e logo não há vantagem em trocar de porta. Infelizmente, esse raciocínio não está correto. Sim, existe uma vantagem em trocar de porta. A probabilidade que a porta inicial contenha a Ferrari é 1/3, ou seja, a probabilidade de ganhar trocando de porta é de 2/3. Por quê? A maneira mais fácil de entendê-lo é com o seguinte desenho (que eu não tive vergonha de roubar da Wikipédia):

A figura da esquerda mostra que a probabilidade de você ter acertado na sua primeira escolha é de 1/3, ou seja, a probabilidade que a Ferrari esteja em uma das outras duas portas é de 2/3. Quando Sílvio revela a cabra, ele não altera as probabilidades calculadas anteriormente! Assim, como vemos na figura da direita, a probabilidade de encontrar a Ferrari trocando de porta é de 2/3.

Esse famosíssimo problema, conhecido como Problema de Monty Hall, gerou muita confusão e discussão nos EUA há pouco mais de 20 anos. Ele foi publicado por uma colunista chamada Marylin vos Savant na revista Parade em 1990, e desencadeou uma enxurrada de respostas furiosas da parte dos leitores que não aceitavam que a resposta fosse diferente de 1/2 (reza a lenda que, das 10 mil reclamações recebidas, mais de mil foram redigidas por pessoas com um PhD).

Mas o que há de errado afinal com o raciocínio que leva à conclusão de que não há vantagem em trocar de porta? Um pequeno detalhe: Sílvio Santos sabe o que há atrás das portas. O raciocínio seria correto se a porta a ser revelada fosse escolhida ao acaso, mas ela não é! Sílvio Santos nunca vai revelar a Ferrari para o jogador, e é essa assimetria que gera a assimetria probabilística do problema,

Como observado pelo (meu grande amigo) dono do blog Todas as configurações possíveis, existe ainda uma outra maneira intuitiva de se compreender a vantagem em mudar de escolha: se houvesse 1000 portas, você escolhesse uma, e Sílvio abrisse 998, revelando cabras em todas elas, você trocaria? Qual é, honestamente, a chance de você ter acertado de primeira?

Ao leitor que não ficou convencido com esses argumentos intuitivos: uma prova mais formal (mas menos astuciosa) envolvendo a famigerada fórmula de probabilidade condicional existe. Não por acaso, é exatamente o conceito de probabilidade condicional que está por trás da confusão que o Problema de Monty Hall gera na nossa intuição.

As histórias divertidas envolvendo probabilidade não acabam por aí. Num futuro artigo, que deve ser matematicamente (um pouquinho) mais complicado, falaremos sobre as peculiaridades da mistura de álcool, probabilidades condicionais, e cadeias de Markov!

Epidemias, parte I

Hardcore

Trombei esses dias com um artigo de 2001 sobre propagação de vírus em humanos e sua comparação a vírus de internet. O estudo da disseminação de infecções é velho na física, diversos modelos de epidemias são estudados e muitos com resultados razoavelmente bons. Um ponto comum em modelos estudados pela epidemiologia é a noção de threshold, ou seja, o valor mínimo de eficiência que uma infecção deve ter para conseguir se propagar. Novamente, esse é um post hardcore, os corajosos sigam-me, vamos ver com cuidado como isso funciona.

Esse post ficou grande, então parti em dois. Nesse primeiro, comento o modelo de propagação de vírus em seres humanos, no próximo trato da internet.

Representamos indivíduos como pontos e o contato entre indivíduos como linhas em um grande grafo. Passamos a nos perguntar qual seria um modelo eficaz de grafo para modelizar as relações humanas. Certamente não conhecemos pessoas aleatoriamente na rua, costumamos conhecer melhor nossos vizinhos, familiares e colegas de trabalho, que por sua vez conhecem-se. Um jeito legal de modelizar essa ideia, que chamamos de grafo de small world, é tomar um anel de pontos, sendo cada ponto ligado a seus $ m$ vizinhos mais próximos. Em seguida, passamos “em revista” essas conexões da seguinte forma: cada ponto terá uma probabilidade $ p$ de desfazer uma conexão com um vizinho seu no sentido horário e associá-la a algum outro ponto aleatoriamente. A ideia do sentido horário é apenas para evitar mexer na mesma conexão duas vezes. Se $ p=1$, essa revista resulta em um grafo em forma de anel com conexões completamente aleatórias. Se $ p=0$, o grafo continuará no modelo do conhecimento apenas da vizinhança, mas, se $ p$ é pequeno, o grafo tornar-se-á um modelo muito próximo do que queremos: vizinhos possuem uma chance maior de se conhecerem do que conhecerem alguém do outro lado do grafo, mas de vez em quando algum vizinho seu conhece alguém lá longe, o que é bem coerente com a realidade e até permite aquelas coincidências do tipo “hoje meu avô almoçou com o pai de um professor meu”.

O resultado está bem representado nessa figura, onde os pontos são inicialmente ligados a seus $ 2m$ vizinhos mais próximos, com $ m=2$. É o famoso modelo de Watts-Strogatz, ou modelo de small-world:

Podemos, com esse modelo bonitinho, estudar a propagação de infecções entre seres humanos. Imaginemos um vírus que, a cada contato entre são e infectado, tenha uma probabilidade $ nu$ de contágio e, a cada “turno”, tenha uma probabilidade $ \delta$ de cura de um infectado. A chance de um ponto possuir $ k$ vínculos é $ P(k)= \frac{1}{\langle k\rangle}e^{-k/\langle k\rangle}$ nesse modelo, e $ \langle k\rangle=2m$. A equação estocástica dessa criança não é bonita, então vamos usar um mean field, calcular o que vai acontecer com a densidade média de infectados supondo que todos os pontos possuem o mesmo número de conexões, $ 2m$, naturalmente, e que todos estão ligados a um número de infectados igual ao valor médio de infectados, essas são as características de uma abordagem de campo médio. A densidade total de infectados, denotada $ \rho_t$ por ser uma função do tempo, é apenas o número total de infectados dividido pelo número total de pessoas. Diremos que a variação na densidade de infectados $ \rho_t$ (a fração da população infectada naquela “rodada”), que toma valores entre 0 e 1, perde a cada “rodada” o equivalente a $ \delta\rho_t$ (os que se curaram) e ganha o equivalente ao contato são-infectado, que é $ nu\langle k\rangle\rho_t(1-\rho_t)$, ou seja, chance de um contato ser são-infectado $ \rho_t(1-\rho_t)$ multiplicada pelo número médio de contatos $ \langle k\rangle$ e pela chance de esse contato transmitir a infecção $ \nu$. Dividindo a equação toda por $ \delta$ e sem precisar ir muito além de uma reparametrização no tempo, podemos escrever:

\[\frac{d}{dt}\rho_t=-\rho_t+\lambda\langle k\rangle\rho_t(1-\rho_t).\]

Com $ \lambda= \frac{\nu}{\delta}$ o valor que interessa para medir a eficácia de uma infecção. E essa equação, ainda que seja apenas uma teoria de campo médio, já nos dá bastante informação sobre o que está acontecendo. Você até pode pedir para o Wolfram Alpha resolver essa para você, eu não faria diferente, mas vale mais estudar algumas propriedades na mão. Chamamos densidade de persistência o valor de $ rho_t$ para o qual sua derivada temporal é zero. Se ela não é nula, temos uma infecção persistente em uma fração da população. Igualando a equação acima a zero, percebemos duas respostas possíveis: ou $ rho_t = 0$, ou $ \rho_t=1- \frac{1}{\lambda\langle k\rangle}$. Como a densidade de infectados não pode ser menor que 0, naturalmente, descobrimos que, se $ \lambda < \frac{1}{\langle k\rangle}$, então a única solução possível é $ \rho_t=0$, pois a segunda solução fica absurda. Mas, se a infecção é mais eficaz que o threshold $ \frac{1}{\langle k\rangle}$, teremos um crescimento da densidade de persistência que tende a 1 quando $ \lambda$ se aproxima do infinito.

Densidade de persistência com m=2.

E fica claro que o threshold, dependendo do inverso do número médio de contatos, que nesse modelo é proporcional ao número de vizinhos, nos dá uma informação esperada: quanto maior o número de vizinhos (contatos), menos eficaz uma doença deve ser para se propagar. Se uma doença é bem eficaz, podemos reduzir seu impacto com uma diminuição nos vizinhos, se está com gripe, não saia de casa.

Esse modelo é bem coerente com diversas observações de epidemias simples em populações. Por esse mecanismo de small-world, apenas doenças suficientemente poderosas, com eficácia $ \lambda$ maior que um determinado limite, podem se propagar pela população, possuem vida no longo prazo. A mudança de fase ocorre no threshold $ \lambda^\star= \frac{1}{\langle k\rangle}$ que, no gráfico acima, ocorre em $ \lambda = 0,25$. O próximo passo nesse modelo seria estudar um grafo em que pessoas podem morrer, nascer, tornar-se imunes, tomarem vacinas ou tornarem-se mais suscetíveis a doenças com o tempo.

Tudo isso é muito interessante, mas não consegue explicar a propagação de vírus na internet. Em um próximo post, veremos que, na internet, small-world não pode ser aplicado (afinal, todos conhecem o Google ou o Facebook) e a própria noção de threshold, por um fenômeno estatístico fascinante, desaparece.

Prova surpresa

Geek Hardcore Rookie

O post de hoje não é muito informativo, é mais perturbador, um probleminha de lógica para não deixar você dormir.

Um professor chega à aula e avisa sua classe que aplicará, no mês de abril, uma prova surpresa. Um aluno, que futuramente se tornaria matemático na área de lógica, pergunta o que o professor entende por surpresa. Estranhando a pergunta, o professor responde que uma prova surpresa é uma prova tal que, no início de cada dia do mês de abril, os alunos não podem deduzir ou saber que a prova será aplicada naquele dia. Triunfante, o aluno conclui que não haverá prova nenhuma, pois:

– Se a prova não for aplicada até o 30 de abril, então ela terá que necessariamente ser nesse dia e, no começo do dia, já não será surpresa. Então o 30 de abril não pode ser a data da prova.

– Se a prova não for aplicada até o 29 de abril, então ela terá que ser necessariamente nesse dia, pois o 30 está excluído. Mas, assim sendo, ela não será uma surpresa, então o dia 29 não pode ser o dia da prova.

– Se a prova não for aplicada até o 28 de abril, então ela terá que ser necessariamente nesse dia, pois o 30 e o 29 estão excluídos. Mas, assim sendo, ela não será uma surpresa, então o dia 28 não pode ser o dia da prova. E assim por diante, ele exclui todos os dias.

No dia 12, ele recebe a prova. Onde ele errou?