Será que todo número existe?


Vemos na escola que, quando elevamos o número √2 ao quadrado (isto é, quando multiplicamos √2 por si mesmo), obtemos 2. Por muito tempo os matemáticos se perguntaram se números como √2 de fato existem, mas não acharam a resposta. O que fizeram? Inventaram uma resposta que não é bem uma resposta e seguiram em frente, felizes da vida, fazendo matemática.


{1}/ Uma questão de definir bem

O professor (vamos chamá-lo de Moisés) entra na classe, põe um grande rolo de papel sobre a mesa, tira um rolo de fita crepe do bolso do jaleco branco e também o põe sobre a mesa, deseja um bom dia à turma, e por fim desenha na lousa uma fórmula simples:

x2 = 2

Vira-se para a classe e pergunta:

“Pessoal, quanto vale x?”

Um dos alunos responde, meio na dúvida:

“Raiz de dois.”

“É o que eu esperava ouvir”, diz Moisés. Ele se vira para a lousa de novo e desenha o símbolo de raiz de dois: √2. “Como é que vocês sabem que esse número existe?”

Vários alunos dão alguma versão das respostas mais comuns: existe porque o professor disse que existe; existe porque a calculadora diz que existe; existe porque é justamente o número que, quando multiplicado por si mesmo, dá 2; existe porque, se não existisse, como resolver a equação da lousa?

“Certo. O símbolo √2 denota um número positivo x que, quando multiplicado por si mesmo, resulta em 2. Por favor, não se esqueçam: –√2 também é uma raiz da equação x2 = 2, pois (–√2)2 também é igual a 2. Mas, na discussão de hoje, para simplificar, vamos conversar sobre números não negativos.”

Desenha na lousa o que acabou de dizer, para que ele e a classe falem a mesma língua.

“Vou usar umas horas desta manhã para lhes dizer que essa afirmação é ex-tra-or-di-ná-ria [Moisés marca cada sílaba da palavra com o punho direito indo para cima e para baixo]. Até hoje ela contém mistérios!”

Sanduíche de racionais. Numa aula anterior, a turma já tinha visto a prova de que √2 é um número irracional, isto é, que não existem dois inteiros positivos c e d tais que c/d = √2. Então Moisés mostra à classe como consegue achar as casas decimais do número x. Primeiro, mostra que 12 = 1 e que 22 = 4.

“O número x, portanto, é maior do que um e menor do que dois.”

Pede a ajuda de um dos alunos, que tem uma calculadora científica, e vai usando esse método para montar uma tabela na lousa, na qual os alunos veem como o valor de x vai sendo ensanduichado entre os valores de a, sempre menor que x, e os valores de b, sempre maior que x.

a

a2

axb

b

b2

1,4

1,96

x 1,4

1,5

2,25

1,41

1,9881

x 1,41

1,42

2,0164

1,414

1,999396

x 1,414

1,415

2,002225

1,4142

1,99996164

x 1,4142

1,4143

2,00024449

1,41421

1,9999899241

x 1,41421

1,41422

2,0000182084

1,414213

1,999998409369

x 1,414213

1,414214

2,000001237796

1,4142135

1,99999982358225

x 1,4142135

1,4142136

2,00000010642496

Os alunos entendem que, se 1,41 ao quadrado é menor do que 2, mas 1,42 é maior, então x está entre 1,41 e 1,42; se 1,414 ao quadrado é menor, mas 1,415 é maior, x está entre 1,414 e 1,415. E assim por diante. Moisés os ajuda a ver que podem realizar esse processo indefinidamente.

“Vocês veem que o processo é bem mecânico?”, pergunta Moisés à classe. “Veem que podemos obter a expansão decimal de x com 20 algarismos, ou com 500, ou com 5 bilhões?”

Mostra à classe que, seguindo o método, os números a e b vão ficando cada vez mais iguais, isto é, a diferença entre eles ficando cada vez menor. Da mesma forma, quanto mais casas decimais o estudante obtém, mais a2 se aproxima de 2 pela esquerda, e mais b2 também se aproxima de 2, só que pela direita.

“Parece razoável dizer que esse número, raiz de dois, existe? Parece razoável dizer que, quando elevamos a raiz de dois ao quadrado, obtemos dois?”

Todo mundo diz que sim, cada um a seu modo, uns com “Massa!”, uns com grunhidos, uns olhando para a lousa fixamente e em silêncio.

“Agora, notem uma coisa interessante. Quando usamos a = 1,4, não estamos lidando com um número irracional, mas com um número racional. Quando usamos b = 1,5, é a mesma coisa.”

Desenha na lousa o que acabou de dizer.

Moisés pede de novo a ajuda do aluno com a calculadora científica; ela é do tipo que, quando o usuário digita um número decimal, ela devolve a fração geratriz. O professor, o aluno e a calculadora se juntam para desenhar na lousa uma tabela mais completa.

a

x

b

1,4

1,41

1,414

√2

1,415

1,42

1,5

7/5

141/100

707/500

√2

283/200

71/50

3/2

“Nós podemos fazer uma tabela assim com quantas colunas quisermos. Contudo, visto que a expansão decimal de a e de b é finita, estamos ensanduichando x entre dois números racionais. Já vimos que x é um número irracional, mas todas as aproximações que vimos de x são números racionais, não importa quantas casas decimais tenham. Não é estranho isso?”

Moisés abre o rolo que tinha posto sobre a mesa; era um cartaz enorme. Pede a ajuda de quatro alunos, e os cinco usam a fita crepe para prender o cartaz sobre a lousa, de modo que todos o vejam (figura 1).

Fig. 1. Um corte de Dedekind/ Wikipedia

“Notem que, se continuamos esse processo por toda a vida, vamos obter um número a e um número b, ambos racionais, tais que a é menor do que b. Vamos obter um número a tal que a2 é sempre um pouquinho menor do que 2 e um número b tal que b2 é sempre um pouquinho maior. É por isso que devemos presumir que o número √2 está entre esses dois números.”

Moisés faz uma pausa, para deixar a classe assimilar essas informações enquanto olha para a figura presa sobre a lousa.

“Agora, como os matemáticos sabem que esse número x = √2 existe? Como eles podem ter a certeza de que, bem no lugar em que deveria haver o número x, na verdade há, digamos assim, um buraquinho, uma ausência? Como eles sabem que justamente esse ponto não está faltando? Como sabem, em resumo, que a reta dos números reais é perfeitamente contínua?”

A classe entra numa discussão e um engraçadinho, que leu O Guia do Mochileiro das Galáxias, diz que a resposta é “obviamente 42”. Moisés se diverte, até que interrompe a algazarra para fazer um anúncio.

“Pessoal!”, faz uma pausa: “os matemáticos não sabem! [De novo marca a ênfase com a mão fechada.] Ao longo dos séculos, milhões de pessoas pegaram milhões de gravetos e fizeram milhões de riscos na areia, e depois disso milhões de pessoas pegaram milhões de canetas e fizeram milhões de riscos no caderno — por causa disso, por causa dessa experiência acumulada, todo mundo acredita que uma linha reta é contínua, inclusive os matemáticos. Só que, na matemática, essa crença tem nome: é o axioma da continuidade.”

Moisés segue explicando que os matemáticos gostam de questões como essa, mas que levam a matemática na esportiva. O que lhes interessa a respeito de um ponto não é se existe (“se existe num plano espiritual, metafísico, vejam bem”), mas sim se podem defini-lo com precisão. Neste caso do número x = √2, “defini-lo com precisão” significa determinar a posição de um racional tão próximo de √2 quanto seja necessário, seja um racional com 5 casas decimais na expansão decimal, seja um racional com 5 trilhões de casas decimais. Visto que podem sim determinar a posição desse racional próximo do ponto x = √2, tão próximo quanto queiram, então, para efeitos práticos, esse ponto existe — mesmo que alguém goste de pensar que não existe… {❏}



{2}/ Cortes de Dedekind

Numa boa escola do ensino básico (= fundamental e médio), é bem possível que o estudante pense sobre os números mais ou menos nesta sequência (sempre usando a linha dos números como referência): operações aritméticas com inteiros não negativos; operações aritméticas com frações não negativas; operações aritméticas com inteiros (entram os inteiros negativos); operações aritméticas com números racionais (entram as frações negativas).

Cedo ou tarde, querendo ou não, aparecem os irracionais. Visto que o estudante não tem ainda as ferramentas intelectuais adequadas para lidar com irracionais, o que a maioria das escolas faz? Segundo Hung-Hsi Wu, um especialista americano em didática da matemática, a escola não discute adequadamente o que é um número irracional e mesmo assim leva o aluno a acreditar que pode lidar com todos os números da reta real, inclusive √2 ou π, exatamente da mesma forma com a qual lida com os inteiros e os racionais. É o que Wu batizou de Pressuposição Fundamental da Matemática Escolar:

Pressuposição Fundamental da Matemática Escolar (PFME). Você pode aplicar, aos números irracionais, toda informação verdadeira sobre operações aritméticas com números inteiros e com números racionais.

“Essa é uma pressuposição muito profunda”, escreve Wu no livro Understanding Numbers in Elementary School Mathematics. “Ela permite que o estudante manipule números irracionais da mesma maneira que manipula inteiros ou racionais, embora o estudante não tenha a menor ideia do que é um irracional.”

E daí surgem dezenas, centenas de dúvidas, tais como: “Como os matemáticos sabem que números como √2 existem, se de modo nenhum podem conhecer toda a sua expansão decimal?” Ou dúvidas muito mais exóticas e incapacitantes, tais como: “Se tenho de somar duas frações esquisitas, sendo que o denominador de uma é 7 e o denominador da outra é 3√5, de que maneira posso tirar o mínimo múltiplo comum entre 7 e 3√5?”

Wu se apressa em dizer que a PFME é correta, mas a escola não deveria pedir ao estudante que acreditasse nela sem, antes disso, discuti-la em atividades semelhantes àquela descrita na seção 1.

A atividade na seção 1 foi feita com base num dos métodos com os quais, na faculdade, o estudante de bacharelado em matemática constrói os números irracionais: com os cortes de Dedekind.

Se o leitor gostaria de montar um corte de Dedekind, eis uma breve explicação: particione todos os números racionais em dois conjuntos disjuntos, o conjunto E e o D. (As letras E e D servem para lembrá-lo de esquerda e direita.) Todos os racionais menores que certo valor x ficam no conjunto E. Todos os racionais iguais a certo valor x, ou maiores que certo valor x, ficam no conjunto D. Fazendo assim, todo elemento e de E é menor que x e, portanto, menor que todo elemento d de D; e todo elemento d de D é igual a x ou maior que x e, portanto, maior que todo elemento e de E.

Depois disso, o leitor pode dar o salto genial que Richard Dedekind deu em 1901: definir “número real” como sendo esse corte, isto é, como sendo essa partição dos racionais em dois conjuntos disjuntos. Se existe um elemento de D que seja o menor de todos (isto é, se x é racional e, portanto, x D), daí esse corte representa o número racional x. Mas, se não existe um elemento d de D que seja o menor de todos (isto é, se x D), daí esse corte representa o número irracional x.

A coisa toda é ligeiramente mais complicada do que isso, mas Dedekind conseguiu, com uma definição semelhante a essa, caracterizar perfeitamente um número real. Caso o leitor use a definição para construir o corte relativo a x = √2, vai definir os conjuntos E e D assim:

E = {e Q : e2 < 2}

D = {d Q : d2 ≥ 2}

Pode verificar como D não pode ter um elemento que seja o menor de todos, pois x = √2 não é elemento de D, pois não é racional. No entanto, você pode manipular o corte da mesma maneira que manipula um número real: pode, de maneira muito natural, somá-lo a outro corte, dividi-lo por um corte que não seja equivalente a zero, etc. (Diante de dois cortes, caracterizados pelos conjuntos E e D, de um lado, e E’ e D’, de outro, para somar os dois basta somar cada um dos elementos de E a cada um dos elementos de E’, e cada um dos elementos de D a cada um dos elementos de D’. O que vai obter são os conjuntos E” e D’’, que deve definir assim: E’’ = {e + e’ : e E e e’ E’}; D’’ = {d + d’ : d D e d’ D’}. Os conjuntos E” e D’’ caracterizam o corte equivalente à soma do número real equivalente ao corte E, D com o número real equivalente ao corte E’, D’.)

Mas daí talvez queira saber:

“OK, entendi. Mas e o valor de √2? Tendo diante de mim o corte de Dedekind relativo a √2, como eu acho o valor de √2?”

Simples: Escolha qualquer racional e do conjunto E, ou qualquer racional d do conjunto D, tal que e2 ou d2 esteja o mais próximo possível de 2 para seus propósitos práticos. Daí, para seus propósitos práticos, declare o valor de √2 como sendo o valor de e ou de d. Foi mais ou menos isso o que, na seção 1, o professor Moisés ajudou a classe a ver.

E talvez ainda queira saber:

“Ora, mas √2 existe? A questão principal não era essa?”

Sim, existe. Na matemática, se você pode definir os critérios objetivos a partir dos quais deve pensar a respeito de determinado conceito, então pode aplicar esse conceito, e obviamente, se pode aplicá-lo, ele existe. Em essência, a matemática é o estudo das consequências lógicas de critérios que podemos estabelecer objetivamente, isto é, de critérios cuja interpretação independe da subjetividade do leitor. Visto que Dedekind pôde estabelecer um critério objetivo pelo qual descrever tanto números racionais quanto números irracionais, então os números irracionais existem. {FIM}


Observação:

Publiquei a matéria da seção 1 pela primeira vez na revista Cálculo: Matemática para Todos, edição 26, março de 2013, pág. 16. A versão que acabou de ler foi revista e reescrita. Quanto à seção 2, é inédita.

O valor de exercícios fáceis


{1}/ As primeiras duas vantagens

Outro dia, um professor de matemática me disse que ele tem dificuldade para convencer seus alunos a resolver exercícios fáceis. Assim que os alunos estudam um assunto e resolvem uns poucos exercícios, reclamam caso o professor insista num exercício fácil.

“Ah, esse não, professor!”, eles dizem. “Esse a gente já sabe.”

Contudo, se o estudante resolve exercícios fáceis de quando em quando, ele se prepara melhor para a matemática, comparado àquele que só resolve exercícios difíceis. Exercícios fáceis nos ensinam a prestar atenção. Quando realizamos algo que consideramos fácil, nossa atenção ao que estamos fazendo cai — entramos, por assim dizer, no modo automático. Fazemos as contas, manipulamos os sinais dos números e das variáveis, movemos as letras de lugar — e, ao mesmo tempo, ficamos pensando no melhor menu para o jantar. Sopa de legumes ou sobrecoxa de frango assada?

Esse mesmo fenômeno acontece em outras áreas da vida. A maioria dos acidentes de carro, por exemplo, ocorre perto de casa, porque o motorista se sente em casa, relaxa, e sua atenção cai. Na matemática, enquanto fazemos as contas e tudo o mais, dividimos uma expressão por x sem levar em consideração que, talvez, x seja igual a zero. Segundo especialistas em olimpíadas de matemática, até competidores muito bons cometem erros bobos e erram sinais por falta de atenção.

Treinar com exercícios fáceis rende mais duas vantagens. Uma delas: para resolver um exercício difícil, o estudante tem de realizar dezenas ou centenas de operações matemáticas fáceis, com as quais já está acostumado. Se sua atenção cai durante tais operações, ele corre o risco de cometer um erro bobo, e se isso acontece torna o exercício difícil mais difícil do que deveria ser. A outra vantagem: exercícios fáceis deixam o estudante feliz. Isso é bom: recarrega o ânimo. Quem só ataca problemas difíceis está sempre cansado de se sentir burro.



{2}/ Uma ressalva: facilidade e criatividade

Não quero desculpar o professor que insiste em exercícios fáceis e chatos, pois um exercício pode ser ao mesmo tempo fácil e criativo. Por exemplo:

Problema. Um arco e uma flecha custam 11 reais ao todo. O arco custa 10 reais a mais que a flecha. Quanto custa a flecha?

Pense no problema por um instante. A solução está logo abaixo.

.

.

.

.

.

.

.

.

.

.

Resolução. Muita gente responde no modo automático:

“A flecha custa 1 real.”

Ora, se o arco custa 10 reais a mais que a flecha, e se a flecha custa 1 real, então o arco custa 11 reais — com isso, o arco e a flecha juntos custam 12 reais. Resposta errada.

Para resolver esse problema adequadamente, nada melhor que um pouco de álgebra escolar. Nas linhas a seguir, usei A para denotar o preço do arco e F, o preço da flecha.

Assim, a flecha custa 50 centavos, o arco custa 10 reais e 50 centavos, e o conjunto todo custa 11 reais.



{3}/ Revisitando lugares conhecidos

Outro dia, num dos Seminários de Educação Matemática (FE/USP), o professor João Tomás do Amaral me cutucou e me mostrou uma página, na qual ele havia acabado de escrever à mão:

7x + 12y = x + Ay

“E aí?”, ele me perguntou.

Eu comecei, sempre olhando para o papel:

“Tire x dos dois lados, tire 12y dos dois lados, e você fica com 7xx = Ay – 12y […]” Parei de repente. Falávamos baixinho, porque a palestrante discorria sobre como a álgebra tem aparecido nos livros didáticos nos últimos anos, e sobre como a escola distorce o sentido da álgebra, e eu deveria ter desconfiado.

Em vez de olhar para o papel, olhei para o João, e vi que ele mal conseguia disfarçar a vontade de rir.

Recomecei:

“O que você quer dizer com x, y, A, 7, 12, o sinal de mais, e o sinal de igual?”

João riu, pois essa era a pegadinha: antes de usar algum tipo de álgebra, e antes de dizer qualquer coisa sobre álgebra, você tem de saber com que sistema está trabalhando. (Sistema = estrutura algébrica.) Olhei para a expressão no papel e parti do pressuposto de que dizia algo sobre o sistema dos números reais — e que x, y, e A, portanto, denotavam números reais. Mas não havia nada no papel que me autorizasse a pensar assim. E se os números denotassem grandezas escalares e as letras, matrizes ou vetores? No problema do arco e da flecha, por exemplo, o estudante, ao atribuir valores para A e para F, só pode usar múltiplos inteiros de 1 centavo, 5 centavos, 10 centavos, 25 centavos, 50 centavos, 1 real, 2 reais, 5 reais, 10 reais, 50 reais, e 100 reais. Poucos estudantes pensam nisso quando resolvem problemas sobre dinheiro, pois ainda não se acostumaram a perguntar: “Qual é o conjunto do qual devo retirar os valores de minhas variáveis?”

E essa é, portanto, mais uma das vantagens de resolver exercícios fáceis (e criativos) de quando em quando: visto que você está sempre aprendendo mais, vai olhar para eles de outro ângulo, e ver coisas que não poderia ter visto quando sabia menos. {FIM}


Observações:

1. Publiquei uma versão da seção 1 na carta ao leitor da revista Cálculo: Matemática para Todos, edição 3, abril de 2011, pág. 5. As outras duas seções são inéditas.

2. Minha versão prática de “resolva exercícios fáceis” é “leia vários livros sobre o mesmo assunto”. Nunca perdi meu tempo ao ler um livro sobre um assunto que, em tese, já estudei e deveria saber. Meu primeiro livro de cálculo foi difícil, pois o assunto era novo para mim e, a bem da verdade, o livro era mal escrito; o mais recente (Infinitesimal Calculus, por Henle e Kleinberg) foi uma tremenda aventura — divertido e estimulante. Mas só tive condições de me divertir porque esse era meu sexto livro de cálculo; se tivesse sido o primeiro, não sei nem se teria conseguido terminá-lo.

Uma lógica para estudar o arco-íris


Num sistema feito com lógica clássica, se uma afirmação se revela verdadeira e falsa ao mesmo tempo, o sistema trava. Contudo, pesquisadores têm usado a lógica paraconsistente, com a qual um sistema não trava diante de uma afirmação verdadeira e falsa, para criar máquinas mais inteligente e até óculos para deficientes visuais.



{1}/ Para além da lógica convencional

Uma mulher (vamos chamá-la de Andresa) está lendo ao ar livre, mas levanta os olhos do livro e nota um arco-íris. Ela repara nas faixas coloridas: o arco-íris começa (ou termina) numa faixa vermelha, que vai clareando até virar uma faixa amarela. Andresa acha que o meio da primeira faixa é vermelho, e que o meio da segunda faixa é amarelo, mas e as transições? Em que ponto exato ocorre a transição do vermelho para o amarelo, isto é, em que ponto exato o vermelho deixa de ser vermelho e o amarelo começa a ser amarelo? Se Andresa usa a lógica clássica para modelar esse problema, não pode ir longe, porque a lógica clássica só lida com problemas do tipo ou “verdadeiro” ou “falso”, mas nunca ambos. Se é o caso de que algo seja vermelho, ele só pode ser vermelho.

Andresa não iria longe com a lógica clássica mesmo que recorresse a medidores sofisticados. Se num ponto a faixa do arco-íris contém 98% de amarelo 2% de vermelho, ela é amarela ou vermelha? A natureza com frequência funciona assim: vai da brisa ao furacão em transições suaves. “Não podemos nos limitar aos princípios binários da lógica clássica, do verdadeiro ou falso, do sim ou não, do é ou não é”, diz o professor Jair Minoro Abe, líder do grupo de pesquisas sobre lógica paraconsistente e inteligência artificial da Universidade Paulista (Unip) e coordenador do grupo de lógica e teoria da ciência no Instituto de Estudos Avançados da USP. Abe estuda as aplicações da lógica paraconsistente em áreas como engenharia e biomedicina — e a palavra-chave é paraconsistente, ou seja, além da consistência da lógica clássica.

Na lógica clássica, se um sistema permite a criação de uma afirmação verdadeira, e se essa afirmação verdadeira leva a uma contradição, então todo o sistema perde consistência. Em termos técnicos, ele se torna trivial, isto é, ele permite provar a verdade de qualquer afirmação. Num artigo publicado na revista Plus Magazine, o matemático neozelandês Maarten McKubre-Jordens dá um exemplo: na lógica clássica, se é possível provar que a afirmação A é verdadeira, e que a afirmação não-AA) também é, então é possível provar que Cleópatra é a atual secretária-geral da ONU. Na lógica clássica, uma contradição não é apenas inaceitável; ela é destrutiva. (Ou, no linguajar técnico, ela é “explosiva”.) Essa é, segundo o professor Abe, uma das fragilidades da lógica clássica.

Nas lógicas paraconsistentes, as regras são ligeiramente diferentes. Uma contradição não necessariamente destrói todo o sistema — ou não necessariamente “explode”. Se o matemático considera a afirmação “a neve é branca” verdadeira (como na realidade muitas vezes é), e se considera a afirmação “a neve não é branca” também verdadeira (na realidade, muito facilmente a neve se torna suja; ela não permanece imaculadamente branca por muito tempo), então ele tacha as duas afirmações de inconsistentes (contraditórias), mas não vai além e condena o sistema lógico inteiro. Se ele considera ambas as afirmações falsas, então ele tacha as duas de paracompletas. Fazendo assim, o matemático trabalha com contradições sem trivializar todo o resto. Andresa, observando o arco-íris, pode taxar a transição de vermelha e também de não vermelha, ou de amarela e também de não amarela, sem trivializar o fato de que, no centro da faixa, a faixa vermelha é 100% vermelha e a faixa amarela é 100% amarela.

O professor Abe diz que o cérebro humano funciona mais segundo a lógica paraconsistente. Se um paciente vai ao primeiro médico e recebe o diagnóstico de câncer, e depois vai ao segundo médico e não recebe diagnóstico de câncer, ele não sairá do segundo consultório achando que o planeta Terra foi povoado por girafas alienígenas. Ele vai procurar uma terceira opinião, ou talvez uma quarta, até que tenha condições de dizer qual das afirmações tem valor de verdade, câncer ou ¬câncer, ou até que tenha condições de dizer que é impossível determinar o valor de verdade de qualquer uma das duas afirmações. Enquanto isso, para efeitos lógicos e práticos, as duas afirmações são tratadas como ambas verdadeiras ou (inclusive) ambas falsas. Muitos cientistas, diz Abe, usam a lógica paraconsistente para descobrir coisas novas sobre a natureza.

Sem bengala e sem cão. Jair Abe todo mês se reúne com um grupo de cientistas na Faculdade de Medicina da USP; os membros do grupo discutem modos de usar um tipo de lógica paraconsistente, a lógica anotada, para conduzir suas pesquisas. Esse grupo desenvolveu, por exemplo, um par de óculos especial para pessoas com deficiências visuais ou auditivas (em parceria com a Fundação Dorina Nowill para Cegos). Nas laterais dos óculos, há emissores e sensores de ultrassom, capazes de detectar obstáculos no caminho do usuário. Enquanto a pessoa se movimenta, se houver um obstáculo à direita, os óculos vibram à direita; se houver um obstáculo à esquerda, eles vibram à esquerda; se houver um obstáculo à frente, eles vibram dos dois lados. E se o usuário estiver caminhando na direção de uma porta aberta? Um sensor pode detectar o vão livre da porta e dizer aos óculos que não vibrem; o outro sensor pode detectar a parede bem ao lado da porta e dizer aos óculos que vibrem. Se os óculos funcionassem segundo a lógica clássica, duas afirmações verdadeiras, livre e ¬livre, travariam o sistema. Por meio de uma vibração especial, os óculos avisam o usuário que não conseguem decidir qual das duas afirmações é verdadeira, e o usuário movimenta a cabeça para lá e para cá até entender o que está acontecendo, e para onde deve andar.

Abe se surpreendeu ao observar deficientes visuais usando os óculos (na verdade, protótipos): em geral, quando usa uma bengala, o deficiente não move a cabeça. Ao usar os óculos, os deficientes rapidamente passaram a mover a cabeça como se tivessem nascido com aqueles óculos. É mais uma prova de que o ser humano se adapta facilmente às lógicas paraconsistentes, simplesmente porque ele também é paraconsistente. Agora, Abe e seu grupo planejam embutir sistema de localização por satélite (GPS) nos óculos, o que dará maior autonomia aos usuários.

Os pesquisadores também estudam aplicações da paraconsistência em redes neuronais artificiais, que, por exemplo, poderiam analisar distúrbios da fala, ajudar o paciente a conviver com imperfeições nas articulações da boca, reconhecer células de câncer de colo interino, sequenciar o código genético de um animal, ajudar o médico a diagnosticar a doença de Alzheimer. Engenheiros de produção podem usar a lógica anotada para examinar os procedimentos pelos quais a empresa toma decisões a respeito da produção. O professor Abe também colabora com cientistas estrangeiros, que desenvolvem aplicações dessa lógica em microprocessadores, semáforos inteligentes, bancos de dados inteligentes, computação coletiva, sistema de controle de trens ou de elevadores.

Em sistemas computacionais, os cientistas têm conseguido grandes avanços com o uso de lógicas paraconsistentes. Segundo o professor Marcelo Finger, do departamento de ciência da computação do Instituto de Matemática e Estatística (IME-USP), ninguém consegue traduzir a lógica clássica, principalmente sua forma mais útil (a lógica modal) em programas de computador. O analista de sistemas consegue fazer o computador resolver pequenos problemas de lógica em segundos (em geral, com lógica booleana), mas, conforme o problema lógico fica maior e mais complicado, o tempo de processamento cresce exponencialmente, a ponto de deixar alguns problemas fora do alcance da computação moderna. “Passamos a levar horas, dias e semanas para processá-los; alguns problemas precisariam de séculos”, diz Marcelo. “Para fugir dessa explosão combinatória, como a chamamos, usamos as lógicas paraconsistentes na esperança de tornar tratáveis parte desses problemas.” Na avaliação de Marcelo, à medida que as pessoas desenvolvem programas, robôs e máquinas que, mesmo com autonomia limitada, têm de tomar decisões, de alguma forma eles devem incorporar elementos paraconsistentes.

Problemas de todos os tipos. O neozelandês Maarten McKubre-Jordens diz que estudiosos de lógica paraconsistente não entram em pânico quando acham uma contradição num sistema qualquer — para eles, o paradoxo é sinal de que há algo interessante naquele sistema, que precisa de mais estudos. Um exemplo famoso é o paradoxo do mentiroso. Um sujeito afirma: “Eu sou mentiroso.” Se o que ele diz é verdade, então ele não mentiu; pelo menos uma vez na vida não foi mentiroso. Se o que ele diz é mentira, então costuma dizer a verdade, mas pelo menos uma vez na vida foi verdadeiro. Enfim: se diz a verdade, ele costuma mentir, e se mente, costuma dizer a verdade. “Muitas mentes brilhantes se afligiram diante de problemas como esse”, escreve Maarten, “e não há uma única solução que seja aceita por todos.”

Ora, tudo bem, diz o professor Décio Krause, que dá aulas de lógica no departamento de filosofia da Universidade Federal de Santa Catarina (UFSC). Quem trabalha com lógica não tem a obrigação de dizer, de uma vez por todas, se uma afirmação lógica é verdadeira ou falsa — o pesquisador só precisa construir um sistema, em geral um sistema computadorizado, que não trave diante de inconsistências lógicas. “Existe um número primo maior que 10 milhões?” Décio faz a pergunta e diz que o papel do lógico não é dizer se essa afirmação é verdadeira ou falsa. Essa atribuição cabe ao matemático — e, neste caso, é verdadeira, como demonstrou Euclides. O lógico está preocupado com um fluxograma: se for verdadeira, faça assim, ou se for falsa, faça assado. O especialista em lógica paraconsistente inclui um terceiro item no menu: se for verdadeira e falsa, siga em frente e faça desse outro jeito. “A grande sacada é que, com as lógicas paraconsistentes, o sistema não trava quando há uma contradição.”

Com lógicas paraconsistentes, diz Décio, o matemático e o analista conseguem tratar melhor de negações. Diz um sujeito a outro: “Estou falando com você debaixo da soleira da porta do meu quarto.” E aí? O falante está dentro do quarto (Q) ou fora do quarto (¬Q)? “Segundo a lógica clássica”, diz Décio, “eu tenho de estar dentro ou fora, mas há situações em que a resposta não é tão simples.” Décio diz que cientistas têm feito bom uso da lógica paraconsistente para sistematizar, de modo rigoroso, as teorias que fazem uso da ideia de complementaridade (proposições complementares são aquelas que, tomadas individualmente, podem ser ou só verdadeiras ou só falsas, mas, tomadas em conjunto, levam a contradições). Um exemplo é a teoria do átomo de Niels Bohr (1885-1962); por causa dele, todo físico moderno, quando lida com mecânica quântica em conjunto com a teoria da relatividade geral, lida com algum tipo de lógica paraconsistente.

Além disso, especialistas aplicam as lógicas paraconsistentes no controle de tráfego aéreo e urbano. Eles elaboram softwares paraconsistentes que fazem o semáforo ficar aberto ou fechado por mais ou menos tempo em função do fluxo de veículos, ao invés de ficar um tempo fixo em cada estado.

Já na medicina, onde as pessoas não tomam decisões a partir de um mero sim ou não, Décio Krause imagina situações em que o paciente usa um computador para responder a perguntas sobre si mesmo. Se o computador tiver um programa adequado, pode fazer inferências sobre o paciente ainda que receba respostas contraditórias, do tipo ‘o médico A me disse que tenho câncer, mas o médico B me disse que não’. “Com isso, o governo poderia reduzir as filas nos postos de saúde. Os Estados Unidos usam sistemas desse tipo desde a década de 1980.”

No direito, especialistas usam lógicas paraconsistentes deônticas para interpretar noções como obrigatório e permitido conforme a lei ou conforme algum sistema moral. Há muitas situações nas quais a lei manda fazer A e também manda fazer ¬A, do tipo “é proibido abortar o bebê” e “é proibido arriscar a vida da mãe do bebê”. “Com a lógica paraconsistente”, diz Décio, “podemos discutir como lidar com sistemas morais conflitantes, ou até contraditórios, sem que sejamos tachados de irracionais.” {❏}



{2}/ Os passos da paraconsistência

O polonês Jan Lukasiewicz (1876-1956) e o russo Nicolai A. Vasiliev (1880-1940) foram os primeiros lógicos a dizer que alguns princípios da lógica clássica, como o da redução ao absurdo, deveriam ser revisados. Em 1948, Stanislaw Jaśkowski, um discípulo de Lukasiewicz, apresentou uma lógica para ser aplicada a sistemas envolvendo contradições, sem torná-los triviais. Jaśkowski chamou esse tipo de lógica de discussiva ou discursiva, mas se limitou a reformar uma parte do cálculo proposicional (nome da área da lógica preocupada com proposições, isto é, com afirmações cujo valor de verdade ou seja verdadeiro ou seja falso), e não elaborou nenhuma lógica 100% paraconsistente.

Na década de 1950, o lógico brasileiro Newton da Costa (1929-  ), então professor da Universidade Federal do Paraná, publicou vários estudos sobre sistemas lógicos que admitissem contradições. Newton foi além do cálculo proposicional, o que lhe rendeu fama internacional; ele é hoje reconhecido no mundo todo como o fundador das lógicas paraconsistentes. O termo paraconsistente foi cunhado pelo filósofo peruano Francisco Miró Quesada em 1976, numa carta a Newton da Costa.


O blivet


{3}/ Um exemplo: o blivet

Um sujeito está estudando a proposição P, e chegou à conclusão de que ela é verdadeira ou se a proposição A é verdadeira ou se a proposição B é verdadeira, mas nunca é verdadeira se A e B são ambas verdadeiras ou ambas falsas. Em símbolos:

P = AB

Então, caso o sujeito descubra que A é verdadeira, B é falsa, e caso descubra que A é falsa, B é verdadeira. Assim é a lógica proposicional convencional, que é muito útil. Mais à frente em seus estudos, contudo, o sujeito descobre que, em certas circunstâncias, não tem condições de dizer se A é verdadeira ou se é falsa; nessas circunstâncias, seria bom se pudesse escrever A & ¬A, isto é: “Qualquer que seja o valor de verdade de A, verdadeiro ou falso, eu gostaria de trabalhar com a duas opções.” Na lógica proposicional comum, isso é uma contradição, e toda a teoria que o sujeito montou antes disso iria para o lixo, pois ela se tornaria trivial, ou seja, poderia ser usada para inferir qualquer coisa, inclusive que o homem descende de antigas estátuas do Homer Simpson. Com algumas das lógicas paraconsistentes, o sujeito pode anotar A & ¬A, e pode seguir adiante, pois elas fornecem mecanismos para seguir adiante; o que o sujeito terá de fazer é postergar qualquer inferência ou conclusão a respeito de B, assim como de P.

Com a lógica paraconsistente, os matemáticos agora estudam objetos como o blivet, uma espécie de peça de jogo de montar. Um blivet é uma ilusão de ótica, e é portanto um objeto absurdo. Até antes da lógica paraconsistente, ninguém podia estudá-lo com as ferramentas convencionais da matemática, que não foram feitas para dar tratamento adequado a contradições e absurdos. Contudo, aos olhos do especialista em lógica paraconsistente, o blivet tem lógica — pois, se não tivesse algum tipo de lógica, como alguém poderia desenhá-lo? O desafio hoje em dia é expressar um objeto como o blivet com lógica paraconsistente, e quem sabe até ensinar um computador a criar objetos semelhantes. Um computador desses teria uso militar: porta-aviões desenhados para se parecer com o blivet confundiriam os sistemas do inimigo, que não saberiam direito onde mirar, pois não saberiam interpretar os dados. {FIM}


Observações:

1. Publiquei essa matéria pela primeira vez na revista Cálculo: Matemática para Todos, edição 16, maio de 2012, pág. 32. A versão que acabou de ler foi revista e reescrita.

2. As entrevistas foram feitas pela jornalista Andréa Cordiolli.

Olhe para você daqui a 200 anos


Seu queixo vai cair ao ver como Roberval, Fermat, Descartes, e Newton achavam retas tangentes a curvas no plano. Eles foram hábeis, mas, mesmo assim, seus métodos passam aquela sensação de ridículo que sentimos ao examinar fotos antigas: é a mesma sensação que, provavelmente, vamos provocar em nossos descendentes.


{0}/ Matemáticos mencionados neste texto

Cauchy: Augustin-Louis Cauchy (1789-1857), francês.

Descartes: René Descartes (1596–1650), francês.

Fermat: Pierre de Fermat (1601-1665), francês.

Leibniz: Gottfried Wilhelm Leibniz (1646–1716), alemão.

Newton: Isaac Newton (1642-1727), inglês.

Roberval: Gilles Personne de Roberval (1602-1675), francês.



{1}/ O perigo da palavra “óbvio”

Quem nunca se surpreendeu pensando que nossos antepassados tinham um quê de ridículo? O leitor (vamos chamá-lo de Tarcísio) nem precisa relembrar a peruca que, no século 18, todo europeu de boa posição social vestia antes de sair às ruas. Para evocar a impressão de ridículo, basta ir à locadora, alugar um filme de Charles Chaplin e botar reparo no modo como os homens se vestiam: a gola alta, a gravata borboleta, o colete, a corrente ligada ao relógio no bolso do colete, o chapéu-coco, o bigode, a bengala. Ou então Tarcísio pode estudar um pouco da história do cálculo, mais especificamente a história de como os antepassados achavam o coeficiente angular de uma reta tangente à curva de uma função; é o que hoje chama de derivada. Como pode o Fermat, tão inteligente, ter bolado métodos que só funcionavam com determinadas curvas? Como pode não ter visto algo tão óbvio — que seu método caso a caso continha a semente de um método geral, que valeria para qualquer caso?

Vocabulário. Sem entrar em detalhes técnicos: coeficiente angular da reta tangente à curva de uma função = gradiente da reta tangente à curva de uma função = tangente da reta tangente à curva de uma função = inclinação da reta tangente à curva de uma função = derivada.

Na Escola de Artes, Ciências e Humanidades da Universidade de São Paulo (conhecida na cidade como USP Leste), o professor Carlos Henrique Barbosa Gonçalves precisa tomar cuidado para que seus alunos não fiquem com essa impressão de ridículo a respeito dos matemáticos antigos. Evita, por exemplo, a palavra óbvio. “Quando trato de história da matemática em sala de aula”, diz Carlos, “procuro nem pensar nesses termos, se as ideias eram óbvias ou não, porque os antigos estavam interessados em outras coisas. Os problemas que os moviam eram provavelmente diferentes dos problemas que nos movem.” Carlos acha que os elementos contidos nesse quê de ridículo podem reforçar no estudante Tarcísio a impressão de que a matemática está acima de seu tempo — pois é eterna. Tarcísio chegaria a tal conclusão mais ou menos assim: as ideias matemáticas são eternas; logo, a mesma ideia conhecida hoje estava presente, como uma espécie de espírito, no escritório em que Fermat ou Descartes escrevia; visto que eles trataram de temas que hoje todos associam a tal ideia, e visto que hoje todos acham essa ideia meio óbvia, e visto que Fermat ou Descartes não a viu, embora ela estivesse lá pairando pelo escritório, então Fermat ou Descartes foi ridiculamente ingênuo. “Quando alguém estuda um texto antigo de matemática”, diz Carlos, “acaba entendendo que a matemática é um produto do meio. Ela não é eterna; ela não fica do mesmo jeito, congelada para sempre. Aí então esse alguém terá um plá: daqui a 200 anos, é bem provável que nossos descendentes achem a matemática do século 20 e do século 21 muito desajeitada. Quem sabe?”

A pedido do redator deste blogue, Carlos explicou como os matemáticos antigos achavam o coeficiente angular da reta tangente à curva de determinada função. Escolheu concentrar as explicações em quatro matemáticos (Roberval, Fermat, Descartes, e Newton), e mostrar como eles achariam o coeficiente angular da reta tangente a uma parábola do tipo y = x2, pois todos eles estudaram parábolas desse tipo. Mas avisa: o leitor não deve concluir a leitura com a falsa impressão de que sabe tudo a respeito dos métodos antigos para achar tangentes. “Nestas explicações, vou fazer simplificações muito grandes. Vou recorrer, por exemplo, à notação e ao vocabulário atuais, e não à notação ou ao vocabulário usados por cada um deles.”

Os vetores de Roberval. Veio a ser conhecido mais pela cidade onde nasceu (Roberval) que pelo nome (Gilles), já que seu nome completo, Gilles Personne de Roberval, significa mais ou menos “Gilles, uma pessoa nascida em Roberval”. Para compreender as características de uma função, via seu gráfico como a rota de uma partícula; com isso, usava o que sabia (conscientemente ou não) a respeito de movimentos para descobrir características da função. “Para entender um gráfico”, diz Carlos, “Roberval pensava em pontos que se movimentavam no plano. As características dos movimentos revelariam características geométricas e matemáticas do gráfico.” Por exemplo, para achar a derivada de uma parábola, Roberval se perguntou: como posso decompor o movimento paraboloide de um ponto no plano em movimentos mais simples?

Com frequência, Roberval usava uma definição geométrica de parábola: é a curva formada por todos os pontos que estão à mesma distância de um ponto (o foco) e de uma reta (a diretriz). Na figura 1 (logo abaixo), o foco se chama F e a diretriz, L; a distância do ponto P1 até F é, portanto, a mesma distância do ponto P1 ao ponto Q1. Roberval raciocinou assim: se a parábola é o traçado de um ponto em movimento, o tanto que esse ponto se afasta do foco deve ser o mesmo tanto que se afasta da diretriz. Se esse ponto tiver uma velocidade, o analista pode decompô-la em duas forças mais simples (figura 2). “O resultado dessa decomposição”, diz Carlos, “é essa diagonal do paralelogramo, cujo coeficiente angular é o mesmo da reta tangente à parábola no ponto P.”

Fig. 1 e Fig. 2

Ao examinar o desenho, o leitor Tarcísio tem a impressão de que já viu aquilo antes, em livros de álgebra linear — na linguagem atual, quem diria, Roberval somava vetores. No plano, um vetor é um objeto com magnitude, direção, e sentido; o estudante, ao usar a notação típica das matrizes, pode representá-lo com uma coluna com dois números reais; além disso, para propósitos didáticos, pode vê-lo como uma flecha depositada sobre o plano cartesiano. Tarcísio sabe que pode converter cada aresta do paralelogramo num vetor (cuja magnitude será igual à distância do ponto P ao foco F, ou então igual à distância de P à diretriz L), e que a diagonal do paralelogramo não passa da soma dos dois vetores que representam as duas arestas principais do paralelogramo.

Carlos faz questão de frisar que Roberval nunca pensou em vetores ou derivadas do modo como Tarcísio pensa neles hoje, até porque a palavra “vetor” apareceu pela primeira vez em 1704, e a palavra “derivada”, em 1670. “A partir de um raciocínio sobre movimentos ele deduziu o coeficiente angular da reta tangente à parábola”, diz Carlos. “É uma maneira diferente de tratar as retas tangentes porque o problema do qual partiu era diferente.”

Fermat e as coisas indistinguíveis. Fermat resolveu esse problema de um jeito mais geométrico, parecido com o modo como hoje, na escola, o aluno verifica se os teoremas sobre ângulos inscritos num círculo são verdadeiros mesmo. Fermat traçou uma linha pelo eixo de simetria da parábola, o que passa pelo vértice (figura 3); nessa linha, marcou quatro pontos: os pontos A, B, C (no vértice) e N. Então, traçou a reta que tangencia a parábola no ponto M, e que cruza o eixo de simetria no ponto N. Um ponto importante na reta tangente é o ponto P, na mesma reta horizontal que passa pelo ponto B. Fermat colocou esse ponto P na reta tangente, mas fora da parábola. Contudo, se a distância e for bem pequena (isto é, se os pontos A e B e os pontos M e P estiverem muito próximos um do outro), “daí essa distância BP escapa da parábola só um pouquinho”, diz Carlos. Ao lado desse desenho, Fermat traçou ainda três segmentos de reta verticais: uma para marcar a distância entre A e B, que chamou de e; um para marcar a distância entre A e C, que chamou de a; e outro para marcar a distância entre A e N, que chamou de d. “Note que, se Fermat tivesse usado um plano cartesiano, essa distância AM seria como a abscissa do ponto M, e essas distâncias a e d é como se fossem distâncias no eixo das ordenadas.”

Fig. 3

Com a ajuda do desenho, Fermat raciocinou assim: AM2 está correlacionada com AC. “Na linguagem de hoje”, diz Carlos, “é como se ele tivesse dito que deve pegar a distância x, no eixo das abscissas, e elevá-la ao quadrado para obter a distância y = x2 no eixo das ordenadas.” Fermat continuou: BP2 está correlacionada com BC; na verdade, não está perfeitamente correlacionado, pois o ponto P escapa um pouquinho da parábola, mas está quase. E daí Fermat chegou à primeira afirmação matemática válida sobre o desenho:

Aqui, Fermat chegou a uma afirmação bem simples; no linguajar atual, Tarcísio faria essa mesma afirmação assim: ao trabalhar com a função y = x2, se pego uma distância a no eixo x, e se pego também uma distância b no eixo x, e se daí divido b2 por a2, isso é o mesmo que dividir, no eixo y, a distância correlacionada com b (que é b2) pela distância correlacionada com a (que é a2). É como se Fermat tivesse dito que, numa parábola do tipo y = x2, b2/a2 é igual a b2/a2 para quaisquer a e b diferentes de 0. Contudo, Fermat usou o símbolo de menor que (<), em vez do símbolo de igual (=), justamente porque a distância BP é um pouquinho maior do que deveria ser, e por isso a razão AM2/BP2 é um pouquinho menor do que deveria ser.

Então Fermat notou que seu desenho mostrava dois triângulos retângulos semelhantes: o triângulo AMN e o triângulo BPN. Sendo assim, podia igualar uma razão entre duas medidas no triângulo AMN à razão entre as medidas equivalentes no triângulo BPN. Foi o que fez, e chegou a:

A partir desse ponto, Fermat usou álgebra: substitui os segmentos de reta por letras, com as quais lidava facilmente; substituiu AN por d, BN por (de), AC por a e BC por (a e) e chegou a:

Fermat então expande o lado direito da desigualdade, multiplica os dois lados por (d2 – 2de + e2) e por (a e), e simplifica tudo:

Notação. A setinha torta ↝ signfica “leva naturalmente a”. Assim, AB significa “a proposição A leva naturalmente à proposição B”. É uma notação mais informal que a notação AB, que indica “a proposição A implica a proposição B”.

“Fermat usou letras diferentes dessas”, diz Carlos, “mas essa era a ideia. Ele sabia que esta última linha valia para a parábola y = x2 não importasse onde estivessem os pontos que escolheu. Por fim, ele deve ter se perguntado: o que acontece se ponho o segmento de reta BP muito, muito próximo de AM?” Quanto mais Fermat aproximava BP de AM, menor ficava o valor de e; quanto menor o valor de e, menor ficava o produto de a por e. Fermat notou que, na última linha da desigualdade acima, podia desprezar o valor de ae, já que podia deixar o valor de e tão pequeno quanto quisesse. Por fim, escreveu:

Como Fermat começou conhecendo o ponto M e a distância AM, e como descobriu a distância d (AN), pôde traçar a reta tangente à parábola no ponto M e medir sua inclinação. “Agora, existe uma dificuldade aqui”, diz Carlos. “Como ele tinha a certeza de que poderia considerar e como uma quantidade desprezível?” Hoje o leitor Tarcísio traduz o símbolo ≈ como “quase igual a”, mas Fermat usou esse símbolo mais como “é praticamente indistinguível de”. Em outras palavras, Fermat trabalhava com uma noção não formalizada do conceito atual de limite, que, como todo professor de cálculo sabe, os estudantes acham perigosamente natural — eles não se incomodam de desprezar um termo que, na visão deles, claramente pode ficar tão pequeno a ponto de reduzir-se a nada. (Ou, se o leitor quiser, Fermat trabalhava com uma noção não formalizada de infinitésimo, no sentido de um número do sistema dos números hiper-reais; no sistema dos números hiper-reais, d ≈ 2a significa “d está infinitamente próximo de 2a”.) “Note que Roberval, no seu método, também empregava uma ideia semelhante à de infinitésimo”, diz Carlos. “Se você parte da pressuposição de que é capaz de determinar a cada instante a posição de um ponto em movimento, então parte da pressuposição de que existe algo parecido com um infinitésimo de tempo.”

Descartes recorre a círculos. Tarcísio supõe que Descartes quis saber o coeficiente angular da reta tangente à parábola y = x2 no ponto (1, 1). O que deveria fazer? Ao examinar a explicação, nota como o método de Descartes se parece com os exercícios que aparecem em livros de geometria analítica. Pudera: Descartes foi um dos inventores da geometria feita com álgebra.

Fig. 4

Como primeiro passo, Descartes escreveu a principal igualdade com a qual trabalharia:

Daí ele marcou na parábola o ponto P = (1, 1). (Veja a figura 4.) Feito isso, desenhou um círculo que passa pelo ponto (1, 1) e que, ao mesmo tempo, tangencia a parábola nesse ponto. Que círculo é esse? Ele tem centro no ponto C = (0, c); para descobrir o valor de c, Descartes usou, na igualdade abaixo, a equação geral do círculo. No lado esquerdo da igualdade, colocou a equação geral de um círculo com centro no ponto (0, c); no lado direito, colocou a mesma equação, mas, desta vez, substituiu x por 1 e y por 1, pois procurava um círculo que tinha de passar pelo ponto (1, 1).

Ao chegar neste ponto, Descartes trocou x2 por y, e arrumou os termos em ordem decrescente de índice:

Olhando bem, Tarcísio percebe que Descartes obteve uma equação do segundo grau típica, do tipo a2x2 + a1x + a0 = 0, na qual o termo a2 vale 1, o termo a1 vale (1 – 2c), e o termo a0 vale (2c – 2). “Neste caso”, diz Carlos, “achar o valor de y é achar um valor para o qual a circunferência toca a parábola uma única vez.” (Uma única vez no quadrante 1; como y = x2 é uma função par, e portanto simétrica em relação ao eixo y, esse mesmo círculo toca a parábola também quando x = –1.) “Então”, diz Carlos, “essa equação tem de ter solução única. Como Descartes fez? Na linguagem atual, ele igualou o delta a zero, e com isso garantiu solução única para a equação do segundo grau.”

Descartes continuou (na equação abaixo, Tarcísio anota b2 – 4ac apenas porque memorizou esta fórmula desta maneira no ensino básico):

Ao resolver a última linha da equação acima (que também é uma equação do segundo grau), Descartes chegou a c = 3/2. Com isso, pôde responder a uma pergunta importante: qual é o coeficiente angular da reta que passa pelo centro do círculo, no ponto (0, 3/2), e também pelo ponto (1, 1)? Com a notação moderna, Descartes chamaria esse coeficiente de m. Agora, visto que tal reta é perpendicular à reta tangente à parábola no ponto (1, 1), o coeficiente angular da reta tangente tem de ser igual ao negativo do inverso multiplicativo de m, isto é, tem de ser igual a –(1/m). Descartes fez as contas:

Então, foi mais ou menos assim que Descartes descobriu o coeficiente angular da reta tangente à parábola y = x2 no ponto (1, 1). Na linguagem atual, Descartes primeiro achou o coeficiente angular da reta normal à reta tangente, e daí achou o coeficiente angular da reta tangente. “O que podemos dizer sobre esses métodos até agora? Todos estão procurando caracterizar a reta tangente, mas partem de circunstâncias muito diferentes. A mesma história se repete com Newton.”

Lembrete. A equação genérica do círculo de raio r e com centro no ponto (a, b) é:

A fórmula é resultado direto do teorema de Pitágoras. Em palavras: o x em questão, menos a abscissa do centro, elevado ao quadrado; mais o y em questão, menos a ordenada do centro, elevado ao quadrado; o resultado dessa soma tem de ser igual ao quadrado do raio.

Newton: fluentes e fluxões. Como muitos matemáticos de seu tempo, Newton não era apenas matemático, mas também físico e astrônomo. (Na verdade, na linguagem de seu tempo, Newton era um filósofo; filósofos eram teólogos, físicos, astrônomos, matemáticos, e o que mais quisessem ser.) Seus textos sobre matemática contêm centenas de menções a movimento, como se para ele os números não fossem apenas pontos numa reta real idealizada, mas coisas que se moviam. Nos seus textos sobre cálculo, se referia à quantidade x como um fluido (alguns autores usam fluente); em suas próprias palavras, um fluido é “uma quantidade que flui”. Quanto à taxa instantânea de variação do fluido (isto é, a derivada do fluido x nesse ponto), Newton a chamou de fluxão. Com frequência Newton trabalhava com dois eixos: o eixo da variável dependente, que ele chamava de x (e que hoje comumente Tarcísio chama de y) e o eixo da variável independente, que quase sempre era o tempo, e que por isso ele chamava de t. Quando ocorria uma variação minúscula em t, variação diferente de 0 mas tendendo a 0, Newton a denotava com um t com um pingo em cima (algo como t’); tal variação minúscula em t provocava uma variação minúscula em x, que Newton denotava com um x com um pingo em cima (algo como x’),  sendo que t’ e x’ eram fluxões.

Fig. 5 e Fig. 6

Carlos desenha um plano cartesiano com eixo y e x (figura 5), em que y é função de x, rabisca uma curva qualquer para mostrar como x e y se relacionam, e explica: “Dada uma relação entre duas grandezas, talvez o estudante queira saber qual é a razão entre os respectivos fluxões, isto é, qual é a taxa de variação instantânea das duas grandezas. Em outras palavras, dada uma relação entre duas grandezas, talvez o estudante queira saber, à moda de Newton, a razão entre y’ e x’.” Graças a Newton, até hoje o estudante Tarcísio pode usar os pontos para indicar derivadas, desde que a variável independente (no eixo das abscissas) seja o tempo: caso trabalhe com a função y = f(t), pode usar algo como y’/t’ para denotar a derivada f’(t). “Newton sabia”, diz Carlos, “que a razão entre y’ e x’ daria o coeficiente angular da reta tangente.”

Depois da breve introdução, Carlos mostra como Newton talvez rabiscasse um pedaço de papel para estudar as grandezas x e y, cuja relação produz um gráfico na forma de parábola, e os fluxões y’ e x’, cuja razão produz o coeficiente angular da reta tangente (figura 6):

Daí, Newton calculou o que aconteceria com a função y = x2 caso ele adicionasse um valor proporcional a x’ à variável x, o que provocaria uma variação equivalente na variável y:

Neste caso, Newton chamou o coeficiente de proporcionalidade de o, e poderia atribuir a o (no linguajar atual) um valor tão pequeno quanto quisesse. Depois, Newton expandiu a equação acima e a simplificou, fazendo valer o fato de que podia trocar y por x2 e vice-versa:

“Aqui”, explica Carlos, “é como se ele tivesse pegado a velocidade da função [no eixo y] e a tivesse multiplicado por um tempinho [no eixo x]. Essa velocidade, mantida por um certo tempo, dá espaço, pois velocidade vezes tempo dá espaço. Mas Newton sabia que o é uma grandeza infinitamente pequena, e que ele podia diminuir essa quantia tanto quanto quisesse. Sendo assim, podia desprezar o termo multiplicado por o.” Foi o que Newton fez para obter:

Tarcísio nota que esse método é muito parecido com o que é ensinado hoje na faculdade. De fato, diz Carlos, Newton foi capaz de usá-lo não apenas para achar o coeficiente angular da reta tangente à parábola y = x2, mas a qualquer parábola do tipo y = xn. Para tanto, usou o que Tarcísio chama de coeficiente binomial (ou binômio de Newton):

De novo, Newton pôde cortar y (à esquerda da igualdade) com xn (à direita), pois são iguais. De novo, dividiu tudo por o e desprezou todos os termos multiplicados por o, visto que o é infinitamente pequeno. Por fim, ficou com:

Essa talvez seja a regra de derivação mais conhecida de todas; Tarcísio a conhece por “regra da potência”: se y = xn, então y’ = nxn−1.

Carlos diz que o principal problema, naquela época, era justamente tratar dessas grandezas infinitamente pequenas. Ora, como alguém pode desprezar ox’2 e também desprezar ox’55, que é muito maior, e que aparece na parábola y = x55? Naquela ocasião, essa pergunta incomodava os matemáticos, mas, como as contas funcionavam, eles seguiram em frente, na esperança de que, um dia, alguém colocaria todas aquelas descobertas em bases mais sólidas — foi o que Cauchy fez no século 19, recorrendo a limites, e Abraham Robinson fez no século 20, recorrendo à lógica. “Ao comparar o método de Newton com o de Fermat”, diz Carlos, “o estudante percebe que os dois usaram uma grandeza infinitamente pequena, mas o método de Fermat só servia para a parábola, e o de Newton era muito mais geral. Com o de Newton, o estudante já consegue achar a derivada de todas as funções polinomiais.”

Lembrete: Coeficiente binomial. É o número que o estudante denota por C(n, r), em que n é um inteiro positivo e r é um inteiro tal que 0 ≤ rn, e que expressa com a fórmula:

Por convenção, 0! = 1, e portanto o estudante pode aceitar a igualdade a seguir:

O prédio da matemática. Carlos consegue dar todas essas explicações (mais explicações sobre os métodos de Leibniz, que não foram incluídas neste texto) em apenas meia hora, desde que o interlocutor recorde a matemática do ensino médio e já conheça um pouco de cálculo. Mesmo assim, raramente dá tais explicações a alunos da graduação. “Faço apenas breves comentários; por exemplo, digo que alguns autores achavam importante correlacionar movimento com formas geométricas.” Não dá tempo de parar um curso de graduação, no qual todo mundo está morrendo de pressa, para explicar os métodos antigos e o modo como os antigos pensavam. “Não acho que seja absolutamente essencial recorrer à história da matemática em sala de aula”, diz Carlos; isso porque há outras maneiras de o aluno se manter motivado. “O aluno de engenharia, por exemplo, estuda cálculo com afinco assim que percebe que, sem o cálculo, não tem como estudar direito os temas da engenharia.” No entanto, Carlos acha que o professor de matemática deve conhecer a história dos assuntos que ensina. Mesmo que não tenha tempo de se referir à história explicitamente, pode usá-la para propor exercícios, organizar a sequência de matérias, e aproveitar aquelas situações nas quais um aluno diz alguma coisa, ou faz uma brincadeira, e daí uma referência à história cabe com perfeição.

Ao estudar a história da matemática do jeito que deve ser estudada (veja mais abaixo a seção ‘Como Estudar a História da Matemática?’), o estudante (seja só estudante, seja também professor) deixa de ver tal história como um prédio, no qual cada geração adiciona uma nova fileira de tijolos. “Essa visão não faz muito sentido”, diz Carlos. “Na matemática, não existe nada atemporal; nem mesmo as ideias fundamentais da matemática são atemporais. O Euclides procurando padrões, por exemplo, é muito diferente de Cauchy procurando padrões, porque, se damos atenção aos detalhes, cada um deles está fazendo algo diferente do que o outro está fazendo.” Com as lições de história, o estudante Tarcísio percebe que cada geração reduz o prédio da matemática a escombros, e com os escombros constrói um prédio novo e diferente. Assim como no prédio anterior, no prédio novo existe um tijolo chamado “teorema de Pitágoras”, e outro chamado “limite”, e outro chamado “derivada”, mas esses tijolos estão em lugares diferentes do prédio, assentados em cima de tijolos diferentes e debaixo de tijolos diferentes, escondidos sob acabamento diferente. Uma ideia matemática só é eterna no sentido de que é revista e reescrita sempre que surgem ideias novas — mas ideias novas surgem sempre. {FIM DA MATÉRIA PRINCIPAL}



{2}/ Um estudo do método de Roberval

Fig. 7

Em primeiro lugar, Tarcísio precisa saber onde fica o foco duma parábola do tipo y = x2. Depois de umas tentativas, esboça a figura 7 (acima) e reúne num canto do caderno as informações sobre cada um dos pontos:

● A distância da origem O até o foco F é igual a a; logo as coordenadas do ponto F são (0, a).

● A distância do ponto O ao ponto D é x; as coordenadas de D são (x, 0).

● Pela definição de parábola, as coordenadas do ponto B são (0, –a), pois a distância da origem O até o foco F tem de ser a mesma da origem O até a diretriz, que passa pelo ponto B. (A diretriz é a linha y = –a.)

● Sendo assim, as coordenadas do ponto C são (x, –a).

● As coordenadas do ponto G, que pertence à parábola, são (x, x2).

● A distância d é a distância entre o foco F e o ponto G; pela definição da parábola, deve ser igual à distância entre o ponto C e o ponto G.

● A distância EG é igual a x2a, isto é, igual à ordenada de G menos a ordenada de E.

● A distância FE é igual a x, isto é, igual à abscissa de G menos a abscissa de F.

● Portanto, d = FG = CG, que deve ser igual a x2 + a, isto é, igual à ordenada de G mais o valor absoluto da ordenada de C, que é igual ao valor absoluto da ordenada de B.

Com tudo isso, Tarcísio usa o teorema de Pitágoras para criar e depois desenvolver a igualdade abaixo:

Feito isso, eleva os dois lados da igualdade ao quadrado:

Toma nota da descoberta: “O foco duma parábola do tipo y = x2 fica no ponto F = (0, 1/4). Como consequência, a diretriz dessa parábola fica na linha y = –1/4. Qualquer que seja o valor de x, a distância entre o ponto (x, x2) e o ponto (0, 1/4) tem de ser a mesma distância entre o ponto (x, x2) e a linha y = –1/4.” (Mantidos, é claro, os sinais corretos, positivo ou negativo.)

Fig. 8

Com o primeiro passo dado, Tarcísio esboça a figura 8, dá nome a todos os pontos (até aqueles que, depois, não vai usar para nada) e escreve no caderno mais coisas que pode dizer a respeito do desenho, visto que já descobriu onde fica o foco da parábola y = x2:

● A distância do ponto M até o ponto J é igual a x2.

● A distância de J até I tem de ser a mesma distância de E até G, pois os triângulos GFE e IGJ são idênticos; essa distância é igual a x2 – (1/4), isto é, a ordenada de G menos a ordenada de E.

● A distância de I até P tem de ser a mesma distância de G até H, pois tais pontos fazem parte do paralelogramo regular GHPI; tal distância é igual a x2 + (1/4), isto é, igual à ordenada de G mais o valor absoluto da ordenada de C. (Tarcísio notou que a distância GH é a mesma distância CG, que é a distância do ponto em estudo, o ponto G, até a diretriz da parábola.)

● As coordenadas do ponto M são (2x, 0).

Com tudo isso, Tarcísio sente que pode responder à pergunta: quais são as coordenadas do ponto P? A abscissa é fácil: é 2x, a mesma abscissa de M. A ordenada é a soma das distâncias de M até J (x2), de J até I (x2 – 1/4) e de I até P (x2 + 1/4): fazendo as contas, 3x2.

Bom, por meio de Roberval, Tarcísio sabe que o coeficiente angular da reta que passa pelos pontos G e P é igual à derivada de y = x2 no ponto G. As coordenadas de G são (x, x2) e as de P são (2x, 3x2). Tarcísio usa a teoria usual sobre retas para achar o gradiente do segmento de reta GP, que ele chama de mGP:

Perfeito. Tarcísio fica espantado com o fato de que, com a ajuda de um francês do século 17, tenha provado que a derivada de y = x2 é igual a 2x sem a ajuda de nenhum limite. “Roberval merece seu lugar na história.” {❏}



{3}/ Um estudo do método de Fermat

Fig. 9

Tarcísio examina de novo a prova de Fermat, e procura jeitos de traduzi-la em linguagem e notação atuais. Quando, na última linha de sua demonstração, Fermat afirmou que d ≈ 2a, o que quis dizer? Tarcísio esboça a figura 9, que mostra três pontos importantes no gráfico da parábola y = f(x) = x2, e percebe que Fermat disse o seguinte:

Tarcísio sabe que pode usar a derivada de f para reescrever a equação da reta t (do tipo y = mx + c) de outra maneira, visto que sabe que a reta t passa pelo ponto P = (b, b2) e pelo ponto C = (0, c) e é a reta tangente a y = x2 no ponto (b, b2):

Tarcísio simplesmente reafirmou que o gradiente da reta tangente (m na equação usual de uma reta qualquer) tem de ser igual à derivada e que, conhecendo os valores de b, de f(b) = b2 e da derivada f’(b), qualquer um pode calcular o valor de c. Com isso passa às contas, trocando as distâncias usadas por Fermat (d e a) pelas distâncias marcadas na figura 9 (sempre tomando cuidado com os sinais positivo e negativo):

Como a penúltima linha é verdadeira, Tarcísio prova que a afirmação de Fermat é verdadeira à luz da geometria analítica, mais uma pitada de cálculo diferencial. {❏}



{4}/ Coordenadas, abscissas, ordenadas

Quando usa o plano cartesiano, o estudante pode identificar cada ponto por meio de duas distâncias: a distância x da origem até a linha vertical que passa pelo ponto e a distância y da origem até a linha horizontal que passa pelo ponto. Se o ponto for chamado de P, pode identificá-lo assim: P = (x, y). A distância x é chamada de abscissa, e a distância y, de ordenada.



{5}/ Coeficiente angular ou tangente?

Fig. 10

Coeficiente angular, tangente, gradiente, e derivada são quatro nomes distintos para o mesmo objeto matemático; conforme o contexto, o matemático escolhe um nome ou outro.

Para entender esse ponto, o estudante Tarcísio desenha no caderno um plano cartesiano com uma reta r, e marca no plano os pontos A, B, e M (figura 10). A e B estão contidos na reta r, mas M é um ponto cuja reta que interliga A e M é paralela ao eixo x e cuja reta que interliga M e B é paralela ao eixo y. Feito isso, acha o gradiente da linha reta ao calcular o quociente de duas distâncias:

Ele nota que MB é a medida do vetor MB, isto é, a linha que liga B a M tem direção positiva para cima. Então, a distância MB vale |MB| se B está acima de M, mas vale –|MB| se B está abaixo de M. Da mesma forma, a distância AM = |AM| se M está à direita de A, mas a distância AM = –|AM| se M está à esquerda de A. Tarcísio traduz isso tudo assim: “O gradiente de r é o quanto y aumentou (no eixo y), aumento esse dividido pelo quanto x aumentou (no eixo x); ou, no caso de gradiente negativo, o quanto y diminuiu (no eixo y), diminuição essa dividida pelo quanto x aumentou (no eixo x).” É a famosa variação em y dividida pela variação correspondente em x.

“É o quanto subo na rampa em relação à distância que percorro no solo, ou o quanto desço na rampa em relação à distância que percorro no solo.”

Tarcísio denota o gradiente da reta r por mAB, as coordenadas do ponto A por (x1, y1) e do ponto B por (x2, y2), com x1x2. Então calcula o gradiente de r com facilidade:

Também recorre ao círculo trigonométrico (de raio igual a 1; veja a figura 11) e prova que o gradiente equivale à tangente do ângulo θ, o ângulo que a reta r faz com o eixo x (ângulo medido em radianos). “Coeficiente angular” é o nome dessa tangente de θ. Como os triângulos ABM e CDE são semelhantes, Tarcísio facilmente prova que:

Fig. 11

Conhecendo todas essas informações, mais a altura na qual a reta r cruza o eixo y (marcado no desenho pelo ponto (0, c)), Tarcísio pode escrever a equação da reta r assim:

Se a reta que une A e B é vertical, é costume dizer que o gradiente é infinito. (Visto que o gradiente é um quociente, em tese não faz sentido falar do gradiente de uma reta vertical; contudo, o gradiente tende ao infinito quando x2x1 tende a zero, e por isso é comum ouvir alguém falar de “gradiente infinito”.) Tarcísio toma notas sobre as propriedades principais do coeficiente angular:

● Os pontos A, B, e C = (0, c) são colineares se e somente se mAB = mAC. (Pontos colineares pertencem à mesma reta, isto é, suas coordenadas x e y, quando colocadas na equação da reta, tornam a equação verdadeira.) Isso inclui o caso em que mAB e mAC são ambos infinitos.

● As reta de gradiente m1 é paralela à reta de gradiente m2 se e somente se m1 = m2. Isso vale quando m1 e m2 são ambos infinitos.

● As reta de gradiente m1 é perpendicular à reta de gradiente m2 se e somente se m1 · m2 = –1. Tarcísio percebe que, ao analisar os números, precisa verificar se m1 = 0 e m2 é infinito, ou vice-versa, pois neste caso as duas retas são perpendiculares, porém a fórmula m1 · m2 = –1 não se aplica.

A ideia de derivada. Com essas informações, Tarcísio se pergunta: “Qual é coeficiente angular de uma curva y = f(x) num ponto A?” (Veja a figura 12.) De modo simples, intuitivo (ou heurístico, como dizem os matemáticos), pode definir esse coeficiente angular como o gradiente da reta tangente à curva no ponto A. Tarcísio arrisca uma explicação em termos menos elegantes: “O coeficiente angular de uma curva num ponto A é a tangente da reta tangente à curva no ponto A.”

Fig. 12

Hoje Tarcísio sabe que o melhor jeito de achar essa tangente é calcular um limite. Ele pega essa função y = f(x) qualquer, e marca um ponto A no gráfico dessa função, cujas coordenadas são (x0, f(x0)), e marca também um ponto B no gráfico, próximo de A, cujas coordenadas são (x0 + Δx, f(x0 + Δx)). (Δ é a letra grega delta, e é muito usada para passar a ideia de variação.) “Posso dizer que uma mudança Δx em x provoca, de acordo com a fórmula da função f, uma mudança Δy em y.” (Neste caso, Δy = f(x0 + Δx) – f(x0).) Ao calcular o quociente Δyx, Tarcísio obtém o gradiente da corda AB. (Corda é um segmento de uma reta secante a uma curva; reta secante é a que intercepta uma curva.) Conforme Tarcísio diminui o valor de Δx (isto é, conforme aproxima o ponto B do ponto A), o coeficiente angular da corda AB (isto é, a tangente do ângulo α) se aproxima do coeficiente angular da reta tangente à curva no ponto A (na figura 12, essa reta é a C). “A derivada de f no ponto A, ou seja, a derivada de f no ponto em que x = x0, é o limite do quociente Δyx conforme Δx tende a zero, caso esse limite exista.” Tarcísio põe tudo isso no papel:

 

Há vários símbolos para a derivada. Se r = g(s), isto é, se r é função de s conforme a fórmula representada pela letra g (por exemplo, r = s3s2), Tarcísio pode representar a derivada de g(s) de várias maneiras, todas equivalentes:

Tarcísio sabe então que, quando diz “a derivada da função g no ponto em que s = a”, está querendo dizer “o coeficiente angular da reta tangente à curva da função g no ponto em que s = a”, ou está querendo dizer “a tangente da reta tangente à curva da função g no ponto em que s = a”, ou está querendo dizer “o gradiente da reta tangente à curva da função g no ponto em que s = a” ou está querendo dizer “a tangente à curva da função g no ponto em que s = a”, ou, mais simplesmente, “a inclinação da curva da função g no ponto em que s = a”. Tarcísio sabe também que, se pudesse viajar para o passado, Roberval, Fermat, Descartes, Newton e Leibniz pagariam caro para saber o que ele estuda hoje em livros comuns de cálculo, e pagariam mais caro ainda para conhecer o sistema dos números hiper-reais. {❏}



{6}/ Por que a parábola?

Ao examinar textos de matemática a partir do século 17, o estudante fica com a impressão de que os matemáticos eram obcecados por parábolas. Todos os grandes matemáticos investigaram suas propriedades, e por isso o professor Carlos Gonçalves preferiu mostrar exemplos de como achar o coeficiente angular de retas tangentes a parábolas. Mas por que os matemáticos mais antigos ficavam fascinados com parábolas? Ora, parábolas abundam na natureza, e os matemáticos antigos raramente eram apenas matemáticos — eram também cientistas, principalmente físicos e astrônomos.

Ao jogar uma bola ao ar, por exemplo, ela percorre uma trajetória que pode ser bem descrita com as fórmulas de uma parábola. A trajetória de qualquer corpo que esteja sob a influência de um campo gravitacional uniforme (e que não seja desviado pela resistência do ar) pode ser descrita com as fórmulas de uma parábola: isso vale para uma bola de basquete quicando no chão, para uma bala de canhão voando pelo ar, para um planeta orbitando uma estrela… Oops! Um planeta orbitando uma estrela? Esse movimento não deve ser descrito com uma elipse?

Parábolas, elipses, hipérboles, e círculos são seções cônicas, e todo cientista usa muito tais seções para estudar fenômenos da natureza. Isso significa que, a partir do século 17, quando nasceu a ciência do modo como a entendemos hoje, todos os matemáticos trabalharam bastante para achar as derivadas e as integrais de todas as seções cônicas. Hoje, um aluno de engenharia que estude jeitos de aplicar o cálculo diferencial e integral às seções cônicas deu um passo largo na direção de se transformar num ótimo engenheiro. {❏}



{7}/ Como estudar a história da matemática?

Há ótimos livros de história da matemática no mundo, alguns publicados em português, mas Carlos Gonçalves diz que, na universidade, um estudo sério de história toma tempo — tanto tempo que o aluno é obrigado a escolher: ou história da matemática ou outra coisa qualquer. Pouquíssimos conseguem se especializar em outra coisa qualquer (como cálculo de variedades) e em história também.

Para começar, o estudante de história tem de ler textos antigos no original: sumério, grego, latim, francês, alemão, o que for. Carlos, por exemplo, é especialista em história da matemática na mesopotâmia antiga, e trabalha com textos de 4.000 anos de idade. Lê sumério e arcadiano (as línguas usadas pelos mesopotâmios daquela época) em textos cuneiformes. “O cuneiforme não é a língua”, diz Carlos, “mas o sistema de escrita.” Lê também grego e latim antigos.

Um estudante de história da matemática impõe a si mesmo o desafio de se livrar de seus olhos modernos. Deve usar a língua do matemático em estudo, sua notação, e deve também raciocinar de acordo com as ideias vigentes na época em estudo. “Uma das questões que costumamos pesquisar é: a partir do ponto de vista do personagem que estou estudando, por que determinada resposta a um problema lhe pareceu satisfatória? É difícil entender as motivações do personagem.” De certa forma, o trabalho do historiador beira o impossível.

Nesta reportagem, portanto, quando o leitor topa com uma frase do tipo “Fermat raciocinou assim e assado, e desenhou isso e aquilo”, deve saber que está diante de uma versão supersimplificada do que aconteceu no passado, criada não pelo professor Carlos Gonçalves (ele não faria isso), mas pelo redator deste blogue, com o objetivo de deixar o texto mais fácil de interpretar e mais agradável.



{8}/ A derivada de y = x2 pelo método moderno

O estudante Tarcísio já viu que, para calcular a derivada de y = f(x) = x2, deve calcular um limite:

 

Ele começa colocando x + h e x na fórmula da função f, e depois disso usa a teoria a respeito de limites para simplificar a fórmula da derivada f’:

Antes de arrematar a conta, Tarcísio para um pouco e examina a última linha da lista acima. “Isto é um infinitésimo”, ele anota no caderno. “O limite de h, quando h tende a zero, é zero. Uma variável cujo limite tende a zero é uma das definições atuais de infinitésimo. Antigamente, os matemáticos diziam que o infinitésimo era a quantidade que desaparecia, sem nunca, contudo, desaparecer de fato. Até certo ponto, estavam certos!” Então Tarcísio arremata a conta e acha a derivada de y = f(x) = x2, que grafa de dois jeitos, um com a notação de Newton (chamada hoje de notação de linha) e o outro com a notação de Leibniz:

Ambos os jeitos querem dizer a mesma coisa. A notação de Newton é vantajosa quando o estudante tem de realizar muitas manipulações algébricas, pois é mais fácil mover o símbolo f’(x) para cima e para baixo do que mover o quociente dy/dx. A notação de Leibniz é vantajosa quando o estudante quer deixar na cara do leitor a função original (x2), a variável que serve de referência para a derivada (x) e a derivada em si (2x). {❏}



{9}/ A derivada de todo dia

Todo engenheiro e cientista precisa muito da ideia de derivada. Por quê? Derivadas representam um isso dividido por um aquilo: quilômetros por hora, metros por segundo ao quadrado, mililitros por quilograma, reais por dia, calorias por semana. Como derivadas representam a velocidade com que alguma coisa muda em função das mudanças de outra coisa, são utilíssimas.

Se o leitor dirige, topa sempre com uma derivada ao olhar o velocímetro do carro. A distância total percorrida, dividida pelo tempo para percorrer tal distância, dá a velocidade média do carro durante a viagem. O motorista conhece a velocidade instantânea quando olha o velocímetro, e vê a taxa com que o carro está percorrendo, a cada instante infinitésimo da viagem, certa quantidade de quilômetros a cada hora. {FIM}


Observações:

1. Publiquei uma versão deste texto pela primeira vez na revista Cálculo: Matemática para Todos, edição 25, fevereiro de 2013, pág. 28. A versão que acabou de ler foi revista e reescrita.

2. Se gostaria de saber mais sobre vetores, veja o texto A Aritmética do Espaço; para ver como usar a ideia de vetores na construção de números complexos, veja o texto Tudo Sobre Números Complexos.

3. Este blogue contém um curso de cálculo diferencial e integral com base não em limites, mas no sistema dos números hiper-reais. Para ler o primeiro capítulo, clique aqui.

4. Há outros dois bons textos sobre história da matemática: Os Mesopotâmicos Sabiam Mais do que Imaginávamos e O Teorema de Pitágoras Não É de Pitágoras.

5. As figuras 1 a 12 foram feitas pelo artista gráfico Henrique Arruda.

6. Sobre o modo como o blogueiro padronizou o uso das palavras “círculo” e “circunferência”, veja esta matéria.

Ano de eleições é ano de estatística é ano de erros


Uma previsão para as próximas eleições, quer ocorram este ano, quer ocorram em 2018: em algum momento, em alguma cidade, algum instituto de pesquisa errará feio. Os acadêmicos sabem disso, os institutos sabem disso, e neste texto o leitor entende os porquês.


{1}/ O problema de métodos baratos e rápidos

Nas eleições de 1985 para a prefeitura de São Paulo, uma pesquisa do Datafolha indicava a vitória de Fernando Henrique Cardoso sobre Jânio Quadros. Fernando Henrique chegou a se sentar na cadeira do prefeito, e o fotógrafo presente (Jorge Rosenberg) clicou a cena várias vezes, de vários ângulos. Há várias cópias dessas fotos na internet: uma delas mostra o candidato olhando para a câmera, segurando uma caneta sobre um papel, como se já fosse o prefeito e estivesse a ponto de assinar um documento importante. Terminadas as eleições e apurados os votos, Jânio Quadros se elegeu prefeito com 4 pontos porcentuais de vantagem sobre FHC. Na internet, também existe a cópia de outra foto: antes de se sentar na tal cadeira, Jânio teve o cuidado de, digamos assim, desinfetá-la. A foto mostra Jânio passando inseticida sobre o espaldar.

Todos os institutos erram: Ibope, Vox Populi, Sensus; todos eles já divulgaram pesquisas que, depois, se mostraram muito erradas. Visto que os funcionários desses institutos tiveram tempo de estudar os erros do passado, o que acontecerá na próxima vez que houver eleições? É bem provável que eles, os funcionários e os institutos, errem feio de novo — isso é tão batata quanto uma batata é uma batata. Se não em São Paulo, errarão em Brasília; se não em Brasília, em Vitória; se não em Vitória, em Palmas. Pois tais funcionários não podem recorrer ao método mais confiável de realizar uma pesquisa eleitoral: ele é caro, mas, pior do que isso, ele só permite uma boa previsão depois de semanas de trabalho. Então os funcionários recorrem ao método com o qual produzem uma previsão em dois ou três dias, e que também é mais barato, mas com o qual, de quando em quando, produzem erros difíceis de explicar.

Três bairros em São Paulo. De modo geral, o analista de um instituto de pesquisas pode escolher dois métodos, e quase sempre ele escolhe o método de amostragem por cotas, que é mais rápido e mais barato, mas também menos confiável. Se ele quer saber em quais candidatos os eleitores de São Paulo pretendem votar, primeiro procura saber qual é o perfil dos eleitores de São Paulo: como tais eleitores podem ser classificados por sexo, idade, escolaridade, renda mensal, endereço?

Se o analista pudesse entrevistar só 1.000 pessoas, e se São Paulo tivesse só três bairros (o bairro A, de classe alta, que representa 10% da população; o bairro B, de classe média, que representa 30% da população; e o bairro C, de classe baixa, que representa 60% da população), o analista faria assim: ele localizaria, em cada bairro, um lugar por onde passa muita gente daquele bairro. No bairro A, esse lugar seria um shopping center. No bairro B, uma galeria. No bairro C, um mercadão. O analista iria até o shopping do bairro A e entrevistaria a esmo 100 pessoas. Iria até a galeria do bairro B e entrevistaria a esmo 300 pessoas. E iria até o mercadão do bairro C e entrevistaria a esmo 600 pessoas. É assim que funciona o método por cotas: o analista vai até o lugar por onde as pessoas de determinado perfil andam, e aborda as pessoas mais ou menos a esmo (mais ou menos porque, se tem de entrevistar 100 homens e 100 mulheres, por exemplo, ele aborda a esmo 100 homens e aborda a esmo 100 mulheres; se tem de entrevistar 20 mulheres grávidas, aborda a esmo 20 mulheres grávidas). No segundo turno das eleições de 2010 para presidente, por exemplo, o Datafolha usou esse método para ouvir 6.554 eleitores em 257 cidades ao longo de dois dias.

O instituto de pesquisa, quando divulga os resultados, divulga também a margem de erro, de dois a três pontos porcentuais. Se 51% dos eleitores planejam votar no candidato Direita e 49% planejam votar no candidato Esquerda, e se a margem de erro é de 3 pontos porcentuais, então o analista deveria divulgar uma tabela mais ou menos assim:

Direita Esquerda
51% 49%
54% 46%
48% 52%

O cenário divulgado pelo instituto diz que Direita deve ganhar de Esquerda, mas talvez direita ganhe de lavada ou talvez Esquerda ganhe com alguma folga — ou talvez ainda aconteça qualquer coisa entre esses dois extremos. Especialistas não veem problema nenhum nas margens de erro — toda pesquisa eleitoral, não importa o método, tem margem de erro. Mas Cristiano Ferraz, professor de pós-graduação em estatística na Universidade Federal de Pernambuco, diz que com frequência a realidade se revela muito além ou muito aquém da margem de erro das pesquisas feitas com o método por cotas.

Em 1989, nas eleições para presidente, o Datafolha disse que Collor teria 26% dos votos, mas teve 30,5% (diferença de 4,5 pontos porcentuais); disse que Ulysses Guimarães teria 11% dos votos, mas teve 4,7% (diferença de 6,3 pontos porcentuais). Em 1986, nas eleições para governador, o Ibope disse que Itamar Franco (39%) ganharia o governo de Minas Gerais concorrendo com Newton Cardoso (36%), mas Newton Cardoso ganhou com 40% dos votos (diferença de 4 pontos porcentuais). No Pará, ainda segundo o Ibope, Hélio Mota Gueiros ganharia o governo do estado com 63% dos votos; Hélio ganhou de fato as eleições, mas com 55% dos votos (diferença de 8 pontos porcentuais). Em 1994, foi a vez do Vox Populi errar feio. Nos últimos dias do segundo turno, o instituto disse que Valmir Campelo (48%) ganharia de Cristovam Buarque (42%), mas, terminada contagem dos votos, Cristovam ganhou a eleição com 51% dos votos (diferença de 9 pontos porcentuais). Em 2010, na última pesquisa antes das eleições, o Datafolha disse que os paulistas elegeriam dois senadores, Marta Suplicy (24%) e Netinho de Paula (24%), e deixariam de fora Aloysio Nunes (20%), mas, no fim das contas, os paulistas elegeram Aloysio Nunes com 30,42% dos votos (diferença de 10,42 pontos porcentuais) e Marta Suplicy com 22,61% dos votos (dentro da margem de erro).

O grandão mal-encarado. Autores de livros didáticos sobre estatística dizem que, para que uma amostra da população represente bem o que pensa a população inteira, cada membro da população tem de ter a chance de ser incluído na amostra. Isso significa que, se o Datafolha ou o Sensus querem organizar uma pesquisa para saber em qual prefeito os paulistanos pretendem votar, cada paulistano deve ter uma chance maior que zero de ser ouvido. Na amostragem por cotas, contudo, assim que o instituto escolhe o lugar em que vai realizar as entrevistas (por exemplo, o mercadão), ele automaticamente exclui todos os paulistanos que nunca vão ao mercadão. A chance de que tais paulistanos sejam ouvidos se iguala a zero.

Cristiano diz que essa ideia é difícil de entender. Em geral, diz ele, o leigo associa a palavra “aleatório” com “vale tudo e qualquer coisa”. Sendo assim, o leigo não vê problema quando descobre que o instituto colocou pesquisadores na esquina da Ipiranga com a São João, mesmo que ele nunca tenha passado por tal esquina na vida. Além disso, talvez o pesquisador (um homem), postado na tal esquina, tenha de entrevistar 50 homens e 50 mulheres. Lá vem um homem. Ele é grande, está sujo, e olha à sua volta como se buscasse a oportunidade de roubar um relógio. Deixa esse homem para lá. Lá vem outro. Ele usa óculos, carrega uns livros, está com fones de ouvido e está sorrindo; parece que está curtindo o passeio e a música. “Boa tarde”, diz o pesquisador. “Pode responder uma pergunta para o instituto X?” Lá vem uma mulher. Tem o rosto bem enrugado, os cabelos brancos desgrenhados, e está falando sozinha. Deixa essa para lá. Lá vem outra, bem atrás, jovem, linda. Ela viu o pesquisador de longe, entendeu o que está acontecendo, e no seu rosto se lê: me escolhe! me escolhe! “Boa tarde”, diz o pesquisador, e assim, sem perceber, o pesquisador reduziu a chance do homem grande e da velha doida a zero, e tal redução não ocorreu por acaso.

José Ferreira de Carvalho, professor aposentado da Universidade Estadual de Campinas (Unicamp) e coordenador da Statistica Consultoria, traduz essa cena toda numa palavra: subjetividade. “Na amostragem por cotas”, diz Ferreira, “os pesquisadores atribuem probabilidades de seleção iguais dentro de cada extrato.” No exemplo da São Paulo com três bairros, os três extratos são classe alta, classe média e classe baixa. “Mas isso sai da cabeça deles; eles não têm nenhuma base para dizer isso. Não dá para dizer que esse tipo de pesquisa é enviesado. Ele simplesmente… não é uma pesquisa!”

Foi por conta dessa subjetividade que o Datafolha errou em 1985, na disputa entre FHC e Jânio Quadros. Funcionários do Datafolha fizeram reuniões para entender o que aconteceu, e chegaram à conclusão de que havia muitos velhos entre os eleitores de Jânio, e eles haviam se recusado a responder às perguntas dos moços e das moças do Datafolha. No caso de Aloysio Nunes, em 2010, havia muitos votos do tipo “não sei”. Como o eleitor escolhe o senador dentro da escola, na fila para votar; e como muito eleitor também escolhe o senador pela sigla, ao votar no governador, e como o eleitor votou em Geraldo Alckmin (50,63% dos votos válidos), os funcionários do Datafolha não captaram a guinada na direção de Aloysio Nunes.

Aleatório não doma aleatório. Estatísticos como Cristiano e Ferreira batizaram seu método preferido de método por amostragem probabilística; às vezes, eles também chamam esse método de método por amostragem aleatória. Nesse método, todas as pessoas da população a ser estudada têm chance maior que zero de participar da pesquisa, quer frequentem o shopping do bairro A ou não, quer frequentem a galeria do bairro B ou não, quer frequentem o mercadão do bairro C ou não, quer sejam grandes e sujos ou pequenos e limpos, quer penteiem os cabelos ou os deixem desgrenhados, quer falem sozinhos ou cantem no banheiro, quer sejam lindos ou tenham uma verruga peluda no nariz.

Como eles fazem isso? Eles levantam o perfil da população a ser estudada, dividem a população em extratos (por idade, sexo, renda, escolaridade, etc.), depois sorteiam as pessoas a entrevistar, e por fim entrevistam somente as pessoas sorteadas. Na São Paulo de três bairros, eles sorteariam 10% das pessoas do bairro A, 30% das pessoas do bairro B e 60% das pessoas do bairro C. Dito assim, isso tudo parece simples, mas, se um instituto consegue cumprir o método de amostragem por cotas em uns poucos dias, precisa de meses para cumprir o método de amostragem aleatória. Primeiro, terá de conseguir algum banco de dados confiável com os dados da população a ser estudada, pois, em geral, o analista precisa de um banco de dados antes de sortear as pessoas a entrevistar. Conseguir um banco desses, contudo, ou é caro, se for comprado pronto, ou é difícil de construir, se for construído do zero. Depois do sorteio, o entrevistador tem de ir até a casa do entrevistado tantas vezes forem necessárias até que consiga realizar a entrevista. Supondo que o entrevistado esteja acampando no Denali National Park, no Alasca, o instituto terá de realizar um novo sorteio. Esse é o método usado pelo Instituto Brasileiro de Geografia e Estatística (IBGE) para produzir a Pesquisa Nacional por Amostra de Domicílios (PNAD); em 2009, o IBGE ouviu 399.387 pessoas em 153.837 domicílios do Brasil inteiro.

Segundo Cristiano, a questão é que é impossível domar o aleatório com o aleatório. Para compreender o aleatório, o analista precisa de método; não pode recorrer à subjetividade vale-tudo da amostragem por cotas. “O sorteio sistematiza a amostra de forma objetiva.” Ferraz concorda. “O sorteio é o ingrediente-chave, o diferencial científico do método probabilístico.”

Cristiano até acha que os institutos, ao divulgar pesquisas apuradas com o método por cotas, se comportam de modo quase irresponsável. “Não é difícil encontrar eleitor que tenha a vontade de derrotar quem está na frente”, diz Cristiano, “e também não é difícil encontrar eleitor que tenha a vontade de votar em quem está na frente, simplesmente porque ela não gosta de perder.” Em outras palavras, as pesquisas interferem no comportamento dos eleitores, mas não só isso — elas interferem no comportamento de candidatos também. Um exemplo: em 2010, na disputa pela presidência, José Serra usou o segundo turno para condenar o aborto. As pesquisas mostravam duas coisas: que uma parcela importante dos eleitores não gostava de aborto, e que, se Serra insistisse na polêmica, não perderia os eleitores que já tinha conquistado. Ora, num mundo perfeito, o candidato deveria ser honesto com o eleitor, e o eleitor deveria votar no candidato que achasse melhor.

Trabalho em vão. No Datafolha, Renata Nunes César ouve todas essas explicações e críticas sem que seu rosto se altere um milímetro. Ela se formou em estatística, e trabalha no Datafolha desde 1998, onde chegou ao cargo de gerente de operações. Só para realizar uma pesquisa na cidade de São Paulo, por exemplo, o Datafolha emprega umas 150 pessoas, entre entrevistadores, checadores, planejadores e coordenadores. Há o risco de subjetividade na abordagem? O Datafolha, diz Renata, treina os entrevistadores para que eles conheçam o risco e saibam evitá-lo; eles até passam por simulações. Há o risco de alterar a resposta do entrevistado pelo jeito de fazer a pergunta? “Não fazemos perguntas prévias”, diz Renata. “Vamos direto para a intenção de voto, para não contaminar a manifestação do entrevistado.”

Além disso, Renata acha que estatísticos de perfil mais acadêmico, como Cristiano e Ferreira, confundem prognóstico com diagnóstico. “Temos claro que uma pesquisa de intenção de voto é diagnóstico, é uma fotografia do momento.” Como exemplo, Renata diz que o Datafolha foi o primeiro instituto a detectar, nas eleições de 2010, a onda verde, isto é, a existência de brasileiros simpáticos a Marina Silva (que na ocasião estava no Partido Verde); no fim das contas, ela ficou em terceiro lugar, com quase 20 milhões dos votos válidos. Logo em seguida, Renata afirma: “Uma pesquisa não é prognóstico. Não há como prever o que vai acontecer nas urnas.” Uma semana faz diferença: basta uma denúncia nos jornais, basta uma entrevista na TV, basta um debate, basta uma propaganda de TV bem-feita, basta um sermão numa igreja lotada, basta um boato no Facebook — e, de uma semana para outra, o eleitorado muda de opinião. “Se adotamos o método por amostragem aleatória, quando a pesquisa terminar, muito possivelmente a fotografia será outra. Todo o trabalho terá sido em vão.”

Cristiano acha que, se os institutos vão continuar usando o método das cotas, pelo menos deveriam divulgar as falhas do método. Será que isso funcionaria?

Diante do analista, talvez uma eleitora lhe diga:

“Eu tenho aqui duas moedas. Uma delas é viciada: tem duas caras. A outra é uma moeda comum. Vou escolher uma delas ao acaso, jogá-la para cima e deixá-la cair no chão cinco vezes seguidas.”

A eleitora faz o que prometeu, e o analista anota o resultado: deu cara cinco vezes seguidas. O que ele pode concluir dessa experiência? O analista usa o teorema de Bayes para chegar à conclusão de que a probabilidade de que a eleitora tenha escolhido a moeda viciada é de quase 97%. O que o instituto de pesquisa deveria divulgar, e o que os jornalistas de TV deveriam dizer no jornal da noite?

“O instituto X divulgou hoje os resultados da última pesquisa eleitoral”, diz o apresentador de TV. “A probabilidade de que a eleitora tenha escolhido a moeda viciada é de 97%.”

Corta para entrevistas com analistas e políticos, e um dos políticos até diz:

“Ahá! Eu sabia! Isso demonstra claramente que, se a eleitora jogar a moeda para cima 500 vezes, 500 vezes vai obter cara! Precisamos urgentemente tratar dessa questão no Congresso.”

Depois disso, corta para o apresentador de TV:

“Mas o instituto também avisa: talvez nada disso seja verdade, pois há 3% de probabilidade de que a eleitora tenha simplesmente escolhido a moeda comum, e que essa moeda comum caiu com a cara virada para cima cinco vezes seguidas por mero acaso.”

É pouco provável que aconteça algo assim, tão sensabor.

Cristiano e Ferreira, de um lado, e Renata, de outro, pelo menos concordam numa coisa: para quem gosta de estatística, não há lugar melhor no qual trabalhar do que num instituto de pesquisas em ano de eleição. Talvez essa seja a única situação na qual, no fim das contas, terminadas as eleições, o analista consegue acesso ao que toda a população de fato pensava uns momentos antes de clicar suas escolhas na urna eletrônica. Ainda assim, Renata não pode divulgar quantas vezes o Datafolha acertou nos últimos anos, quando comparado com as eleições reais. Seus chefes não permitem que essa informação seja divulgada, pois muito eleitor muda de ideia no dia da eleição. “Apesar do alto índice de acertos”, disse uma vez um dos executivos do Datafolha, “nós rejeitamos essa contabilidade, pois não é correta.” {❏}



{2}/ A famosa margem de erro

Estatísticos usam a expressão “margem de erro” para dizer algo de significado bem especial: se a margem de erro de uma pesquisa é de 3 pontos porcentuais, com nível de confiança de 95%, significa que, se alguém realizar 100 pesquisas como aquela, usando o mesmo método, em 95 das pesquisas os resultados deveriam estar a três pontos porcentuais do valor correto (seja ele qual for) e em 5 das pesquisas os resultados estarão muito longe do valor correto. Isso tudo tem três consequências importantes:

[1] Embora as 95 pesquisas mostrem um valor que está a 3 pontos porcentuais do valor correto, talvez o valor correto não apareça em nenhuma delas.

[2] É bem possível que 5 dessas 100 pesquisas mostrem valores muito distantes do valor correto, só que não existe matemático no mundo que possa dizer qual pesquisa é qual. Em outras palavras: é possível que as notícias no jornal e na TV se refiram a uma dessas 5 pesquisas completamente erradas.

[3] Se a margem de erro de uma pesquisa é de 3 pontos porcentuais, e se na próxima pesquisa, realizada pelo mesmo instituto com o mesmo método, os números variarem muito pouco em relação aos números da pesquisa anterior, então talvez nada tenha mudado. Por exemplo: se a intenção de voto no candidato A ficou em 45% na primeira pesquisa, significa que ficou entre 42% e 48%; se na segunda pesquisa a intenção de voto ficar em 47% (isto é, ficar entre 44% e 50%), talvez nada tenha mudado. Talvez a intenção de voto no candidato A era de 46% na primeira pesquisa e continuou em 46% na segunda. Portanto, essa segunda pesquisa deveria ser divulgada com cuidado, sem alarde, embora provavelmente será divulgada descuidadamente e com muito alarde… {❏}



{3}/ Um curso de estatística em poucas palavras

Jogue três moedas comuns para cima. O leitor não tem como prever como as três cairão no chão, se com a cara (C) ou a coroa (K) virada para cima, mas pode usar duas ideias bem básicas da matemática para estudar esse fenômeno.

● Defina o espaço amostral Ω, isto é, defina o conjunto de todos os resultados possíveis:

Ω = {CCC, CCK, CKC, CKK, KCC, KCK, KKC, KKK}

● Defina a densidade de probabilidade dentro do espaço amostral, isto é, defina como 1 a probabilidade associada ao espaço amostral Ω, e como 1 – pn a probabilidade associada a cada subconjunto n de Ω que você esteja considerando. (Dois lembretes: Ω tem 2n subconjuntos, sendo n o número de elementos de Ω; neste caso, n = 8 e 28 = 256. Além disso, na probabilidade e na estatística, pode chamar cada subconjunto de um espaço amostral de evento.) Por exemplo, o subconjunto {CKK} é um evento do espaço amostral Ω; o subconjunto {CKK, KKK} é outro evento. Fazendo assim, p1 + p2 + … + pn = 1, sempre conforme o perfil dos subconjuntos que esteja analisando. No caso do espaço amostral Ω, se estiver interessado apenas em eventos com um único elemento de Ω (como o evento {KCC} ou o evento {CCK}), a probabilidade de cada evento do espaço amostral é igual a 1/8 (12,5%), pois existem 8 eventos com apenas um elemento de Ω.

Pode parecer incrível, mas os matemáticos construíram toda a probabilidade, e depois dela a estatística, em cima dessas duas ideias fundamentais. Só com este breve exercício o leitor já pode responder várias perguntas sobre Ω:

(a) Qual é a probabilidade de que as moedas saiam com três caras ou três coroas? É 2/8 = 25%.

(b) Qual é a probabilidade de que as moedas caiam de tal modo que pelo menos duas coroas estejam viradas para cima? É 4/8 = 50%.

(c) Qual é a probabilidade de que a moeda do meio saia com a cara virada para cima? É de 4/8 = 50%. {FIM}


Observações:

1. Publiquei essa matéria pela primeira vez na revista Cálculo: Matemática para Todos, edição 16, maio de 2012, pág. 40. A versão que acabou de ler foi revista e reescrita.

2. As entrevistas foram realizadas pelo jornalista Francisco Bicudo.

3. O exemplo da cidade de São Paulo com apenas três bairros foi adaptado de um exemplo publicado pelo jornal Correio Braziliense.