aforismos e afins

09 dezembro 2005

Wikipedia, Falácias, e a Lei dos Grandes Números

A ler o post da Susana no Lida Insana acerca do que escreveu JPP no Abrupto, sobre polémicas à volta da Wikipedia, que inclui uma referência à Falácia 'Tu Quoque' (uma forma de ataque à pessoa que consiste em fazer notar que a pessoa não pratica o que diz).

Sobre a LGN. JPP diz que "A lei dos grandes números não garante a verdade." Ora, o que JPP queria provavelmente dizer é que uma audiência elevada não é garantia de verdade. Com certeza. Mas isto não tem nada a ver com a "Lei dos Grandes Números", e a menção que ele faz é desadequada. A LGN diz apenas, e muito simplesmente, que a média duma amostra converge (em probabilidade) para a média da população à medida que o tamanho da amostra aumenta (indefinidamente). A pretensa analogia/metafora de JPP não é aceitável porque a LGN diz respeito a uma propriedade interna do fenómeno estudado, enquanto a questão da audiência/popularidade da Wikipedia é uma propriedade externa.
¦
Para ilustrar a LGN, imaginemos uma fábrica de moldes onde a probabilidade de ter peçacas defeituosas é de 3%. Se se produzirem 200 moldes, o número esperado de erros é 6, mas não é lícito que ele seja exactamente 6. Ainda que em média a proporção de defeitos seja 3%, existe uma distribuição dessa mesma proporção de defeitos, o que implica que a sua variância não seja nula. Logo, a concretização dessa variável aleatória não tem que ser exactamente 3%, mas pode ser qualquer valor dessa distribuição (com diferente probabilidade). Contudo, à medida que a produção dessa fábrica cresce (e se aproxima do infinito), a proporção verificada de erros será cada vez mais próxima de 3%. [Equivalentemente, a variância da media amostral vai convergindo para zero]. No limite, a méedia amostral de peças defeituosas será mesmo 3%.
¦
Caso para dizer, Quem te manda a ti sapateiro sapateiro tocar rabecãao...

12 Comments:

  • Exactamente! Eu ate ja lhe mandei um mail a dizer-lhe para nao se meter muito nas ciencias, para se ficar pelas fotos do universo, porque so o faz cair no ridiculo! E ele ate escreve umas coisas engracadas sobre politica.
    luis

    By Anonymous Anónimo, at 3:12 da tarde  

  • Meu amigo. não fazes a distinção entre lei forte e lei fraca?

    By Anonymous Anónimo, at 6:02 da tarde  

  • Achei o teu exemplo da fabrica e dos 3%, muito teorico e com um erro, que nao e erro, porque tu sabes:
    "Contudo, 'a medida que a producao dessa fabrica cresce (e se aproxima do infinito), a proporcao verificada de erros sera' cada vez mais proxima de 3%."
    Isto da a impressao que a probabilidade da fabrica ter pecas defeituosas, estava determinada a partida, e que quantas mais medicoes fazes, mais a media se aproxima dos 3%. Tu sabes muito bem que nao e assim, que so no final de muitas contagens, a media se aproximara de um valor, que pode ser 3% ou 3,00001!
    "No limite"?!!
    Na pratica temos sempre limites! Nunca tens infinitos! Nao podes falar assim!
    Este tipo de raciocinio so e valido para abstracoes matematicas.
    Eu sei que tu sabes isso, nao e?
    luis

    By Anonymous Anónimo, at 7:03 da tarde  

  • "Meu amigo. não fazes a distinção entre lei forte e lei fraca?"

    Isso nao invalida o ponto que e' a desaquabilidade da analogia de JPP, uma vez que naquele contexto invocar a LGN nao tem sentido, porque nao se trata de um processo interno mas externo, sancionado pela popularidade, leitores, etc. Nao concordas?

    By Blogger Tiago Mendes, at 7:24 da tarde  

  • "Isto da a impressao que a probabilidade da fabrica ter pecas defeituosas, estava determinada a partida"

    Pode de facto. Por exemplo, se for uma distribuicao de Bernoulli, em que a probabilidade de sucesso (nao defeito) seja 97%, e onde as tiragens sao independentes.

    "Isto da a impressao que a probabilidade da fabrica ter pecas defeituosas, estava determinada a partida, e que quantas mais medicoes fazes, mais a media se aproxima dos 3%"

    A media amostral converge para a media da populacao. A media amostral so converge, 'a medida que se fazem mais amostras, em probabilidade, nao ha' determinismos aqui. Ou seja, nao e' *necessariamente* verdade que a media amostral de 1.000 amostras esteja mais perto da media da populacao que a media amostral de 50 amostras. (Mas e' mais provavel).

    "Na pratica temos sempre limites! Nunca tens infinitos! Nao podes falar assim! Este tipo de raciocinio so e valido para abstracoes matematicas."

    A LGN estupila um resultado que se verifica "no limite". Para uma discussao interessante sobre limites e infinito, lembro um livro que ja' recomendei:

    "Os problemas fundamentais da Matematica", de Bento de Jesus Caraca.

    O facto da LGN invocar o infinito nao lhe retira valor nem muito menos proibe que uma pessoa o possa utilizar para ilustrar um argumento. O que acontece e' que JPP o utilizou de forma errada, porque a analogia nao e' possivel.

    By Blogger Tiago Mendes, at 7:34 da tarde  

  • Caro LA-C:

    Achas que se eu tivesse referido a Strong Law of Large Numbers que alguem entendia alguma coisa?? O meu intuito foi mesmo dar um exemplo, tentar fazer com que a nota parecesse didactica, e nao hermetica ou demasiado tecnica ou longa...

    Caro Luis:

    Nao percebo bem que ache o exemplo da fabrica teorico, mas ok, e' uma opiniao. A distribuicao de Bernoulli e' a mais intuitiva que ha', e at'e me lembrei da fabrica dos Simpsons em que o Homer verificava (se estivesse atento) as pecas defeituosas.

    Tambem achei que falar em distribuicao de Bernoulli seria desnecessario, senao mesmo pedante. Enfim, nunca podemos alegrar toda a gente, I guess :)

    By Blogger Tiago Mendes, at 7:52 da tarde  

  • Tiago, eu nao me expliquei bem, desculpa. Se a maquina que faz as pecas nunca (impossivel!) se alterar ate ao fim da vida, a probabilidade estaria determinada a partida, e o mesmo que para um dado. O que eu queria dizer e, que para saberes essa probabilidade, tens que a medir! E quanto maior for a amostra, maior e a precisao, claro!
    O que tu dizes, e que tens um valor teorico, 3, e que a pratica se ira encarregar de demonstrar, cada vez mais correctamente, a medida que o numero de medicoes aumenta.
    Eu so te estava a chamar a atencao para te dizer que nao ha valores teoricos correctos a partida, especialmente para uma maquina numa fabrica. Pode haver boas previsoes. Primeiro experimentas a maquina e depois ficas a saber os defeitos dela.
    Nao ha valores teoricos exactos, PARA NADA! Nem que tenha que se ir buscar a equacao de incertesa de Heisenberg! Acho que nao e preciso isso para uma maquina numa fabrica, pois nao?
    luis

    By Anonymous Anónimo, at 7:58 da tarde  

  • Caro Luis,

    Ok, percebo o ponto. O exemplo nesse sentido era de facto teorico. Imaginemos um computador que determina, de forma aleatoria, e baseado numa distribuicao de Bernoulli com probabilidade de sucesso de 97%, se uma peca e' defeituosa ou nao.

    Assim, o valor de 3% e' um dado adquirido "'a prior" e nao sujeito a medicoes, nem ao problema que subjaz ao principio da incerteza de Heisenberg.

    Mas de facto nao precismaos disso. Assumindo que a probabilidade de defeito se mantem ao longo do tempo inalteravel (hipotese pouco provavel, mas teorica, e apenas para fazer o ponto de que nao e' NECESSARIO conhecer a priori o seu valor), ela sera X.

    Logo, o que eu queria dizer e' que - sem precisar de medicoes - nos sabemos que a media amostral vai convergir para X no limito. E nos so vamos descobrir X se vivermos infinitamente, etc. Eu dei um numero a X para que o exemplo fosse mais compreensivel.

    Enfim, e' preciso distinguir o grau discursivo num post e nos comentarios :)

    Concluindo: o teu ponto nao e' estritamente valido porque pode nao ser necessaria medicao. Com base somente em abstraccao teorica poderemos chegar a este resultado. Alternativamente, podemos pensar numa maquina que gera defeitos - claro, for the sake of example!!

    Mas esse exmplo ilustra que ha' uma "random process" por detras da fabrica, com a tal probabilidade desconhecida de X que, a manter-se constante, vai ser o limite da media amostral de defeitos quanto a amostra tende para infinito.

    By Blogger Tiago Mendes, at 8:18 da tarde  

  • Penso que a LGN garante que havera sempre erros que passem despercebidos.

    By Anonymous Anónimo, at 10:55 da tarde  

  • Tiago, nao ha nenhum exemplo pratico, real, onde nao haja erro de medicao!
    O metodo cientifico diz que a teoria e provada pela pratica. Se tu tens uma previsao teorica para seja o que for, so a pratica (a amostra), te vai dizer se a tua previsao estava, mais ou menos, correcta. Como e que um computador pode determinar com exactidao os 3% a priori, essa nao percebi! Nao te preocupes que eu conheco a distribuicao de Bernoulli.
    As teorias ou valores calculados, sao corrobados pela pratica. Tu sabes isso perfeitamente.
    Na vida real, as variancias nao convergem para 0!
    luis

    By Anonymous Anónimo, at 7:06 da tarde  

  • Luís, eu falei de exemplo teórico e não prático. Um computador concebe perfeitamente gerar as distribuiçõe que tiveres, que raio de pergunta é essa? Simulações de MOnte Carlo, etc. Escolhes a distribuição, os parâmetros dela, e simulas. E podes então obter resultados para médias amostrais com diferentes tamanhos da população. Aliás, a simulação é usada para ilustrar e ganhar intuição de muitos resultados teóricos.

    É preciso distinguir o plano teórico e empírico. Ou agora já não há matemática abstracta e matemática aplicada?

    PS: LA-C, não percebo honestamente o que queres dizer com "Penso que a LGN garante que havera sempre erros que passem despercebidos." O que a LGN garante é que os erros convergem para zero à medida que a amsotra atinge o infinito.

    By Blogger Tiago Mendes, at 8:25 da tarde  

  • "É preciso distinguir o plano teórico e empírico" dizes-me tu! Mas isso foi o que eu te disse no primeiro comentario:"Este tipo de raciocinio so e valido para abstracoes matematicas."!
    Dizes tu: "Logo, o que eu queria dizer e' que - sem precisar de medicoes - nos sabemos que a media amostral vai convergir para X no limito." Desculpa Tiago, mas numa maquina de uma fabrica, tu tens que fazer medicoes primeiro, para saber a media de pecas defeituosas, nao me venhas falar em simulacoes! Por isso e que eu nao percebi a tua resposta sobre as simulacoes!
    Conheco o metodo de Monte Carlo, e tu? Tu sabes bem, que nesse metodo,a tua precisao aumenta como o numero de "tiros" dados no alvo, ou nao e assim? Mesmo ai, tens sempre um valor que nao e exacto, PORQUE NUNCA CHEGAS AO INFINITO, NA VIDA REAL NAO HA INFINITOS! E nem vamos falar das funcoes que criam numeros aleatorios! E estamos a falar de uma simulacao, nao de uma situacao real, que foi com isso que eu comecei a conversa!
    PS Eu so te fiz uma pequena observacao!! Queres ganhar as discussoes todas?! Fazes-me lembrar um economista conhecido: nunca tenho duvidas e raramente me engano!
    luis

    By Blogger LA, at 9:39 da manhã  

Enviar um comentário

<< Home