Wikipedia, Falácias, e a Lei dos Grandes Números
A ler o post da Susana no Lida Insana acerca do que escreveu JPP no Abrupto, sobre polémicas à volta da Wikipedia, que inclui uma referência à Falácia 'Tu Quoque' (uma forma de ataque à pessoa que consiste em fazer notar que a pessoa não pratica o que diz).
Sobre a LGN. JPP diz que "A lei dos grandes números não garante a verdade." Ora, o que JPP queria provavelmente dizer é que uma audiência elevada não é garantia de verdade. Com certeza. Mas isto não tem nada a ver com a "Lei dos Grandes Números", e a menção que ele faz é desadequada. A LGN diz apenas, e muito simplesmente, que a média duma amostra converge (em probabilidade) para a média da população à medida que o tamanho da amostra aumenta (indefinidamente). A pretensa analogia/metafora de JPP não é aceitável porque a LGN diz respeito a uma propriedade interna do fenómeno estudado, enquanto a questão da audiência/popularidade da Wikipedia é uma propriedade externa.
Sobre a LGN. JPP diz que "A lei dos grandes números não garante a verdade." Ora, o que JPP queria provavelmente dizer é que uma audiência elevada não é garantia de verdade. Com certeza. Mas isto não tem nada a ver com a "Lei dos Grandes Números", e a menção que ele faz é desadequada. A LGN diz apenas, e muito simplesmente, que a média duma amostra converge (em probabilidade) para a média da população à medida que o tamanho da amostra aumenta (indefinidamente). A pretensa analogia/metafora de JPP não é aceitável porque a LGN diz respeito a uma propriedade interna do fenómeno estudado, enquanto a questão da audiência/popularidade da Wikipedia é uma propriedade externa.
¦
Para ilustrar a LGN, imaginemos uma fábrica de moldes onde a probabilidade de ter peçacas defeituosas é de 3%. Se se produzirem 200 moldes, o número esperado de erros é 6, mas não é lícito que ele seja exactamente 6. Ainda que em média a proporção de defeitos seja 3%, existe uma distribuição dessa mesma proporção de defeitos, o que implica que a sua variância não seja nula. Logo, a concretização dessa variável aleatória não tem que ser exactamente 3%, mas pode ser qualquer valor dessa distribuição (com diferente probabilidade). Contudo, à medida que a produção dessa fábrica cresce (e se aproxima do infinito), a proporção verificada de erros será cada vez mais próxima de 3%. [Equivalentemente, a variância da media amostral vai convergindo para zero]. No limite, a méedia amostral de peças defeituosas será mesmo 3%.
¦
Caso para dizer, Quem te manda a ti sapateiro sapateiro tocar rabecãao...
12 Comments:
Exactamente! Eu ate ja lhe mandei um mail a dizer-lhe para nao se meter muito nas ciencias, para se ficar pelas fotos do universo, porque so o faz cair no ridiculo! E ele ate escreve umas coisas engracadas sobre politica.
luis
By Anónimo, at 3:12 da tarde
Meu amigo. não fazes a distinção entre lei forte e lei fraca?
By Anónimo, at 6:02 da tarde
Achei o teu exemplo da fabrica e dos 3%, muito teorico e com um erro, que nao e erro, porque tu sabes:
"Contudo, 'a medida que a producao dessa fabrica cresce (e se aproxima do infinito), a proporcao verificada de erros sera' cada vez mais proxima de 3%."
Isto da a impressao que a probabilidade da fabrica ter pecas defeituosas, estava determinada a partida, e que quantas mais medicoes fazes, mais a media se aproxima dos 3%. Tu sabes muito bem que nao e assim, que so no final de muitas contagens, a media se aproximara de um valor, que pode ser 3% ou 3,00001!
"No limite"?!!
Na pratica temos sempre limites! Nunca tens infinitos! Nao podes falar assim!
Este tipo de raciocinio so e valido para abstracoes matematicas.
Eu sei que tu sabes isso, nao e?
luis
By Anónimo, at 7:03 da tarde
"Meu amigo. não fazes a distinção entre lei forte e lei fraca?"
Isso nao invalida o ponto que e' a desaquabilidade da analogia de JPP, uma vez que naquele contexto invocar a LGN nao tem sentido, porque nao se trata de um processo interno mas externo, sancionado pela popularidade, leitores, etc. Nao concordas?
By Tiago Mendes, at 7:24 da tarde
"Isto da a impressao que a probabilidade da fabrica ter pecas defeituosas, estava determinada a partida"
Pode de facto. Por exemplo, se for uma distribuicao de Bernoulli, em que a probabilidade de sucesso (nao defeito) seja 97%, e onde as tiragens sao independentes.
"Isto da a impressao que a probabilidade da fabrica ter pecas defeituosas, estava determinada a partida, e que quantas mais medicoes fazes, mais a media se aproxima dos 3%"
A media amostral converge para a media da populacao. A media amostral so converge, 'a medida que se fazem mais amostras, em probabilidade, nao ha' determinismos aqui. Ou seja, nao e' *necessariamente* verdade que a media amostral de 1.000 amostras esteja mais perto da media da populacao que a media amostral de 50 amostras. (Mas e' mais provavel).
"Na pratica temos sempre limites! Nunca tens infinitos! Nao podes falar assim! Este tipo de raciocinio so e valido para abstracoes matematicas."
A LGN estupila um resultado que se verifica "no limite". Para uma discussao interessante sobre limites e infinito, lembro um livro que ja' recomendei:
"Os problemas fundamentais da Matematica", de Bento de Jesus Caraca.
O facto da LGN invocar o infinito nao lhe retira valor nem muito menos proibe que uma pessoa o possa utilizar para ilustrar um argumento. O que acontece e' que JPP o utilizou de forma errada, porque a analogia nao e' possivel.
By Tiago Mendes, at 7:34 da tarde
Caro LA-C:
Achas que se eu tivesse referido a Strong Law of Large Numbers que alguem entendia alguma coisa?? O meu intuito foi mesmo dar um exemplo, tentar fazer com que a nota parecesse didactica, e nao hermetica ou demasiado tecnica ou longa...
Caro Luis:
Nao percebo bem que ache o exemplo da fabrica teorico, mas ok, e' uma opiniao. A distribuicao de Bernoulli e' a mais intuitiva que ha', e at'e me lembrei da fabrica dos Simpsons em que o Homer verificava (se estivesse atento) as pecas defeituosas.
Tambem achei que falar em distribuicao de Bernoulli seria desnecessario, senao mesmo pedante. Enfim, nunca podemos alegrar toda a gente, I guess :)
By Tiago Mendes, at 7:52 da tarde
Tiago, eu nao me expliquei bem, desculpa. Se a maquina que faz as pecas nunca (impossivel!) se alterar ate ao fim da vida, a probabilidade estaria determinada a partida, e o mesmo que para um dado. O que eu queria dizer e, que para saberes essa probabilidade, tens que a medir! E quanto maior for a amostra, maior e a precisao, claro!
O que tu dizes, e que tens um valor teorico, 3, e que a pratica se ira encarregar de demonstrar, cada vez mais correctamente, a medida que o numero de medicoes aumenta.
Eu so te estava a chamar a atencao para te dizer que nao ha valores teoricos correctos a partida, especialmente para uma maquina numa fabrica. Pode haver boas previsoes. Primeiro experimentas a maquina e depois ficas a saber os defeitos dela.
Nao ha valores teoricos exactos, PARA NADA! Nem que tenha que se ir buscar a equacao de incertesa de Heisenberg! Acho que nao e preciso isso para uma maquina numa fabrica, pois nao?
luis
By Anónimo, at 7:58 da tarde
Caro Luis,
Ok, percebo o ponto. O exemplo nesse sentido era de facto teorico. Imaginemos um computador que determina, de forma aleatoria, e baseado numa distribuicao de Bernoulli com probabilidade de sucesso de 97%, se uma peca e' defeituosa ou nao.
Assim, o valor de 3% e' um dado adquirido "'a prior" e nao sujeito a medicoes, nem ao problema que subjaz ao principio da incerteza de Heisenberg.
Mas de facto nao precismaos disso. Assumindo que a probabilidade de defeito se mantem ao longo do tempo inalteravel (hipotese pouco provavel, mas teorica, e apenas para fazer o ponto de que nao e' NECESSARIO conhecer a priori o seu valor), ela sera X.
Logo, o que eu queria dizer e' que - sem precisar de medicoes - nos sabemos que a media amostral vai convergir para X no limito. E nos so vamos descobrir X se vivermos infinitamente, etc. Eu dei um numero a X para que o exemplo fosse mais compreensivel.
Enfim, e' preciso distinguir o grau discursivo num post e nos comentarios :)
Concluindo: o teu ponto nao e' estritamente valido porque pode nao ser necessaria medicao. Com base somente em abstraccao teorica poderemos chegar a este resultado. Alternativamente, podemos pensar numa maquina que gera defeitos - claro, for the sake of example!!
Mas esse exmplo ilustra que ha' uma "random process" por detras da fabrica, com a tal probabilidade desconhecida de X que, a manter-se constante, vai ser o limite da media amostral de defeitos quanto a amostra tende para infinito.
By Tiago Mendes, at 8:18 da tarde
Penso que a LGN garante que havera sempre erros que passem despercebidos.
By Anónimo, at 10:55 da tarde
Tiago, nao ha nenhum exemplo pratico, real, onde nao haja erro de medicao!
O metodo cientifico diz que a teoria e provada pela pratica. Se tu tens uma previsao teorica para seja o que for, so a pratica (a amostra), te vai dizer se a tua previsao estava, mais ou menos, correcta. Como e que um computador pode determinar com exactidao os 3% a priori, essa nao percebi! Nao te preocupes que eu conheco a distribuicao de Bernoulli.
As teorias ou valores calculados, sao corrobados pela pratica. Tu sabes isso perfeitamente.
Na vida real, as variancias nao convergem para 0!
luis
By Anónimo, at 7:06 da tarde
Luís, eu falei de exemplo teórico e não prático. Um computador concebe perfeitamente gerar as distribuiçõe que tiveres, que raio de pergunta é essa? Simulações de MOnte Carlo, etc. Escolhes a distribuição, os parâmetros dela, e simulas. E podes então obter resultados para médias amostrais com diferentes tamanhos da população. Aliás, a simulação é usada para ilustrar e ganhar intuição de muitos resultados teóricos.
É preciso distinguir o plano teórico e empírico. Ou agora já não há matemática abstracta e matemática aplicada?
PS: LA-C, não percebo honestamente o que queres dizer com "Penso que a LGN garante que havera sempre erros que passem despercebidos." O que a LGN garante é que os erros convergem para zero à medida que a amsotra atinge o infinito.
By Tiago Mendes, at 8:25 da tarde
"É preciso distinguir o plano teórico e empírico" dizes-me tu! Mas isso foi o que eu te disse no primeiro comentario:"Este tipo de raciocinio so e valido para abstracoes matematicas."!
Dizes tu: "Logo, o que eu queria dizer e' que - sem precisar de medicoes - nos sabemos que a media amostral vai convergir para X no limito." Desculpa Tiago, mas numa maquina de uma fabrica, tu tens que fazer medicoes primeiro, para saber a media de pecas defeituosas, nao me venhas falar em simulacoes! Por isso e que eu nao percebi a tua resposta sobre as simulacoes!
Conheco o metodo de Monte Carlo, e tu? Tu sabes bem, que nesse metodo,a tua precisao aumenta como o numero de "tiros" dados no alvo, ou nao e assim? Mesmo ai, tens sempre um valor que nao e exacto, PORQUE NUNCA CHEGAS AO INFINITO, NA VIDA REAL NAO HA INFINITOS! E nem vamos falar das funcoes que criam numeros aleatorios! E estamos a falar de uma simulacao, nao de uma situacao real, que foi com isso que eu comecei a conversa!
PS Eu so te fiz uma pequena observacao!! Queres ganhar as discussoes todas?! Fazes-me lembrar um economista conhecido: nunca tenho duvidas e raramente me engano!
luis
By LA, at 9:39 da manhã
Enviar um comentário
<< Home