terça-feira, 1 de junho de 2010

CREDIBILIDADE DA DATAFALHA FOI PRO SACO!

Blog do Nassif
24/05/2010 - 16:42

Amostragem do Datafolha favoreceu Serra

Por J

Problemas com a amostra coletada pela última pesquisa Datafolha.
Se a pesquisa mediu 37 x 37, Dilma Rousseff já deve estar 5 a 6 pontos na frente de José Serra.

Problema 1: a amostra é URBANA, não vai ao RURAL

A amostra por fluxo de ponto (fluxo de pessoas nas ruas) somente vai ao URBANO (85% do país), não vai ao RURAL (15% do país). Vai à sede URBANA dos pequenos municípios, como se fossem RURAL. A amostra por fluxo de ponto é somente calculada para REGIÃO DO PAÍS e NATUREZA DO MUNICÍPIO. No RURAL, Lula e Dilma Rousseff apresentam percentuais de aprovação ainda maiores do que no URBANO. Não há cruzamentos por URBANO e RURAL.

www.datafolha.com.br

Problema 2: a amostra tem a ESCOLARIDADE errada

A amostra é somente calculada para SEXO e IDADE, sem a inclusão no PLANO AMOSTRAL da ESCOLARIDADE como nas outras pesquisas. A ESCOLARIDADE no fluxo de ponto é coletada no trabalho de campo. Na amostra coletada, o ENSINO FUNDAMENTAL aparece com 47,6%, enquanto pelos dados do IBGE é de 55,2%. A amostra, portanto, tende para José Serra, com eleitores de maior ESCOLARIDADE.
Fundamental = 1266 / 2660 = 47,6%
PNAD 2008
www.ibge.gov.br

Por Gunter Zibell

Dá para fazer um exercício do impacto do Datafolha usando as ferramentas do Excel.
Usando todas as pesquisas desde novembro (cenários sem Ciro), sendo que 5 delas são Datafolha, é possível separar dois grupos : Ibope + Sensus + Vox Populi de um lado e Datafolha de outro.
A ferramenta linha de tendência polinômio desenha uma curva que melhor se ajusta aos dados.
Aí daria para inferir o “efeito Datafolha” (seu conjunto de diferenças metodológicas) : para Serra tende a superestimar em 1 a 2% o nível dos votos. Para Dilma tende a subestimar em 2%. Na prática isso significa que o “X” ficou postecipado.
Há exceções, claro, pois as amostragens são pequenas e as margens de erro são grandes. Mas nas últimas 3 pesquisas os resultados do Datafolha ficaram do lado de fora (isto é, acima para Serra e abaixo para Dilma) das curvas de tendência dos outros institutos.
O exercício está no link, mas ressalve-se que são muito poucos pontos para se fazer inferências. Grosso modo equivaleria a dizer que, se os demais institutos fizessem a coleta exatamente nos mesmos dias com suas metodologias, apresentariam um resultado 3 a 4% de vatagem para Dilma quando no Datafolha empata. (E vice-versa : quando os outros empatam, o Datafolha estaria 3 a 4% favorável a Serra.)
8) Mas me parece base pequena base de dados para avaliar…
E não vamos esquecer do fator “conhecimento”, que é tão importante quanto os recortes sócio-econômicos. Lembro que em dez./2008, em função do “recall”, Serra atingia mais de 50% das intenções no NE enquanto Dilma lograva apenas 10%. Quando o conhecimento for mais homogêneo em todos os subgrupos, possivelmente as curvas se encontram de novo.

Nenhum comentário: