Sovrastime e sottostime nei sondaggi CAWI

Pubblicato il 9 Giugno 2009 alle 20:55 Autore: Eugenio Angelillo
elezioni anticipate voto anticipato

Sovrastime e sottostime nei sondaggi CAWI

Una delle questioni più ricorrenti che si pone ai sondaggisti e’ il livello di attendibilità’ di un sondaggio CAWI, quindi di una misura della sovrastima o sottostima nelle rivelazioni per i singoli partiti. Prendendo spunto dall’analisi condotta da Marco Ghiotti si può tentare una possibile misura di questi effetti incrociando i dati Itanes, che forniscono per una serie di classificazioni socio demografiche le percentuali ottenute dai maggiori partiti nelle elezioni del 2008, i dati Audiweb, che ci forniscono la penetrazioni di internet  nelle medesime classi sociali, e i dati ISTAT che ci consentono di quantificare le medesime classi.

Il primo passo e’ quindi stato la creazione di una tabella che per ogni classificazione socio-demografica riportasse la popolazione della medesima fascia e i risultati ottenuti dai partiti in quella medesima fascia.

L’operazione e’ stata non banale perché le classificazioni Audiweb e Itanes non coincidono esattamente.

I risultati sono mostrati nella Fig. 1

figura1.png

Occorre precisare alcune cose.

1) La colonna rappresenta i votanti 2008, considerando la percentuale degli astenuti identica per ogni fascia

2) Audiweb non presenta statistiche per gli over 75. Il dato e’ ricavato da una campionatura dei nostri sondaggi

[ad]3) Per quanto riguarda le altre fasce di eta’, le classificazioni Audiweb sono piu’ “larghe” di quelle Itanes. Si e’ quindi proceduto a sommare le fasce Itanes per avere risultati comparabili a quelli Audiweb

4) Audiweb non usa la stessa suddivisione della fasce della popolazione dei comuni utilizzata di ISTAT e Itanes, tranne per l’ultima classificazione (oltre 250mila abitanti). Purtuttavia, essendo le variazioni tra le fasce inferiori assolutamente minime abbiamo mantenuto la classificazione Itanes utilizzando il dato Audiweb in cui il massimo della fascia Itanes e’ compreso

5) Il dato sui Disoccupati/In cerca e’ ottenuto incrociando I dati Audiweb e Istat per ricondurlo alla classificazione Itanes

6) Il dato Audiweb sugli occupati e’ stato ottenuto facendo una media su tutte le classificazioni professionali proposte da Audiweb

7) Il numero degli insegnanti in Italia, non disponibile da ISTAT, e’ stato stimato a 1 milione, considerando che il Ministero dell’Istruzione ha un organico di 838mila docenti, cui si devono aggiungere precari e insegnanti di scuole private

8) Nella sotto categoria Dirigente si considerano compresi anche i Quadri

9) Si assume che la stima audiweb per gli insegnanti sia la medesima di quella per gli impiegati

10) Nel caso delle categoria geografica per le percentuali si utilizzano i risultati reali calcolati per ogni raggruppamento geografico e non le stima Itanes che sono ovviamente più imprecise. Inoltre e’ stato considerato per la Lega come meno rappresentativo il dato del Centro, non essendosi all’epoca la Lega presentata al Sud e Isole

11) tutte le percentuali di penetrazione audiweb sono riferite al “Profilo degli individui con accesso a internet da casa e/o lavoro/ufficio tramite computer”. Dati dal 12/05/08 al 12/03/09

Il secondo passo e’ stato quello di calcolare per ogni partito il campione piu’ rappresentativo, quello meno rappresentativo, la percentuale del partito in questi due campioni e infine la percentuale di utenti web in ogni campione

I risultati sono mostrati nelle figure 2 e 3

figura2.png

figura3.png

Anche in questo caso occorre dire che riguardo alla classificazione Occupazione, la fascia Occupati non e’ stata considerata come possibile minimo o massimo, preferendo utilizzare la più dettagliata classificazione per Professione.

Alcuni dati interessanti saltano subito all’occhio. Ad esempio il campione piu’ rappresentativo del PDL risulta essere quello con meno utenti web in percentuale, mentre invece il campione meno rappresentativo del PDL e’ anche quello con maggiore copertura web

 

Rimarchevole anche il fatto che il campione più rappresentativo per il PD e’ quello meno penetrato dagli utenti web dopo quello del PDL.

(per continuare la lettura cliccare su “2”)