Analisi di stabilità Elezioni Europee 1994-2004/ Elezioni Politiche 2008
INTRODUZIONE
Quello che presentiamo è il primo di una serie di lavori che il Termometro Politico sta svolgendo sulle elezioni Europee/Politiche-Nazionali a livello provinciale.
L’idea di fondo è piuttosto semplice e non richiede grandi conoscenze statistiche per comprenderla: considerate per ogni tornata politica (noi trattiamo in questo caso EUR94, EUR99, EUR04 e POL08) i primi 5 partiti per numero di voti in ogni provincia. L’ordine di questi partiti sarà, in generale, diverso da quello su scala nazionale per ovvie ragioni. Questa differenza però non intacca il concetto di fondo dell’analisi, anzi, lo corrobora se mai possibile. Infatti ora ci chiediamo quale sia la relazione che intercorre tra le percentuali dei primi 5 partiti per numero di voti in una data provincia ed i primi 5 partiti per numero di voti a livello nazionale. Tale relazione è importante, dal nostro punto di vista, per stabilire quanto, a prescindere dal singolo partito, le varie province rispecchino i rapporti di forza che si osservano su scala nazionale. Si parla in questo caso di stabilità provinciale.Vi possono essere diversi tipi di stabilità e ne presenteremo a breve di altre. Per il momento soffermiamoci su questa.
ESEMPIO
Cosa potremmo dedurre in linea teorica da questa analisi? Potremmo innanzitutto stabilire quali province siano più in sintonia con i rapporti di forza nazionali a prescindere, ribadiamo con forza questo punto, dal determinato partito. Proponiamo un esempio che potrebbe chiarire le idee: nelle passate elezioni politiche nazionali 2008, i primi 5 partiti per numero di voti nella provincia di Torino si distribuirono nel seguente modo
Pd | 36,376% |
Pdl | 32,441% |
Lega | 8,6675% |
Idv | 5,9673% |
Udc | 5,0448% |
A livello nazionale, invece, i primi 5 partiti furono rispettivamente
Pdl | 37,388% |
Pd | 33,174% |
Lega | 8,297% |
Udc | 5,624% |
Idv | 4,371% |
Come notate, sebbene l’ordine sia diverso, la provincia di Torino rispecchia a grandi linee i rapporti di forza generali tra i primi 5 partiti. Basandoci sui pesi relativi dentro questo campione di 5 partiti, essi “pesano” relativamente come
Partito | Torino | Italia |
1 | 41.10% | 42.08% |
2 | 36.66% | 37.34% |
3 | 9.79% | 9.34% |
4 | 6.74% | 6.33% |
5 | 5.70% | 4.92% |
dove si mette in relazione il dato di Torino ed Italia per CAM08 (abbiamo usato una precisione a due soli decimali in questo caso).
ANALISI DATI
Chiarito dunque il tipo di analisi che intendiamo svolgere, presentiamo la prima parte di questo studio. Di seguito elenchermo per ogni tornata elettorale (ripetiamo EUR94, EUR99, EUR04 e CAM08) alcuni risultati. Per consentire la consultazione più agevoli dei dati, potete scarica in un formato .zip i dati elettorali dei primi 5 partiti per ogni elezioni
http://www.fileshost.com/download.php?id=4DC282D11
[ad]Il primo studio che abbiamo svolto consiste nello studiare la correlazione tra le dispersioni in ogni provincia rispetto al dato nazionale.
Cosa intendiamo per correlazione? La correlazione è un indicatore statistico che determina quanto sia legato un dato rispetto ad un altro. La correlazione si misura con valori che vanno da 0 ad 1, dal più basso grado di relazione al più alto rispettivamente.
Cosa intendiamo per dispersione? La dispersione si misura come (A – B)/B ed indica quanto un dato A si discosti da un dato B. Se moltiplicato per 100 ne da la percentuale di dispersione. Il valore di dispersione può essere positivo o negativo: più è prossimo allo zero, più A è uguale a B. Nel nostro caso, più il dato provinciale (A) è simile a quello nazionale (B).
Di seguito mostriamo i valori, provincia per provincia, delle correlazioni di dispersione (per ragioni di grafica abbiamo potuto indicare solo alcune province sull’asse delle ordinate)
Come possiamo notare, le diverse province mostrano un grado di dispersione relativamente buono con i vari dati nazionali. Elenchiamo ora le province che nelle 4 elezioni considerate hanno mostrato un valore di correlazione superiore a 0.995 (quindi il 99.5% grado di correlazione con il dato nazionale)
(per continuare la lettura cliccare su “2”)
EUR04
‘Como’
‘Gorizia’
‘Caserta’
‘Bari’
‘Cosenza’
‘Ragusa’
‘Trapani’
[ad]EUR99
‘Savona’
‘Rovigo’
‘Venezia’
‘Forlì-Cesena’
‘Piacenza’
‘Arezzo’
‘Massa-Carrara’
‘Pistoia’
‘Prato’
‘Pesaro e Urbino’
EUR04
‘Rovigo’
‘Lucca’
‘Reggio Calabria’
CAM08
‘Torino’
‘Gorizia’
‘Trieste’
‘Genova’
‘La Spezia’
‘Rimini’
‘Grosseto’
‘Lucca’
‘Massa Carrara’
‘Pistoia’
‘Ascoli’
‘Macerata’
‘Fermo’
‘Roma’
‘Rieti’
‘Chieti’
‘Teramo’
‘Taranto’
‘Matera’
‘Potenza’
‘Cosenza’
‘Crotone’
‘Vibo Valentia’
‘Enna’
‘Sassari’
‘Carbonia iglesias’
‘Medio Campidano’
‘Ogliastra’
Mostriamo ora le densità di distribuzione dei coefficienti di correlazione per ogni provincia, per data elezione.
Cosa intendiamo per densità di distribuzione? Data una serie di misure o osservazioni si calcola quante volte un certo valore ricade in un intervallo arbitrario. Per esempio, data una serie numerica 1,2,3,4,5,6, una denistà di distribuzione potrebbe mostrare quanti valori ricadono tra i seguenti intervalli 0-3 e 3,1-6. Chiaramente 1,2 e 3 ricadono nel primo intervallo, mentre 4,5 e 6 nel secondo. Perciò la frequenza dei valori sarà di 3 per il primo intervallo e di nuovo 3 per il secondo.
La nostra previsione perciò risulta piuttosto corretta: come notate infatti la maggior parte delle province ricade nell’intervallo più prossimo ad 1, laddove si misura il più alto grado di correlazione con il dato nazionale. Ovviamente si osservano province molto scorrelate, ma questo è logico e prevedibile, specie perchè vi sono partiti (la Lega per esempio) che a causa della loro territorialità sbilanciano i rapporti.
In questo file .zip che vi alleghiamo, sono contenuti tutti i dati di dispersione, provincia per provincia, per elezione dei primi 5 partiti per numero di voti.
http://www.fileshost.com/download.php?id=78D90FC31
Sempre in merito alle dispersioni, mostriamo la densità di distribuzione delle dispersioni per elezione. Ricordiamo che più il valore di dispersione è prossimo a zero, più abbiamo che il dato provinciale rispecchia quello nazionale.
Per chi fosse interessato all’aspetto più statistitico e formale, diamo di seguito i valori di regressione tramite una densità di distribuzione test “t-location”
EUR94
Distribution: t location-scale
Log likelihood: -22.3992
Domain: -Inf < y < Inf
Mean: 0.0524236
Variance: 0.0724119
Parameter Estimate Std. Err.
mu 0.0524236 0.0109012
sigma 0.201697 0.00984724
nu 4.5642 0.794857
Estimated covariance of parameter estimates:
Indicatore | Mu | Sigma | Nu |
Mu | 0.000118836 | 6.2186e-006 | 0.000592683 |
Sigma | 6.2186e-006 | 9.69681e-005 | 0.0042663 |
Nu | 0.000592683 | 0.0042663 | 0.631797 |
(per continuare la lettura cliccare su “3”)
EUR99
Distribution: t location-scale
Log likelihood: 82.9359
Domain: -Inf < y < Inf
Mean: 0.0272955
Variance: 0.0431785
Parameter Estimate Std. Err.
mu 0.0272955 0.00905149
sigma 0.186402 0.00834187
nu 10.2405 3.41355
Estimated covariance of parameter estimates:
Indicatore | Mu | Sigma | Nu |
Mu | 8.19295e-005 | 9.43691e-006 | 0.00508658 |
Sigma | 9.43691e-006 | 6.95868e-005 | 0.0175496 |
Nu | 0.00508658 | 0.0175496 | 11.6523 |
EUR04
Distribution: t location-scale
Log likelihood: -120.248
Domain: -Inf < y < Inf
Mean: 0.0580028
Variance: 0.102786
Parameter Estimate Std. Err.
mu 0.0580028 0.0132888
sigma 0.247606 0.0133264
nu 4.95622 1.07708
Estimated covariance of parameter estimates:
Indicatore | Mu | Sigma | Nu |
Mu | 0.000176593 | 4.68853e-005 | 0.00431121 |
Sigma | 4.68853e-005 | 0.000177594 | 0.00975254 |
Nu | 0.00431121 | 0.00975254 | 1.16009 |
CAM08
Distribution: t location-scale
Log likelihood: -128.505
Domain: -Inf < y < Inf
Mean: -0.097013
Variance: Inf
Parameter Estimate Std. Err.
mu -0.097013 0.0101764
sigma 0.175032 0.00975562
nu 1.93011 0.190473
Estimated covariance of parameter estimates:
Indicatore | Mu | Sigma | Nu |
Mu | 0.000103559 | 1.66549e-005 | 0.000313154 |
Sigma | 1.66549e-005 | 9.51722e-00 | 0.00097977 |
Nu | 0.000313154 | 0.00097977 | 0.0362799 |
Per concludere questa prima analisi di stabilità, mostriamole densità di distribuzione per i 5 partiti su tutte e 4 le tornate elettorali.
Si può quindi stabilire graficamente quale sia il valore medio ed estremo per i 5 partiti secondo numero di voti.
CONCLUSIONI
In questo primo studio abbiamo indicato i valori non-incrociati di tutte le province per ognuna delle 4 elezioni considerate. E’ immediatamente emerso come, in termini generali, si possano selezionare province più concordi (o stabili) con i valori nazionali e questo è un buon indicatore per procedere con ulteriore studio.
[ad]Rispetto al coefficiente di correlazione, si è dimostrato come le Elezioni Europee 2004 siano stata la tornata elettorale col più basso grado di correlazione rispeto al dato nazionale, mentre le Elezioni Politiche 2008 quelle con il più alto. Questo dato comunque tiene solo conto dell’intervallo 0.995-1; quindi è possibile che nel computo totale EUR04 non sia così scorrelata. Tuttavia a noi preme rintracciare le province con il più alto grado di correlazione.
Le EUR99 sono state invece le elezioni con il più alto valore positivo di verosimiglianza logaritmica rispetto alla denistà di distribuzione di dispersione: questo implica che in tale elezione si ha la più alta verosimiglianza di distribuzione teorica. In CAM08 si registra invece il più basso valore di verosimiglianza logaritmica.
Se ci dobbiamo riferire solo all’ultima Elezione Europea, possiamo affermare che le province di ‘Rovigo’, ‘Lucca’, ‘Reggio Calabria’ siano le province in cui ci aspettiamo di trovare la correlazione più alta nelle prossime Elezioni Europee. Questa previsione va comunque confermata in merito alla prossima analisi.
Nella prossima analisi perciò tenteremo di mettere in relazione le 4 elezioni per selezionare, se mai possibile, quelle province che abbiano mostrato storicamente, entro appropriati margini di errore e dispersione, la migliore stabilità rispetto ai dati italiani.
Il risultato a cui vogliamo giungere è un blocco di 5-6 province su cui effettuare il test di controllo con le prossime elezioni Europee 2009.