Come applicare il sistema bayseano alla politica italiana per predire le elezioni future.
Una collaboratrice del Termometro Politico tempo fa mi passò un articolo sui sistemi bayseani applicati alla politica USA. L’articolo di Kari Lock e Andrew Gelman mi fece pensare ad un qualche sistema per applicare il sistema bayseano, molto diretto da applicare in un sistema bipolare come quello statunitense con rumore di fondo dovuto al terzo incomodo, ma ben più difficile in un sistema multipolare ed estremamente dinamico come quello italiano. A pagina 3 dell’articolo compaiono alcuni grafici interessanti: rappresentano la dispersione del voto negli stati in funzione del vincitore alla Casa Bianca. Come si nota, la dispersione è pressoché lineare con, come spiegano gli autori, correlazioni maggiori o minori a seconda che lo stato in questione sia storicamente pro-Democrat o pro-Republican. Da pagina 4 in poi si mostra il modello basato su dati storici per poi predirre il risultato di Obama nel 2009 (leggermente sottostimante sia sulla percentuale sia sul numero di delegati). Tuttavia il modello appare promettente.
Per poterlo applicare anche all’Italia bisogna inventarsi un modo, sicuramente non triviale, di ripesare i micropartiti che vanno e vengono, le nuove formazioni che si aggregano di anno in anno, etc. etc.. Tuttavia, come primo discriminante che mi sono posto, vorrei riuscire a dimostrare che anche in Italia, nazione dal voto politico spesso aleatorio, la dispersione sull’esito finale segua un andamento rettilineo. Questo sarebbe un buon viatico per poi creare un modello bayseano.
[ad]Qui di seguito si osservano le dispersioni, comune per comune, per i primi 9 partiti, rispetto al dato nazionale di EUR09. La scala è logaritmica, con il log della frequenza sulle ordinate ed il log della dispersione sulle ascisse. I risultati, come si può leggere dai grafici, sono a dir poco sorprendenti per la precisione e la costanza del coefficiente angolare, con uno scarto di pochi percentuali rispetto all’unità. La massima differenza relativa è dell’8,82%, tra il valore più basso del coefficiente (Italia dei Valori: 0.09668) ed il più alto (Popolo della Libertà: 1.096), che tra l’altro sono negativamente correlati come si noterà più in là. Perciò non mi stupisco che siano anche anti-correlati nel coefficiente angolare. Mi sarei stupito dell’opposto.
Gli intervalli di dispersione sono scelti in un range tra l’1‰ ed il 20% sul dato nazionale di EUR09.
AUTONOMIE
ITALIA DEI VALORI
(per continuare la lettura cliccare su “2”)
La matrice di correlazione tra i vari partiti indica i seguenti coefficienti
SEL | AUT | RC-PDCI | PDL | RAD | PD | UDC | LEGA | IDV | |
SEL | 1,0000 | -0,0012 | 0,1710 | -0,1014 | -0,1417 | 0,0321 | -0,0002 | -0,3761 | 0,1044 |
AUT | -0,0012 | 1,0000 | -0,0400 | 0,0034 | -0,2083 | -0,0774 | 0,2044 | -0,2801 | -0,0710 |
RC-PDCI | 0,1710 | -0,0400 | 1,0000 | -0,0646 | -0,0250 | 0,3320 | -0,0196 | -0,3497 | 0,0826 |
PDL | -0,1014 | 0,0034 | -0,0646 | 1,0000 | -0,0107 | -0,1764 | -0,0399 | -0,2631 | 0,0719 |
RAD | -0,1417 | -0,2083 | -0,0250 | -0,0107 | 1,0000 | 0,0085 | -0,1638 | 0,1690 | 0,0233 |
PD | 0,0321 | -0,0774 | 0,3320 | -0,1764 | 0,0085 | 1,0000 | -0,0758 | -0,4063 | -0,0336 |
UDC | -0,0002 | 0,2044 | -0,0196 | -0,0399 | -0,1638 | -0,0758 | 1,0000 | -0,1880 | -0,0504 |
LEGA | -0,3761 | -0,2801 | -0,3497 | -0,2631 | 0,1690 | -0,4063 | -0,1880 | 1,0000 | -0,2718 |
IDV | 0,1044 | -0,0710 | 0,0826 | 0,0719 | 0,0233 | -0,0336 | -0,0504 | -0,2718 | 1,0000 |
da cui si evince che anche all’interno delle stesse coalizioni i vari partiti si danno battaglia: il PDL è negativamente correlato con la Lega, addirittura -27%, l’IDV ha correlazione del -3% con il PD ma +10% con SEL e +8% con RC-PDCI. L’UDC si correla al 20% con le AUT, -16% con i Radicali, -7% con il PD, -17% con il PDL e -18% con la Lega.
Ogni partito mostra un distribuzione t di Pearson (tranne PD e PDL, più distribuiti normalmente) con un coefficiente di verosimiglianza molto buono con valori di V.a.R. ed Expected short-fall l 5% secondo la seguente tabella riepilogativa (ovvero, qual’è il minimo tra i risultati peggiori sul 5% del campione e quale il risultato medio tra i peggiori)
VAR al 5% | MEAN | MAX |
SEL | -0,9124 | -0,80668 |
AUT | -1 | -1 |
RC-PDCI | -0,92117 | -0,80611 |
PDL | -0,68233 | -0,4656 |
RAD | -0,94833 | -0,8446 |
PD | -0,78876 | -0,65466 |
UDC | -0,79324 | -0,61904 |
LEGA | -0,99716 | -0,98787 |
IDV | -0,7571 | -0,64727 |
[ad]Il PDL perciò ha il VAR/Expected short-fall più basso, mentre le AUT quello più alto. In pratica, con il PDL c’è meno rischio nominale di non trovarsi sulla retta di massima interpolazione; il contrario con le AUT, sebbene anche la Lega mostri ampi margini di errore, dovuti alla sua alta localizzazione elettorale. Se dovessimo scommettere un euro su quale partito potrebbe disperdersi di più sul 5% dei comuni italiani, quell’euro andrebbe molto probabilmente al PDL, se vogliamo metterla sul piano più da bookmaker. Tuttavia, il PD e l’IDV mostrano valori meno discordanti tra il valor medio ed il massimo, indicando che sono partiti con un minor tasso di dispersione tra i valori estremi. Quindi, un bookmaker più oculato potrebbe puntare su questi due partiti. Con AUT e Lega, rischio quasi certo di sbancare.
Ora bisogna solo trovare il sistema bayseano più adatto alla conformazione partitica italiana!
Se qualcuno dei lettori è interessato a collaborare alla stesura del modello, ci contatti per favore alla nostra email
redazione@termometropolitico.it
Grazie.
Sinistra e Libertà | Autonomie | Rifondazione Comunista/Partito dei Comunisti Italiani | Popolo della Libertà | Radicali/Lista Bonino-Pannell | Partito Democratico | Unione di Centro | Lega Nord | Italia dei Valori | |
Sinistra e Libertà | 1 | -0,00124 | 0,17103 | -0,1014 | -0,14166 | 0,032104 | -0,00017 | -0,37614 | 0,10441 |
Autonomie | -0,00124 | 1 | -0,03998 | 0,003427 | -0,20825 | -0,07741 | 0,20437 | -0,28011 | -0,07102 |
Rifondazione Comunista/Partito dei Comunisti Italiani | 0,17103 | -0,03998 | 1 | -0,06459 | -0,02497 | 0,33204 | -0,01958 | -0,34965 | 0,08259 |
Popolo della Libertà | -0,1014 | 0,003427 | -0,06459 | 1 | -0,01071 | -0,17644 | -0,03986 | -0,2631 | 0,071916 |
Radicali/Lista Bonino-Pannell | -0,14166 | -0,20825 | -0,02497 | -0,01071 | 1 | 0,008501 | -0,1638 | 0,16895 | 0,023276 |
Partito Democratico | 0,032104 | -0,07741 | 0,33204 | -0,17644 | 0,008501 | 1 | -0,07582 | -0,40627 | -0,0336 |
Unione di Centro | -0,00017 | 0,20437 | -0,01958 | -0,03986 | -0,1638 | -0,07582 | 1 | -0,18797 | -0,05036 |
Lega Nord | -0,37614 | -0,28011 | -0,34965 | -0,2631 | 0,16895 | -0,40627 | -0,18797 | 1 | -0,27184 |
Italia dei Valori | 0,10441 | -0,07102 | 0,08259 | 0,071916 | 0,023276 | -0,0336 | -0,05036 | -0,27184 | 1 |