Alla ricerca di un sistema bayseano.
Come applicare il sistema bayseano alla politica italiana per predire le elezioni future.
Una collaboratrice del Termometro Politico tempo fa mi passò un articolo sui sistemi bayseani applicati alla politica USA. L’articolo di Kari Lock e Andrew Gelman mi fece pensare ad un qualche sistema per applicare il sistema bayseano, molto diretto da applicare in un sistema bipolare come quello statunitense con rumore di fondo dovuto al terzo incomodo, ma ben più difficile in un sistema multipolare ed estremamente dinamico come quello italiano. A pagina 3 dell’articolo compaiono alcuni grafici interessanti: rappresentano la dispersione del voto negli stati in funzione del vincitore alla Casa Bianca. Come si nota, la dispersione è pressoché lineare con, come spiegano gli autori, correlazioni maggiori o minori a seconda che lo stato in questione sia storicamente pro-Democrat o pro-Republican. Da pagina 4 in poi si mostra il modello basato su dati storici per poi predirre il risultato di Obama nel 2009 (leggermente sottostimante sia sulla percentuale sia sul numero di delegati). Tuttavia il modello appare promettente.
Per poterlo applicare anche all’Italia bisogna inventarsi un modo, sicuramente non triviale, di ripesare i micropartiti che vanno e vengono, le nuove formazioni che si aggregano di anno in anno, etc. etc.. Tuttavia, come primo discriminante che mi sono posto, vorrei riuscire a dimostrare che anche in Italia, nazione dal voto politico spesso aleatorio, la dispersione sull’esito finale segua un andamento rettilineo. Questo sarebbe un buon viatico per poi creare un modello bayseano.
[ad]Qui di seguito si osservano le dispersioni, comune per comune, per i primi 9 partiti, rispetto al dato nazionale di EUR09. La scala è logaritmica, con il log della frequenza sulle ordinate ed il log della dispersione sulle ascisse. I risultati, come si può leggere dai grafici, sono a dir poco sorprendenti per la precisione e la costanza del coefficiente angolare, con uno scarto di pochi percentuali rispetto all’unità. La massima differenza relativa è dell’8,82%, tra il valore più basso del coefficiente (Italia dei Valori: 0.09668) ed il più alto (Popolo della Libertà: 1.096), che tra l’altro sono negativamente correlati come si noterà più in là. Perciò non mi stupisco che siano anche anti-correlati nel coefficiente angolare. Mi sarei stupito dell’opposto.
Gli intervalli di dispersione sono scelti in un range tra l’1‰ ed il 20% sul dato nazionale di EUR09.
AUTONOMIE
ITALIA DEI VALORI
(per continuare la lettura cliccare su “2”)