Big data i kommunalvalget

Ved det seneste folketingsvalg i 2011 benyttede alle partier detaljerede analyser af demografiske oplysninger og markedsdata for at målrette indsatsen, hvor der var mest af hente, og ved at bruge de sager, der interesserede de pågældende mest.

Micro targeting kaldes det. Det er dog stadig et nyt fænomen i Danmark, som partierne kun lige er begyndt at arbejde med på nogle få platforme. De har endnu ikke taget metoden i brug i samme udstrækning som fx Obama ’12.

Det oplyste Lars Groth, partner i Geomatic, på et møde i Foreningen for Undersøgende Journalistik på Danmarks Medie- og Journalisthøjskole i Aarhus den 10. juni 2013, hvor jeg var ordstyrer.

Geomatic benytter deres conzoom-model, der inddeler befolkningen i en lang række kategorier, og parrer det med oplysninger om stemmeafgivning på det enkelte afstemningssted, som der i dag er omkring 1.500 af rundt om i Danmark.

Erfaringen er, at en målrettet indsats kan flytte 1-2 procent af stemmerne. Men intet er videnskabeligt bevist, understreger Lars Groth.
Han har ikke set andre firmaer bevæge sig ind på området med at bruge Big Data i danske valg.

“Men der er intet specielt ved det. Vi benytter åbne data, som enhver kan anskaffe sig,” understregede han.

Få midler ved kommunalvalget
Ved kommunalvalget til november er der ikke de samme midler til at føre valgkamp, som til folketingsvalg. Ved valget i 2011 brugte partierne omkring 100 millioner kroner på valgkamp. Hertil kommer de enkelte kandidaters budgetter. Ved kommunalvalget ventes partierne at kunne bruge omkring 25 millioner kroner.

Derfor er det mere tvivlsomt, i hvor stor udstrækning partier og lister vil benytte analyser af Big Data og microtargeting til kommunalvalget. Dog kan det tænkes, at de centrale partiorganisationer benytter redskaberne og hjælper afdelingerne rundt om i landet, ligesom det kan tænkes, at partierne har medlemmer, der selv kan bruge denne nye type metoder.

Amerikanske metoder
Assistant Editor for Interactive News på New York Times, Chase Davis, fortalte over et Google Hangout, hvordan tilsvarende metoder har været anvendt af amerikanske partier og kandidater, især i forbindelse med præsidentvalget i 2012. Specielt Obamas kampagne blev kendt for at benytte metoderne effektivt.

Chase Davis er ansat i foråret 2013 på New York Times for at indføre tilsvarende metoder i den journalistiske dækning, så medierne kan matche og skildre de metoder, der bliver anvendt. Første gang bliver i forbindelse med valget af borgmester i New York til september i år. Han lover, at avisen er klar til den store test ved næste præsidentvalg i 2016.

Det kommer bl.a. til at omfatte en omfattende databaseregistrering af indholdet af politikernes udtalelser på sociale medier, pressemeddelelser og andre steder. Oven på dette vil New York Times benytte kunstig intelligens (machine learning) til at afdække mønstre i deres udtalelser.

Grundlaget for dataanalysen
I Danmark er grundlaget for analyserne i princippet tre datasæt, der matches:

1. Detaljerede afstemningsresultater på de enkelte afstemningssteder. Geomatic får valgdata Den Danske Valgdatabase. Her ligger data for en lang række danske valg frit tilgængeligt. Kaas og Mulvad har samlet de centrale data for kommunalvalget i 2009 her.

2. Detaljerede demografiske oplysninger fra Danmarks Statistik på basis af kvadratnettet, der opdeler Danmark i kvadrater på 100 * 100 meter. Er der i et sådant kvadrat for få personer til at opnå en anonymitet (typisk på fem personer), klynges kvadraterne sammen i en klyngemodel. For at matche mod afstemningssteder sikres det, at klyngerne ikke går på tværs af afstemningssteder.

I disse demografiske oplysninger indgår data om uddannelse, indkomst, ægteskabelig status, bopæl etc. Data fra Danmarks Statistik suppleres med landbrugsdata og ejendomsdata fra OIS.

Oplysningerne benyttes til at klassificere befolkningen i otte grupper og 30 forskellige typer. Se mere her.

3. Gallups undersøgelse af markedsforhold med navnet Index Danmark/Gallup. TNS Gallup laver Danmarks største media- og marketingundersøgelse.Det er marketing-delen, som Geomatic benytter til at tegne et helt billede af de enkelte grupper og typer. Se mere her.

Centrale spørgsmål
Det centrale er at forstå, hvor stemmer kan rykke sig. Hvilke spørgsmål, man skal stille i den enkelte kommune, og hvordan man undersøger dem med at blande data om afstemningssteder med demografiske data.

Typiske undersøgelser vil dreje sig om at undersøge de afstemningssteder, hvor der er særligt mange eller få sofavælgere, eller hvor det enkelte parti eller kandidat har fået mange eller få vælgere. Mange andre vinkler kan der lægges ned over de konkrete data.

Sociale medier og google doc

Redaktionen bør desuden lave et google-regneark med oplysninger om kandidater og byrådsmedlemmer, dvs. telefon, adresse, koordinater, email, twitterhandles etc.

Det er også en god ide at sætte overvågning af sociale medier op i en enkelt kommune – for at prøve det af i denne omgang.

I twitter kan man overvåge via hootsuite og med Aarhus som eksempel, kan overvågningen være:

#dkpol, #kv13 , #aarhus, listen @nmulvad/aarhus samt det geografiske område: geocode:56.1868,10.105,10km, dvs alt i en radius 10 km fra Bilka i Tilst, som jeg har sat som centrum for kommunen. Man kan tilføje overvågning af kommunalvalg og aarhus/århus.

Her er huskesedler i at lave lister i twitter og opsætning i hootsuite vedr. søgning:

http://data.kaasogmulvad.dk/unv/SocialMedia/Journalistik/KM-H-brug-twitterlister.pdf

http://data.kaasogmulvad.dk/unv/SocialMedia/Journalistik/KM-H-hootsuite.pdf

 

 

Der er lukket for kommentarer.