7 tip: Sådan bruger du AI i din data-analyse

Data-analyse går ud på at trække nyttig information ud af data, og det kan kunstig intelligens hjælpe med. Her er nogle gode råd, der kan spare dig for noget arbejde.

Om du er journalist eller ej, er ikke så afgørende. Dataanalyse kan alle have gavn af. For en journalist vil det oftest handle om at finde frem til de (potentielt) gode historier i et datasæt. Andre leder mere efter tendenser og trends. Hvis man – som vi – udvikler efteruddannelseskurser, analyserer vi fx deltagernes evalueringer på tværs af kurserne for at blive klogere på, hvorfor nogle fungerer bedre end andre, og hvordan vi får flest mulige kursister til at gå glade og begejstrede hjem.

Valget af analyseprogram afhænger af den enkeltes erfaring, hvilke programmer man har adgang til, hvordan data ser ud, og hvad man vil opnå. Vil man fx lave en netværks-analyse, må man bruge et program, der kan netop det. Der er masser at vælge mellem. Selv har jeg til 80-90 procent af mine analyseopgaver gennem de seneste mange år brugt Microsoft Access og Excel. Andre vil sværge til andre programmer.

Den type AI-værktøjer, de fleste har lært at kende som fx ChatGPT, Gemini, Claude, Copilot etc. er imponerende, men langt fra perfekte. Alligevel kan de på forskellig vis hjælpe os med data-analyser. De vil spille en større rolle, efterhånden som kvaliteten stiger. Her er 7 teknikker, jeg anbefaler her og nu:

1. Forvis dig om, at du og AI forstår data på samme måde

Man siger, at tal ikke lyver, men tal er ikke nødvendigvis entydige. En kolonne-overskrift i et datasæt er ikke altid så klar og præcis, som man kunne ønske sig. Måske står der bare en forkortelse, som ikke giver den store mening. Derfor kan det være en god ide – før du overhovedet går i gang med at analysere, at uploade datasættet til din AI-tjeneste og bede om en sammenfattende præsentation af dit datasæt. Brug fx en prompt som:
“Giv en oversigt over datasættet og forklar, hvordan det ser ud? Hvilke typer af data indeholder det, og er der nogle umiddelbare mønstre eller uregelmæssigheder?”
I bedste fald giver det dig et godt og hurtigt overblik, og selvfølgelig er der mest brug for dette, hvis datasættet er komplekst.

2. Lad AI finde svaghederne i dine data

Inden vi går i gang med den egentlige analyse, er det både vigtigt og nødvendigt, at vi undersøger datasættet grundigt for at afdække eventuelle fejl og mangler. Det er sjældent, at man selv har skabt det datasæt, man vil analysere. Ofte kommer det fra andre kilder, og så skal man være på vagt.

Vi har fået mange datasæt fra kilder, hvor man skulle tro, at alting var i orden. Men så har der alligevel været fejl. Fejl kan fx være oplysninger, der er tastet forkert ind, testindtastninger, der ikke er blevet fjernet eller bare fejl, som stammer andre steder fra, og som nu optræder i datasættet. Data er måske indtastet af flere forskellige, der har brugt hver deres metodik.

AI kan hjælpe med hurtigt at identificere manglende værdier eller datatyper, der ikke passer sammen. En simpel prompt som:
“Kan du i datasættet finde kolonner eller rækker med manglende værdier eller fejl, der kan påvirke analysen?” kan måske spare tid og senere ærgrelser.

En af de gode og helt enkle måder at teste data på er ved at sortere datasættet efter alle kolonner – én efter én –  så man kan tjekke de højeste og laveste værdier i hver enkelt kolonne. Det kan være lidt tidskrævende, hvis datasættet er stort, men her kan man med fordel give sit AI-program en prompt a la: “Undersøg data – kig på ekstremerne i hver kolonne – altså de største og mindste tal. Er der noget, der tyder på fejl i data? Fejl i data opdager man jo typisk ved, at ekstremerne er – for – ekstreme.”

I et konkret eksempel svarede ChatGPT således på ovenstående prompt:

En anden slags fejl og mangler i et datasæt kan være forkert formattering. Hvis kolonner med tal eller eller datoer fx er formatteret som tekst, skal de ændres, hvis man skulle få brug for at sortere dem stigende/faldende. Det kan man gøre manuelt, eller man kan prøve en prompt som ”Rengør og formatér, hvis nødvendigt, data i filen, så den er klar til dataanalyse”. Man kan selvfølgelig også være specifik med, præcis hvilke kolonner der skal ændres format på.

3. Få ideer og forslag til analyser

Du kan sagtens kommandere din AI-hjælper (ChatGPT eller andet) til straks at gå i gang med at lave analyser, men det er en dårlig ide. I stedet bør du til en start bede om forslag og ideer til, hvordan man kan analysere det konkrete datasæt. Forklar grundigt i din prompt, hvad data indeholder, gerne kolonne for kolonne, hvis det ikke giver sig selv. (Du kan altid bede din AI-tjeneste om en grundig beskrivelse af data, hvis du vil være helt sikker på, at den har forstået dit datasæt). Og giv den derefter en prompt – fx i stil med denne: “Hvilke analyser kan du foreslå for, at vi kan få så mange informationer som muligt ud af datasættet?” Som journalist kan det være praktisk at understrege, at resultaterne ikke kun skal have akademisk interesse – de skal bruges journalistisk.

Hvis alt ved data ikke er indlysende, er det fornuftigt at stille AI spørgsmålet: “Har du spørgsmål til data, inden vi skal i gang med at analysere?”

Når du endelig beder om forslag til analyser, vil du typisk få adskillige – måske også visualiseringer, der jo også kan fungere som analyser. Synes, du at AI-hjælperen ikke har været grundig nok, beder du bare om flere forslag.

Måske vil du selv have overvejet nogle af de forslag, du får præsenteret. Men hvis du ikke er meget rutineret, og hvis datasættet er komplekst eller diffust, kan det være rart at få yderligere inspiration til, hvordan man griber det an.

Nu, hvor du har fået præsenteret 5-10-20 ideer til måder at analysere dit datasæt på, kan du roligt lade din AI-hjælper gå dem igennem og vise dig resultaterne – et for et. Nogle vil sikkert ikke være spændende, mens andre måske har overraskende pointer. Du kan roligt bede om at få forfinet eller vendt og drejet resultaterne, så slutproduktet bliver så godt som muligt.

4. Start simpelt

Generelt er det en god ide – også for din egen forståelse af data – at begynde med de simpleste analyser og så gradvis gøre dem mere avancerede. Begynd fx med at få et overblik over datasættet ved at lave optællinger, find evt. gennemsnit, tjek beregninger, der måske allerede er foretaget i data. Byg videre på det og gør gradvis opgaverne til AI mere avancerede. Du kan bare bede om at få resultaterne gemt i et regneark, du kan downloade.

5. Spørg AI om kombinationsmuligheder

Din AI-hjælper kender dit datasæt og kan formentlig komme med gode bud på, hvilke datasæt man kunne koble det med for at få nye vinkler og mulige historier frem. Hvis du fx har et datasæt over, hvor mange biler, der er indregistreret i hver af landets kommuner, er det oplagt at koble datasættet med antal indbyggere i hver kommune, så man fx kan beregne biler pr. 100 indbyggere. Men måske vil AI kunne remse nogle ikke helt så oplagte muligheder op. AI vil ikke nødvendigvis vide, om et tænkt datasæt eksisterer eller er tilgængeligt, men det kan du selv efterfølgende tjekke.

6. Tjek, tjek, tjek…

Måske har du via AI’s hjælp nu skudt dig ind på to-tre analyser, du ønsker at bruge. Resultaterne ser så gode og interessante ud, at de kan indgå i din journalistik, præsentation eller hvad du nu skal bruge det til. Måske har AI også vist dig nogle visualiseringer. Nu er det vigtigt, at du selv kan kontrollere resultaterne, du vil gå videre med.

Vi kan endnu ikke stole på, at det, som AI-tjenesterne foreslår, er korrekt. Måske kommer vi dertil på et tidspunkt, men vi er der afgjort ikke endnu. Du kan derfor heller ikke slippe for selv at skulle i gang med regneark, databaser etc. Men du kan stadig spare meget tid, fordi du kan lade AI-tjenesterne teste analysemuligheder for dig – og du behøver ikke selv bruge kræfter på det, der alligevel ikke vil være spændende at gå videre med.

7. Bed AI om at dokumentere dit arbejde

Har man arbejdet et stykke tid med et datasæt, kan man let miste overblikket. For at sikre gennemsigtighed og genanvendelighed er det en god ide at dokumentere prompts og resultater løbende.
Du kan bruge AI til at generere en data-logbog.
Du kan fx bruge denne prompt:
“Hjælp mig med at opsummere de skridt, jeg har taget indtil videre i denne analyse.”
Det er også praktisk, hvis du senere skal forklare om metoder og analyse-skridt til en kollega eller redaktør eller måske skrive et “Sådan gjorde vi”-resume til dine læsere/brugere.

 

Vil du lære at samarbejde med AI om dataanalyse – og vil du klædes på, så du også selv kan gøre analysen efter og tjekke udvalgte resultater, så meld dig til vores kursus “Datajournalistik – i en AI-tid”, hvor jeg selv er kursusleder.

Det kører 23. til 25. april i København. Læs mere her…

 

 

 

No comments yet.

Skriv et svar

This site uses Akismet to reduce spam. Learn how your comment data is processed.