I fjor høst etterlyste jeg flere eksempler på datadrevet journalistikk. Nå begynner både prosjekter, erfaringsrapporter og analyser å dukke opp. En liten samling fra de siste ukene:
- Databasejakt med WikiLeaks: Espen Andersen forteller om hvordan NRK bearbeidet og presenterte materiale fra de lekkede Afghanistan-dokumentene.
- Landbruksstøtte: Tommy Kaas beretter om hvordan han fikk ut data om norsk landbruksstøtte på oppdrag fra VG. Kaas er i Bergen førstkommende tirsdag og forteller om sine erfaringer med datadrevet journalistikk, så vent mer fra Kaas her.
- Fortellinger og rådata: Alan McLean fra New York Times har lagt ut en svært interessant presentasjon om hvordan avisen arbeider med datakilder. Se nedenfor.
Det er kanskje litt off topic men det fremste eksemplet på datadrevet journalistikk er vel egentlig Skattelistene.
I 4 år lå samtlige fosterbarn ute på nettet (kilde: http://www.dinside.no/824461/listene-navngir-fosterbarn), uten at nettpublikasjonene tenkte på å spørre om hvorfor det lå ett og toåringer i datamaterialet. I årets lister kan man fortsatt finne en rekke 16–17 åringer som havner i skattelistene uten inntekt og formue.
Ved publisering av så store datasett må man også diskutere hvor vidt dette skal finnes via søkemotorer. Personlig har jeg ingenting i mot at ligningen publiseres, men jeg skjemmes å bo i et land hvor det første man finner ut om et annet menneske når man googler de er hva de tjener via 8–9 konkurrerende skattelisteløsninger.
Om man skal legge hvordan norske nettaviser publiserer/har publisert skattelistene så har vi grunn til bekymring. Jeg håper på Vær varsom regler for store datasett før man begynner å publisere større mengder data.