Å fortelle historier med datakilder

Det dukker stadig opp nye eksempler på datadrevet journalistikk -- her er en liten samling.

I fjor høst etterlyste jeg flere eksem­pler på datadrevet jour­nal­is­tikk. Nå beg­yn­ner både pros­jek­ter, erfar­ingsrap­porter og analyser å dukke opp. En liten sam­ling fra de siste ukene:

 • Data­base­jakt med Wik­iLeaks: Espen Ander­sen forteller om hvor­dan NRK bear­bei­det og pre­sen­terte mate­ri­ale fra de lekkede Afghanistan-dokumentene.
 • Land­bruksstøtte: Tom­my Kaas beretter om hvor­dan han fikk ut data om norsk land­bruksstøtte på opp­drag fra VG. Kaas er i Bergen førstk­om­mende tirs­dag og forteller om sine erfaringer med datadrevet jour­nal­is­tikk, så vent mer fra Kaas her.
 • Fortellinger og råda­ta: Alan McLean fra New York Times har lagt ut en svært inter­es­sant pre­sen­tasjon om hvor­dan avisen arbei­der med datak­ilder. Se nedenfor.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

 1. Det er kan­skje litt off top­ic men det frem­ste eksem­plet på datadrevet jour­nal­is­tikk er vel egentlig Skattelistene. 

  I 4 år lå samtlige fos­ter­barn ute på net­tet (kilde: http://www.dinside.no/824461/listene-navngir-fosterbarn), uten at nettpub­likasjonene tenk­te på å spørre om hvor­for det lå ett og toåringer i data­ma­te­ri­alet. I årets lis­ter kan man fort­satt finne en rekke 16–17 åringer som havn­er i skat­telis­tene uten inntekt og formue. 

  Ved pub­lis­er­ing av så store datasett må man også diskutere hvor vidt dette skal finnes via søke­mo­tor­er. Per­son­lig har jeg ingent­ing i mot at lignin­gen pub­lis­eres, men jeg skjemmes å bo i et land hvor det første man finner ut om et annet men­neske når man googler de er hva de tjen­er via 8–9 konkur­rerende skattelisteløsninger. 

  Om man skal legge hvor­dan norske net­tavis­er publiserer/har pub­lis­ert skat­telis­tene så har vi grunn til bekym­ring. Jeg håper på Vær var­som regler for store datasett før man beg­yn­ner å pub­lis­ere større mengder data.

 2. Det er neppe feil å påstå at skat­telis­tene er den for­men for datadrevet jour­nal­is­tikk som norske redak­sjon­er har brukt mest ressurs­er på til nå.

  Og jeg synes ikke ditt inn­legg er off top­ic — tvert imot. Det er svært vik­tig å diskutere per­son­vern­spørsmål par­al­lelt med den økende inter­essen for datadrevet jour­nal­is­tikk. Etter min mening bør skat­telis­tene for­bli et sær­til­felle. Det aller meste av datadrevet jour­nal­is­tikk bør være basert på data som ikke kan brukes til å iden­ti­fis­ere enkelt­per­son­er. Dette er også noe vi på Info­me­dia poengterte i rap­porten vi pub­lis­erte tidligere i år.

til toppen