Vis redaktørene hvordan det kan gjøres

Journalistikk og programmering: En begrepsopprydning med oversikt over god praksis som bonus.

Redak­sjon­sun­der­søkelsen vis­er at datastøt­tet jour­nal­is­tikk er et område redak­tørene ser poten­siale i. Sam­tidig vis­er under­søkelsen at dette poten­sialet ikke kom­mer til å bli realis­ert gjen­nom redak­sjonenes ledelse. Dette er gode nyheter for deg som vil utnytte datakraft i nyhet­sredak­sjo­nen, for kam­p­en om beinet blir for­mod­entlig let­tere, og du byg­ger opp en kom­petanse som det er rimelig at kun blir vik­tigere og vik­tigere. Det er ingent­ing som tyder på at meng­den sam­funnsnyt­tig data kom­mer til å bli min­dre med årene.

Men hvor beg­yn­ner vi? Hva gjør de som satser på dette?

“Computational journalism” og “data journalism”

Jonathan Stray (Inter­ac­tive Tech­nol­o­gy Edi­tor hos Asso­ci­at­ed Press) — en særs tek­nol­o­gisk kom­pe­tent mann i nyhets­bran­sjen, pub­lis­erte nylig en leseliste med tit­te­len a com­pu­ta­tion­al jour­nal­ism read­ing list. Lis­ten består av en bredt sam­men­satt sam­ling lenker til tek­ster om data­jour­nal­is­tikk, visu­alis­er­ing, infor­masjon­s­g­jen­finning, kryp­tolo­gi, datastøt­tet lingvis­tikk osv. De fleste tek­stene er let­tere leses­tykker som blog­g­poster, wikipedi­atek­ster og tuto­ri­aler, men enkelte er hele bøk­er og viten­skapelige artikler.

I denne leselis­ten grup­per­er Stray tek­ster under over­skriften “data jour­nal­ism”, som en under­kat­e­gori av com­pu­ta­tion­al jour­nal­ism. Dette er prob­lema­tisk på norsk. Datastøt­tet jour­nal­is­tikk brukes ofte for “com­pu­ta­tion­al jour­nal­ism”, og det er fris­tende å kalle “data jour­nal­ism” for data­jour­nal­is­tikk, men det er svært lite som skiller disse på norsk. Begrepene er uklare, og også prak­sisen som skiller de to er en gli­dende overgang: 

Data jour­nal­ism is obtain­ing, report­ing on, curat­ing and pub­lish­ing data in the pub­lic inter­est. The prac­tice is often more about spread­sheets than algo­rithms, so I’ll sug­gest that not all data jour­nal­ism is “com­pu­ta­tion­al,” in the same way that a nov­el writ­ten on a word proces­sor isn’t “com­pu­ta­tion­al.”

Alt­så; data­jour­nal­is­tikk han­dler mer om reg­n­eark enn algo­rit­mer, mens “com­pu­ta­tion­al jour­nal­ism” rom­mer alle mulige pro­gram­vare­ori­en­terte tiltak i redaksjonen.

På norsk hadde muli­gens “algo­rit­misk jour­nal­is­tikk” eller “pro­gram­mer­ingsjour­nal­is­tikk” dekket bedre for “com­pu­ta­tion­al jour­nal­ism” enn datastøt­tet, særlig i kon­trast til datajournalistikk. 

Jeg er usikker på om dette er en fruk­t­bar måte å bruke begrepene på, veldig mange pro­gram­vare­ori­en­terte tiltak for å sam­le inn data, struk­turere og analy­sere, havn­er i for­mater som kan bear­bei­des i reg­n­eark uansett. I prak­sis kan det dog hende at dette er en fruk­t­bar dis­tinksjon, for det skiller mel­lom de som kan pro­gram­mere og de som ikke kan det. Jour­nal­is­ter flest pro­gram­mer­er ikke. 

Alle som ikke kan pro­gram­mere kan likev­el bedrive data­jour­nal­is­tikk med denne dis­tinksjo­nen — og hvis vi hop­per tilbake til redak­tørun­der­søkelsen: her lig­ger lan­det i stor grad upløyd i Norge. 

Det som hadde vært nyt­tig for å komme i gang er innsyn i hvor­dan andre redak­sjon­er løs­er oppgavene.

To caser — en med og en uten programmering

Case 1: data til folket

The Guardians Dat­a­blog har en datatung stil. De pub­lis­er­er ofte, bredt og på en måte som ikke krev­er pro­gram­mer­ing. I en nylig blog­g­post visu­alis­er­er de arbei­ds­fly­ten for sin datajournalistikk. 

Under slagordet “facts are sacred” del­er redak­sjo­nen data i større grad som de formi­dler kom­mentar­er. Denne strate­gien er ikke unik for the Guardian. Å pub­lis­ere data, ofte i form av en tabell, har vært en god strate­gi også for f.eks. Texas Tri­bune. Dette er en enkel pub­lis­er­ings­form, og krev­er intet mer enn inter­esse og dedikasjon. 

Eksem­pel på verk­tøy som benyttes er Google fusion tables, Google docs og refine. Hvis målet kun er å pub­lis­ere data på nett, er det slett ikke mye som skal til. Enkle visu­alis­er­ingsverk­tøy for å formi­dle tal­lene på en enklere måte finnes også i stadig økende mengder.

Selvsagt pub­lis­er­er både The Guardian og Texas Tri­bune mer enn kun data i tabeller i blog­gfor­mat. Dataene er første skritt, så kom­mer visu­alis­eringer, grafer, kart, app­likasjon­er og artik­ler på nett og papir. Ved å bruke pub­likum aktivt hen­ter også The Guardian inn pub­likums tolkninger, kom­mentar­er og visu­alis­eringer basert på dataene som deles. Det finnes som kjent alltid noen der ute som vet bedre enn journalisten. 

Case 2: pro­gram­mer­ing som metode

The Guardians Prezi-pre­sen­tasjon gir et innsyn i hvor­dan data fly­ter gjen­nom sys­temet der. Et lik­nende innblikk i Chica­go Tri­bunes “news apps team” får vi i videoen Best Prac­tices for Impos­si­ble Dead­lines fra PyCon 2011. Christo­pher Groskopf rep­re­sen­ter­er en mer tek­nol­o­gisk front, og pro­gram­mer­ing brukes gjen­nom hele den jour­nal­is­tiske arbei­d­spros­essen, fra innsam­ling av data til pre­sen­tasjon. Det spen­nende med Groskopfs video er de noe utradis­jonelle verk­tøyene og teknikkene som gjen­gen i Chica­go bruk­er for å lande sak­ene på dead­line. F.eks. at teamet stre­ber mot å ser­vere “app­likasjonene” sine som flate fil­er med så lite som mulig av inter­ak­tive fea­tures er inter­es­sant. Hvor­dan de tak­ler trafikk på er også spen­nende. For deg som er en selv, eller forstår en pro­gram­vareutviklers språk, så anbe­fales denne videoen på det varmeste:

Gjen­gen hos Chica­go Tri­bune del­er imponerende mye kunnskap og kode i bloggen sin, på blog.apps.chicagotribune.com og Github. Åpen­het og del­ingskul­tur står tydelig sterkt i denne sub­kul­turen av pro­gram­vareutvikling, Groskopfs pre­sen­tasjon vis­er også hvor­dan dette er nyt­tig for alle.

Med utgangspunk­tet at vi har data (no.ckan.net, data.norge.no, offent­lighet­sloven, …) er det veldig mange ret­ninger å gå. Lis­ten over nyhet­sap­p­likasjon­er innehold­er mange gode eksempler. 

Selv er jeg svak for kartløs­ninger, og synes Patrick Cains arbeid hos Toron­to Star, særlig “map of the week”, er for­billedlig. Dette krev­er for­resten heller ikke pro­gram­mer­ing i utgangspunk­tet, men kan selvsagt utvides og kom­bineres i mer avanserte applikasjoner.

Hva som er begren­snin­gene med pro­gram­mer­ing som metode, er et spørsmål helt avhengig av kon­tekst. Det som er sikkert er at dette er en man­gel­vare, og kom­petansen kan brukes i ulike områder i en nyhet­sredak­sjon. Fra research, til analyse, pre­sen­tasjon og automa­tis­er­ing — mulighetene er mange.

Vi har et lite, eksklu­sivt knippe pro­gram­merende jour­nal­is­ter i Norge, og meng­den er også begrenset i utlandet. Poten­sialet er langt større enn innsat­sen som settes inn. Carpe diem.

TEMA

J

ournali
stikk

136 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

  1. […] her. For en over­sikt over begreper tilknyt­tet datastøt­tet jour­nal­is­tikk, ta en kikk på Vox Pub­li­cas begreps­g­jen­nom­gang. Sys­tem­a­tis­er­ing og vask­ing av dataene er alt­så første skritt, så kom­mer visualiseringer, […]

  2. […] eller CAR (Com­put­er Assist­ed Report­ing) og lur­er på defin­isjon­er og forskjeller, ta en kikk på denne fine blog­g­posten på Vox Pub­li­ca som vil opp­klare eventuelle […]

til toppen