Redaksjonsundersøkelsen viser at datastøttet journalistikk er et område redaktørene ser potensiale i. Samtidig viser undersøkelsen at dette potensialet ikke kommer til å bli realisert gjennom redaksjonenes ledelse. Dette er gode nyheter for deg som vil utnytte datakraft i nyhetsredaksjonen, for kampen om beinet blir formodentlig lettere, og du bygger opp en kompetanse som det er rimelig at kun blir viktigere og viktigere. Det er ingenting som tyder på at mengden samfunnsnyttig data kommer til å bli mindre med årene.
Men hvor begynner vi? Hva gjør de som satser på dette?
“Computational journalism” og “data journalism”
Jonathan Stray (Interactive Technology Editor hos Associated Press) — en særs teknologisk kompetent mann i nyhetsbransjen, publiserte nylig en leseliste med tittelen a computational journalism reading list. Listen består av en bredt sammensatt samling lenker til tekster om datajournalistikk, visualisering, informasjonsgjenfinning, kryptologi, datastøttet lingvistikk osv. De fleste tekstene er lettere lesestykker som bloggposter, wikipediatekster og tutorialer, men enkelte er hele bøker og vitenskapelige artikler.
I denne leselisten grupperer Stray tekster under overskriften “data journalism”, som en underkategori av computational journalism. Dette er problematisk på norsk. Datastøttet journalistikk brukes ofte for “computational journalism”, og det er fristende å kalle “data journalism” for datajournalistikk, men det er svært lite som skiller disse på norsk. Begrepene er uklare, og også praksisen som skiller de to er en glidende overgang:
Data journalism is obtaining, reporting on, curating and publishing data in the public interest. The practice is often more about spreadsheets than algorithms, so I’ll suggest that not all data journalism is “computational,” in the same way that a novel written on a word processor isn’t “computational.”
Altså; datajournalistikk handler mer om regneark enn algoritmer, mens “computational journalism” rommer alle mulige programvareorienterte tiltak i redaksjonen.
På norsk hadde muligens “algoritmisk journalistikk” eller “programmeringsjournalistikk” dekket bedre for “computational journalism” enn datastøttet, særlig i kontrast til datajournalistikk.
Jeg er usikker på om dette er en fruktbar måte å bruke begrepene på, veldig mange programvareorienterte tiltak for å samle inn data, strukturere og analysere, havner i formater som kan bearbeides i regneark uansett. I praksis kan det dog hende at dette er en fruktbar distinksjon, for det skiller mellom de som kan programmere og de som ikke kan det. Journalister flest programmerer ikke.
Alle som ikke kan programmere kan likevel bedrive datajournalistikk med denne distinksjonen — og hvis vi hopper tilbake til redaktørundersøkelsen: her ligger landet i stor grad upløyd i Norge.
Det som hadde vært nyttig for å komme i gang er innsyn i hvordan andre redaksjoner løser oppgavene.
To caser — en med og en uten programmering
Case 1: data til folket
The Guardians Datablog har en datatung stil. De publiserer ofte, bredt og på en måte som ikke krever programmering. I en nylig bloggpost visualiserer de arbeidsflyten for sin datajournalistikk.
Under slagordet “facts are sacred” deler redaksjonen data i større grad som de formidler kommentarer. Denne strategien er ikke unik for the Guardian. Å publisere data, ofte i form av en tabell, har vært en god strategi også for f.eks. Texas Tribune. Dette er en enkel publiseringsform, og krever intet mer enn interesse og dedikasjon.
Eksempel på verktøy som benyttes er Google fusion tables, Google docs og refine. Hvis målet kun er å publisere data på nett, er det slett ikke mye som skal til. Enkle visualiseringsverktøy for å formidle tallene på en enklere måte finnes også i stadig økende mengder.
Selvsagt publiserer både The Guardian og Texas Tribune mer enn kun data i tabeller i bloggformat. Dataene er første skritt, så kommer visualiseringer, grafer, kart, applikasjoner og artikler på nett og papir. Ved å bruke publikum aktivt henter også The Guardian inn publikums tolkninger, kommentarer og visualiseringer basert på dataene som deles. Det finnes som kjent alltid noen der ute som vet bedre enn journalisten.
Case 2: programmering som metode
The Guardians Prezi-presentasjon gir et innsyn i hvordan data flyter gjennom systemet der. Et liknende innblikk i Chicago Tribunes “news apps team” får vi i videoen Best Practices for Impossible Deadlines fra PyCon 2011. Christopher Groskopf representerer en mer teknologisk front, og programmering brukes gjennom hele den journalistiske arbeidsprosessen, fra innsamling av data til presentasjon. Det spennende med Groskopfs video er de noe utradisjonelle verktøyene og teknikkene som gjengen i Chicago bruker for å lande sakene på deadline. F.eks. at teamet streber mot å servere “applikasjonene” sine som flate filer med så lite som mulig av interaktive features er interessant. Hvordan de takler trafikk på er også spennende. For deg som er en selv, eller forstår en programvareutviklers språk, så anbefales denne videoen på det varmeste:
Gjengen hos Chicago Tribune deler imponerende mye kunnskap og kode i bloggen sin, på blog.apps.chicagotribune.com og Github. Åpenhet og delingskultur står tydelig sterkt i denne subkulturen av programvareutvikling, Groskopfs presentasjon viser også hvordan dette er nyttig for alle.
Med utgangspunktet at vi har data (no.ckan.net, data.norge.no, offentlighetsloven, …) er det veldig mange retninger å gå. Listen over nyhetsapplikasjoner inneholder mange gode eksempler.
Selv er jeg svak for kartløsninger, og synes Patrick Cains arbeid hos Toronto Star, særlig “map of the week”, er forbilledlig. Dette krever forresten heller ikke programmering i utgangspunktet, men kan selvsagt utvides og kombineres i mer avanserte applikasjoner.
Hva som er begrensningene med programmering som metode, er et spørsmål helt avhengig av kontekst. Det som er sikkert er at dette er en mangelvare, og kompetansen kan brukes i ulike områder i en nyhetsredaksjon. Fra research, til analyse, presentasjon og automatisering — mulighetene er mange.
Vi har et lite, eksklusivt knippe programmerende journalister i Norge, og mengden er også begrenset i utlandet. Potensialet er langt større enn innsatsen som settes inn. Carpe diem.
[…] her. For en oversikt over begreper tilknyttet datastøttet journalistikk, ta en kikk på Vox Publicas begrepsgjennomgang. Systematisering og vasking av dataene er altså første skritt, så kommer visualiseringer, […]