Vis redaktørene hvordan det kan gjøres

Journalistikk og programmering: En begrepsopprydning med oversikt over god praksis som bonus.

Redak­sjons­un­der­sø­kel­sen viser at data­støt­tet jour­na­lis­tikk er et områ­de redak­tø­re­ne ser poten­sia­le i. Sam­ti­dig viser under­sø­kel­sen at det­te poten­sia­let ikke kom­mer til å bli rea­li­sert gjen­nom redak­sjo­ne­nes ledel­se. Det­te er gode nyhe­ter for deg som vil utnyt­te data­kraft i nyhets­re­dak­sjo­nen, for kam­pen om bei­net blir for­mo­dent­lig let­te­re, og du byg­ger opp en kom­pe­tan­se som det er rime­lig at kun blir vik­ti­ge­re og vik­ti­ge­re. Det er ingen­ting som tyder på at meng­den sam­funns­nyt­tig data kom­mer til å bli mind­re med åre­ne.

Men hvor begyn­ner vi? Hva gjør de som sat­ser på det­te?

«Computational journalism» og «data journalism»

Jonat­han Stray (Inte­rac­ti­ve Tech­no­lo­gy Edi­tor hos Associa­ted Press) — en særs tek­no­lo­gisk kom­pe­tent mann i nyhets­bran­sjen, pub­li­ser­te nylig en lese­lis­te med tit­te­len a com­pu­ta­tio­nal jour­na­lism read­ing list. Lis­ten består av en bredt sam­men­satt sam­ling len­ker til teks­ter om data­jour­na­lis­tikk, visu­ali­se­ring, infor­ma­sjons­gjen­fin­ning, kryp­to­lo­gi, data­støt­tet ling­vis­tikk osv. De fles­te teks­te­ne er let­te­re lese­styk­ker som blogg­pos­ter, wiki­pe­dia­teks­ter og tuto­ria­ler, men enkel­te er hele bøker og viten­ska­pe­li­ge artik­ler.

I den­ne lese­lis­ten grup­pe­rer Stray teks­ter under over­skrif­ten «data jour­na­lism», som en under­ka­te­go­ri av com­pu­ta­tio­nal jour­na­lism. Det­te er pro­ble­ma­tisk på norsk. Data­støt­tet jour­na­lis­tikk bru­kes ofte for «com­pu­ta­tio­nal jour­na­lism», og det er fris­ten­de å kal­le «data jour­na­lism» for data­jour­na­lis­tikk, men det er svært lite som skil­ler dis­se på norsk. Begre­pe­ne er ukla­re, og også prak­si­sen som skil­ler de to er en gli­den­de over­gang:

Data jour­na­lism is obtai­ning, repor­ting on, cura­ting and pub­lish­ing data in the pub­lic inte­rest. The prac­tice is often more about spre­ads­he­ets than algo­rithms, so I’ll sug­gest that not all data jour­na­lism is “com­pu­ta­tio­nal,” in the same way that a novel writ­ten on a word proces­sor isn’t “com­pu­ta­tio­nal.”

Alt­så; data­jour­na­lis­tikk hand­ler mer om regne­ark enn algo­rit­mer, mens «com­pu­ta­tio­nal jour­na­lism» rom­mer alle muli­ge pro­gram­vare­ori­en­ter­te til­tak i redak­sjo­nen.

På norsk had­de muli­gens «algo­rit­misk jour­na­lis­tikk» eller «pro­gram­me­rings­jour­na­lis­tikk» dek­ket bed­re for «com­pu­ta­tio­nal jour­na­lism» enn data­støt­tet, sær­lig i kon­trast til data­jour­na­lis­tikk.

Jeg er usik­ker på om det­te er en frukt­bar måte å bru­ke begre­pe­ne på, vel­dig man­ge pro­gram­vare­ori­en­ter­te til­tak for å sam­le inn data, struk­tu­re­re og ana­ly­se­re, hav­ner i for­ma­ter som kan bear­bei­des i regne­ark uan­sett. I prak­sis kan det dog hen­de at det­te er en frukt­bar dis­tink­sjon, for det skil­ler mel­lom de som kan pro­gram­me­re og de som ikke kan det. Jour­na­lis­ter flest pro­gram­me­rer ikke.

Alle som ikke kan pro­gram­me­re kan like­vel bedri­ve data­jour­na­lis­tikk med den­ne dis­tink­sjo­nen — og hvis vi hop­per til­ba­ke til redak­tør­un­der­sø­kel­sen: her lig­ger lan­det i stor grad upløyd i Nor­ge.

Det som had­de vært nyt­tig for å kom­me i gang er inn­syn i hvor­dan and­re redak­sjo­ner løser opp­ga­ve­ne.

To caser — en med og en uten programmering

Case 1: data til fol­ket

The Guar­di­ans Data­b­log har en data­tung stil. De pub­li­se­rer ofte, bredt og på en måte som ikke kre­ver pro­gram­me­ring. I en nylig blogg­post visu­ali­se­rer de arbeids­fly­ten for sin data­jour­na­lis­tikk.

Under slag­or­det «facts are sacred» deler redak­sjo­nen data i stør­re grad som de for­mid­ler kom­men­ta­rer. Den­ne stra­te­gi­en er ikke unik for the Guar­di­an. Å pub­li­se­re data, ofte i form av en tabell, har vært en god stra­te­gi også for f.eks. Texas Tri­bu­ne. Det­te er en enkel pub­li­se­rings­form, og kre­ver intet mer enn inter­es­se og dedi­ka­sjon.

Eksem­pel på verk­tøy som benyt­tes er Goog­le fusion tab­les, Goog­le docs og refine. Hvis målet kun er å pub­li­se­re data på nett, er det slett ikke mye som skal til. Enk­le visu­ali­se­rings­verk­tøy for å for­mid­le tal­le­ne på en enk­le­re måte fin­nes også i sta­dig øken­de meng­der.

Selv­sagt pub­li­se­rer både The Guar­di­an og Texas Tri­bu­ne mer enn kun data i tabel­ler i blogg­for­mat. Data­ene er førs­te skritt, så kom­mer visu­ali­se­rin­ger, gra­fer, kart, appli­ka­sjo­ner og artik­ler på nett og papir. Ved å bru­ke pub­li­kum aktivt hen­ter også The Guar­di­an inn pub­li­kums tolk­nin­ger, kom­men­ta­rer og visu­ali­se­rin­ger basert på data­ene som deles. Det fin­nes som kjent all­tid noen der ute som vet bed­re enn jour­na­lis­ten.

Case 2: pro­gram­me­ring som meto­de

The Guar­di­ans Pre­zi-pre­sen­ta­sjon gir et inn­syn i hvor­dan data fly­ter gjen­nom sys­te­met der. Et lik­nen­de inn­blikk i Chi­ca­go Tri­bu­nes «news apps team» får vi i video­en Best Prac­tices for Impos­sib­le Dead­li­nes fra PyCon 2011. Chris­to­pher Gro­sko­pf repre­sen­te­rer en mer tek­no­lo­gisk front, og pro­gram­me­ring bru­kes gjen­nom hele den jour­na­lis­tis­ke arbeids­pro­ses­sen, fra inn­sam­ling av data til pre­sen­ta­sjon. Det spen­nen­de med Gro­sko­pfs video er de noe utra­di­sjo­nel­le verk­tøy­ene og tek­nik­ke­ne som gjen­gen i Chi­ca­go bru­ker for å lan­de sake­ne på dead­li­ne. F.eks. at team­et stre­ber mot å ser­ve­re «appli­ka­sjo­ne­ne» sine som fla­te filer med så lite som mulig av inter­ak­ti­ve featu­res er inter­es­sant. Hvor­dan de tak­ler tra­fikk på er også spen­nen­de. For deg som er en selv, eller for­står en pro­gram­vare­ut­vik­lers språk, så anbe­fa­les den­ne video­en på det var­mes­te:

Gjen­gen hos Chi­ca­go Tri­bu­ne deler impo­ne­ren­de mye kunn­skap og kode i blog­gen sin, på blog.apps.chicagotribune.com og Git­hub. Åpen­het og delings­kul­tur står tyde­lig sterkt i den­ne sub­kul­tu­ren av pro­gram­vare­ut­vik­ling, Gro­sko­pfs pre­sen­ta­sjon viser også hvor­dan det­te er nyt­tig for alle.

Med utgangs­punk­tet at vi har data (no.ckan.net, data.norge.no, offent­lig­hets­lo­ven, …) er det vel­dig man­ge ret­nin­ger å gå. Lis­ten over nyhets­ap­pli­ka­sjo­ner inne­hol­der man­ge gode eksemp­ler.

Selv er jeg svak for kart­løs­nin­ger, og synes Pat­rick Cains arbeid hos Toron­to Star, sær­lig «map of the week», er for­bil­led­lig. Det­te kre­ver for­res­ten hel­ler ikke pro­gram­me­ring i utgangs­punk­tet, men kan selv­sagt utvi­des og kom­bi­ne­res i mer avan­ser­te appli­ka­sjo­ner.

Hva som er begrens­nin­ge­ne med pro­gram­me­ring som meto­de, er et spørs­mål helt avhen­gig av kon­tekst. Det som er sik­kert er at det­te er en man­gel­vare, og kom­pe­tan­sen kan bru­kes i uli­ke områ­der i en nyhets­re­dak­sjon. Fra rese­arch, til ana­ly­se, pre­sen­ta­sjon og auto­ma­ti­se­ring — mulig­he­te­ne er man­ge.

Vi har et lite, eks­klu­sivt knip­pe pro­gram­me­ren­de jour­na­lis­ter i Nor­ge, og meng­den er også begren­set i utlan­det. Poten­sia­let er langt stør­re enn inn­sat­sen som set­tes inn. Car­pe diem.

TEMA

J

ournali
stikk

130 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

  1. […] her. For en over­sikt over begre­per til­knyt­tet data­støt­tet jour­na­lis­tikk, ta en kikk på Vox Pub­li­cas begreps­gjen­nom­gang. Sys­te­ma­ti­se­ring og vas­king av data­ene er alt­så førs­te skritt, så kom­mer visu­ali­se­rin­ger, […]

  2. […] eller CAR (Com­pu­ter Assis­ted Repor­ting) og lurer på defi­ni­sjo­ner og for­skjel­ler, ta en kikk på den­ne fine blogg­pos­ten på Vox Pub­li­ca som vil opp­kla­re even­tu­el­le […]

til toppen