Analyseprogram avdekker nettavisenes prioriteringer

Nyutviklet programvare åpner nye muligheter for forskning på nettavisjournalistikk.

Det dreier seg her om et tver­rfaglig samar­beid mel­lom infor­masjonsvitere og medievitere, om utnyt­ting av kom­petanse fra to fagom­råder og om utvikling av pro­gram­vare for arkiver­ing av net­tavis­for­sider. Pro­gram­met skal arki­vere endringer på net­tavis­ers for­sider, lage et søk­bart reg­is­ter og vise hvor­dan nettsak­er «beveg­er» seg på for­si­den over tid.

Arbei­det med pro­gram­met startet i beg­yn­nelsen av feb­ru­ar 2012, i forbindelse med mitt dok­tor­grad­spros­jekt som under­søk­er pressedeknin­gen av NAV, herun­der blant annet net­tavisen VG Nett. Pros­jek­tet søk­er blant annet å under­søke hvor­dan net­tavis­ar­tik­ler «beveg­er» seg på for­si­den, slik at man kan få et bilde på hvor­dan en nettsak har vært pri­or­itert i forhold til resten av artik­lene på for­si­den. Til sam­men­lign­ing vil en topp­sak på for­si­den av en papi­ravis ha en høyere pri­or­i­ter­ing enn en sak uten forsidereferanse. 

Top­pen av VGs for­side 5. feb­ru­ar 2012 kl 08.46 og kl. 09.05 (grønn mark­er­ings­farge lagt på).

Det er imi­dler­tid flere utfor­dringer med å inklud­ere net­tavis­er i innhold­s­analyser. En net­tar­tikkel kan spores ved hjelp av avis­arkivet Retriev­er, men arkivet gir ingen infor­masjon om hvor­dan redak­sjo­nen har pri­or­itert sak­en. Med andre ord er det ingen infor­masjon om hvor artikke­len har vært plassert på for­si­den, eller om den i det hele tatt har vært på for­si­den. Det er net­topp disse utfor­drin­gene det nye pro­gram­met skal løse. Pro­gram­met er utviklet av infor­masjonsviterne Mads Tordal, Ruben Oen og Øyvind Døske­land i samar­beid med under­teg­nede — samtlige ved Insti­tutt for infor­masjons- og medieviten­skap, UiB.

I forkant av arbei­det med pro­gram­met er det også blitt under­søkt hvorvidt andre tjen­ester kan være til hjelp, slik som eksem­pelvis Nasjon­al­bib­liotekets arkiver­ing av norske nettsider. Disse sys­temene er ikke tilstrekke­lig for å dri­ve denne typen for­side­analyser. «Way­back Machine» (et søk­bart inter­net­tarkiv) er heller ikke et godt alter­na­tiv, da denne tjen­esten kun arkiver­er for­sider utval­gte dager, og som regel fra 1–8 ganger om dagen. VG Nett arkiver­er sine egne for­sider i html-for­mat hvert femte min­utt, og dette arkivet strekker seg tilbake til 2010. Redak­sjo­nen stiller arkivet til dis­po­sisjon for medieforskn­ing. Arkivet til VG Nett gir imi­dler­tid ikke mulighet til å bruke arkivet som et søk­bart reg­is­ter med utgangspunkt i artik­lene. Her må man alt­så lete gjen­nom for­si­dene manuelt for å finne ut hvor­dan artik­lene «beveg­er» seg på forsiden. 

Prob­lematikken med analyser og innhent­ing av data i forhold til net­tavis­er er således bak­grun­nen for dette samar­bei­det mel­lom infor­masjons- og medievitere. Pro­gram­met har i første omgang tatt utgangspunkt i VG Netts for­sider og fun­ger­er på føl­gende vis: for­sider arkiveres i html-for­mat hver gang det skjer en redak­sjonell endring på siden. Med andre ord vil den ikke reg­istrere at det skiftes annonser eller at et bilde skifter serv­er (uten at selve bildet endr­er seg). Dette arkiveres så kro­nol­o­gisk i et søk­bart reg­is­ter. Her kan man søke etter artik­lenes net­tadresse (URL), og pro­gram­met gener­erer deretter en over­sikt over hvilke for­sider artikke­len har vært plassert på. Dette åpn­er videre for muligheten til å lage en bilde­serie der man ser hvor­dan artikke­len «beveg­er seg på for­si­den» over tid. Artik­lene kan også få et grønt merke slik at den enkelt kan spores på de forskjel­lige forsidene.

Arkivet kan også brukes til å gjøre analyser av hvilke tid­spunkt endringer på net­tavis­for­sider skjer. Eksem­pelvis kan man vise hvilke klokkeslett de fleste opp­da­terin­gene på for­si­den skjer. 

Koden publisert på Github

Net­tavis­arkiver­ing­spro­gram­met vil forhåpentligvis moti­vere frem­tidi­ge stu­den­ter og forskere til å rette opp­merk­somheten mot forskn­ing på net­tavis­er og net­tar­tik­ler. Der­som pro­gram­met blir fer­digutviklet og får funksjo­nen som en data­base, kan man også grave i arkivet av net­tavis­ar­tik­ler på for­si­den. Videre slip­per man å ta skjer­mdumper manuelt for å arki­vere forsider.

Det må påpekes at pro­gram­met ikke er feil­fritt slik det står nå. Eksem­pelvis er pro­gram­met kun tilpas­set VG Nett for øye­b­likket, og pro­gram­met vil kun lagre for­si­dene som html. Der­som VG-redak­sjo­nen slet­ter artik­ler eller annet innhold, vil dette påvirke fremvis­nin­gen av net­tavis­for­si­den. Vi job­ber med å løse disse utfor­drin­gene, og ønsker nye forslag velkom­men. Koden til pro­gram­met er tilgjen­gelig på Github.

TEMA

J

ournali
stikk

136 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

  1. Anders Ericson says:

    Inter­es­sant. En annen ting, som noen kan­skje også vil forske på, og kan­skje ved hjelp av dette pro­gram­met?: Utviklin­ga når det gjelder bruken (omfanget) av eksterne hyper­lenker i redak­sjonelle tek­ster. Over tid? I forhold til type artikkel? Tema? I forhold til for­fat­ter? Hvem som sit­ter på desken?

    • Mads Tordal says:

      Mulighetene er mange! Det du ramser opp er ting som en kan finne ut av. I dette til­fel­let så er det bevar­ing av frem­si­dene som står i fokus, hva en vil gjøre med dataen som blir sam­let inn er helt opp til den enkelte forsker/interessent.

      I nåværende form må hver enkelt kjøre pro­gram­met for å sam­le inn data, det er ikke noen mulighet å gå tilbake i tid. Ideelt sett kunne dette ha blitt kjørt en sen­tral plass slik at de som var inter­essert i dataene kunne se på disse uten å måtte prøve å sam­le disse inn selv — ved å ta kon­takt med de aktuelle avisene, som såvidt meg bek­jent ikke lagr­er veldig mye. F.eks, hadde dette pro­gram­met kjørt fra 22. juli rundt kl 1500 og utover, kunne det gitt en svært etter­lengtet over­sikt, men her hadde det vært inter­es­sant å sett på utviklin­gen av artikke­linnhold også (http://www.dagbladet.no/2012/03/31/kultur/terrorangrep_i_oslo/nasjonalbiblioteket/medieforskning/20879267/). Reg­istrering av endringer i artikke­linnhold kan være et naturlig steg videre, men det er foreløpig ingen plan­er om å beg­ynne på den oppgaven.

til toppen