Journalist med medier og internett som spesialfelt. Redaktør i Vox Publica.
Det dukker stadig opp nye eksempler på datadrevet journalistikk — her er en liten samling.
I fjor høst etterlyste jeg flere eksempler på datadrevet journalistikk. Nå begynner både prosjekter, erfaringsrapporter og analyser å dukke opp. En liten samling fra de siste ukene:
Ny serie i Vox Publica: Vi publiserer dataene bak aktuelle nyhetssaker.
En av nyhetssakene som har fått mest oppmerksomhet i dag, er Aftenpostens oppslag om “kraftig vekst i studielån”. Artikkelen fokuserer blant annet på en økning i gjennomsnittsstudentens gjeld til Statens lånekasse ved avsluttet utdanning.
Som mange andre nyheter, bygger denne på data hentet fra en offentlig virksomhet, i dette tilfelle Lånekassen (for ordens skyld, artikkelen har også andre kilder!). Framover vil vi i den nye Vox Publica-serien “Aktuelt datasett” se nærmere på slike datakildebaserte nyheter. Hvordan løser mediene sakene, og hva kunne eventuelt vært gjort annerledes? Hva med datakildene, har dataeieren gjort dem tilgjengelig for viderebruk på riktig måte? Hensikten er blant annet å skape mer interesse for utviklingen av datadrevet journalistikk. Inspirasjon er særlig hentet fra The Guardians Datablog.
Et sentralt datasett i Aftenpostens artikkel er “Gjennomsnittsgjeld ved avsluttet utdanning”. Aftenposten har trukket ut tall fra fire år (1989, 1999, 2004, 2009) og publisert i et søylediagram. Det bør imidlertid være interessant for mange å se på hele datasettet, som er publisert i html-format på Lånekassens nettsted (se også øvrig lånekassestatistikk).
Dette datasettet går bare tilbake til 1994 (Aftenposten har fått litt spesialservice og fått ut tallet for 1989). Det er kolonnen “Høyere utdanning” med beløp omregnet til 2009-kroneverdi som brukes. Det er tydelig at økningen det vinkles på har funnet sted de siste fire årene. I perioden 1994-2005 økte faktisk ikke gjennomsnittsgjelden ved avsluttet utdanning i det hele tatt. Fra 2005 til 2009 har økningen vært på drøyt 9 prosent — så blir det et tolkningsspørsmål om det er riktig å kalle dette “eksplosivt”.
Datadrevet lokaljournalistikk og åpning av forskningsdata blant temaene 7. september.
MediArena, et nytt innovasjonsprosjekt for mediebransjen i bergensregionen, inviterer sammen med Vox Publicas utgiver Infomedia til seminaret “Bergen Open”. Det blir presentasjoner og diskusjon om temaene datadrevet lokaljournalistikk, semantisk framtid, forskning og journalistikk og kontekstuelle annonsemodeller. Se mer informasjon og påmeldingsdetaljer.
Tid: Tirsdag 7. september kl. 09.00-15.30. Sted: Scandic Hotell Bergen City.
Blant innlederne er medieutvikler Anders Brenna, danske Johannes Wehner som har gjort spennende arbeid med Information.dk og Bente Kalsnes fra Origo. Dessuten er selvsagt vi i “Fakta først” med. Flere detaljer om opplegg og foredragsholdere er underveis.
MediArenas mål er å “stimulere til økt innovasjon basert på samarbeid mellom bedrifter, FoU og utdanningsmiljøer og offentlige utviklingsaktører.” Det er spennende at de har valgt offentlig sektors data som et satsingsområde. Nettopp regionale og lokale satsinger på å åpne opp data har stort potensial, det har initiativer som London DataStore vist. Kanskje Bergen her kan vise vei for andre norske byer og regioner? I beste fall kan dette lede til en konkurranse om å være den mest åpne byen eller kommunen.
Texas Tribune får betalt for satsing på datadrevet journalistikk.
En serie nye, ambisiøse nettsteder finansiert av stiftelser og filantroper hører til de mest spennende journalistiske prosjektene i USA de siste par årene. Mange av dem henvender seg til et regionalt publikum, som Texas Tribune, California Watch og MinnPost.
Texas Tribune er spesielt interessante for oss som er opptatt av datadrevet journalistikk. Tilrettelegging av datakilder er en prioritert del av redaksjonens arbeid, som det går fram av en grundig profil i Columbia Journalism Review. På Texas Tribunes dataside finner leseren mange ulike datasett om politikk, økonomi og samfunn i Texas, primært basert på tilgjengelige data fra offentlig sektor. Redaksjonen har laget visualiseringer og gjort databaser søkbare.
Fire av vinnerne i regjeringens Nettskap-konkurranse vil ta i bruk offentlige datakilder.
Fornyingsdepartementet har kåret vinnerne i konkurransen “Nettskap”, der til sammen 2,5 millioner kroner deles ut i støtte til web-prosjekter for innovasjon, demokratisering og effektivisering. I alt 17 prosjekter har fått støtte, og som ventet er det stor spennvidde i temaene søkerne har tatt for seg. Departementet har fått hjelp fra en egen ekspertgruppe til å vurdere søknadene.
Minst fire av prosjektene har viderebruk av offentlig sektors data som et viktig aspekt, ifølge departementets oppsummering. Det dreier seg om disse prosjektene:
Spennende eksperiment: Eksterne utviklere kan nå lage sine egne utgaver av The Guardian via avisens åpne API.
Bloggen Webmonkey beskriver et vakkert eksempel på hva som kan skje når en avis får et åpent API (programmeringsgrensesnitt).
The Guardian har nylig lansert et slikt med sin åpne plattform. Både teknologisk og økonomisk er dette et spennende prosjekt som kan vise vei både for medier og andre virksomheter som vurderer å dele sine data med andre.
Om du er opptatt av brukervennlighet, lesbarhet eller å senke barrierene for å lese nyheter, ta en titt på Today’s Guardian på guardian.gyford.com og les tankene bak hos skaperen; Phil Gyford.
Dette er en av potensielt mange utgaver av The Guardian som eksterne utviklere kan lage med deres Open Platform API.
Om dette er en teknisk modell noen av de norske aktørene faktisk vil gjennomføre, gjenstår å se. NRKbeta har diskutert saken ved flere anledninger.
Konferanser, seminarer, tvitring — en liten lenkesamling.
Interessen for å åpne opp offentlig sektors data for viderebruk er upåklagelig og utvilsomt økende. I dag arrangerer Vestlandsforsking et seminar i Oslo med bred deltakelse. Debatten kan følges på Twitter.
I går arrangerte EU-prosjektet Epsiplatform en stor konferanse i Madrid. Presentasjonene herfra skal oppsummeres og publiseres i etterkant. Imens kan en følge den videre debatten — på Twitter.
Arbeidet med kravspesifikasjonen til den norske regjeringens kommende datakildeportal data.norge.no fortsetter. Fornyingsdepartementet ber om innspill til arbeidet.
Twitter er en god kanal for å få tips om den internasjonale utviklingen. Her anbefales stikkordet #opendata.
Tips om noe som burde vært med her? Bruk kommentarfeltet eller @oovrebo.
Ønsker du tilgang til data fra et offentlig organ? Offentlighetsloven er et bedre verktøy enn mange er klar over.
Den reviderte offentlighetsloven som trådte i kraft 1. januar 2009 har en egen paragraf om datakilder. Ordlyden er slik:
§ 9. Rett til å krevje innsyn i ei samanstilling frå databasar
Alle kan krevje innsyn i ei samanstilling av opplysningar som er elektronisk lagra i databasane til organet dersom samanstillinga kan gjerast med enkle framgangsmåtar.
Paragrafen har antakelig vært lite brukt til nå, men det er grunn til å tro at det vil endre seg. Interessen for offentlig sektors datakilder som råmateriale for journalistikk er økende. Det journalistiske miljøet har lang erfaring med å bruke offentlighetsloven til å få innsyn i dokumenter, så journalistene kan bli “bjellesauer” også på datakilde-området.
Alle andre grupper og enkeltpersoner som ønsker tilgang til datakilder kan selvsagt også gjøre bruk av loven.
Selv blant dem som har kjent til paragrafen om datakilder, er det trolig ikke mange som har vært klar over alt den kan brukes til. Et eksempel: Et vanlig hinder de som vil ha tilgang til datakilder støter på, er at dataene publiseres i et uegnet format, for eksempel pdf.
Fire av ti nettbrukere går direkte til datakildene, viser spørreundersøkelse.
Den amerikanske satsingen på å gjøre stadig mer data fra offentlig sektor tilgjengelig ser ut til å støte på stor interesse i befolkningen — overraskende stor, vil nok mange si. I en spørreundersøkelse fra Pew Internet sier så mange som 23 prosent av alle nettbrukere i USA at de i løpet av det siste året har besøkt nettstedet recovery.gov, der de kan sjekke i detalj hvordan regjeringens enorme økonomiske redningspakke blir brukt. 16 prosent har besøkt data.gov, den sentrale oversikten over offentlig sektors datakilder.
Pew har i tillegg sjekket interessen ved å spørre om to andre typer offentlige data: 22 prosent har sjekket lovtekster på nett, mens 14 prosent har undersøkt dataene som viser hvem som har donert penger til politikeres valgkampbudsjetter. Totalt har fire av ti nettbrukere besøkt minst en av disse fire typene data-samlinger.
Les hele innlegget »
Last ned og skriv ut plakaten med oppskrift på korrekt frigivelse av data.
Nå er den klar og kan lastes ned, den norske versjonen av plakaten (pdf) som vil gjøre livet lettere for dem som går med planer om å frigi datakilder (vi har tidligere lovet en oversettelse). Se bilder nedenfor.
Plakaten visualiserer de forskjellige skrittene i prosessen med å gjøre offentlig sektors data tilgjengelig for viderebruk. Den er laget av Ton Zijlstra og James Burke og er publisert med Creative Commons-lisensen by-nc-sa (kreditering, del på samme vilkår til ikke-kommersiell bruk). I tråd med dette republiserer vi den her i norsk versjon med samme lisens. Håvard Legreid og undertegnede har oversatt teksten.
Plakaten inneholder naturligvis ikke alle detaljer om de ulike skrittene i datapublisering, men gir en grei oversikt over prosessen. Mer i dybden har vi gått tidligere med artikkelen “Kan mine data gjenbrukes?”
Ytterligere informasjon er lovet av Fornyingsdepartementet i forbindelse med dets videre arbeid med offentlige data: De arbeider med en veileder/guide til viderebruk av data.
Tross gode nyheter om offentlige data stritter Kartverket imot, skriver Håkon Wium Lie i dette gjesteinnlegget.
Det har vært en god vår for offentlige data. Teknologirådet har overlevert Fra Altinn til alt ut? til regjeringen, og statsråd Rigmor Aasrud har kvittert ved å lansere data.norge.no. Det er bare en blogg i dag, men lunta er tent og vi gleder oss til fyrverkeriet.
Den dårlige nyheten er at Statens kartverk fortsatt stritter mot. Kartverkssjef Anne Cathrine Frøstrup er svært fornøyd med dagens situasjon hvor smaksprøver deles ut gratis, men hvor brukerbetaling er normen. Hun hevder brukerne vet å verdsette gode kartdata og er villige til å betale for dette.
Selv mener jeg vi har et betydelig underforbruk av kart i Norge grunnet dagens prisingspolitikk. De gebyrbetalende brukere er kanskje fornøyde, men vi andre får ikke den tilgangen vi som skattebetalere har betalt for. Kartdata som er finansert med offentlige midler må også publiseres offentlig. Og i 2010 betyr dette gratis, på nett, med en lisens som tillater gjenbruk.
Her er fem krav jeg mener vi som skattebetalere og nettbrukere må kunne stille Statens kartverk:
Les hele innlegget »
Kvalitetsmerking av datasett blant forslagene fra Teknologirådets ekspertgruppe.
Teknologirådet presenterte i dag sin rapport om frigivelse og viderebruk av offentlige data (pdf). Fornyingsminister Rigmor Aasrud benyttet anledningen til å kunngjøre navnet på regjeringens kommende datakildeportal — data.norge.no –, og ba samtidig om innspill til hva portalen bør inneholde og hvordan den bør utformes.
Slike innspill inneholdt også rapporten fra ekspertgruppen. Den anbefaler at data.norge.no skal inneholde blant annet denne informasjonen:
Det blir adressen til nettstedet som skal samle informasjon om offentlige data, skriver fornyingsminister Rigmor Aasrud i dette gjesteinnlegget.
Visste du at du kan finne ut hvilket postnummer en gateadresse har hos Postens Elektroniske Postadressebok? At du på vinteren kan laste ned isvarsel for hele landet hos Kystverket? At du kan laste ned værvarsel fra Meteorologisk institutt hos Yr.no? Eller at du kan se hvor mye penger de ulike politiske partiene har fått i støtte på partifinansiering.no? Dette er gode eksempler på informasjon det offentlige gjør tilgjengelig for innbyggerne, og det kommer til å komme langt flere slike eksempler i årene som kommer.
Derfor har jeg begynt arbeidet med å lage et nettsted som kan samle informasjon om offentlige data. Dette nettstedet skal ha adressen data.norge.no! Når både USA, England, Spania, Danmark, New Zealand og Australia har gjort det, er det på tide at vi også gjør det! Målsetningen er at dette nettstedet skal være en møteplass for alle som arbeider med viderebruk av offentlige data. At offentlige data kan brukes av andre enn de etatene og kommunene som har samlet dem inn har nemlig et stort verdiskapingspotensial. Kanskje noen kan lage en tjeneste som sender vær- og isvarsel til deg på mobiltelefonen når du tenker på å dra ut med båten? En tjeneste som peker ut veien til det nærmeste bysykkelstativet? Eller kanskje en tjeneste som varsler deg hvis det er veiarbeider langs den veien du pleier å gå, sykle eller kjøre til jobb, slik at du kan ta en annen vei og unngå kø?
Dette temaet har blitt diskutert flittig det siste året, og mange gode og konstruktive innspill har dukket opp gjennom debatter både på NRKbeta, på Origo-bloggen og på nettmagasinet Vox Publica sin blogg Fakta først. Det har også vært inspirerende å se det arbeidet Sondre Bjellås har lagt ned i wikien datakilder.no, og det dugnadsbaserte kartleggingsarbeidet til Olav Anders Øvrebø og Vox Publica der de har samlet inn datakilder i et regneark som er redigerbart for alle på nettet og nå nylig no.ckan.net.
Jeg trenger deres hjelp til å utvikle nettstedet data.norge.no som en god oversikt over de offentlige datakildene som er tilgjengelige for viderebruk. Hva synes dere er viktig? Hva bør vi ta hensyn til? Hva slags informasjon bør det være på nettstedet? Hvilke typer datasett er viktigst? Hva er det viktig å vite om dataene for å kunne gjenbruke dem i praksis?
Si deres mening her — eller via andre kanaler, som Twitter eller e-post. Vi er åpne for innspill for å lage et godt nettsted på data.norge.no, og gjøre offentlige data tilgjengelige på en god og hensiktsmessig måte.
OPPDATERING FRA REDAKSJONEN: Se Aasruds innlegg på Teknologirådets seminar.
Du kan også se mange kommentarer til frokostmøtet og offentlige data via Twitter-stikkordet #offdata.
Se blogginnlegg fra Svein Ølnes om temaet.
Nå får Norges kreative nettsjeler sin sjanse: Regjeringen lyser ut 2,5 millioner i prosjektpenger.
“Nettskap 2.0″ har Fornyingsdepartementet (FAD) kalt initiativet. Målet er å få fram prosjektideer innen det løselig sammenbundne temafeltet webteknologi-delingskultur-brukerskapt innhold. Og forbildet er konkurranser som har vært avholdt i bl.a. Danmark, Storbritannia og USA de siste par årene (jeg har skrevet om noen av erfaringene).
Det er bare å hive seg rundt, for søknadsfristen er allerede 9. mai. Etter planen skal beslutningen om hvem som får støtte/stipend tas mot slutten av juni. Totalrammen er 2,5 millioner kroner, en ganske raus sum som bør strekke til å få finansiert en hel del gode ideer. FAD ser for seg et støttenivå på 100-150.000 kroner per prosjekt, men åpner for både mindre og større tildelinger.