Stortingsmeldinga Eit informasjonssamfunn for alle viste allerede i 2007 at norske myndigheter var innforstått med “verdiskapingspotensialet” ved gjenbruk av offentlige data.
Nylig har Fornyingsdepartementet fulgt opp med nettstedet data.norge.no — som skal utvikles til en portal til offentlige data tilrettelagt for gjenbruk. Ideen henter inspirasjon fra USA og Storbritannia, som har etablert lignende tjenester. I Storbritannia har man sågar leid inn webens «oppfinner» Tim Berners-Lee til å lede prosjektet. I motsetning til dagens situasjon hvor data gjerne er lagret i spesialiserte databaser og formater, ser Berners-Lee for seg et «smartere» internett hvor data er gjort tilgjengelige i henhold til nettvennlige standarder. Dette vil gi enklere tilgang til data, gjøre det mulig å lenke på tvers av datasett og ikke minst legge til rette for utvikling av spennende applikasjoner «på toppen».
I rapporten Fra Altinn til alt ut? har Teknologirådet utredet prinsipper for offentliggjøring. Her konkluderer de med at alle datasett som «ikke utgjør en trussel mot rikets sikkerhet eller individets personvern», som hovedregel bør offentliggjøres. Det legges blant annet til grunn at dataproduksjon som finansieres av skattepenger prinsipielt bør tilfalle fellesskapet. Enkelte av fellesskapets data, for eksempel fra Meteorologisk institutt (yr.no) og Trafikanten, er da også allerede gjort tilgjengelige gjennom populære nettjenester og mobilapplikasjoner.
Hva innebærer dette for bibliotekene?
Vi sitter på data i form av mengder med katalogposter. Kan man dermed uten videre offentliggjøre disse dataene via data.norge.no i henhold til ministerens oppfordring? Og hva skulle man nå egentlig vinne på å gjøre det?
Verdifulle data
Undersøkelser viser at bruken av bibliotekenes data i publikumskataloger er beskjeden. Statistisk sentralbyrås bibliotekrapport fra 2006 slår fast at bare 9 prosent av de intervjuede hadde brukt bibliotekets nettjenester i eller utenfor bibliotekets lokaler i løpet av siste år. En undersøkelse utført av den internasjonale bibliotekorganisasjonen OCLC i 2005 fant at kun 1 prosent av brukerne begynner informasjonssøking på hjemmesiden til et bibliotek. Dette betyr verken at dataene er dårlige eller uinteressante, men at de har et ikke-utløst brukspotensial.
Under årets KORG-dager på Høgskolen i Oslo ga André Nesse, mannen bak bokelskere.no, noen eksempler på hvilke verdier man kan skape ved relativ enkel bearbeidelse av bibliografiske data. Bokelskere.no er et aktivt litteraturformidlende nettsamfunn hvor folk anbefaler og diskuterer litteratur. Her finner vi mye av funksjonaliteten som det strandede prosjektet Litteratursiden.no forsøkte å få på plass. Nesse kunne også fortelle at han tidlig i utviklingsprosessen henvendte seg til biblioteksektoren på jakt etter rådata. Usikkerhet fra sektorens side resulterte i at han etter lang ventetid kjøpte data fra Den norske Bokdatabasen, som er eid av bokbransjens aktører. Bibliotekdataene ble altså liggende igjen i katalogen, mens formidlingstjenestene sektoren kunne bidratt til, blomstrer uten bibliotekenes deltakelse eller innflytelse.
Det viser seg at tanken på å gjøre data allment tilgjengelig er uvant i offentlige institusjoner. Produksjon av data knyttes gjerne til bruk innenfor tradisjonelle rammer og frykten for misbruk er stor. Biblioteksektoren er nok ikke noe unntak i så måte, men har samtidig en lang tradisjon for å dele data. Utviklingen av MARC-formatet var i sin tid et eksempel på det. Nå er tiden inne til å ta enda et skritt.
Pionerer
UBIT 2010-prosjektet lister opp 11 alternative måter å nyttegjøre seg BIBSYS-data på, fra referansehåndteringsverktøy til mobilapplikasjoner. Dette er gode eksempler på formidling av data. UBIT går også videre, de ønsker å legge til rette for at også andre kan bruke dataene i egne tjenester. I det ABM-u-støttede prosjektet Rådata nå! ønsker de å eksperimentere med publisering av autoritetsdata i tråd med Tim Berners-Lees visjon om åpne, sammenlenkede og standardiserte datasett, såkalt Linked Data.
Internasjonalt har enkelte bibliotek begynt å spre postene sine på tilsvarende måte. Svenske LIBRIS var først ute, i etterkant har både det ungarske nasjonalbiblioteket og Deutsche Nationalbibliothek fulgt opp med offensive planer. Library of Congress har også innrettet seg mot åpne rådata ved å legge til rette for gjenbruk av emnedata samt autoritetsposter for navn i Virtual International Authority File (VIAF).
Eierskap
Deling av data forutsetter imidlertid at eierskapet til dem er avklart. I Norge er det skattebetalerne som finansierer kjøp av bibliotekdata i de offentlig eide bibliotekene. Blir disse dataene offentlig eiendom av den grunn? Selvsagt, vil mange si. Nei, hevder andre, ikke så lenge produsenter som for eksempel Biblioteksentralen ikke tillater spredning av postene sine til tredjepart.
For å avklare disse grunnleggende spørsmålene, ba ABM-utvikling tidligere jurist i Nasjonalbiblioteket Vebjørn Søndersrød om en utredning. Ifølge Søndersrød består katalogposter stort sett av sammenstilling av elementer hentet fra publikasjonene (tittel, forlag, ISBN etc.). Man kan derfor ikke snakke om verkshøyde etter åndsverkloven.
Sagt med andre ord: en katalogpost er ikke et åndsverk. Det vi gjerne omtaler som «katalogkrydder», for eksempel omtale og omslagsbilde, er å betrakte som åndsverk, mens emneord ikke fyller kriteriet. Ved å fjerne krydderelementer fra postene, kan data gjenbrukes uten hensyn til åndsverkvern. Avtaler mellom opphavsperson til åndsverkene og eieren av katalogen, kan imidlertid sikre at også katalogkrydder kan gjøres tilgjengelig for videre bruk.
Åndsverklovens § 43 gir derimot en sammenstilling av data i for eksempel en database, en vernetid på 15 år (katalogregelen). Hensikten med katalogregelen er å beskytte økonomiske interesser. Institusjoner som Nasjonalbiblioteket, Biblioteksentralen eller Den norske Bokdatabasen vil gjennom katalogregelen ha eierett til basene sine. Institusjoner som betaler andre for å produsere data, vil også i utgangspunktet være eiere og ha enerett på disse. Eneretten innebærer retten til å publisere og kopiere data.
Det er i utgangspunktet tillatt for bibliotek å kopiere enkeltposter («uvesentlige deler») fra baser som faller inn under katalogregelen, men ikke større mengder data eller «gjentatt og systematisk» nedlasting hvis dette «skader den normale utnyttelse av arbeidet eller urimelig tilsidesetter frembringerens legitime interesser». De som lever av å selge katalogdata, for eksempel Biblioteksentralen, vil med andre ord kunne hevde at de blir økonomisk skadelidende ved at data systematisk kopieres og gjenbrukes av tredjepart. Gjenbruk av enkeltposter er imidlertid lovlig.
Hvem tar ansvar?
Selv om jussen er innfløkt, fins det en enkel vei ut av eierskapsproblematikken, nemlig å inngå juridiske avtaler om frigjøring av data. Og det er det flere grunner til å gjøre. Noen av dem er prinsipielle, på bakgrunn av offentlig finansiering, myndighetenes politiske vilje og internasjonale trender. Andre er av mer funksjonell art, som bibliotekenes behov for samarbeid og utveksling av data med andre produsenter, eller som synliggjøring av bibliotektjenester gjennom spredning av data på nettet. Teknologirådet hevder at det på forhånd «kan være vanskelig å vurdere gjenbruksverdien av et datasett», og at det i seg selv er en god grunn for offentliggjøring. Eksempelet bokelskere.no viser i så måte at sektorens data både kan være ettertraktede og verdifulle. Bokelskere.no viser også at en liten og dynamisk aktør kan ha lettere for å etablere og drive tjenester enn større offentlige institusjoner. Og så lenge formålet med tjenestene er i tråd med bibliotekenes mandat, bør vel også bibliotekene kunne stille opp med data?
For å muliggjøre slike aktiviteter må det settes i gang en prosess som sikrer at offentlig finansierte katalogdata fristilles for bruk gjennom juridisk bindende avtaler mellom bibliotekene og dataprodusenter som Biblioteksentralen og Den norske Bokdatabasen. Kunne kollegiet av fylkesbiblioteksjefer, Nasjonalbiblioteket og/eller Universitets- og høgskolerådet tatt initiativ til dette?
Artikkelen ble først publisert i Bok og Bibliotek nr. 3, 2010.