Frigjør data — Hvad fanden nøler I efter?

Derfor bør også bibliotekene frigi sine data.

Stort­ingsmeldin­ga Eit infor­masjon­ssam­funn for alle viste allerede i 2007 at norske myn­digheter var inn­forstått med “verdiskap­ingspoten­sialet” ved gjen­bruk av offentlige data. 

Nylig har Forny­ings­de­parte­mentet ful­gt opp med nettst­edet data.norge.no — som skal utvikles til en por­tal til offentlige data tilret­te­lagt for gjen­bruk. Ideen hen­ter inspi­rasjon fra USA og Storbri­tan­nia, som har etablert lig­nende tjen­ester. I Storbri­tan­nia har man sågar leid inn webens «oppfinner» Tim Bern­ers-Lee til å lede pros­jek­tet. I mot­set­ning til dagens situ­asjon hvor data gjerne er lagret i spe­sialis­erte data­bas­er og for­mater, ser Bern­ers-Lee for seg et «smartere» inter­nett hvor data er gjort tilgjen­gelige i hen­hold til nettvennlige stan­dard­er. Dette vil gi enklere til­gang til data, gjøre det mulig å lenke på tvers av datasett og ikke minst legge til rette for utvikling av spen­nende app­likasjon­er «på toppen».

I rap­porten Fra Altinn til alt ut? har Teknolo­girådet utre­det prin­sip­per for offentlig­gjøring. Her kon­klud­er­er de med at alle datasett som «ikke utgjør en trussel mot rikets sikker­het eller indi­videts per­son­vern», som hov­e­dregel bør offentlig­gjøres. Det legges blant annet til grunn at dat­apro­duk­sjon som finan­sieres av skat­te­penger prin­sip­ielt bør til­falle fel­lesskapet. Enkelte av fel­lesskapets data, for eksem­pel fra Mete­o­rol­o­gisk insti­tutt (yr.no) og Trafikan­ten, er da også allerede gjort tilgjen­gelige gjen­nom pop­ulære net­tjen­ester og mobilapplikasjoner.

Hva innebær­er dette for bibliotekene?

Vi sit­ter på data i form av mengder med kat­a­log­poster. Kan man dermed uten videre offentlig­gjøre disse dataene via data.norge.no i hen­hold til min­is­terens opp­for­dring? Og hva skulle man nå egentlig vinne på å gjøre det?

Verdifulle data

Under­søkelser vis­er at bruken av bib­liotekenes data i pub­likum­skat­a­loger er beskje­den. Sta­tis­tisk sen­tral­byrås bib­liotekrap­port fra 2006 slår fast at bare 9 pros­ent av de inter­vjuede hadde brukt bib­liotekets net­tjen­ester i eller uten­for bib­liotekets lokaler i løpet av siste år. En under­søkelse utført av den inter­nasjonale bib­lioteko­r­gan­isas­jo­nen OCLC i 2005 fant at kun 1 pros­ent av bruk­erne beg­yn­ner infor­masjon­ssøk­ing på hjemmes­i­den til et bib­liotek. Dette betyr verken at dataene er dårlige eller uin­ter­es­sante, men at de har et ikke-utløst brukspotensial.

Under årets KORG-dager på Høgskolen i Oslo ga André Nesse, man­nen bak bokelskere.no, noen eksem­pler på hvilke verdier man kan skape ved rel­a­tiv enkel bear­bei­delse av bib­li­ografiske data. Bokelskere.no er et aktivt lit­ter­atur­formi­dlende nettsam­funn hvor folk anbe­faler og diskuter­er lit­ter­atur. Her finner vi mye av funksjon­aliteten som det strand­ede pros­jek­tet Litteratursiden.no forsøk­te å få på plass. Nesse kunne også fortelle at han tidlig i utvikling­spros­essen hen­vendte seg til bib­liotek­sek­toren på jakt etter råda­ta. Usikker­het fra sek­torens side resul­terte i at han etter lang ven­tetid kjøpte data fra Den norske Bok­data­basen, som er eid av bok­bran­sjens aktør­er. Bib­liotek­dataene ble alt­så liggende igjen i kat­a­lo­gen, mens formidlingst­jen­estene sek­toren kunne bidratt til, blom­str­er uten bib­liotekenes deltakelse eller innflytelse. 

bokelskere.no: Data og lit­ter­atur i skjønn forening.

Det vis­er seg at tanken på å gjøre data all­ment tilgjen­gelig er uvant i offentlige insti­tusjon­er. Pro­duk­sjon av data knyttes gjerne til bruk innen­for tradis­jonelle ram­mer og fryk­ten for mis­bruk er stor. Bib­liotek­sek­toren er nok ikke noe unntak i så måte, men har sam­tidig en lang tradis­jon for å dele data. Utviklin­gen av MARC-for­matet var i sin tid et eksem­pel på det. Nå er tiden inne til å ta enda et skritt.

Pionerer

UBIT 2010-pros­jek­tet lis­ter opp 11 alter­na­tive måter å nyt­tegjøre seg BIB­SYS-data på, fra refer­anse­hånd­ter­ingsverk­tøy til mobi­lap­p­likasjon­er. Dette er gode eksem­pler på formidling av data. UBIT går også videre, de ønsker å legge til rette for at også andre kan bruke dataene i egne tjen­ester. I det ABM-u-støt­tede pros­jek­tet Råda­ta nå! ønsker de å eksper­i­mentere med pub­lis­er­ing av autoritets­da­ta i tråd med Tim Bern­ers-Lees visjon om åpne, sam­men­lenkede og stan­dard­is­erte datasett, såkalt Linked Data.

Inter­nasjon­alt har enkelte bib­liotek beg­y­nt å spre postene sine på tilsvarende måte. Svenske LIBRIS var først ute, i etterkant har både det ungarske nasjon­al­bib­lioteket og Deutsche Nation­al­bib­lio­thek ful­gt opp med offen­sive plan­er. Library of Con­gress har også innret­tet seg mot åpne råda­ta ved å legge til rette for gjen­bruk av emne­da­ta samt autoritet­sposter for navn i Vir­tu­al Inter­na­tion­al Author­i­ty File (VIAF).

Eierskap

Del­ing av data forut­set­ter imi­dler­tid at eier­skapet til dem er avk­lart. I Norge er det skat­te­be­talerne som finan­sier­er kjøp av bib­liotek­da­ta i de offentlig eide bib­liotekene. Blir disse dataene offentlig eien­dom av den grunn? Selvsagt, vil mange si. Nei, hevder andre, ikke så lenge pro­dusen­ter som for eksem­pel Bib­liotek­sen­tralen ikke tillater spred­ning av postene sine til tredjepart. 

For å avk­lare disse grunn­leggende spørsmå­lene, ba ABM-utvikling tidligere jurist i Nasjon­al­bib­lioteket Veb­jørn Søn­der­srød om en utred­ning. Ifølge Søn­der­srød består kat­a­log­poster stort sett av sam­men­still­ing av ele­menter hen­tet fra pub­likasjonene (tit­tel, for­lag, ISBN etc.). Man kan der­for ikke snakke om verk­shøyde etter åndsverkloven.

Sagt med andre ord: en kat­a­log­post er ikke et åndsverk. Det vi gjerne omtaler som «kat­a­logkry­d­der», for eksem­pel omtale og omslags­bilde, er å betrak­te som åndsverk, mens emne­ord ikke fyller kri­teri­et. Ved å fjerne kry­d­derele­menter fra postene, kan data gjen­brukes uten hen­syn til åndsverkvern. Avtaler mel­lom opphavsper­son til åndsverkene og eieren av kat­a­lo­gen, kan imi­dler­tid sikre at også kat­a­logkry­d­der kan gjøres tilgjen­gelig for videre bruk. 

Åndsverklovens § 43 gir der­i­mot en sam­men­still­ing av data i for eksem­pel en data­base, en ver­netid på 15 år (kat­a­lo­grege­len). Hen­sik­ten med kat­a­lo­grege­len er å beskytte økonomiske inter­ess­er. Insti­tusjon­er som Nasjon­al­bib­lioteket, Bib­liotek­sen­tralen eller Den norske Bok­data­basen vil gjen­nom kat­a­lo­grege­len ha eierett til basene sine. Insti­tusjon­er som betaler andre for å pro­dusere data, vil også i utgangspunk­tet være eiere og ha enerett på disse. Eneretten innebær­er ret­ten til å pub­lis­ere og kopiere data.

Fra web til web of data (ill.: Linkeddata.org).

Det er i utgangspunk­tet tillatt for bib­liotek å kopiere enkelt­poster («uvesentlige del­er») fra baser som fall­er inn under kat­a­lo­grege­len, men ikke større mengder data eller «gjen­tatt og sys­tem­a­tisk» ned­last­ing hvis dette «skad­er den nor­male utnyt­telse av arbei­det eller urimelig til­sideset­ter frem­brin­gerens legit­ime inter­ess­er». De som lever av å selge kat­a­log­da­ta, for eksem­pel Bib­liotek­sen­tralen, vil med andre ord kunne hevde at de blir økonomisk skadeli­dende ved at data sys­tem­a­tisk kopieres og gjen­brukes av tred­jepart. Gjen­bruk av enkelt­poster er imi­dler­tid lovlig.

Hvem tar ansvar?

Selv om jussen er inn­fløkt, fins det en enkel vei ut av eier­skap­sprob­lematikken, nem­lig å inngå juridiske avtaler om frigjøring av data. Og det er det flere grun­ner til å gjøre. Noen av dem er prin­sip­ielle, på bak­grunn av offentlig finan­sier­ing, myn­dighetenes poli­tiske vil­je og inter­nasjonale tren­der. Andre er av mer funksjonell art, som bib­liotekenes behov for samar­beid og utvek­sling av data med andre pro­dusen­ter, eller som syn­lig­gjøring av bib­liotek­t­jen­ester gjen­nom spred­ning av data på net­tet. Teknolo­girådet hevder at det på forhånd «kan være vanske­lig å vur­dere gjen­bruksver­di­en av et datasett», og at det i seg selv er en god grunn for offentlig­gjøring. Eksem­pelet bokelskere.no vis­er i så måte at sek­torens data både kan være etter­trak­t­ede og verdi­fulle. Bokelskere.no vis­er også at en liten og dynamisk aktør kan ha let­tere for å etablere og dri­ve tjen­ester enn større offentlige insti­tusjon­er. Og så lenge for­målet med tjen­estene er i tråd med bib­liotekenes man­dat, bør vel også bib­liotekene kunne stille opp med data?

For å mulig­gjøre slike aktiviteter må det settes i gang en pros­ess som sikr­er at offentlig finan­sierte kat­a­log­da­ta fris­tilles for bruk gjen­nom juridisk bindende avtaler mel­lom bib­liotekene og dat­apro­dusen­ter som Bib­liotek­sen­tralen og Den norske Bok­data­basen. Kunne kol­legi­et av fylkes­bib­liotek­sje­fer, Nasjon­al­bib­lioteket og/eller Uni­ver­sitets- og høgskol­erådet tatt ini­tia­tiv til dette?

Artikke­len ble først pub­lis­ert i Bok og Bib­liotek nr. 3, 2010.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen