Frigjør data — Hvad fanden nøler I efter?

Derfor bør også bibliotekene frigi sine data.

Stor­tings­mel­din­ga Eit infor­ma­sjons­sam­funn for alle vis­te alle­re­de i 2007 at nors­ke myn­dig­he­ter var inn­for­stått med «verdi­ska­pings­po­ten­sia­let» ved gjen­bruk av offent­li­ge data.

Nylig har For­ny­ings­de­par­te­men­tet fulgt opp med nett­ste­det data.norge.no — som skal utvik­les til en por­tal til offent­li­ge data til­rette­lagt for gjen­bruk. Ide­en hen­ter inspi­ra­sjon fra USA og Stor­bri­tan­nia, som har etab­lert lig­nen­de tje­nes­ter. I Stor­bri­tan­nia har man sågar leid inn webens «opp­fin­ner» Tim Ber­ners-Lee til å lede pro­sjek­tet. I mot­set­ning til dagens situa­sjon hvor data gjer­ne er lag­ret i spe­sia­li­ser­te data­ba­ser og for­ma­ter, ser Ber­ners-Lee for seg et «smar­te­re» inter­nett hvor data er gjort til­gjen­ge­li­ge i hen­hold til nett­venn­li­ge stan­dar­der. Det­te vil gi enk­le­re til­gang til data, gjø­re det mulig å len­ke på tvers av data­sett og ikke minst leg­ge til ret­te for utvik­ling av spen­nen­de appli­ka­sjo­ner «på top­pen».

I rap­por­ten Fra Alt­inn til alt ut? har Tek­no­logi­rå­det utre­det prin­sip­per for offent­lig­gjø­ring. Her kon­klu­de­rer de med at alle data­sett som «ikke utgjør en trus­sel mot rikets sik­ker­het eller indi­vi­dets per­son­vern», som hoved­re­gel bør offent­lig­gjø­res. Det leg­ges blant annet til grunn at data­pro­duk­sjon som finan­sie­res av skatte­pen­ger prin­si­pi­elt bør til­fal­le fel­les­ska­pet. Enkel­te av fel­les­ska­pe­ts data, for eksem­pel fra Meteoro­lo­gisk insti­tutt (yr.no) og Tra­fi­kan­ten, er da også alle­re­de gjort til­gjen­ge­li­ge gjen­nom popu­læ­re nettje­nes­ter og mobil­ap­pli­ka­sjo­ner.

Hva inne­bæ­rer det­te for biblio­te­ke­ne?

Vi sit­ter på data i form av meng­der med kata­log­pos­ter. Kan man der­med uten vide­re offent­lig­gjø­re dis­se data­ene via data.norge.no i hen­hold til minis­te­rens opp­ford­ring? Og hva skul­le man nå egent­lig vin­ne på å gjø­re det?

Verdifulle data

Under­sø­kel­ser viser at bru­ken av biblio­te­ke­nes data i pub­li­kums­ka­ta­lo­ger er beskje­den. Sta­tis­tisk sen­tral­by­rås biblio­te­k­rap­port fra 2006 slår fast at bare 9 pro­sent av de inter­vjue­de had­de brukt biblio­te­kets nettje­nes­ter i eller uten­for biblio­te­kets loka­ler i løpet av sis­te år. En under­sø­kel­se utført av den inter­na­sjo­na­le biblio­te­kor­ga­ni­sa­sjo­nen OCLC i 2005 fant at kun 1 pro­sent av bru­ker­ne begyn­ner infor­ma­sjons­sø­king på hjem­me­si­den til et biblio­tek. Det­te betyr ver­ken at data­ene er dår­li­ge eller uin­ter­es­san­te, men at de har et ikke-utløst bruks­po­ten­si­al.

Under årets KORG-dager på Høg­sko­len i Oslo ga André Nes­se, man­nen bak bokelskere.no, noen eksemp­ler på hvil­ke ver­di­er man kan ska­pe ved rela­tiv enkel bear­bei­del­se av biblio­gra­fis­ke data. Bokelskere.no er et aktivt lit­te­ra­tur­for­mid­len­de nett­sam­funn hvor folk anbe­fa­ler og dis­ku­te­rer lit­te­ra­tur. Her fin­ner vi mye av funk­sjo­na­li­te­ten som det stran­de­de pro­sjek­tet Litteratursiden.no for­søk­te å få på plass. Nes­se kun­ne også for­tel­le at han tid­lig i utvik­lings­pro­ses­sen hen­vend­te seg til biblio­tek­sek­to­ren på jakt etter rådata. Usik­ker­het fra sek­to­rens side resul­ter­te i at han etter lang vente­tid kjøp­te data fra Den nors­ke Bok­data­ba­sen, som er eid av bok­bran­sjens aktø­rer. Biblio­tek­da­ta­ene ble alt­så lig­gen­de igjen i kata­lo­gen, mens for­mid­lings­tje­nes­te­ne sek­to­ren kun­ne bidratt til, blomst­rer uten biblio­te­ke­nes del­ta­kel­se eller inn­fly­tel­se.

bokelskere.no: Data og lit­te­ra­tur i skjønn for­ening.

Det viser seg at tan­ken på å gjø­re data all­ment til­gjen­ge­lig er uvant i offent­li­ge insti­tu­sjo­ner. Pro­duk­sjon av data knyt­tes gjer­ne til bruk innen­for tra­di­sjo­nel­le ram­mer og fryk­ten for mis­bruk er stor. Biblio­tek­sek­to­ren er nok ikke noe unn­tak i så måte, men har sam­ti­dig en lang tra­di­sjon for å dele data. Utvik­lin­gen av MARC-for­ma­tet var i sin tid et eksem­pel på det. Nå er tiden inne til å ta enda et skritt.

Pionerer

UBIT 2010-pro­sjek­tet lis­ter opp 11 alter­na­ti­ve måter å nytte­gjø­re seg BIB­SYS-data på, fra refe­ranse­hånd­te­rings­verk­tøy til mobil­ap­pli­ka­sjo­ner. Det­te er gode eksemp­ler på for­mid­ling av data. UBIT går også vide­re, de øns­ker å leg­ge til ret­te for at også and­re kan bru­ke data­ene i egne tje­nes­ter. I det ABM-u-støt­te­de pro­sjek­tet Rådata nå! øns­ker de å eks­pe­ri­men­te­re med pub­li­se­ring av auto­ri­tets­data i tråd med Tim Ber­ners-Lees visjon om åpne, sam­men­len­ke­de og stan­dar­di­ser­te data­sett, såkalt Lin­ked Data.

Inter­na­sjo­nalt har enkel­te biblio­tek begynt å spre pos­te­ne sine på til­sva­ren­de måte. Svens­ke LIBRIS var først ute, i etter­kant har både det ungars­ke nasjo­nal­bi­blio­te­ket og Deut­sche Natio­nal­bi­bliot­hek fulgt opp med offen­si­ve pla­ner. Libra­ry of Con­gress har også inn­ret­tet seg mot åpne rådata ved å leg­ge til ret­te for gjen­bruk av emne­data samt auto­ri­tets­pos­ter for navn i Vir­tu­al Inter­na­tio­nal Aut­hority File (VIAF).

Eierskap

Deling av data for­ut­set­ter imid­ler­tid at eier­ska­pet til dem er avklart. I Nor­ge er det skatte­be­ta­ler­ne som finan­sie­rer kjøp av biblio­tek­data i de offent­lig eide biblio­te­ke­ne. Blir dis­se data­ene offent­lig eien­dom av den grunn? Selv­sagt, vil man­ge si. Nei, hev­der and­re, ikke så len­ge pro­du­sen­ter som for eksem­pel Biblio­tek­sen­tra­len ikke til­la­ter spred­ning av pos­te­ne sine til tredje­part.

For å avkla­re dis­se grunn­leg­gen­de spørs­må­le­ne, ba ABM-utvik­ling tid­li­ge­re jurist i Nasjo­nal­bi­blio­te­ket Vebjørn Søn­ders­rød om en utred­ning. Iføl­ge Søn­ders­rød består kata­log­pos­ter stort sett av sam­men­stil­ling av ele­men­ter hen­tet fra pub­li­ka­sjo­ne­ne (tit­tel, for­lag, ISBN etc.). Man kan der­for ikke snak­ke om verks­høy­de etter ånds­verk­lo­ven.

Sagt med and­re ord: en kata­log­post er ikke et ånds­verk. Det vi gjer­ne omta­ler som «kata­log­kryd­der», for eksem­pel omta­le og omslags­bil­de, er å betrak­te som ånds­verk, mens emne­ord ikke fyl­ler kri­te­ri­et. Ved å fjer­ne kryd­der­ele­men­ter fra pos­te­ne, kan data gjen­bru­kes uten hen­syn til ånds­ver­kvern. Avta­ler mel­lom opp­havs­per­son til ånds­ver­ke­ne og eie­ren av kata­lo­gen, kan imid­ler­tid sik­re at også kata­log­kryd­der kan gjø­res til­gjen­ge­lig for vide­re bruk.

Ånds­verk­lo­vens § 43 gir der­imot en sam­men­stil­ling av data i for eksem­pel en data­base, en verne­tid på 15 år (kata­log­re­ge­len). Hen­sik­ten med kata­log­re­ge­len er å beskyt­te øko­no­mis­ke inter­es­ser. Insti­tu­sjo­ner som Nasjo­nal­bi­blio­te­ket, Biblio­tek­sen­tra­len eller Den nors­ke Bok­data­ba­sen vil gjen­nom kata­log­re­ge­len ha eie­rett til base­ne sine. Insti­tu­sjo­ner som beta­ler and­re for å pro­du­se­re data, vil også i utgangs­punk­tet være eiere og ha ene­rett på dis­se. Ene­ret­ten inne­bæ­rer ret­ten til å pub­li­se­re og kopiere data.

Fra web til web of data (ill.: Linkeddata.org).

Det er i utgangs­punk­tet til­latt for biblio­tek å kopiere enkelt­pos­ter («uve­sent­li­ge deler») fra baser som fal­ler inn under kata­log­re­ge­len, men ikke stør­re meng­der data eller «gjen­tatt og sys­te­ma­tisk» ned­las­ting hvis det­te «ska­der den nor­ma­le utnyt­tel­se av arbei­det eller uri­me­lig til­side­set­ter frem­brin­ge­rens legi­ti­me inter­es­ser». De som lever av å sel­ge kata­log­data, for eksem­pel Biblio­tek­sen­tra­len, vil med and­re ord kun­ne hev­de at de blir øko­no­misk ska­de­li­den­de ved at data sys­te­ma­tisk kopie­res og gjen­bru­kes av tredje­part. Gjen­bruk av enkelt­pos­ter er imid­ler­tid lov­lig.

Hvem tar ansvar?

Selv om jus­sen er inn­fløkt, fins det en enkel vei ut av eier­skaps­pro­ble­ma­tik­ken, nem­lig å inn­gå juri­dis­ke avta­ler om fri­gjø­ring av data. Og det er det fle­re grun­ner til å gjø­re. Noen av dem er prin­si­pi­el­le, på bak­grunn av offent­lig finan­sie­ring, myn­dig­he­te­nes poli­tis­ke vil­je og inter­na­sjo­na­le tren­der. And­re er av mer funk­sjo­nell art, som biblio­te­ke­nes behov for sam­ar­beid og utveks­ling av data med and­re pro­du­sen­ter, eller som syn­lig­gjø­ring av biblio­tek­tje­nes­ter gjen­nom spred­ning av data på net­tet. Tek­no­logi­rå­det hev­der at det på for­hånd «kan være vans­ke­lig å vur­de­re gjen­bruks­ver­di­en av et data­sett», og at det i seg selv er en god grunn for offent­lig­gjø­ring. Eksem­pe­let bokelskere.no viser i så måte at sek­to­rens data både kan være etter­trak­te­de og ver­di­ful­le. Bokelskere.no viser også at en liten og dyna­misk aktør kan ha let­te­re for å etab­le­re og dri­ve tje­nes­ter enn stør­re offent­li­ge insti­tu­sjo­ner. Og så len­ge for­må­let med tje­nes­te­ne er i tråd med biblio­te­ke­nes man­dat, bør vel også biblio­te­ke­ne kun­ne stil­le opp med data?

For å mulig­gjø­re sli­ke akti­vi­te­ter må det set­tes i gang en pro­sess som sik­rer at offent­lig finan­sier­te kata­log­data fri­stil­les for bruk gjen­nom juri­disk bin­den­de avta­ler mel­lom biblio­te­ke­ne og data­pro­du­sen­ter som Biblio­tek­sen­tra­len og Den nors­ke Bok­data­ba­sen. Kun­ne kol­le­gi­et av fyl­kes­bi­blio­tek­sje­fer, Nasjo­nal­bi­blio­te­ket og/eller Uni­ver­si­tets- og høg­skole­rå­det tatt ini­tia­tiv til det­te?

Artik­ke­len ble først pub­li­sert i Bok og Biblio­tek nr. 3, 2010.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen