Publicerat

Internet archive

Internet Archive. Foto: Kristina Alexanderson (CC BY-SA-NC)

Ett av tisdagens seminarium var på temat arkivering. Hur arkiverar vi allt som finns på nätet idag så att det kan sparas på ett långsiktigt sätt?

Internet Archive

Kris Carpenter Negulescu från Internet Archive inledde med att berätta om vad de gör, vad de har i arkivet och vad de gör publikt och inte. Det mesta av det hon pratade om finns på archive.org.

Men hon berättade även en hel del om de problem man har med hur allt material ska visas. Det börjar redan bli svårt idag att visa det material som finns sparat, och det kommer att bli ännu svårare. Morgondagens webbläsare kommer inte att tolka gamla webbsidor som de var gjorda. Det är ett problem.

Dessutom sparar de ner massor av material från sociala medier, Youtube och mobila lösningar med mera som man idag inte riktigt vet hur man ska kunna presentera och där vill de ha så mycket hjälp de bara kan få. Internet Archive är en organisation som idag lever på donationer.

Pelle Snickars

Pelle Snickars från Kungliga biblioteket utgick från forskarperspektivet, från den avancerade användaren. Han hade inte bara ros att dela ut, det fanns massor av ris också.

I projektet Kw3 så började KB att samla in ögonblicksbilder från den svenska delen av internet. Man gjorde det ungefär två gånger per år. Det blev snabbt en stor skatt att söka i. Problemet är bara att det endast är tillgängligt innanför KBs väggar och idag finns det bara en dator på KB som har tillgång till detta material.

Så det är ingen som använder det. Det är ingen forskare som använder allt material som finns, eftersom det bara går att komma åt via en endaste dator som står på KB.
Dessutom tog man 2009 en paus från insamlandet. Att man skulle ta en paus från att samla in böcker skulle aldrig hända. Men det är tydligen helt ok när det gäller den information som finns på nätet.

Idag baseras insamlandet på pliktexemplar av fysiska böcker och tidningar. Men här uppstår ju frågan, vad är originalet? Är det boken, eller är det den digitala filen som använts till tryck.

Det viktigaste är nästan det här med att samla in vs att tillgängliggöra.

Idag samlar man in massor och man tillgängliggör väldigt lite. Man stödjer sig på personuppgiftslagen och på upphosrättslagen och gör inget tillgängligt. Det blir alltid nedprioriterat.

Användandet ska vara utgångsläget!

Sören Öman

Sören Öman är jurist på utbildningsdepartementet och fick i uppdrag att snabbutreda hur man ska samla in allt material som idag bara publiceras på nätet men som inte faller under det här med pliktexemplar.

Han har lämnat sitt svar och det jobbas nu på en proposition. Om det går igenom så är tanken att några större betydande publicister ska börja lämna in pliktexemplar på allt som publiceras efter 1 april 2012. De får bli en förtrupp och testa inför det stora genomförandet 1 januari 2015.
Det kan tyckas vara lång tid, men man måste tänka på att KB ska lagra det här för evigt.

Det svåraste med det här är att lista ut vad som ska samlas in. Vad är en hemsida? För att det inte ska bli för teknikberoende så samlas innehållet in i format som i framtiden går att konvertera till då gällande filformat. Man får skicka in de olika beståndsdelarna som utgör en webbsida och ange metadata som visar att de tillhör samma plats. Sedan får KB bygga en lösning för att sätta samman det.

Allt går ju inte att samla in. Inte varenda blogg. Istället det som är grundlagsskyddat, fast med ett tillägg för yrkesmässiga publicister eftersom grundlagen inte gäller sådant som endast publiceras på nätet.

Lars Aronson

Lars Aronson är mest känd för projektet Runeberg men pratade idag om vad svenska museer gör på nätet. Egentligen inte så mycket om långvarig arkivering utan mer om vad som händer när museerna blir irrelevanta på nätet.

Om man för 20 år sedan ville veta mer om Bruno Liljefors, Anders Zorn eller Carl Larsson så sökte man sig till Nationalmuseum. Idag googlar man och de vanligaste träffarna är Wikipedia och privata museum eller sidor. Nationalmuseum syns inte ens.

Många av institutionernas webbplatser är idag tröga och svåranvända och framför allt finns det inte så mycket att se och läsa. Till exempel har ju KB stora mängder information som är digitaliserat men som är väldigt svårtillgängligt idag. Varför?

– För att vi fick pengar för att digitalisera det, men inte till att göra det tillgängligt.

Ofta har men inte ens digitaliserat det för att kunna göra det tillgängligt.

Så frågan är varför alla dessa skattepengar går till dessa institutioner när man idag letar kunskapen på Wikipedia?

Så varför lägger man då inte mer krut på att ta fram arkiveringsmöjligheter för kulturinstitutionernas webbplatser? För att de är så tomma och statiska så det är ingen direkt brådska.

 

/ Henrik Löwenhamn, kommunikatör Riksantikvarieämbetet