Under två dygn 20-22 maj fylldes Riksantikvarieämbetets hörsal i Visby av systemutvecklare, användarupplevelseexperter, och verksamhetsutvecklare. De kom från Kungliga biblioteket i Stockholm, SEAD miljöarkeologisk databasen och HumLab i Umeå, och från Riksantikvarieämbetets egna personal. Orsaken till att de samlades hos oss i Visby var, att de skulle delta i ett hackathon – ArkHacket – med syftet att utveckla infrastrukturen för information som rör arkeologi, kulturmiljö och kulturarv. Meningen var att laborativt försöka hitta nya sätt att meningsfullt länka ihop våra respektive datamängder som öppna länkade data på den semantiska webben.
Kungliga biblioteket förvaltar Libris bibliografisystemet, som har nyss genomgått en omstrukturering som gör det bättre tillämpat till öppna länkade data. SEADs miljöarkeologisk databas innehåller digital information från miljöprovtagningar, C14 dateringar, pollenanalys, och olika sorters vetenskapliga provmaterial ur arkeologiska kontexter. Hoppet var att vi skulle lyckas skapa nya länkar mellan både dessa databaser och K-samsök, tjänsten som Riksantikvarieämbetet förvaltar som skördar in kulturmiljöers från över 40 olika institutioner i Sverige, t.ex. Länsmuseer och FMIS.
Datatjänsterna i fråga befinner sig på olika nivåer när det gäller den semantiska webben: Libris utveckling har varit väldigt framgångsrik, och alla deras data uttrycks numera som länkade RDF tripletter som är sökarna genom ett SPARQL gränssnitt. SEAD däremot har bara nyss börjat titta på öppna data. K-samsök befinner sig någonstans där emellan, med data som uttrycks som RDF fast utan en riktig triplestore eller SPARQL gränssnitt. Vi delade oss därför upp i olika grupper och försökte lära oss av varandras olika erfarenheter.
En grupp jobbade med möjliga kopplingar mellan Libris och K-samsök. Utvecklarna hos Riksantikvarieämbetet hade under veckorna innan hacket förberett en triplestore med SPARQL gränssnitt i en testmiljö, fullproppat med tripletterna ur K-samsök. De jobbade därför tillsammans med utvecklarna från Libris för att hitta poster som både databaser hade gemensamt – t.ex. arkitekter från Bebyggelseregistret som också fanns som författare hos Libris – och skapa länkar de emellan för att kunna visa sammanställda uppgifter ur både källor.
En annan grupp jobbade med SEADs relationsmodell och försökte mappa en delmängd av den komplexa modellen till RDF. De försökte dessutom koppla prov i SEAD databasen till de fasta fornlämningar de härrörde från hos K-samsök, med fornlämningsnummret ur FMIS som en gemensam nyckel.
Ytterligare två grupper jobbade med gränssnittsfrågor respektive framtidsvisioner. Gränssnittsgruppen hade som uppgift att rita fram skisser på snygga och pedagogiska sätt att presentera data som dras in från de här tre olika tjänsterna, på ett konsekvent och användbar sätt. Visionsgruppen däremot skulle ta en annan synvinkel och tänka på möjliga användningsscenarior: hur skulle länkade kulturmiljödata användas, och av vilka? Vilka sorters frågor skulle man kunna tänka sig ställa till datan, och hur skulle sådana frågor besvaras?
Resultat
Gruppernas resultaten presenterade på hackets sista dag. Efter några tidiga problem med åtkomst till SPARQL gränssnittet hade den första teknikgruppen lyckats hitta ett flertal gemensamma poster mellan Libris och K-samsök genom att jämföra deras länkar till externa auktoriteter (t.ex. Wikipedia) med SPARQL frågor, och skapade sedan direkta länkar i testversionen K-samsöks UGC-hubb. Ett oerhört lyckat resultat efter bara att par dygns arbete, som visar att det skulle gå – rent tekniskt, iaf – att använda en riktig triplestore och införa sådana kopplingar i driftversionen av K-samsök. Den andra teknikgruppen lyckades också med mappningen av en delmängd av SEAD datamodellen till RDF, och visade kopplingarna mellan provresultat och fornlämningar med hjälp av ett mikroramverk webbgränssnitt. Vi hoppas att detta kan ligga till grund för närmare samarbete med SEAD, och kanske att de så småningom ska gå med och levererar metadata till K-samsök.
Gränssnittgruppen presenterade ett antal förslag på mockups. De utgick först ifrån perspektivet av en person-orienterad vy på datan: med personuppgifterna i centrum och uppgifter om relaterade objekt hämtad från olika datamängder. Sedan tittade de på ett mer plats-orienterat perspektiv, med en lämning som utgångspunkt och information från FMIS (via K-Samsök) om själva lämningen, från Libris om verk som har skrivits om eller kring den, och tolkad data från SEADs provdata för att visa hur miljön kan ha sett ut under tiden lämningen var aktuellt och vad vi har för bevis på insektarter osv. De lyckades integrera relevant information från olika källor på en sida på ett sömlöst sätt.
Visionsgruppen presenterade sist. De hade försökt hitta nya möjliga användarfall, tänka på kopplingar mellan de tre olika tjänster som representerades på hacket och andra befintliga tjänster. Det visades även en matris över vilka tjänster fanns/är planerade, publicerar sina data, använder länkade öppna data, och är tillgängliga som SPARQL endpoints. Ett exempel på en fråga som är svår att få svar på med dagens särskilda datakällor men som kunde lätt svaras om data mängderna länkas ihop är, “Visa mig alla utgrävningar i Halland som har producerat en viss typ av keramik där man utfört lipidanalys som visar förekomst av får eller get. Keramiken ska ha hittats i en kontext som har daterats till årtal X“. För att kunna svara på den frågan så måste man söka tvärs igenom K-samsök där fornlämningsinformationen finns, och SEAD, där analyser av arkeologiskt material finns. Information om relaterade publikationer hämtas från Libris.
Summering
Det var imponerande att se hur långt vi kom inom bara dygn. Medan inga av tjänsterna och kopplingarna som skapades under hacket är färdiga för att driftsättas, att vi lyckades överhuvudtaget länka ihop tre såpass heterogena datamängder under så kort tid skapar bra förutsättningar för framtidsutveckling inom kulturmiljövårdsdata och samarbete mellan olika intressenter på riktigt. Vi ser fram emot flera sådana laborativa hackdagar och fortsatt samverkan med Kungliga biblioteket, SEAD, HumLab mm i framtiden. Ett stort tack till alla som deltog – bra jobbat!
3 kommentarer