Publicerat

K-samsök levererar data till Europeana som visas i portalen www.europeana.eu. Informationen i Europeana är även nåbar via ett API. Sedan årsskiftet använder Europeana en ny rättighetsmodell som jag tidigare skrivit om.

Enligt det avtal/överenskommelse som informationsleverantörer skriver med Riksantikvarieämbetet så gäller följande:

“K-samsök möjliggör uppmärkning av rättigheter på objektsnivå och Riksantikvarieämbetet uppmanar IF att märka upp sina objekt för att tydliggöra vad tillämpningsutvecklare och andra användare får göra med dessa.“

Idag går det att i K-samsök att märka upp metadata och media (bilder, ljud mm) med olika licenser. Detta görs idag enligt denna modell:

  • Allmänt tillgängligt (public) - Objektet är allmänt tillgängligt utan restriktioner (motsvarande “public domain“), inkluderar objekt med utgången skyddstid och information som inte faller inte ramen för upphovsrätten, t ex fakta.
  • Okänd status (unknown) - Objektets upphovsrättsstatus är okänd, sätts automatiskt på alla objekt som inte är uppmärkta av inforamtionsförvaltaren. Detta innebär att det blir svårt att återanvända informationen och därför uppmanas informationsförvaltaren att märka upp informationen. Även s k Orphan works där skyddstiden bedöms ha gått ut kan använda “Okänd“.
  • Creative Commons - En informationsförvaltare kan märka upp informationen med de sex Creative Commonlicenserna där “2.5 Sverige“ (exempel) är satt som standard.
  • Public Domain Mark - Public Domain Mark är en icke juridiskt bindande märkning av material där upphovsrätten gått ut eller där materialet inte skyddas av upphovsrätten. Märkningen är framtagen av Creative Commons och används bl a av Europeana.
  • Alla rättigheter reserverade (all rights) - Objektet är helt skyddat av upphovsrätt och institutionen måste kontaktas för att användning ska vara möjlig. Denna variant försvårar återanvändning av informationen och bör undvikas om möjligt.

Det finns en del skillnader mellan denna modell och Europeanas, t ex en del osäkerhet kring all rights (som inte är lika flexibel som hos Europeana) och unknown som, i fallet K-samsök, används som ”slaskpost” för material som inte är uppmärkt hos informationsförvaltarna. Det saknas även licenser för ”public domain dedication”, t ex CC0. K-samsöks modell behöver modifieras för att fungera med fler typer av information i linje med arbetet kring PSI-direktivet och Open Data. Ett annat skäl är att i större utstäckning använda standardiserade och maskinläsbara öppna licenser.

I avtalet står det att Informationsförvaltaren garanterar:

“IF har märkt upp sitt material så att det blir tydligt mot Riksantikvarieämbetet och tredje part hur detta får användas och vidareutnyttjas.“

Även om fler och fler har märkt upp sin data enligt modellen ovan så är det långt från alla som gjort detta idag.

Alla metadata som levereras till Europeana får märkningen CC0 enligt deras Data Exchange Agreement. Detta innebär att metadatan är fri att använda utan restriktioner. I K-samsök är det idag möjligt att märka metadata med andra licenser,  t ex de övriga Creative Commons-licenserna. Detta skapar redundans och det blir svårt för K-samsök att leverera denna data till Europeana. Det medför även otydlighet mot tredjepartsutvecklare som använder K-samsök via API:et.

Otydligheter i avtalet
Det kan i K-samsöksavtalet uppfattas otydligt vad som är att betrakta som objekt, är det metadataobjektet, den digitala representationen (t ex den scannade bilden eller den digitaliserade boken) eller den fysiska artefakten i museets magasin? Det är även otydligt vad som är metadata och vad som är “content“ (dvs den information som metadatan representerar, t ex en scannad bild).

Att viss data idag inte är uppmärkt i K-samsök innebär problem i leveransen till Europeana. I o m att <edm:rights> i Europeanas datamodell är obligatoriskt skapar det problem när det finns icke uppmärkt data i K-samsök. Hittils har dessa varit märkta med “unknown“ i mappningen mot Europeana vilket utifrån definationen ovan är felaktigt (Unknown används för verk med okänd upphovsman).

Möjliga lösningar på detta problem är:

  1. Europeana skördar inte dessa objekt från K-samsök.
  2. Om mediaLicense saknas märks objektet med Rights reserved – free access  i mappningen mot Europeana. Detta är inte den bästa lösningen eftersom även fria objekt kan kommer att få denna märkning. Detta borde dock vara ett minskande problem i takt med att informationsförvaltarna märker upp sin information. Avtalet behöver formuleras om för att detta ska vara möjligt.

Möjliga vägar framåt
Det är önskevärt att informationsflödet från informationsförvaltare, via K-samsök och Europeana till tredje part (via API) går till på ett smidigt och enhetligt sätt. För att underlätta för applikationsutvecklare är det även önskvärt att informationen är uppmärkt på ett enhetligt sätt, oavsett var den hämtas ifrån. Detta gör det enklare att kommunicera vad som gäller kring rättigheter samt möjliggör för Riksantikvarieämbetet att tillgängliggöra informationen i K-samsök som Linked Oped Data. För att uppnå detta behöver vi göra vissa förändringar i K-samsök och det tillhörande avtalet. Dessa  förändringar är: 

  • Alla metadata som levereras till K-samsök får samma öppna licens som är anpassad för metadata,  t ex CC0. CC0 lämpar sig för att det redan används av Europeana och andra institutioner, t ex Kungliga Biblioteket. Detta innebär att <itemLicense> sätts automatiskt i den lokala porten/mappningen. Avtalet behöver omformuleras för att detta ska vara möjligt.
  • Implementera Eurpeanas modell för right statements i K-samsök kopplat till <mediaLicens> för att underlätta aggregering och återanvändning. Förslagsvis utgår vi ifrån rdf-resusern för licsenser och anpassar där det behövs. Avtalet behöver omformuleras för att detta ska vara möjligt.
  • Elementet <image> ersätts av <media> för att kunna användas bredare (t ex för direktlänkar till ljudklipp eller fulldigitaliserade böcker) och enklare kunna mappas mot Europeanas objektstyper. Typen av media definieras via <mediaType>. Här bör det finnas en möjlighet att under en övergångsperiod kunna använda <image> för bakåtkompabilitet.
  • All media som inte är märkt vid skördning till K-samsök märks automatiskt med Rights reserved – free access enligt Europeanas modell.  Detta försvårar förvisso återanvändning men tydliggör vad som gäller, både mot Europeana, tredjepart och slutanvändare (via t ex Kringla). Detta är inte den optimala lösningen men gör att vi slipper filtrera bort media vid skördningen till K-samsök.
  • Hittils har K-samsök inte skördat metadata om objekt som är upphovsrättsskyddat och/eller som användaren måste betala för. Då Europeana har en ambition att ta in mer sådan data (korrekt uppmärkt) finns det ett behov att likrikta K-samsöks ambition kring dessa frågor. Eftersom metadatan är fri skapas ändå förutsättningar att länka ihop denna typ av data med andra källor enligt principerna kring Linked Open Data.
Vad innebär detta för institutionerna som levererar data till K-samsök?
Tanken är att göra den reviderade rättighetsmodellen så bakåtkompatibel som möjligt. Inget av förslagen ovan är beslutade utan är att betrakta som arbetsmaterial.  Vårt mål är dock att ”sätta ner foten” relativt snart, förhoppningsvis redan vid halvårsskiftet då Europeanas Data Exchange Agreement börjar gälla i sin helhet.
Jag är nyfiken på vad ni tycker om förslagen. Är det något som saknas? Kommentera gärna.

>> Johan Carlström – systemförvaltare för K-samsök

Ett svar

  1. Pingback: Anonym 768778

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *