Dostopnost/ozadje

Iz eVsebine
Skoči na: navigacija, iskanje

Skupine težav glede dostopnosti digitalnih vsebin

Fizične

  • kaj je sploh na voljo v digitalni obliki + na internetu
  • kdo vse (v celotni družbi) ima dostop do interneta/digitalnih vsebin

Licenčne

  • podatki se zbirajo z javnim denarjem, vendar pogoji uporabe prepovedujejo nadaljnjo uporabo (seznam javno financiranih knjig: Knjige na trgu: www.bukla.si..)
  • zaradi Europeane (vsi metapodatki so tam objavljeni pod CC0) je to delno relativizirano – vendar samo za metapodatke
  • zagovarjamo uporabo ene od CC licenc, za vse metapodatke, ki bodo zahtevani v okviru naših priporočil – in tudi za e-vsebine same, kjer je to primerno/možno /npr. fotografija Prešernovega spomenika, plačana iz javnih sredstev, v polni ločljivosti/ - pozitiven zgled Culture.si

Tehnološke

  • nekonsistentno obnašanje (URL-ji niso trajni (cobiss, arhiv slo); iskanje: vsi rezultati namesto 0 – ko ni zadetka, različne interpretacije iskalnih nizov)
  • slab markup, slabe možnosti parsanja (artservis.org)
  • ni strukturiranih podatkov, ni metapodatkov

pozitiven primer: dedi.si – podpira opensearch z ATOM izpisom (s pomanjkljivostmi: slike so v besedilu)

Organizacijske / logistične

Tudi ko že obstaja konsenz o naboru metapodatkov za določen namen, lahko naletimo na razlike:

Primer Europeana: tu naletimo na razdrobljenost agregatorjev in različno razumevanje vsebine posameznih metapodatkov - verjetno bi morala neka nacionalna instanca/ministrstvo/ imeti mehanizem za avtorizacijo in verifikacijo/spremljanje posameznih /področnih/ agregatorjev.


Motivacija za oblikovanje minimalnih zahtev za spletno prezentacijo digitalnih vsebin

  • gola objava besedil/slik/etc na spletu že dolgo ni dovolj
  • vse spletne strani danes želijo
    • biti dostopne iskalnikom (google)
    • izpis v “statični” obliki, da je strojno indeksiranje strani sploh možno
    • stalni/trajni in unikatni (kanonični) URL-ji za vse strani / objekte spletne aplikacije
    • običajni HTML meta podatki: tradiocionalni + novi
    • microformats
    • microdata / structured data: schema.org
  • biti vpete v družabna omrežja
    • FB Open Graph predpisuje celo hierarhijo meta tagov
    • drugi so manj zahtevni: LinkedIn, Twitter,
  • omogočiti syndication / agregiranje svojih vsebin za večjo vidnost
    • vrsta programov za “social reading”: Flipboard, Flud, Feedly
    • spletna mesta (novice na najdi.si, napovednik.si, kulturnik.si, google news, snip.it, ...)
  • javno finanicirane kulturne strani želijo posredovati svoje zbrane (meta)podatke
  • v Europeano
  • različne napovednike (agregatorje dogodkov)
  • druge nacionalne baze

Izhodišča za priporočila

e-vsebine

  • trajni kanonični naslovi URL
  • osnovno: metapodatki v obliki HTML meta tagov (1 objekt = 1 stran / naslov URL)
  • napredno: microdata markup (schema.org) (1 stran / naslov URL lahko vsebuje več objektov)

(meta)iskanje / agregiranje

  • opensearch – discovery & result format
  • google/solr sintaksa za iskalne nize
  • (sub)minimum: parsable HTML output
  • osnovno: RSS z dodatnimi namespace-i (opensearch, DC, EDM, ..) - mnogo CMS-jev to podpira že v osnovi ali s standardnimi dodatki
  • napredno:
    • JSON v skladu s schema.org in (3) dodatnimi opensearch tagi (European Library, Europeana).
    • Alternativa: HTML izpis opremljen z microdata.

Za oba namena uporabljamo isti nabor metapodatkov, za iskanje še nekaj dodatnih (opensearch: število rezultatov, link na naslednji dataset). Zelo sorodno iskanju je agregiranje – potrebuje analogen zapis.

V ožjem smislu moramo torej določiti:

  • minimalni nabor metapodatkov, ki bo verjetno zajemal izbor iz Europeane, z natančno definicijo možnih interpretacij
  • širši nabor – iz Europeane in od drugod – po možnosti schema.org ali specializirani nabori (Lido za muzeje)
  • dvojni standard za izpis metapodatkov v XML/RSS ali JSON. Skupaj z bijektivno preslikavo Europeana Data Model (in drugih namespaceov) v JSON / schema.org – vsaj v obsegu, ki ga bomo uporabili v priporočilih
  • poiskati in prevesti oz. razviti referenčne implementacije za priljubljene CMS-je (Wordpress, Drupal, Mediawiki)

Pričakovani dokumenti

  • priporočila za e-vsebine (naslovi, strojna berljivost) + seznam metatagov – z vsebinsko razlago za vsak tag
  • seznam metatagov za iskanje
  • preslikave: (RDF), RSS, ATOM, JSON/shema.org
  • priporočene implementacije / open search / za CMS-je