2008-05-06

SKOS - Simple Knowledge Organization Systems

Η εργασία αυτή πραγματοποιήθηκε στο πλαίσιο του μαθήματος του Α΄ εξαμήνου του ΠΜΣ: Διαχείριση Γνώσης (Εισηγητές: κ.κ. Μανόλης Γεργατσούλης και Χρήστος Σκουρλάς)

Περίληψη

Το SKOS ή Simple Knowledge Organization Systems είναι μια οικογένεια των τυπικών γλωσσών που σχεδιάζονται για την αναπαράσταση θησαυρών, σχεδίων ταξινόμησης, ταξονομιών, συστημάτων προσυνδυασμένης ευρετηρίασης, ή οποιουδήποτε άλλου τύπου δομημένου ελεγχόμενου λεξιλογίου. Το SKOS δομείται επάνω σε RDF και RDFS, και ο κύριος στόχος τους είναι να επιτρέψει τη δημοσίευση ελεγχόμενων δομημένων λεξιλογίων στο σημασιολογικό Ιστό με ένα τρόπο ευκολότερο από τις γλώσσες οντολογιών. Το SKOS αναπτύσσεται αυτήν την περίοδο στο πλαίσιο του W3C.

Abstract

SKOS or Simple Knowledge Organization Systems is a family of formal languages designed for representation of thesauri, classification schemes, taxonomies, subject-heading systems, or any other type of structured controlled vocabulary. SKOS is built upon RDF and RDFS, and its main objective is to enable easy publication of controlled structured vocabularies for the Semantic Web. SKOS is currently developed within the W3C framework.Εισαγωγή

Οι κειμενικές μηχανές αναζήτησης για τον Ιστό που βασίζονται στο περιεχόμενο έχουν διάφορους περιορισμούς. Αρχικά, πολλοί πόροι του Ιστού έχουν ελάχιστο ή κανένα κειμενικό περιεχόμενο (εικόνες, ηχητικό ή οπτικοακουστικό περιεχόμενο κ.λπ.) Αφ’ ετέρου, η ακρίβεια είναι χαμηλή όπου οι όροι φυσικής γλώσσας έχουν αυξημένη σημασία (π.χ. 'bank', 'watch', 'chip' κ.λπ.) Τρίτον, η ανάκληση είναι ελλιπής όπου η αναζήτηση δεν λαμβάνει υπόψη τα συνώνυμα ή τα οιωνεί συνώνυμα. Τέταρτον, δεν υπάρχει καμία βάση για έναν χρήστη στην τροποποίηση (επέκταση, βελτίωση, μετάφραση) μιας αναζήτησης βασισμένης στην έννοια της αρχικής αναζήτησης. Πέμπτον, δεν υπάρχει καμία βάση για τις φυσικές γλώσσες, ή διατύπωση ερωτημάτων αναζήτησης με όρους συμβολικών γλωσσών.
Ο σημασιολογικός Ιστός είναι ένα πλαίσιο για τη δημιουργία, δημοσίευση και αναζήτηση σημασιολογικά πλούσιων μεταδεδομένων για τους διαδικτυακούς πόρους. Ο σχολιασμός των διαδικτυακών πόρων με ακριβείς και σημαντικές δηλώσεις για τις εννοιολογικές πτυχές του περιεχομένου τους παρέχει μια βάση για όλους τους περιορισμούς των κειμενικών μηχανών αναζήτησης που βασίζονται στο περιεχόμενο.
Η δημιουργία αυτού του τύπου μεταδεδομένων απαιτεί ότι οι παραγωγοί μεταδεδομένων είναι σε θέση να αναφέρουν στα κοινά νοηματικά αποθετήρια: "λεξιλόγια" εννοιών που είναι κοινές για μια κοινότητα, και περιγράφουν την περιοχή ενδιαφέροντος για εκείνη την κοινότητα.
Αυτός ο τύπος προσπάθειας είναι κοινός στην κοινότητα ψηφιακών βιβλιοθηκών, όπου μια ομάδα ειδικών θα αλληλεπιδράσει με μια κοινότητα χρηστών για να δημιουργήσει έναν θησαυρό για μια συγκεκριμένη περιοχή (π.χ. ο θησαυρός τέχνης & αρχιτεκτονικής AAT[1]) ή ένα υπερθεματικό σχέδιο ταξινόμησης (π.χ. η δεκαδική ταξινόμηση Dewey). Ένας παρόμοιος τύπος δραστηριότητας αναλαμβάνεται πιο πρόσφατα με έναν λιγότερο συγκεντρωτικό τρόπο από τις κοινότητες του Ιστού, παράγοντας, για παράδειγμα, τον διαδικτυακό κατάλογο DMOZ[2], ή το Topic Exchange[3], για τα θέματα web log.
Ο Ιστός, συμπεριλαμβανομένου του Σημασιολογικού Ιστού, παρέχει ένα μέσο μέσα στο οποίο οι κοινότητες μπορούν να αλληλεπιδράσουν και σε συνεργασία να δομήσουν και να χρησιμοποιήσουν λεξιλόγια εννοιών. Απαιτείται μια απλή γλώσσα που επιτρέπει σε αυτές τις κοινότητες να εκφράσουν τη δομή και το περιεχόμενο των λεξιλογίων τους με τρόπο κατανοητό από τη μηχανή, επιτρέποντας την ανταλλαγή και την επαναχρησιμοποίηση.
Το πλαίσιο περιγραφής των πόρων (RDF) είναι μια ιδανική γλώσσα για την παραγωγή δηλώσεων για τους διαδικτυακούς πόρους και την δημοσίευση μεταδεδομένων. Εντούτοις, το RDF παρέχει μόνο τη χαμηλού επιπέδου σημασιολογία που απαιτείται για να διαμορφώσει τις δηλώσεις μεταδεδομένων. Τα λεξιλόγια RDF πρέπει να δομηθούν πάνω από το RDF για να υποστηρίξουν την έκφραση των πιο συγκεκριμένων τύπων πληροφοριών εντός των μεταδεδομένων.
Οι γλώσσες οντολογίας όπως η OWL[4] προσθέτουν ένα επίπεδο εκφραστικής δύναμης στο RDF, και παρέχουν ισχυρά εργαλεία για τις σύνθετες εννοιολογικές δομές, οι οποίες μπορούν να χρησιμοποιηθούν για να παραγάγουν τα πλούσια μεταδεδομένα. Εντούτοις, η ταξο-προσανατολισμένη, λογικά ακριβής διαμόρφωση που απαιτείται για τη δόμηση χρήσιμων οντολογιών του Ιστού είναι απαιτητική από πλευράς εμπειρίας, προσπάθειας, και επομένως κόστους. Σε πολλές περιπτώσεις αυτός ο τύπος διαμόρφωσης μπορεί να είναι περιττός ή ακατάλληλος προς τις απαιτήσεις.
Επομένως υπάρχει μια ανάγκη για μια γλώσσα για την έκφραση των λεξιλογίων των εννοιών για τη χρήση σε σημασιολογικά πλούσια μεταδεδομένα, η οποία είναι αρκετά ισχυρή να υποστηρίξει σημασιολογικά ενισχυμένη αναζήτηση, αλλά αρκετά και αρκετά απλή ώστε να είναι αμελητέα από πλευράς απαιτούμενου κόστους και εμπειρίας στη χρήση της.

Ιστορία

SWAD-Europe (2002-2004)

Το SKOS αναπτύχθηκε αρχικά ως παράγωγο του Thesaurus Activity Work Package, στο πλαίσιο του προγράμματος Semantic Web Advanced Development for Europe (SWAD-Europe)[1]. Το SWAD-Europe χρηματοδοτήθηκε από την Ευρωπαϊκή Κοινότητα, και ήταν μέρος του προγράμματος Information Society Technologies. Το πρόγραμμα είχε ως σκοπό να υποστηρίξει την W3C's Semantic Web Activity μέσω της έρευνας, επιδείξεων και προσπαθειών που διευθύνθηκαν από τους πέντε συνεργάτες του προγράμματος, το ERCIM, το ILRT στο Πανεπιστήμιο του Μπρίστολ, τα HP Labs, το CCLRC και το Stilo[2]. Η πρώτη δημοσίευση του SKOS Core και η SKOS Mapping έγιναν στο τέλος του 2003, μαζί με άλλα προϊόντα της κωδικοποίησης RDF των πολύγλωσσων θησαυρών[3] και της αναπαράστασης θησαυρών [4].

Semantic Web Activity (2004-2005)

Μετά από τη λήξη της SWAD-Europe, η προσπάθεια SKOS υποστηρίχθηκε από τη W3C's Semantic Web Activity[5] στο πλαίσιο της ομάδας εργασίας Best Practice and Deployment Working Group[6]. Κατά τη διάρκεια αυτής της περιόδου, η προσοχή εστιάστηκε και στη σταθεροποίηση του SKOS Core, και την ανάπτυξη των πρακτικών οδηγιών για μεταφορά και δημοσίευση θησαυρών για το Σημασιολογικό Ιστό.

Παρούσα κατάσταση και Roadmap (2006-2008)

Το SKOS είναι ένα έργο που διεξάγεται αυτή τη στιγμή, και τα κύρια δημοσιευμένα τεκμήρια - το SKOS Core Guide[7], το SKOS Core Vocabulary Specification[8], και το Quick Guide to Publishing a Thesaurus on the Semantic Web[9] – έχουν δείκτη κατάστασης W3C Working (υπό επεξεργασία). Οι κύριοι συντάκτες του SKOS είναι ο Alistair Miles[10] και ο Dan Brickley[11].
Η νέα Ομάδα Εργασίας Επέκτασης του Σημασιολογικού Ιστού[12], που έχει επιφορτιστεί με το έργο για δύο έτη (Μάιος 2006 – Απρίλιος 2008), έχει συμπεριλάβει στο σχεδιασμό την προώθηση του SKOS στο W3C Recommendation. Τo roadmap προβάλλει το SKOS, ως Υποψήφια Σύσταση μέχρι το τέλος του 2007, και ως Προτεινόμενη Σύσταση για το πρώτο τρίμηνο του 2008. Τα κύρια προς επίλυση θέματα καθορίζουν το ακριβές πεδίο χρήσης του, και την διάρθρωσή του βάσει άλλων γλωσσών RDF και πρότυπων που χρησιμοποιούνται στις βιβλιοθήκες (όπως το Dublin Core) [13] [14].

Κοινότητα και συμμετοχή

Όλο το έργο της ανάπτυξης εκτελείται μέσω της public-esw-thes@w3.org mailing list που είναι ένας απολύτως ανοικτός και δημόσια αρχειοθετημένος[15] κατάλογος διευθύνσεων που αναλώνεται στη συζήτηση των ζητημάτων σχετικά με τα συστήματα οργάνωσης της γνώσης, την ανάκτηση πληροφοριών και τον Σημασιολογικό Ιστό. Καθένας μπορεί να συμμετέχει ανεπίσημα στην ανάπτυξη του SKOS με την προσχώρηση σε ομάδες συζητήσεων σχετικά με το public-esw-thes@w3.org - η άτυπη συμμετοχή χαίρει θερμής υποδοχής. Οποιοσδήποτε εργάζεται για κάποιο οργανισμό - μέλος του W3C μπορεί τυπικά να συμμετέχει στη αναπτυξιακή διαδικασία προσχωρώντας στο Semantic Web Deployment Working Group - αυτό εξουσιοδοτεί μεμονωμένα άτομα να επεξεργαστούν τις προδιαγραφές και να ψηφίσουν για τις αποφάσεις που αφορούν στις δημοσιεύσεις.

Συστατικά του SKOS

Το SKOS είναι μια οικογένεια γλωσσών που σχεδιάζεται ως σύνολο λειτουργικών μονάδων και είναι επεκτάσιμη και με τρόπο τέτοιο ώστε η χρήση και η εφαρμογή του να είναι όσο το δυνατόν απλούστερες.

Ο Πυρήνας SKOS (SKOS Core)

Το SKOS Core αναπτύχθηκε αρχικά στο πλαίσιο του προγράμματος Semantic Web Advanced Development for Europe (SWAD-E), στο 5ο Πρόγραμμα – Πλαίσιο SWAD, ως πρόχειρη εκδοχή ενός RDF Schema για θησαυρούς, συμβατό με τα σχετικά πρότυπα ISO. Επιπλέον εργασία το επέκτεινε στους πολύγλωσσους θησαυρούς και στις αναπαραστάσεις μεταξύ θησαυρών και ανέπτυξε κάποια πιλοτικά εργαλεία[5].
To SKOS Core [16] καθορίζει τάξεις και ιδιότητες επαρκείς να αναπαραστήσουν τα κοινά χαρακτηριστικά γνωρίσματα που βρίσκονται σε έναν τυποποιημένο θησαυρό. Είναι βασισμένο σε μια έννοιο-κεντρική άποψη του λεξιλογίου, όπου τα πρωτογενή αντικείμενα δεν είναι όροι, αλλά αφηρημένες έννοιες που αντιπροσωπεύονται από τους όρους. Κάθε έννοια στο SKOS ορίζεται ως ένας πόρος RDF. Κάθε έννοια μπορεί να έχει συνημμένες τις ιδιότητες RDF, που περιλαμβάνουν:
· έναν ή περισσότερους προτιμώμενους όρους (το πολύ ένας σε κάθε φυσική γλώσσα)
· εναλλακτικούς όρους ή συνώνυμα
· ορισμούς και σημειώσεις, με την προδιαγραφή της γλώσσας τους.
Οι έννοιες μπορούν να οργανωθούν σε ιεραρχίες χρησιμοποιώντας τις σχέσεις ευρύτερου - στενότερου ή να συνδεθούν με μη-ιεραρχικές (συνειρμικές) σχέσεις. Οι έννοιες μπορούν να συγκεντρωθούν σε εννοιολογικά σχέδια έννοιας, για να παρέχουν τα συνεπή και δομημένα σύνολα εννοιών, που αναπαριστούν το σύνολο ή μέρος ενός ελεγχόμενου λεξιλογίου.
Αυτά τα χαρακτηριστικά γνωρίσματα αποτελούν το σταθερό μέρος του SKOS Core. Άλλα στοιχεία του λεξιλογίου θεωρούνται ακόμα ασταθή.

Το Λεξιλόγιο του Πυρήνα SKOS (SKOS Core Vocabulary)

To SKOS Core Vocabulary είναι ένα σύνολο RDF ιδιοτήτων και RDFS τάξεων, που μπορούν να χρησιμοποιηθούν στην έκφραση του περιεχομένου και της δομής του σχήματος ως ενός RDF Γράφου[6].
Τα ταξινομικά σχήματα και οι θησαυροί έχουν χρησιμοποιηθεί από την κοινότητα των βιβλιοθηκών για πολλά χρόνια, με καλύτερη την πρακτική που εντοπίζεται στα δύο πρότυπα ISO από τα μέσα της δεκαετίας του ’80 (ISO2788 ISO2788, ISO5964 ISO5964). Στο πλαίσιο ενός διαδικτυακού περιεχομένου, έχουν υπάρξει αρκετά προτεινόμενα μορφότυπα για την αναπαράσταση συγκεκριμένων θησαυρών με χρήση XML και RDF. Ένα γενικό RDF schema για θησαυρούς παρήχθη αρχικά από το πρόγραμμα
extract from the UKAT
Term: Economic cooperation Used For:    Economic co-operation Broader terms:    Economic policy Narrower terms:    Economic integration    European economic cooperation    European industrial cooperation    Industrial cooperation Related terms:    Interdependence  Scope Note:Includes cooperative measures in banking, trade, industry etc., between and among countries.clip_image002


DESIRE και αναπτύχθηκε περεταίρω στο πλαίσιο του προγράμματος Limber. Αυτά τα έργα αποτέλεσαν και τη βάση του SKOS Core.


SKOS MappingΤο SKOS Mapping[17] προορίζεται να παρέχει ένα λεξιλόγιο για να εκφράσει το ταίριασμα (ακριβές ή συγκεχυμένο) των σχήμα έννοιας σε άλλο. Αυτό το μέρος του SKOS έχει αναπτυχθεί στο πρόγραμμα SWAD-Europe και αυτήν την περίοδο δεν έχει επίσημη έδρα. Διατηρείται ανεπίσημα από τους συντάκτες του SKOS.


Επεκτάσεις του SKOSΠροορισμός των επεκτάσεων[18] του SKOS είναι να παρέχουν τρόπους να δηλωθούν οι σχέσεις μεταξύ των εννοιών με πιο συγκεκριμένη σημασιολογία από την απλή «ευρύτερης – στενότερης», όπως η τάξη – στιγμιότυπο ή οι μεριστικές σχέσεις. Όπως το SKOS Mapping, αυτό το μέρος είναι πιθανό να μείνει σε κατάσταση αναμονής εωσότου ολοκληρωθεί το SKOS Core ως W3C Recommendation.


ΕφαρμογέςΕτικέτες Technorati: ,,
· Μερικά σημαντικά λεξιλόγια έχουν ενσωματωθεί στο σχήμα SKOS και είναι διαθέσιμα στο δημόσιο τομέα, συμπεριλαμβανομένου του AGROVOC[7] και του GEMET[8].


· Το SKOS έχει χρησιμοποιηθεί ως γλώσσα για τους θησαυρούς που χρησιμοποιούνται στον SWED Environmental Directory[19] που αναπτύσσεται στο πλαίσιο του προγράμματος SWAD-Europe.


· Ένας τρόπος να μετατραπούν οι θησαυροί σε SKOS[20], με τα παραδείγματα συμπεριλαμβανομένου του θησαυρού των MeSH, έχει διαγραφεί από το Vrije Universiteit Amsterdam.


· Η θεματική ταξινόμηση που χρησιμοποιεί DITA και SKOS έχει αναπτυχθεί από τη IBM.[21]


· Το SKOS χρησιμοποιείται για να αναπαραστήσει τους γεωγραφικούς τύπους χαρακτηριστικών γνωρισμάτων στην οντολογία GeoNames[9].


Εργαλεία
· Το ThManager[22] είναι μια εφαρμογή ανοικτού κώδικα Java αφιερωμένου στην έκδοση και τη διαχείριση των λεξιλογίων του SKOS.


· Το W3C παρέχει πειραματική on-line υπηρεσία επικύρωσης [23].


· Τα αρχεία SKOS μπορούν επίσης να εισαχθούν και να επεξεργασθούν σε RDF-OWL editors όπως το Protégé ή το SWOOP που αναπτύσσεται από το Mindswap [24].


· Τα συνώνυμα στο SKOS μπορούν να μετασχηματιστούν από το σχήμα WordNet RDF χρησιμοποιώντας ένα XSL stylesheet (βλ. W3C RDF)
Σχέσεις με άλλα πρότυπαΠρότυπα SKOS και ΘησαυρώνΗ ανάπτυξη του SKOS έχει περιλάβει τους ειδικούς και του RDF και της κοινότητας των βιβλιοθηκών, και SKOS σκοπεύει να επιτρέψει την εύκολη ενσωμάτωση των θησαυρών που καθορίζονται από πρότυπα, όπως το NISO Z39.19 - 2005[25] ή ISO 5964:1985 [26].


Το SKOS και άλλα Πρότυπα του Σημασιολογικού ΙστούΤο SKOS προορίζεται να παρέχει έναν τρόπο για τη δημιουργία ενός κληροδοτήματος εννοιολογικών σχημάτων διαθέσιμο στις εφαρμογές του Σημασιολογικού Ιστού, απλούστερη από μια, πιο σύνθετη, γλώσσα οντολογίας, την OWL. Η OWL προορίζεται να εκφράσει τις σύνθετες εννοιολογικές δομές, οι οποίες μπορούν να χρησιμοποιηθούν για να παραγάγουν πλούσια μεταδεδομένα και εργαλεία υποστήριξης αποφάσεων. Εντούτοις, η δόμηση των χρήσιμων οντολογιών του Ιστού είναι απαιτητική από πλευράς εξειδίκευσης, προσπάθειας, και κόστους. Σε πολλές περιπτώσεις, αυτός ο τύπος προσπάθειας μπορεί να είναι περιττός ή ακατάλληλος προς τις απαιτήσεις, και το SKOS να είναι καλύτερη επιλογή. Η επεκτασιμότητα του RDF κάνει δυνατή την περαιτέρω ενσωμάτωση ή την επέκταση των λεξιλογίων του SKOS σε πιο σύνθετα λεξιλόγια, συμπεριλαμβανομένων των οντολογιών της OWL.


ΒιβλιογραφίαAlistair, M. [et. al]. SKOS: A language to describe simple knowledge structures for the web. In: XTech 2005: XML, the Web and beyond. XTech 2005 Conference Proceedings. Ανάκτηση 22 Φεβρουαρίου 2008 από: http://idealliance.org/proceedings/xtech05/papers/03-04-01/#TOPEX


SWAD-Europe Thesaurus Activity: Ανάκτηση 22 Φεβρουαρίου 2008 από: http://www.w3.org/2001/sw/Europe/reports/thes/


Simple Knowledge Organization System (SKOS) - Home Page: Ανάκτηση 22 Φεβρουαρίου 2008 από: http://www.w3.org/2004/02/skos/


SKOS. Ανάκτηση: 22 Φεβρουαρίου 2008 από http://en.wikipedia.org/wiki/SKOS


Χρήσιμοι πόροι στο διαδίκτυο σχετικά με το SKOS, τις εφαρμογές και τα εργαλεία του


SKOS Core Guide W3C Working Draft 2 November 2005


SKOS Core Vocabulary Specification W3C Working Draft 2 November 2005


SKOS: Requirements for Standardization. The paper by Alistair Miles presented in October 2006 at the International Conference on Dublin Core and Metadata Applications.


Retrieval and the Semantic Web, incorporating a Theory of Retrieval Using Structured Vocabularies. Dissertation on the theory of retrieval using structured vocabularies by Alistair Miles.


public-esw-thes@w3.org online archive. Archives of mailing list used for SKOS development.
Subject classification using DITA and SKOS by IBM developer Works.


ThManager an Open Source Tool for creating and visualizing SKOS RDF vocabularies.
SWOOP A Hypermedia-based Featherweight OWL Ontology Editor, developed by Mindswap - Maryland Information and Network Dynamics Lab Semantic Web Agents Project


NISO Standards Z39.19 - 2005: Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies


ISO 5964:1985 Guidelines for the establishment and development of multilingual thesauri


[3] The Internet Topic Exchange


[6] SKOS Core Vocabulary Specification. Alistair Miles, Dan Brickley, W3C Working Draft, 2005.


[7] Πληροφορίες για το AGROVOC στο http://en.wikipedia.org/wiki/AGROVOC


[8] Πληροφορίες για το GEMET στο http://en.wikipedia.org/wiki/GEMET


[9] Επιπλέον πληροφορίες για το GeoNames στο http://en.wikipedia.org/wiki/GeoNames


Δεν υπάρχουν σχόλια: