4 Μαρ 2008

Αξιολόγηση ψηφιακών βιβλιοθηκών με ανάλυση των προτύπων ανάκτησης των χρηστών

 

Η παρούσα ανάρτηση αποτελεί εργασία εξαμήνου στο πλαίσιο του μαθήματος Ψηφιακές Βιβλιοθήκες του ΠΜΣ στην Επιστήμη της Πληροφόρησης στην Αθήνα, της φοιτήτριας του Α' εξαμήνου Αφροδίτης Φράγκου και έχει βασιστεί κατά κύριο λόγο στο άρθρο των Bollen, J., Vemulapalli, S., and Xu, W. (2002), 'Digital Library Evaluation by Analysis of User Retrieval Patterns.'

Περίληψη

Προτείνεται μια μεθοδολογία αξιολόγησης του βαθμού επιρροής της συλλογής μιας Ψηφιακής Βιβλιοθήκης (ΨΒ) και των χαρακτηριστικών της κοινότητας χρηστών όπως αυτή προκύπτει από την ανάλυση προτύπων ανάκτησης από τους χρήστες. Πρότυπα ομο-ανάκτησης περιοδικών και τεκμήριων αναδομούνται από τον εξυπηρετητή της ΨΒ και χρησιμοποιούνται στην παραγωγή δεδομένων για τα περιοδικά και τα τεκμήρια που συνδέονται με σχέσεις εγγύτητας μεταξύ τους. Αυτό έχει ως αποτέλεσμα μια σχέση με βάρη που ορίζεται από την συλλογή τεκμηρίων της ΨΒ και αναπαρίσταται από ένα δίκτυο τεκμηρίων και περιοδικών. Μια μέτρηση της απόκλισης μεταξύ των μετρήσεων υπολογισμού του βαθμού επιρροής ενός τεκμηρίου όπως αυτός ορίζεται από τους χρήστες και το Journal Citation Record (JCR) Impact Factor (IF) που δημοσιεύεται από το Institute for Scientific Information (ISI) χρησιμοποιείται για να αναλύσει τα χαρακτηριστικά της κοινότητας των χρηστών της ΨΒ. Μια προκαταρκτική ανάλυση των αρχείων καταγραφής του εξυπηρετητή του Los Alamos National Laboratory (LANL) Research Library (RL) που καταχωρήθηκαν το 2001 επιδεικνύει αυτή την προσέγγιση.

Abstract

This paper proposes a methodology to evaluate the impact of a Digital Library’s (DL) collection and the characteristics of its user community by an analysis of user retrieval patterns. Patterns of journal and document co-retrievals are reconstructed from DL server logs and used to generate proximity data for journals and documents, resulting in a weighted relation defined over the DL document collection represented by a network of document and journals. A measure of discrepancy between user-defined measures of document impact and the Journal Citation Record (JCR) Impact Factor (IF) published by the Institute for Scientific Information (ISI) is used to analyze characteristics of the DL user community. A preliminary analysis of the Los Alamos National Laboratory (LANL) Research Library (RL) server logs registered in 2001 demonstrates the potential of this approach[1].

Εισαγωγή

Η πρόσφατη αύξηση του αριθμού και του μεγέθους των ψηφιακών εφαρμογών για βιβλιοθήκες έχει εισάγει το ζήτημα της αξιολόγησης των υπηρεσιών των ΨΒ και των συλλογών (Kaplan and Nelson, 2000). Λαμβάνοντας υπόψη τον πολλαπλασιασμό των νέων υπηρεσιών όπως η ολοκλήρωση των συλλογών (Vandesompel, 1999), η διασύνδεση πληροφοριών, και τα αναβαθμισμένα προτεινόμενα συστήματα ΨΒ (Bollen and Rocha, 2000Rocha, 1999), γίνεται όλο και περισσότερο σημαντικό να καθοριστεί εάν αυτές οι υπηρεσίες πράγματι ανταποκρίνονται στις προτιμήσεις και τα χαρακτηριστικά των χρηστών, και κατά συνέπεια ποιες είναι αυτές οι επιλογές.

Ένα παρόμοιο ζήτημα σχετικό με την αξιολόγηση της συλλογής μιας ΨΒ είναι εάν μια δεδομένη συλλογή ΨΒ ταιριάζει με τα χαρακτηριστικά και τις προτιμήσεις της κοινότητας χρηστών της. Σε αυτήν την περίπτωση, είναι επίσης σημαντικό να αναλυθούν οι μοναδικές προτιμήσεις μιας δεδομένης κοινότητας. Έχουν γίνει μερικές προσπάθειες για να αξιολογηθούν οι υπηρεσίες ΨΒ και οι συλλογές με τη χρήση της ανάλυσης παραπομπών και της συχνότητας παραπομπών. Παραδοσιακά, ο βαθμός επιρροής ενός δεδομένου περιοδικού αξιολογείται με τον υπολογισμό του αριθμού παραπομπών στα άρθρα που δημοσιεύονται στο περιοδικό κατά τη διάρκεια μιας δεδομένης περιόδου. Αυτός ο αριθμός κανονικοποιείται με τη διαίρεση αυτής της αρίθμησης από τον αριθμό των άρθρων στα οποία γίνονται παραπομπές που δημοσιεύτηκαν στο περιοδικό κατά τη διάρκεια της ίδιας περιόδου (Garfield, 1979). Το Institute for Scientific Information (ISI) δημοσιεύει τον Impact Factor (παράγοντα επιρροής - IF) για ένα δεδομένο περιοδικό για μια συγκεκριμένη χρονιά x που ορίζεται ως αναλογία μεταξύ των δύο ποσοτήτων Α και Β ως εξής:

IF = A/B Εξίσωση1. (Πηγή: Bollen, Vemulapalli and Xu, 2002)

όπου

A = αριθμός παραπομπών στο περιοδικό κατά τη διάρκεια τελευταίων 2 ετών που προηγήθηκαν x

B = αριθμός άρθρων που δημοσιεύτηκε στο περιοδικό κατά τη διάρκεια των τελευταίων 2 ετών που προηγήθηκαν x

To ISI δημοσιεύει μια ετήσια βάση δεδομένων που περιέχει τους καθορισμένους παράγοντες επιρροής για έναν μεγάλο αριθμό περιοδικών. Αυτοί οι παράγοντες επιρροής έχουν, ελλείψει άλλων συνόλων στοιχείων, γίνει το de facto πρότυπο βάσει του οποίου κρίνεται η επιρροή ενός δεδομένου περιοδικού και βρίσκει εφαρμογή στην αξιολόγηση της ποιότητας των μεμονωμένων ερευνητών και ολόκληρων ερευνητικών τμημάτων δια των αντιπροσώπων τους μέσω της επιρροής των περιοδικών στα οποία αυτοί έχουν δημοσιεύσει. Έχουν γίνει αναπόσπαστο τμήμα της αξιολόγησης των ακαδημαϊκών δημοσιεύσεων και ερευνών, και μπορούν έτσι να εφαρμοστούν στην αξιολόγηση των υπηρεσιών και των συλλογών των ΨΒ.

Εντούτοις, μπορούν να προσδιοριστούν τουλάχιστον τα ακόλουθα προβλήματα με αυτήν την προσέγγιση:

1. Δεν έχει τεκμηριωθεί η έκταση στην οποία οι συχνότητες παραπομπής και o IF πραγματικά υποδεικνύουν επιρροή ή χρησιμότητα. (Kostoff, 1998MacRoberts H. and MacRoberts B., 1989Opthof, 1997Reedijk, 1998)

2. Τα αρχεία παραπομπής ισχύουν μόνο για τις ακαδημαϊκές δημοσιεύσεις και δεν αντικατοπτρίζουν την επιρροή των τεχνικών εκθέσεων, ψηφιακών δημοσιεύσεων, πολυμεσικών τεκμηρίων κ.τ.λ.

3. Οι παραπομπές καθορίζονται παγκοσμίως και δεν μπορούν να προσαρμοστούν στις προτιμήσεις της κοινότητας χρηστών μιας συγκεκριμένης ΨΒ.

Η προσέγγισή μας στην ανάλυση των χαρακτηριστικών των συγκεκριμένων κοινοτήτων χρηστών στηρίζεται στη χρήση των αιτημάτων τους για ανάκτηση τεκμηρίων στις διεπαφές της ΨΒ στο WWW. Παράγουμε τα δίκτυα τεκμηρίων και περιοδικών από τις ακολουθίες ανάκτησης των χρηστών καθώς μπορούν να αναδομηθούν από τα αρχεία καταγραφής των εξυπηρετητών της ΨΒ στο WWW. Αυτά τα δίκτυα δημιουργούνται για να εκφράσουν έναν συλλογικό «νοητικό χάρτη» των σχέσεων μεταξύ των τεκμηρίων και των περιοδικών, όπως υπάρχουν μεταξύ μιας συγκεκριμένης κοινότητας χρηστών της ΨΒ, δηλαδή εκείνων για τους οποίους έχουν τηρηθεί τα αρχεία καταγραφής του εξυπηρετητή της ΨΒ.

Η κύρια υπόθεσή είναι ότι όταν οι χρήστες ανακτούν μια ακολουθία ψηφιοποιημένων τεκμηρίων με χρονική εγγύτητα, περίπτωση που καλείται ομο-ανάκτηση, είναι αυτονόητο πως έτσι εμφανίζουν έναν ορισμένο βαθμό ομοιότητας μεταξύ των ανακτημένων τεκμηρίων. Η δύναμη της σχέσης μεταξύ των ανακτημένων άρθρων, και των περιοδικών στις οποίες εμφανίστηκαν, αντιστοιχούν στη συχνότητα της ομο-ανάκτησής τους. Ένα σύνολο σχέσεων με βάρη τεκμηρίων και περιοδικών με αυτόν τον τρόπο καθορίζεται από τις συχνότητες ομο-ανάκτησης των χρηστών. Οι παραχθείσες σχέσεις τεκμηρίων και περιοδικών μπορούν έπειτα να συνδυαστούν για να διαμορφώσουν δίκτυά. Μια ανάλυση αυτών των δικτύων θα παραγάγει τις μετρήσεις της επιρροής των περιοδικών για μια συγκεκριμένη κοινότητα χρηστών που μπορεί να χρησιμοποιηθεί για να αξιολογήσει τα χαρακτηριστικά αυτής της κοινότητας καθώς επίσης βοηθά και στην αξιολόγηση του βαθμού στον οποίο η ΨΒ έχει ανταποκριθεί και έχει εξυπηρετήσει αυτά τα ενδιαφέροντα.

Μεθοδολογία

Η μεθοδολογία που ακολουθήθηκε για τη διεξαγωγή της παρούσας εργασίας ήταν αρχικά η παρουσίαση τους κυρίως άρθρου των Bollen, Vemulapalli and Xu (2002), το οποίο αποτελεί και το βασικό αντικείμενό της. Στη συνέχεια αναζητήθηκαν άρθρα σχετικά με το θέμα της αξιολόγησης ψηφιακών βιβλιοθηκών και πληροφορίες από αυτά ενσωματώθηκαν στην υπόλοιπη εργασία. Τέλος, διατυπώθηκαν κάποιοι προβληματισμοί που προέκυψαν από τη μελέτη της βιβλιογραφίας.


Ορισμοί

Η έννοια της αξιολόγησης απαντάται σε πολλά επιστημονικά πεδία, με αποτέλεσμα να ορίζεται και διαφορετικά για καθένα από αυτά. Όπως είναι φυσικό, το γενικό περίγραμμα της έννοιας είναι παρόμοιο όχι όμως και πανομοιότυπο μεταξύ των διαφόρων επιστημών.

Ένας πρώτος πολύ απλοϊκός ορισμός είναι αυτός που προκύπτει από την ετυμολογία της λέξης, που είναι 1. Ο καθορισμός της αξίας ενός πράγματος. 2. Ο προσδιορισμός της αξίας προσώπου, ενεργείας κ.τ.λ. με καθορισμένα κριτήρια.

Τεγόπουλος – Φυτράκης, 1997

Αξιολόγηση είναι η εκτίμηση ενός συστήματος βάσει κάποιου προτύπου/στόχου ή μια σύγκριση μεταξύ των εναλλακτικών προσεγγίσεων.

Η φάση της αξιολόγησης είναι θεμελιώδης προκειμένου να μετρηθεί ο βαθμός ικανοποίησης των απαιτήσεων των χρηστών. Μπορεί να πραγματοποιηθεί νωρίς στον κύκλο του σχεδιασμού, δηλ. διαμορφωτική αξιολόγηση ή μπορεί να πραγματοποιηθεί στο τέλος του κύκλου, αθροιστική αξιολόγηση. Επί του παρόντος, υπάρχουν τρεις κύριες μέθοδοι αξιολόγησης που προτείνονται στον τομέα HCI (Human-Computer Interaction – Διαδραστικότητα Ανθρώπου – Υπολογιστή)

  1. Το γνωστικό πέρασμα,
  2. Δοκιμή της ευχρηστίας και
  3. Ευρετική αξιολόγηση.

Kawasaki, Rizzo and Rodrick, 2003

Η αξιολόγηση οδηγεί στην κατεστημένη άποψη ότι κάτι συμβαίνει, συνήθως, αλλά όχι πάντα οδηγώντας στην απόφαση της ενέργειας με έναν ορισμένο τρόπο.

House, 1980

Από το χώρο της εκπαίδευσης και το US Department of Education αντλείται ο επόμενος ορισμός που αναφέρεται κυρίως στην αξιολόγηση προγραμμάτων σπουδών, είναι, όμως, σύμφωνος με τη γενικότερη τάση που εμφανίζεται στους ορισμούς της αξιολόγησης:

Αξιολόγηση είναι η συστηματική συλλογή και ανάλυση των στοιχείων που απαιτούνται για τη λήψη αποφάσεων, διαδικασία την οποία τα περισσότερα ορθώς λειτουργούντα προγράμματα αξιοποιούν εξαρχής. Ακολουθούν ορισμένες από τις δραστηριότητες αξιολόγησης που είναι ήδη πιθανό να ενσωματωθούν σε πολλά προγράμματα ή που μπορούν να προστεθούν εύκολα:

  • Επισήμανση των απαιτούμενων υπηρεσιών, π.χ. ανακαλύπτοντας σε ποια γνώση, δεξιότητες, θέσεις ή συμπεριφορές ένα πρόγραμμα πρέπει να απευθυνθεί.
  • Καθιέρωση των στόχων του προγράμματος και απόφαση των επιμέρους στοιχείων (όπως η συγκεκριμένη γνώση, οι θέσεις ή η συμπεριφορές) που θα καταδείξουν ότι οι στόχοι έχουν επιτευχθεί. Ένα κλειδί για την επιτυχή αξιολόγηση είναι ο ορισμός σαφών, μετρήσιμων και ρεαλιστικών στόχων του προγράμματος. Εάν οι στόχοι είναι μη ρεαλιστικά αισιόδοξοι ή δεν είναι μετρήσιμοι, το πρόγραμμα μπορεί να μην είναι σε θέση να καταδείξει την επιτυχία του ακόμα κι αν έχει διεκπεραιωθεί επιτυχώς.
  • Ανάπτυξη ή επιλογή μεταξύ των εναλλακτικών προσεγγίσεων του προγράμματος, π.χ. δοκιμάζοντας διαφορετικά προγράμματα σπουδών ή πολιτικές και προσδιορίζοντας αυτά που επιτυγχάνουν καλύτερα τους στόχους.
  • Τήρηση των στόχων του προγράμματος, π.χ., καθιέρωση ενός συστήματος που παρουσιάζει ποιος παίρνει τις υπηρεσίες, τι μέρος της υπηρεσίας παραδίδεται, πώς οι συμμετέχοντες αξιολογούν / βαθμολογούν τις υπηρεσίες που λαμβάνουν, και ποιες προσεγγίσεις υιοθετούνται ευκολότερα από το προσωπικό, ή
  • Δοκιμάζοντας και αξιολογώντας τα νέα σχέδια προγράμματος που καθορίζουν την έκταση στην οποία μια συγκεκριμένη προσέγγιση εφαρμόζεται πιστά από το προσωπικό των σχολείων ή φορέων ή την έκταση στην οποία προσελκύει ή διατηρεί τους συμμετέχοντες.

Μέσω αυτών των τύπων δραστηριοτήτων, εκείνοι που παρέχουν ή διαχειρίζονται τις υπηρεσίες καθορίζουν τι να προσφέρουν και πόσο καλής ποιότητας είναι οι υπηρεσίες που προσφέρουν.

Muraskin for US Department of Education, 1993

Μπορεί τα στοιχεία που αναφέρθηκαν στην αξιολόγηση να φαίνεται ότι ισχύουν για την αξιολόγηση προγραμμάτων σπουδών, όμως διευρύνοντάς τα λίγο, μπορούμε να εντοπίσουμε γενικότερα χαρακτηριστικά που βρίσκουν εφαρμογή και σε άλλους επιστημονικούς τομείς.

Η Παραγωγή των Σχέσεων Περιοδικών και Τεκμηρίων από τα αρχεία των εξυπηρετητών των Ψηφιακών Βιβλιοθηκών

Η προτεινόμενη μεθοδολογία για την άντληση μεγάλων δικτύων τεκμηρίων από τα πρότυπα ομο-ανάκτησης χρηστών αναπτύχθηκε αρχικά για την προσαρμοστική σύνδεση υπερκειμένων και έχει τροποποιηθεί για τις εφαρμογές στη σύνδεση τεκμηρίων των ΨΒ και την αξιολόγηση ΨΒ (Bollen and Rocha, 2000).

Σε αυτό το πλαίσιο έχουν εξεταστεί πρόσφατα τα αρχεία καταγραφής του εξυπηρετητή του Los Alamos National Laboratory (Bollen, 2000). Και στις προσομοιώσεις και στις αναφερθείσες εφαρμογές, η μεθοδολογία φαίνεται με αξιοπιστία και εγκυρότητα να παράγει τα δίκτυα τεκμηρίων που αντιπροσωπεύουν τις συλλογικές προτιμήσεις μιας συγκεκριμένης κοινότητας χρηστών, δηλαδή εκείνων των οποίων τα καταγραμμένα πρότυπα ανάκτησης έχουν χρησιμοποιηθεί για να παραγάγουν το δίκτυο. Τα αποτελέσματα διερευνώνται εν συντομία στην πειραματική περίπτωση της LANL RL.

Αναδόμηση Περιπτώσεων Ομο-ανάκτησης από τα Αρχεία τους Διαδικτυακού
Εξυπηρετητή της Ψηφιακής Βιβλιοθήκης

Οι περισσότερες υπηρεσίες ΨΒ καταγράφουν τα αιτήματα των χρηστών για ανάκτηση τεκμηρίων, για την ακρίβεια, είναι ένας από τους πλέον υποχρησιμοποιούμενους πόρους στην έρευνα των ΨΒ. Συγκεκριμένα, οι υπηρεσίες ΨΒ που είναι προσβάσιμες μέσω κάποιας διεπαφής του WWW, γενικά καταγράφουν τα αιτήματα των χρηστών για ανάκτηση τεκμηρίων στα αρχεία καταγραφής των εξυπηρετητών τους στο WWW. Αυτά τα αρχεία καταγραφής, γενικά, δεν περιέχουν δεδομένα ομο-ανάκτησης αλλά αυτή η πληροφορία μπορεί να αντληθεί από δεδομένα που προέρχονται από έναν αριθμό IP, την ταυτότητα ενός τεκμηρίου, (σε πολλές ΨΒ αυτό περιλαμβάνει τον αριθμό ISSN του εκδιδόμενου περιοδικού) και την ημερομηνία και ώρα κατά την οποία πραγματοποιήθηκε το αίτημα της ανάκτησης.

Ως περίπτωση ομο-ανάκτησης τεκμηρίου ορίζεται ένα ζεύγος οποιωνδήποτε 2 αιτημάτων ανάκτησης από τον ίδιο χρήστη εντός μια συγκεκριμένης, δεδομένης περιόδου Δt. Εξ’ ορισμού, οι περιπτώσεις ομο-ανάκτησης, μπορούν να αναδομηθούν από τα αρχεία καταγραφής των εξυπηρετητών της ΨΒ με απλή σάρωση των αιτημάτων ανάκτησης τεκμηρίων ταξινομημένων βάσει της ώρας κατά την οποία και πραγματοποιήθηκε το αίτημα από τον ίδιο IP αριθμό και ορίζει ότι δύο οποιαδήποτε διαδοχικά αιτήματα των οποίων η ημερομηνία και ώρα που τα χαρακτηρίζουν διαφέρει λιγότερο από Δt, συγκροτούν μία περίπτωση ομο-ανάκτησης.

Παράδειγμα της διαδικασίας παρουσιάζεται στους Πίνακες 1 και 2. Ο Πίνακας 1 απαριθμεί μια σειρά από αιτήματα ανάκτησης για τεκμήρια όπως αυτά κατεγράφησαν από τον Ιούνιο έως τον Οκτώβριο του 2001 από τον Los Alamos National Laboratory Science Server της υπηρεσίας ΨΒ. Σε αυτή την περίπτωση, το Δt, η καθορισμένη αφετηρία για να αποφασιστεί εάν οποιαδήποτε δύο διαδοχικά αιτήματα αποτελούν περίπτωση ομο-ανάκτησης, έχει τεθεί στα 3600 δευτερόλεπτα. Αυτές οι ακολουθίες αιτημάτων ανάκτησης μετασχηματίστηκαν στο σύνολο των περιπτώσεων ομο-ανάκτησης που παρουσιάζονται στον Πίνακα 2.

Αυτή η προσέγγιση στην σύνθεση περιπτώσεων ομο-ανάκτησης προσιδιάζει ιδιαίτερα με τη μέθοδο Time Out-IP που εξετάζεται από τους Pirolli and Pitkow (1999) και η οποία πραγματεύεται τα οφέλη και τις ανεπάρκειες της άντλησης, κατ’ αυτόν τον τρόπο, των διαδρομών ανάκτησης από τα αρχεία καταγραφής του εξυπηρετητή του WWW. Είναι γνωστό ότι είναι ιδιαίτερα δύσκολο να αντληθούν επαρκή δεδομένα για τη χρήση από τα αρχεία καταγραφής των εξυπηρετητών του WWW (Pitkow, 1997). Εντούτοις, ο στόχος δεν είναι το να αναδομηθεί με απόλυτη ακρίβεια η διαδρομή που ακολούθησαν οι χρήστες κατά την ανάκτηση αλλά να αναδομηθούν τα ζεύγη εκείνα που ικανοποιούν τα ομο-ανακτημένα τεκμήρια ή τα περιοδικά με στόχο την έγκυρη εκτίμηση της δύναμης της αμοιβαίας τους σχέσης.

clip_image002

Πίνακας 1. Ένα παράδειγμα τους μετασχηματισμένου αρχείου καταγραφής του Science Server που χρησιμοποιήθηκε για την αναδόμηση των περιπτώσεων ομο-ανάκτησης περιοδικών και τεκμηρίων. (Πηγή: Bollen, Vemulapalli, Xu, 2002)

clip_image003

Πίνακας 2. Περιπτώσεις ομο-ανάκτησης που αντλήθηκαν από το σύνολο των αιτημάτων ανάκτησης των χρηστών του Πίνακα 1. (Πηγή: Bollen, Vemulapalli, Xu, 2002)

Παραγωγή Σχέσεων Τεκμηρίων από Πρότυπα Ομο-ανάκτησης

Το σύνολο αναδομημένων περιπτώσεων ομο-ανάκτησης μπορεί στη συνέχεια να χρησιμοποιηθεί για να παραγάγει δίκτυα τεκμηρίων ή περιοδικών κάνοντας χρήση μιας μεθοδολογίας που σχετίζεται έντονα με το προηγουμένως αναφερθέν από τους Bollen and Heylighen (1998) για να εφαρμόσει την προσαρμοστική σύνδεση υπερκειμένων βάσει των διασταυρωμένων συχνοτήτων υπερσυνδέσεων που χρησιμοποιήθηκαν από τους χρήστες (Bollen, Vandesompel and Rocha, 1999Chan, 1999).

Τα δίκτυα τεκμηρίων και περιοδικών αναπαρίστανται από μια κατευθυνόμενη, γραφική παράσταση με βάρη που προτείνει ότι οι καθορισμένες σχέσεις είναι παρόμοιες με εκείνες που εμφανίζονται στις γραφικές παραστάσεις των παραπομπών: αναπαριστούν την κατευθυντήρια σχέση που υπάρχει μεταξύ ενός ολόκληρου τεκμηρίου και ενός άλλου, και η ύπαρξη ενός συνδέσμου μεταξύ του τεκμηρίου b και του τεκμηρίου α δεν προκύπτει από την ύπαρξη ενός συνδέσμου μεταξύ του τεκμηρίου α και του τεκμηρίου b. Ως εξαίρεση στις σχέσεις παραπομπών, οι σύνδεσμοι συνδέονται με μια αξία βάρους που εκφράζει τη δύναμη ή την εγκυρότητα του συνδέσμου, και αντλούνται από τα πρότυπα ομο-ανάκτησης των χρηστών περισσότερο, παρά από τη συχνότητα παραπομπής.

Μέσω μιας σειράς συναρτήσεων που περιγράφονται από τους Bollen, Venulapalli and Xu (2002), καταλήγουμε να αντιστοιχίσουμε κάθε ομο-ανάκτηση ci = (vi, vj, t(vi, vj)) σε μια μικρή τιμή εφαρμογής r προστεθειμένη στην εγγραφή του πίνακα mij που αντιπροσωπεύει την ισχύ της σχέσης μεταξύ των περιοδικών vi and vj. Από αυτή την άποψη, το σύνολο όλων των επικαλυπτόμενων «ιχνών» των ακολουθιών ανάκτησης χρηστών, ή των ομο-ανακτήσεων, παράγει βαθμιαία ένα δίκτυο περιοδικών που μπορεί να πραγματοποιηθεί για να αντιπροσωπεύσει τις επικαλυπτόμενες προτιμήσεις των ατόμων στην κοινότητα χρηστών για την οποία έχει παραχθεί το σύνολο των ομο-ανακτήσεων.

Ανάλυση Δικτύων Περιοδικών

Οι παραχθέντες πίνακες υποτίθεται ότι παρουσιάζουν τις υπονοούμενες προτιμήσεις μιας κοινότητας χρηστών, όπως εκφράστηκαν στα πρότυπα ανάκτησης τεκμηρίων ή περιοδικών. Από τα παραχθέντα δίκτυα μπορούμε να δομήσουμε μετρήσεις της επιρροής των περιοδικών καθώς επίσης και μετρήσεις για το πώς η δομή των σχέσεων περιοδικών δείχνει προς τη μετατόπιση και τις αλλαγές στις προτιμήσεις χρηστών και στη σύνθεση και στη δομή της ίδιας της κοινότητας χρηστών. Τα αποτελέσματα μιας τέτοιας ανάλυσης είναι πολύ χρήσιμα στην αξιολόγηση των υπηρεσιών ΨΒ, την αξιολόγηση της έρευνας και των δημοσιεύσεων, την ανάλυση της εξέλιξης scientometric στη ευρύτερη επιστημονική κοινότητα (Borgman and Rice, 1992) και ως εργαλείο για τη διαχείριση ΨΒ για να ενημερώσουν σχετικές με την πολιτική τους αποφάσεις.

Συχνότητα Χρήσης Περιοδικών

clip_image005Ο ορισμός του f(vi) σε αυτήν την πρόταση είναι απλός, δηλαδή f(vi) = 1. Επομένως κάθε τιμή του mij αντιστοιχεί ακριβώς στη συχνότητα με την οποία vi και vj περιλήφθηκαν σε μία περίπτωση ομο-ανάκτησης. Η συχνότητα με την οποία ένα άρθρο στο περιο