Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών

Μάστορα, Άννα, Πεπονάκης, Μανόλης and Καπιδάκης, Σαράντος Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών., 2012 . In 21ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών, Πειραιάς (GR), 18-19 Οκτωβρίου 2012. (Unpublished) [Conference paper]

[thumbnail of Mastora_21PALC_Text.pdf]
Preview
Text
Mastora_21PALC_Text.pdf - Updated version
Available under License Creative Commons Attribution Non-commercial.

Download (548kB) | Preview
[thumbnail of Mastora_21PALC_Presentation.pdf]
Preview
Slideshow
Mastora_21PALC_Presentation.pdf - Presentation
Available under License Creative Commons Attribution Non-commercial.

Download (1MB) | Preview

English abstract

A way of dealing with the problem of highly inflectional languages as well as the query – document terms mismatch problem is by implementing Language Processing Techniques. The aim of this study is to report, through presenting empirical data, on the Language Processing Techniques and their advantages if implemented by the information retrieval systems of Greek Academic Libraries. The objectives of this study are twofold. First goal is to acknowledge these techniques and then try to designate the interoperability issues deriving from the varying implementations. For this purpose, we examined Greek Academic Libraries which host both an OPAC and an Institutional Repository towards whether they implement any kind of language technology. Additionally, we report whether these techniques are implemented consistently in terms of the OPAC and the Institutional Repository of the same institution, as well as among different institutions.

Greek abstract

Η αναντιστοιχία μεταξύ των όρων της ερώτησης που υποβάλλει ο χρήστης και των όρων που έχουν ευρετηριαστεί είναι ένα σημαντικό πρόβλημα, το οποίο επηρεάζει την ανάκτηση σχετικών τεκμηρίων κατά την αναζήτηση πληροφοριών. Σε γλώσσες με έντονη μορφολογία, όπως είναι η Ελληνική γλώσσα, η λέξη παίρνει διαφορετικές μορφές για να εκφράσει αριθμούς, πτώσεις, γένη, χρόνους κτλ. Δυσχεραίνεται, συνεπώς, το έργο της αναζήτησης πληροφοριών καθώς πρέπει να είναι εκ των προτέρων γνωστή η μορφή της λέξης που έχει ευρετηριαστεί ώστε να υποβληθεί ομοίως στο σύστημα κατά την αναζήτηση. Ένας τρόπος αντιμετώπισης του προβλήματος της έντονης μορφολογίας των γλωσσών, στο πλαίσιο της αναντιστοιχίας μεταξύ των υποβαλλόμενων όρων σε μια ερώτηση και εκείνων που περιλαμβάνονται στο αντίστοιχο ευρετήριο, σχετίζεται με τις Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας (ΕΤΓΕ). Στόχος της παρούσας μελέτης είναι να καταδείξει τα πλεονεκτήματα των Εφαρμογών Τεχνολογιών Γλωσσικής Επεξεργασίας στα συστήματα αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών και ταυτόχρονα να καταδείξει τα προβλήματα που προκύπτουν όταν υλοποιούνται με διαφορετικό τρόπο οι παραπάνω τεχνολογίες. Για το λόγο αυτό, εξετάσαμε ως προς την εφαρμογή αυτών των τεχνολογιών Ελληνικές Ακαδημαϊκές Βιβλιοθήκες που διαθέτουν και OPAC και Ιδρυματικό Αποθετήριο καθώς και συγκρίναμε τη συνέπεια εφαρμογής αυτών τόσο μεταξύ των συστημάτων του ίδιου ιδρύματος όσο και οριζόντια, δηλαδή των ιδρυμάτων μεταξύ τους για να διαπιστώσουμε το βαθμό διαλειτουργικότητας που επιτυγχάνεται.

Item type: Conference paper
Keywords: Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας, Πληροφοριακά Συστήματα, Δημόσιοι Κατάλογοι Βιβλιοθηκών, Αποθετήρια, Αναζήτηση Πληροφοριών, Language Processing Techniques, Information Systems, Libraries’ OPACs, Repositories, Information Search
Subjects: C. Users, literacy and reading. > CB. User studies.
L. Information technology and library technology > LL. Automated language processing.
L. Information technology and library technology > LR. OPAC systems.
Depositing user: Manolis Peponakis
Date deposited: 02 Jan 2013 22:49
Last modified: 02 Oct 2014 12:24
URI: http://hdl.handle.net/10760/18139

References

- Efthimiadis, E. et al., 2009. Non-english web search: an evaluation of indexing and searching the Greek web. Information Retrieval, 12(3), pp.352–379. Available at: http://dx.doi.org/10.1007/s10791-008-9084-6.

- Gavrilidou, M., Koutsombogera, M. & Patrikakos, A., 2012. The Greek Language in the Digital Age, Springer. Available at: http://www.meta-net.eu/whitepapers/e-book/greek.pdf.

- Hearst, M.A., 2009. Search User Interfaces 1st ed., Cambridge University Press. Available at: http://searchuserinterfaces.com/book/.

- Kapidakis, S., Mastora, A. & Peponakis, M., 2012. Query Expansion of Zero-Hit Subject Searches: Using a Thesaurus in Conjunction with NLP Techniques. In P. Zaphiris et al., eds. Theory and Practice of Digital Libraries. Lecture Notes in Computer Science. Springer Berlin / Heidelberg, pp. 433–438. Available at: http://dx.doi.org/10.1007/978-3-642-33290-6_48.

- Koukourakis, M., 2011. Greek Academic Repositories: Policies for Making Available Scientific and Cultural Content. In New Trends in Qualitive and Quantitative Methods in Libraries: Selected Papers Presented at the 2nd Qualitative and Quantitative Methods in Libraries: Proceedings of the International Conference on QQML2010 Chani. New Trends in Qualitive and Quantitative Methods in Libraries. Athens: World Scientific Publishing, pp. 103–120.

- Lazarinis, F., 2007. An initial exploration of the factors influencing retrieval of Web images in Greek queries. In Proceedings of the 2007 Euro American conference on Telematics and information systems. EATIS ’07. New York, NY, USA: ACM, pp. 69:1–69:4. Available at: http://doi.acm.org/10.1145/1352694.1352765.

- Liddy, E. D. (1998). Natural Language Processing for Information Retrieval and Knowledge Discovery. In P. A. Cochrane, & E. H. Johnson (Eds.): Visualizing Subject Access for 21st Century Information Resources [papers presented at the 1997 Clinic on Library Applications of Data Processing, March 2-4, 1997]: 137-147.

- Mastora, A. & Kapidakis, S., 2012. Query Rewriting Using Shallow Language Processing: Effects on Keyword Subject Searches. In International Workshop on Supporting User’s Exploration on Digital Libraries. pp. 3–14. Available at: http://ixa2.si.ehu.es/suedl/SUEDLproceedings.pdf.

- Salaba, A., 2009. End-User Understanding of Indexing Language Information. Cataloging Classification Quarterly, 47(1), pp.23–51. Available at: http://dx.doi.org/10.1080/01639370802451983.

- Ζώτος, Νικόλαος, 2007. Εξατομικευμένη αναζήτηση πληροφορίας με χρήση σημασιολογικών δικτύων. Μεταπτυχιακή Εργασία. Πανεπιστήμιο Πάτρας. Τμήμα Μηχανικών Η/Υ και Πληροφορικής. Διαθέσιμο στο: http://nemertes.lis.upatras.gr/jspui/handle/10889/642.

- Πεπονάκης, Μανόλης & Σφακάκης, Μιχάλης, 2008. Αξιολόγηση διαλειτουργικότητας μεταδεδομένων μεταξύ των ιδρυματικών αποθετηρίων και των καταλόγων (OPACs) των Ελληνικών ακαδημαϊκών βιβλιοθηκών. Στο 17ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών: Η αξιολόγηση των Βιβλιοθηκών ως στοιχείο ποιότητας των Ακαδημαϊκών Ιδρυμάτων. Ιωάννινα. Διαθέσιμο στο: http://eprints.rclis.org/handle/10760/13276.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item