Ειδικές διεπαφές με ηλεκτρονικά συστήματα βιβλιοθηκών για άτομα με προβλήματα όρασης

Δενδρινός, Μάρκος Ειδικές διεπαφές με ηλεκτρονικά συστήματα βιβλιοθηκών για άτομα με προβλήματα όρασης., 2003 . In 12ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών, Σέρρες (GR), 2003. [Conference paper]

[thumbnail of 12psab039.pdf]
Preview
PDF
12psab039.pdf

Download (197kB) | Preview

English abstract

This paper deals with the adaptation and extension of a specific interface, which has been designed and implemented in the Institute for Language and Speech Processing (ILSP) for the project "Reading Environment for the Blind" in the framework of the National Project EPET II. This interface, which has been designed for the access of persons with visual problems in the graphic environment of Windows operating system, can be used in any application running under Windows, and it can be also adapted / extended to other operating systems. An important application could be the improvement of the access of persons with visual problems to the automatic electronic services of the libraries, such as use of the On-line Public Access Catalogues (OPACs), as well as the process of resource loaning either from the specific library or from the cooperating libraries / information bases (inter-loaning). The components of the interface system are, among others, software for topological description and segmentation into elements (working windows, dialogue boxes, menus, icons, messages etc) of the open windows applications, software for recognizing the verbal elements of the screen, software for recognizing the language in which the verbal elements of the screen are written as well as "speaking them out" with a synthetic voice of the corresponding language. Concerning the speaking of the verbal elements and the acoustic information of the user about the position and the content of the objects of each open windows application, the special speech synthesis software "Ekfonitis" of ILSP has been used for Greek, whereas for the other languages respective commercial speech synthesis systems can be used. Finally, an important extension of the system can be the incorporation of a continuous speech recognition unit, which will give the user the capability to introduce his selections phonetically through a microphone instead of the keyboard. The resulted prototype will be submitted to a final control and assessment by a group of representative users, and then it will be ready to be incorporated in an integrated library management system. The contemporary trend of universal access makes such a system a very important unit of electronic access and management of information in the Academic Libraries environment.

Greek abstract

Το άρθρο αυτό έχει σαν αντικείμενο την προσαρμογή και επέκταση μιας ειδικής διεπαφής που έχει σχεδιαστεί και υλοποιηθεί στο Ινστιτούτο Επεξεργασία του Λόγου (ΙΕΛ) στο πλαίσιο του έργου ‘Περιβάλλον ανάγνωσης για τυφλούς’ του Προγράμματος ΕΠΕΤ ΙΙ. Η διεπαφή αυτή που έχει σχεδιαστεί για την πρόσβαση των ατόμων με προβλήματα όρασης στο παραθυρικό περιβάλλον του λειτουργικού συστήματος Windows, μπορεί να χρησιμοποιηθεί για οποιαδήποτε εφαρμογή που τρέχει κάτω από τα Windows, αλλά μπορεί επίσης να προσαρμοστεί / επεκταθεί και για άλλα λειτουργικά συστήματα. Μια σημαντική της εφαρμογή θα μπορούσε να είναι η διευκόλυνση πρόσβασης των ατόμων με προβλήματα όρασης στις αυτοματοποιημένες ηλεκτρονικές υπηρεσίες των βιβλιοθηκών, όπως η πληροφόρηση από τους επιγραμμικούς καταλόγους των βιβλιοθηκών, καθώς και ο δανεισμός πόρων που διατίθενται από τη συγκεκριμένη βιβλιοθήκη ή τις βιβλιοθήκες / βάσεις πληροφοριών με τις οποίες αυτή συνεργάζεται (διαδανεισμός). Τα εργαλεία του συστήματος διεπαφής είναι, μεταξύ άλλων, λογισμικό τοπολογικής περιγραφής και τεμαχισμού σε επιμέρους στοιχεία (παράθυρα εργασίας, πλαίσια διαλόγου, μενού επιλογών, εικονίδια, μηνύματα κλπ) των ενεργών παραθυρικών εφαρμογών, λογισμικό αναγνώρισης των λεκτικών στοιχείων της οθόνης, λογισμικό αναγνώρισης της γλώσσας των λεκτικών στοιχείων καθώς και εκφώνησής τους μέσω του συνθέτη της προσδιορισθείσας γλώσσας. Για την εκφώνηση των λεκτικών στοιχείων και την ηχητική ενημέρωση του χρήστη για τη θέση και το περιεχόμενο των αντικειμένων κάθε ενεργού παραθυρικής εφαρμογής έχει χρησιμοποιηθεί για μεν την ελληνική γλώσσα το ειδικό λογισμικό σύνθεσης φωνής του ΙΕΛ, ο Εκφωνητής, ενώ για την υπόλοιπες γλώσσες μπορούν να χρησιμοποιηθούν αντίστοιχα εμπορικά συστήματα σύνθεσης φωνής. Τέλος, μια σημαντική επέκταση του συστήματος είναι η ενσωμάτωση μια μονάδα αναγνώρισης φωνής συνεχούς λόγου, η οποία θα δίνει τη δυνατότητα στον χρήστη να εισάγει φωνητικά τις επιλογές του μέσω μικροφώνου αντί για το πληκτρολόγιο. Το πρωτότυπο που θα προκύψει θα υποβληθεί σε έναν τελικό έλεγχο και αξιολόγηση από αντιπροσωπευτικούς χρήστες, οπότε θα είναι πλέον σε θέση να ενσωματωθεί στο ολοκληρωμένο σύστημα διαχείρισης της βιβλιοθήκης. Η σύγχρονη τάση της καθολικής πρόσβασης καθιστά ένα τέτοιο σύστημα μια σημαντικότατη μονάδα ηλεκτρονικής πρόσβασης και διαχείρισης της πληροφορίας στο περιβάλλον των Ακαδημαϊκών Βιβλιοθηκών.

Item type: Conference paper
Keywords: Library service, Multimodal interface, Persons with disabilities, Screen segmentation, Text-to-Speech (TTS), Άτομα με αναπηρίες (ΑΜΕΑ), Πολυτροπική διεπαφή, Σύνθεση φωνής, Τεμαχισμός οθόνης, Υπηρεσία βιβλιοθήκης
Subjects: I. Information treatment for information services > IK. Design, development, implementation and maintenance
J. Technical services in libraries, archives, museum.
Depositing user: Andreas K. Andreou
Date deposited: 13 Jun 2007
Last modified: 02 Oct 2014 12:07
URI: http://hdl.handle.net/10760/9677

References

1. BURGER, D, 2001. BrailleNet digital document delivery for the blind in France. In: IFLA (ed), Digital libraries of the blind and the culture of learning in the information age. Proc. of the IFLA SLB Pre-Conference. Washington DC, USA, Aug. 13-15.

2. CLATT, D.H., 1980. Software for a Cascade / Parallel Formant Synthesizer. Journal of the Acoustical Society of America. Vol.67, No.3.

3. COX, S., 1995. Predictive Speaker Adaptation in Speech Recignition. Computer Speech and Language. Vol.9, No.l, σσ. 1-18.

4. CRAVEN, J., 2001. The development of digital libraries for blind and visually impaired people. Ariadne (Web version) Issue 30, Dec. <http://www.ariadne.ac.uk/issue30/ifla/> (πρόσβαση 2/10/2003)

5. GEORGAKI, Α., RAPTIS, S, BAKAMIDIS, S., 2000. A music interface for Visually Impaired people in the WEDELMUSIC environment, Design and Architecture. Proc. of International 12ο ΠΑΝΕΛΛΗΝΙΟ ΣΥΝΕΔΡΙΟ ΑΚΑΔΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ Symposium on Music Information Retrieval (MUSIC IR 2000). Plymouth, Massachusetts, October 23-25.

6. IFLA, 2001. Digital libraries of the blind and the culture of learning in the information age. Proc. of the IFLA SLB Pre-Conference. Washington DC, USA, Aug. 13-15.

7. LEGETTER C.J., WOODLAND P.C., 1995. Maximum Likelihood Linear Regression for Speaker Adaptation of Continuous Density Hidden Markov Models. Computer Speech and Language, Vol.9, No.2, σσ 171-185.

8. MIESENBERG, K., Future library services: developing research skills among blind students. In: IFLA (ed), Digital libraries of the blind and the culture of learning in the information age. Proc. of the IFLA SLB Pre-Conference, Washington DC, USA, Aug. 13-15.

9. RAPTIS, S, MAIUOPOULOS, C, BAKAMIDIS, S, STAINHAOUER G, 1998. A Speech Agent for Remote E-Mail Access. The 4th IEEE workshop on Interactive Voice Technology for Telecommunications Applications and ESCA Tutorial and Research Workshop on Applications of Speech Technology in Telecommunications. Torino, Italy, Sept. 29-30.

10. SUNG, C, The future of lifelong learning in the next generation of library services. In: IFLA (ed), Digital libraries of the blind and the culture of learning in the information age. Proc. of the IFLA SLB Pre-Conference. Washington DC, USA, Aug. 13-15.

11. WOODLAND P.C., LEGGETTER C.J., ODELL, J., VALTCHEV, V., YOUNG, S.J., 1995. The 1994 HTK Large Vocabulary Speech Recognition System, Proc. of the International Conference on Acoustics, Speech and Signal Processing (ICASSP), Detroit, Vol.1, σσ. 73-76.

12. YOUNG, S, 1996. Large Vocabulary Speech Recognition : A Review, IEEE Signal Processing Magazine. 13(5), σσ. 45-57.

13. ΡΑΠΤΗΣ, Σ., ΜΠΑΚΑΜΙΔΗΣ, Σ, ΓΑΡΜΠΗ, Α., ΚΑΡΒΟΥΝΗΣ, Δ., 2000. Καθορισμός των τεχνικών προδιαγραφών του Περιβάλλοντος Ανάγνωσης για Τυφλούς. Παραδοτέο του Έργου "Περιβάλλον Ανάγνωσης για Τυφλούς" του Ερευνητικού Προγράμματος ΤΕΠΕΤ II'.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item