Text Encoding Initiative επισκόπηση, προβλήματα και εφαρμογές

Μπουντούρη, Λίνα Text Encoding Initiative επισκόπηση, προβλήματα και εφαρμογές., 2004 . In 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών, Κέρκυρα (GR), 13-15 Οκτωβρίου 2004. [Conference paper]

[img]
Preview
PDF
BOUNTOURI_TEI.pdf

Download (357kB) | Preview

English abstract

The last decades, there have been many efforts in the scientific field of Humanities Computing in order to create standards and useful tools to edit, manage and deliver the humanities textual material in the web. Editing and delivering electronically the textual material was the basic implementation of Computing in the Humanities field. Those procedures were of major importance in promoting, managing and editing texts. The humanists, in order to manage and represent electronically the humanities texts, have used the markup languages (HTML, SGML, and XML). The languages SGML and XML proved to be more efficient, because of their structure, for the creation of standards and metadata concerning the electronic textual material, in comparison to HTML. The particular article examines the Text Encoding Initiative standard (TEI), which was established in 1987. TEI was initially based on SGML but, nowadays, there is also a TEI - XML compatible version. Its main target was to function as a community – based standard that helps libraries, museums, publishers, and individual scholars represent all kinds of literary and linguistic texts for online research and teaching. By giving a general description of the TEI Document Type Definition (TEI DTD) and its components, we will prove TEI’s usefulness for humanities textual material. At the same time, we will emphasize on the use and importance of TEI Header, which is mandatory part of the TEI DTD. The TEI Header offers valuable information to the users that search and retrieve the electronic documents and, at the same time, to the librarians or the creators of the documents. The TEI is used in a world wide basis, especially from libraries and archival institutions. This fact has led to a continuous research for the creation of tools to edit, represent, search and retrieve TEI documents. In parallel, the adoption of TEI in real world implementations makes obvious its advantages and, at the same time, its open research problems that have to be reconsidered in order to improve the standard. Those problematic areas will be analysed in the particular article. Last but not least, the presentation of textual material encoded in TEI shows us not only the usefulness of TEI for the Greek humanists but also opportunity provided to exploit this standard in Greek humanities material.

Greek abstract

Τα τελευταία χρόνια έχουν γίνει αρκετές προσπάθειες στο επιστημονικό πεδίο της Πληροφορικής για τις Ανθρωπιστικές σπουδές (Humanities Computing), με σκοπό τη δημιουργία προτύπων περιγραφής και εργαλείων διαχείρισης των κειμένων ανθρωπιστικών σπουδών στο Διαδίκτυο. Η δυνατότητα ηλεκτρονικής επεξεργασίας και έκδοσης κειμένων αποτέλεσε βασική εφαρμογή των εργαλείων της πληροφορικής στις Ανθρωπιστικές σπουδές και αποτέλεσε σημαντικό παράγοντα για την ανάδειξη, τη διαχείριση και την επιστημονική επεξεργασία των έργων του γραπτού λόγου. Για την ηλεκτρονική εμφάνιση και διαχείριση των κειμένων ανθρωπιστικών σπουδών, οι ερευνητές του κλάδου χρησιμοποίησαν σε μεγάλο βαθμό τις γλώσσες σήμανσης (HTML, SGML, XML). Η SGML και η XML, λόγω της δομής τους, αποτέλεσαν εξ’ αρχής μια πιο αποτελεσματική βάση – σε σχέση με την HTML – για τη δημιουργία προτύπων και μεταδεδομένων που αφορούν τα ηλεκτρονικά κείμενα. Το συγκεκριμένο άρθρο ασχολείται με το πρότυπο Text Encoding Initiative (TEI), το οποίο εμφανίστηκε το 1987. Το TEI βασίστηκε αρχικά στην SGML και στη συνέχεια και στην XML, με στόχο να καθιερωθεί ως ένα διεθνές πρότυπο το οποίο θα χρησιμοποιείται από βιβλιοθήκες, μουσεία, εκδότες και ακαδημαϊκούς για την παρουσίαση λογοτεχνικών και γλωσσολογικών κειμένων σε ηλεκτρονική μορφή. Μέσα από τη γενική περιγραφή του TEI Document Type Definition (TEI DTD) και των συστατικών μερών του, θα εξακριβωθεί η χρησιμότητά του για τέτοιου είδους υλικό, ενώ θα δοθεί ιδιαίτερη έμφαση στη δομή και στη χρησιμότητα του TEI Header. Το TEI Header αποτελεί αναπόσπαστο κομμάτι του TEI DTD, καθώς παρέχει χρήσιμες πληροφορίες τόσο στους χρήστες που αναζητούν και ανακτούν ηλεκτρονικά κείμενα όσο και στους βιβλιοθηκονόμους ή στους συντάκτες των κειμένων αυτών. Το TEI αξιοποιείται από φορείς πληροφόρησης του εξωτερικού, κυρίως από βιβλιοθήκες και αρχεία. Το γεγονός αυτό δίνει το έναυσμα για τη συνεχή έρευνα στο πεδίο δημιουργίας εργαλείων επεξεργασίας, εμφάνισης και αναζήτησης – ανάκτησης των TEI εγγράφων. Παράλληλα, η υιοθέτησή του σε πραγματικές εφαρμογές κάνει εμφανή τα πλεονεκτήματα της χρήσης του και συγχρόνως αναδεικνύει τα ανοικτά ερευνητικά ερωτήματα για την περαιτέρω βελτίωση του. Οι πλευρές αυτές θα εξεταστούν στα πλαίσια του παρόντος άρθρου. Συνοψίζοντας, η αναφορά σε παραδείγματα κωδικοποίησης ελληνικών κειμένων καταδεικνύει τόσο τη χρησιμότητα του TEI για τους Έλληνες ερευνητές των ανθρωπιστικών σπουδών όσο και το πρόσφορο έδαφος που υπάρχει στην ελληνική πραγματικότητα για την αξιοποίηση του προτύπου.

Item type: Conference paper
Keywords: Κωδικοποίησης κειμένων, Περιγραφικά Μεταδεδομένα, Ανθρωπολογία. Text Encoding Initiative, Descriptive Metadata, Humanities Computing.
Subjects: I. Information treatment for information services > IE. Data and metadata structures.
I. Information treatment for information services > IA. Cataloging, bibliographic control.
Depositing user: Lina Bountouri
Date deposited: 25 May 2007
Last modified: 02 Oct 2014 12:07
URI: http://hdl.handle.net/10760/9588

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item