CONDITOR: Topic Maps and DITA labelling tool for textual documents with historical information

Garrido, Piedad and Tramullas, Jesús and Coll, Manuel CONDITOR: Topic Maps and DITA labelling tool for textual documents with historical information. Journal of Digital Information, 2009, vol. 10, n. 4. [Journal article (Unpaginated)]

[img]
Preview
PDF
264-2230-1-PB.pdf

Download (933kB) | Preview

English abstract

Conditor is a software tool which works with textual documents containing historical information. The purpose of this work two-fold: firstly to show the validity of the developed engine to correctly identify and label the entities of the universe of discourse with a labelled-combined XTM-DITA model. Secondly to explain the improvements achieved in the information retrieval process thanks to the use of an object-oriented database (JPOX) as well as its integration into the Lucene-type database search process to not only accomplish more accurate searches, but to also help the future development of a recommender system. We finish with a brief demo in a 3D-graph of the results of the aforementioned search.

Spanish abstract

Conditor es una herramienta de software que trabaja con documentos de texto que contienen información histórica. El propósito de este trabajo doble: en primer lugar para mostrar la validez del motor desarrollado para identificar y etiquetar correctamente las entidades del universo del discurso con una etiquetado que combina los modelos XTM y DITA. En segundo lugar para explicar las mejoras logradas en el proceso de recuperación de información gracias a la utilización de una base de datos orientada a objetos (JPOX), así como su integración en la base de datos de Lucene tipo de proceso de búsqueda, no sólo para realizar búsquedas más precisas, pero también para ayudar a los de desarrollo futuro de un sistema de recomendación. Terminamos con una breve demostración en un gráfico 3D de los resultados de la búsqueda antes mencionados.

Item type: Journal article (Unpaginated)
Keywords: Topic maps, XTM, DITA, historical information
Subjects: L. Information technology and library technology > LS. Search engines.
L. Information technology and library technology > LM. Automatic text retrieval.
I. Information treatment for information services > IE. Data and metadata structures.
I. Information treatment for information services > IG. Information presentation: hypertext, hypermedia.
Depositing user: Dr. Jesús Tramullas
Date deposited: 04 Mar 2010
Last modified: 02 Oct 2014 12:16
URI: http://hdl.handle.net/10760/14320

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item