Paz-Madrid-Gorelov, Vadim, Zazo, Ángel F., G.-Figuerola, Carlos and Alonso-Berrocal, José-Luis Librerías Lucene y dotLucene para Recuperación de Información. Estudio y desarrollo de casos prácticos., 2007 [Report]
Preview |
PDF
pazmadrid2007librerias.pdf Download (1MB) | Preview |
English abstract
This technical report describes two libraries for Information Retrieval: Lucene and dotLucene. Lucene is a library developed for the Java program language. DotLucene is a port for Lucene in .Net. Our purpose is to make a basic tutorial to use both libraries. So, rst we describe Lucene, its class model and the most important objects for the process of information indexing and searching. Next, we study dotLucene, in this case, using two examples for the description of this library. The former nds les in a folder containing the text of the search. The later can to index elds of XML les using diferent criteria. In this example, some searches can be done using one or more elds of the XML les.
Spanish abstract
En este informe técnico se describe la utilización de dos librerías1 para Recuperación de Información. Después de una introducción a esta disciplina, se realiza un tutorial básico de utilización de la librería Lucene, bajo el lenguaje de programación Java, explicando en qué consiste, qué se puede hacer con ella, y poniendo ejemplo prácticos de su utilización. Se estudia el modelo de clases de Lucene, y se exploran los principales objetos para la indexación y búsqueda de información. Además del estudio e implementación de la librería Lucene, se describe la utilización de dotLucene, un puerto adicional de Lucene en .Net, con el que probar la versatilidad de Lucene en otras plataformas. Para ello se han elaborado y documentado dos ejemplos de búsqueda de información. En el primero se lleva a cabo una búsqueda de información en documentos almacenados en un árbol de directorios. Se pueden realizar búsquedas de información sobre cualquier fichero convertible a texto plano. El segundo va más allá y realiza la indexación, delimitación y búsqueda de información en documentos XML, permitiendo la búsqueda por campos concretos en este tipo de documentos
Item type: | Report |
---|---|
Keywords: | Information retrieval ; Lucence Library ; Recuperación de la información ; Biblioteca Lucence |
Subjects: | L. Information technology and library technology > LM. Automatic text retrieval. |
Depositing user: | R. Gómez-Díaz |
Date deposited: | 10 Dec 2009 |
Last modified: | 02 Oct 2014 12:16 |
URI: | http://hdl.handle.net/10760/13965 |
References
Downloads
Downloads per month over past year
Actions (login required)
View Item |