Proyecto 7: un motor de recuperación de información web colaborativo

García-Figuerola, Carlos, Gómez Díaz, Raquel, Alonso-Berrocal, José-Luis and Zazo Rodríguez, José Francisco Proyecto 7: un motor de recuperación de información web colaborativo. SCIRE : Representación y Organización del Conocimiento, 2010, vol. 16, n. 2, pp. 53-59. [Journal article (Paginated)]

There is a more recent version of this item available.

Preview

PDF
4016-4586-1-PB.pdf
Download (365kB) | Preview

English abstract

With the rise of the Internet as a means of disseminating information is revealed the need for retrieval tools that provide access to desired information quickly and easily. Generalist search engines, and even thematically specialized ones, seek, with more or less success, to cover the entire web space. This type of search engines have proved effective and are used daily by millions of people. Sometimes, however, organizations with web presence need search tools within their own network space, whether it is open to the public, only internal, or a mixture of both. Many of these organizations what they want is to have search engines that focus on your web space, which the organization can precisely control, allowing greater control over indexed web space, on the forms of access and visualizing the retrieved documents; and even the possibility of studying habits of search with the aim of organize this web space and his navigability in a more efficient way. We present the Project 7, a web retrieval engine designed for use by those organizations with a documentary presence in Internet and for which, although having the information stored in any way exclusively local, want to make it accessible via the Internet. The theoretical basis on which this web retrieval engine is based is reviewed, outlining its main features.

Spanish abstract

Con la expansión de Internet como medio de difusión de información se hace patente la necesidad de contar con medios de recuperación que permitan acceder a la información deseada de manera fácil y rápida. Los motores de tipo generalista y los especializados temáticamente pretenden, con mayor o menor fortuna, cubrir todo el espacio web. Este tipo de motores de búsqueda han demostrado su eficacia, y son utilizados a diario por millones de personas. En ocasiones, sin embargo, las organizaciones con presencia en la red desean disponer de herramientas de búsqueda dentro de su propio espacio de red, ya sea éste abierto al público, solamente interno, o una mezcla de ambas cosas. Muchas de estas organizaciones lo que desean es disponer de motores de búsqueda centrados en su espacio web, que la propia organización pueda controlar con precisión, permitiendo un mayor control sobre el espacio web indizado, sobre las formas de acceso, la presentación de la información recuperada e, incluso, la posibilidad de estudiar hábitos de búsqueda a fin de de organizar dicho espacio web y su navegabilidad de una forma más eficiente. En este trabajo presentamos el Proyecto 7, un motor de recuperación web pensado para su aplicación por parte de esas organizaciones con presencia documental en Internet y también para las que, aún teniendo la información almacenada en modo exclusivamente local, quieren hacerla accesible a través de Internet. Se repasan los fundamentos teóricos que en los que se apoya este motor de recuperación web y se exponen sus principales características.

Item type:	Journal article (Paginated)
Keywords:	information retrieval; search engine; web retrieval; project 7; web crawling; probalistic retrieval; Recuperación de información; motor de búsqueda; recuperación web; proyecto 7; web crawling; modelo probabilístico.
Subjects:	I. Information treatment for information services > II. Filtering. I. Information treatment for information services > IZ. None of these, but in this section. L. Information technology and library technology > LC. Internet, including WWW.
Depositing user:	Carlos G. Figuerola
Date deposited:	21 Sep 2012
Last modified:	02 Oct 2014 12:23
URI:	http://hdl.handle.net/10760/17590