Rendimiento de 8 sistemas de recuperación de la información del espacio Web español

Amat, Carlos B. Rendimiento de 8 sistemas de recuperación de la información del espacio Web español. El Profesional de la Información, 2005, vol. 14, n. 5, pp. 335-346. [Journal article (Paginated)]

[thumbnail of EPI.pdf]
Preview
PDF
EPI.pdf

Download (260kB) | Preview

English abstract

Eight search engines (AltaVista, EnlaWeb, Lycos, Olé/Terra, Ozú, Sol, Ya and Yahoo) were evaluated in terms of the Spanish web space and their performance in retrieving information from this space. Indicators chosen were their relative coverage, specific offering, proportion of dead links and accessibility of Spanish websites. Performance was determined by relative recall and precision in retrieval during the first quarter in 2003. Search topics and relevance of results were determined by the end users. 12,4% of the searches led to dead links and 76% of the pages were returned by only a single system. System performance, expressed in terms of recall ranged from 7% (AltaVista) to 14% (Ozú) and precision between 9% (Sol) and 30% (Ozú). Only Yahoo displayed typical inverse relationship between recall and precision figures. The rest of the systems invariably showed an increase in precision figures starting with the second or third search result, suggesting problems with the sorting algorithm.

Spanish abstract

Los sistemas AltaVista, EnlaWeb, Lycos, Olé/Terra,Ozú, Sol, Ya y Yahoo se evaluaron en términos de: 1) su ajuste al espacio web español y 2) su rendimiento en la recuperación de información en dicho espacio. Para la determinación del ajuste se eligieron como indicadores su cobertura general, su aporte específico, la proporción de resultados erróneos (enlaces perdidos) y la accesibilidad de los documentos web españoles a través de los ocho sistemas. La determinación del rendimiento de la recuperación se basó en el cálculo de la precisión y la exhaustividad relativa de los resultados de búsquedas realizadas en el primer trimestre de 2003. La elección de los temas de búsqueda y el juicio de relevancia corrió a cargo de usuarios reales. El 12,4% de los resultados de búsqueda condujeron a enlaces erróneos. El 76% de los resultados obtenidos se obtuvieron a partir de un único sistema. El rendimiento de los sistemas, expresado en términos de exhaustividad y precisión, es reducido, con valores promedio de exhaustividad situados entre el 7 (AltaVista) y el 14% (Ozú) y de precisión entre el 9 (Sol) y el 30% (Ozú). Sólo Yahoo muestra un comportamiento típico con relación inversa entre los valores a lo largo de los 20 resultados de búsqueda. Los sistemas restantes muestran invariablemente un ascenso en las cifras de precisión a partir del segundo o tercer resultado de búsqueda, lo que abunda en la idea de defectos en el algoritmo de ordenación de los resultados obtenidos. Palabras clave: Recuperación en internet, Motores de búsqueda, Rendimiento de la recuperación.

Item type: Journal article (Paginated)
Keywords: Search engines; Web retrieval; Performance; Recall; Precision; Effectiveness; Motores de búsqueda; Recuperación de información en la Web; Exhaustividad; Precisión; Rendimiento; Eficacia
Subjects: L. Information technology and library technology > LS. Search engines.
Depositing user: Carlos Benito
Date deposited: 08 Nov 2006
Last modified: 02 Oct 2014 12:05
URI: http://hdl.handle.net/10760/8332

References

Abad García, María Francisca. “Evaluación de los componentes de los sistemas de recuperación de la información”. En: Investigación evaluativa en documentación: aplicación a la documentación médica. Valencia: Universitat de València, 1997, pp. 125-163.

Abad García, María Francisca. “Evaluación de la eficacia de los SRI”. En: Investigación evaluativa en documentación: aplicación a la documentación médica. Valencia: Universitat de València, 1997, pp. 85-122.

Alonso Berrocal, José Luis. Cibermetría: Análisis de los dominios web españoles. Tesis doctoral. Universidad de Salamanca, 2000.

Amat, Carlos B. “Limitaciones en el nivel de representación, las posibilidades de recuperación y la cobertura relativa de los sistemas españoles de recuperación de información distribuida en internet”. En: Revista española de documentación científica, 2002, n. 25, pp. 329-338.

Amat, Carlos B. “Caracterización de una muestra de sedes web españolas bajo dominio .es”. En: Boletín de RedIris, 2003, n. 64, pp. 33-40.

Amat, Carlos B. “Evaluación de sistemas españoles de recuperación de información distribuida en Internet». Tesis doctoral. Universitat de València, 2004.

Bailey, P.; Craswell, N.; Hawking, D. “Engineering a multi-purpose test collection for web retrieval experiments”. En: Information processing and management, 2003, n. 39, pp. 853-871.

Baró i Queralt, Jaume. “Cerca i recuperació d’informació al world wide web: una aproximació a les eines disponibles”. En: Jornades catalanes de documentació, 1997, pp. 469-479.

Bellardo Hahn, Trudi. “Text retrieval online: historical perspective on web search engines”. En: Bulletin of the American Society for Information Science, 1998, n. 24, pp. 7-10.

Can, F.; Nuray, R.; Sevdik, A. B. “Automatic performance evaluation of web search engines”. En: Information processing; management, 2004, n. 40, pp. 495-514.

Castells, Manuel. Internet y la sociedad red: lección inaugural del programa de doctorado sobre la sociedad de la información y el conocimiento. Universitat Oberta de Catalunya, 2001. Consultado en: 07-04-04. http://www.uoc.edu/web/esp/articles/castells/print.html

Gordon, M.; Pathak, P. “Finding information on the world wide web: the retrieval efectiveness of search engines”. En: Information processing and management, 1999, n. 35, pp. 144-180.

Gómez Díaz, R. “La evaluación en recuperación de la información”. En: Hipertext.net, 2003. Consultado en: 16-05-05. http://www.hipertext.net/web/pag188.htm

Gurrin, C.; Smeaton, A. “Replicating web structure in small-scale test collections”. En: Information retrieval, 2004 n. 7, pp. 239-263.

Harter, S.; Hert, C. “Evaluation of information retrieval systems: approaches, issues and methods”. En: Annual review of information science and technology, 1997, n. 32, pp. 3-94.

Lancaster, Frederick; Warner, Amy. “Evaluation criteria and evaluation procedures”. En: Information retrieval today. Arlington: Information Resources Press, 1993, pp. 159-202.

Leighton, Vernon H.; Srivastava, J. “First 20 precision among world wideweb search services (search engines)”. En: Journal of the American Society for Information Science, 1999, v. 50, n. 10, pp. 870-881.

López Alonso, M.; Mares Marín, J. “El futuro de la identificación de la información en internet”. En: Fesabid, 1996, pp. 513-518.

Maldonado Martínez, Ángeles; Fernández Sánchez, Elena. “Evaluación de los principales ‘buscadores’ desde un punto de vista documental: recogida, análisis y recuperación de recursos de información”. En: Fesabid, 1998, pp. 529-551.

Marcos Mora, Mari Carmen. “Motores de recuperación de información: un análisis comparativo (parte 1)”. En: El profesional de la información, 1998a, v. 7, n. 1-2, pp. 18-22.

Marcos Mora, Mari Carmen. “Motores de recuperación de información: un análisis comparativo (parte 2)”. En: El profesional de la información, 1998b, v. 7, n. 3, pp. 13-20.

Martínez Méndez, F. Javier. Propuesta y desarrollo de una metodología para la evaluación de la recuperación de información en internet. Universidad de Murcia, 2001.

Martínez Méndez, F. Javier; Rodríguez Muñoz, José Vicente. Síntesis y crítica de las evaluaciones de la efectividad de los motores de búsqueda en la web. En: Information research, 2003. Consultado en: 16-05-05. http://informationr.net/ir/8-2/paper148.html

Ministerio de Ciencia y Tecnología. Orden CTE/662/2003, de 18 de marzo, por la que se aprueba el Plan Nacional de nombres de dominio de internet bajo el código de país correspondiente a España («.es»). En: Boletín oficial del estado, 2003, n. 73, pp. 11.917-11.924.

Olvera Lobo, María Dolores. Evaluación de la recuperación de información en internet: un modelo experimental. Facultad de Biblioteconomía y Documentación, Universidad de Granada, 1999.

Olvera Lobo, María Dolores. “Rendimiento de los sistemas de recuperación de información en la world wide web: revisión metodológica”. En: Revista española de documentación científica, 2000, n. 23, pp. 63-78.

Olvera Lobo, María Dolores. “Rendimiento de los sistemas de recuperación de información en la web: evaluación de servicios de búsqueda (search engines)”. En: Revista española de documentación científica, 2000, n. 23, pp. 302-316.

Oppenheim, Charles; Morris, A.; Mcknight, C.; Lowley, S. “The evaluation of www search engines”. En: Journal of documentation, 2000, n. 52, pp. 190-211.

PricewaterhouseCoopers. Estudio de la industria de contenidos digitales en España. Price Waterhouse Coopers España 2004. Consultado en: 07-04-05. http://www.pwc.com/es/esp/ins-sol/spec-int/ind_contenidos.html

Salton, Gerard; McGill, Michael. Retrieval evaluation. En: Introduction to modern information retrieval. New York: McGraw-Hill, 1983, pp. 157-197.

Sánchez Montero, J. “Hacia una optimización de los recursos de internet en la empresa”. En: Revista española de documentación científica, 1997, n. 20, pp. 52-60.

Senso, J. A. “Herramientas para realizar búsquedas en internet: una revisión”. En: El profesional de la información, 1998, n. 7, pp. 24-25.

Travis, Irene. “From ‘storage and retrieval systems’ to ‘search engines’: text retrieval in evolution”. En: Bulletin of the American Society for Information Science, 1998, n. 24.

Vaughan, Liwen. “New measurements for search engine evaluation proposed and tested”. En: Information processing and management, 2004, v. 40, n. 4, pp. 677-691.

Winer, B. “Design and analysis of single-factor experiments”. En: Statistical principles in experimental design, 2nd ed. New York: McGraw-Hill, 1962, pp. 149-260.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item