E-LIS, Eprints in Library and Information Science Homepage E-LIS, Eprints in Library and Information Science
   home   |   about   |   search   |   browse   |   register   |   registered users area   |   help   |   FAQ   |   JITA   

Evaluación de sistemas españoles de recuperación de información distribuída en Internet

Amat, Carlos B. (2005) Evaluación de sistemas españoles de recuperación de información distribuída en Internet. PhD thesis, Departamento de Historia de la Ciencia y Documentación, Universidad de Valencia (Spain).

Full text available as:
PDF - Requires Adobe Acrobat Reader or other PDF viewer.

View statistics for this eprint

Abstract

[Spanish abstract]

El conjunto de espacios informativos que, colectivamente, se denomina Internet, plantea serios desafíos desde el punto de vista de la documentación y la recuperación de información. Parece conveniente introducir este conjunto de problemas con una revisión de la evolución de Internet que, más que centrarse en los desarrollos técnicos, atienda a la progresiva configuración de su contenido informativo. Desde este punto de vista, Internet parece haber evolucionado en sentido centrífugo desde un estado de homogeneidad temática hasta un universo de gran heterogeneidad. Este acercamiento permite caracterizar de forma conveniente el universo documental que alberga y sus propiedades, que lo diferencian mucho del universo documental tradicional, alrededor de documentos y fuentes de información estructurados. Tras esta revisión, se examinan los sistemas para la recuperación de la información distribuida desarrollados en cada uno de los espacios que han venido integrándose en Internet y, especialmente, los del espacio Web. Más que disponerlos en orden cronológico, se propone una clasificación funcional de estos sistemas y se atiende a las ventajas e inconvenientes de cada modelo. Por último, se revisan los trabajos que han intentado evaluar los sistemas de recuperación de información distribuida como paso previo a establecer un plan de trabajo que permita evaluar los sistemas españoles de recuperación de información en Internet.
El examen de la evolución de Internet, el análisis de las características de la información y los documentos que contiene, el establecimiento de una taxonomía de sistemas para su recuperación y los métodos de evaluación de estos mismos sistemas se basan en una revisión de la literatura amplia, pero especialmente centrada en las aportaciones más recientes y procedentes con frecuencia de campos no estrictamente relacionados con la documentación tradicional.

[English abstract]

The set of information spaces collectively referred as Internet poses serious problems to information retrieval tasks. Content evolution of Internet spaces and documents is reviewed and distinctive features of web documents are empathized. Web search engines are classified according to their scope, functionalities and retrieval philosophy. A chapter is devoted to the characterization of Spanish web though the study of a random set of web sites, their quantitative composition and their qualitative features.
The analysis of search engines of the Spanish web begins with a study of coverage, methods of crawling, data schema and indexing mechanisms. Finally, eight search engines (AltaVista, EnlaWeb, Lycos, Olé/Terra, Ozú, Sol, Ya and Yahoo) were evaluated in retrieving information from Spanish web space. Indicators chosen were their relative coverage, specific offering, proportion of dead links and accessibility of Spanish websites. Performance was determined by relative recall and precision in retrieval during the first quarter in 2003. Search topics and relevance of results were determined by the end users. 12,4% of the searches led to dead links and 76% of the pages were returned by only a single system. System performance, expressed in terms of recall ranged from 7% (AltaVista) to 14% (Ozú) and precision between 9% (Sol) and 30% (Ozú). Only Yahoo displayed typical inverse relationship between recall and precision figures. The rest of the systems invariably showed an increase in precision figures starting with the second or third search result, suggesting problems with the sorting algorithm.

Keywords:Search Engines; Web search; Retrieval evaluation
Subjects:L. Information technology and library technology. > LS. Search engines.
ID Code:12199
Deposited By:Benito, Carlos
Deposited On:12 December 2007
All fields:Show all fields

Diameter of the World-Wide Web (1999). Nature, 401 (6749): 130-131.

20 Year Usenet Timeline (2003). Google, Inc [Online]. Accesible en: http://www.google.com/googlegroups/archive_announce_20.html (3 de Julio, 2003)

The Open Directory Project (2003). Wikipedia [Online]. Accesible en: http://www.wikipedia.org/wiki/Open_Directory_Project (6 de Agosto, 2003)

Abad García, M. (1997). Evaluación de los componentes de los sistemas de recuperación de la información. En: Investigación Evaluativa en Documentación (pp. 125-163). Valencia: Universitat de València.

Abad García, M. (1997). Evaluación de la eficacia de los SRI. En: Investigación evaluativa en Documentación: Aplicación a la Documentación Médica (pp. 85-122). Valencia: Universitat de València.

Abiteboul, S., Preda, M., Cobena, G(2003): Adaptive On-Line Page Importance Computation. Twelfth International World Wide Web Conference. 20 de mayoo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Adamic, L. Huberman, B. (2001). The Web's Hidden Order. Communications of the ACM, 44 (9): 55-59.

Adell, J : WWW and gopher statistics? (Respuesta) [Online]. Accesible en: http://groups.google.com/groups?hl=es&lr=&ie=UTF-8&oe=UTF-8&selm=jordi-150394110424%40bembo.edu.uji.es. (15 de Marzo, 1994)

Adell, J. (2002). Arqueología digital: Los primeros servidores web de España. Universitat Jaume I, Departament de Noves Tecnologies en Educació [Online]. Accesible en: http://nti.uji.es/~jordi/historia_spain_web/html/index.html (13 de Febrero, 2003)

Aguilló, I.(2000): Internet invisible o Infranet: definición, clasificación y evaluación. Séptimas Jornadas Españolas de Documentación.19 de octubre de 2000. Bilbao, FESABID.

Tsoi, A.S., Morini, G., Scarselli, F., Hagenbuchner, M., Maggini, M. (2003): Adaptive Ranking of Web Pages. Twelfth International World Wide Web Conference. 20 de Mayo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Aldana Montes, J., Gómez Lora, A., Moreno Vergara, N., Roldán García, MM (2002). Querying the Semantic Web: Feasibility Issues. UPGrade, 3 (4).

Alonso Berrocal, J. (2000). Cibermetría. Análisis de los dominios Web españoles: recuperación en internet. Tesis doctoral. Universidad de Salamanca.

Amat, C. B. (1998). Sistemas de recuperación de información distribuida en Internet. Una revisión de su evolución, sus características y sus perpectivas. Primera parte. Revista Española de Documentación Científica, 21 (4): 463-474.

Amat, C. B. (1999). Recuperación en Internet: Cuatro modelos complementarios y una agenda para su integración. Boletín de RedIRIS,(48).

Amat, C. B. (2003). Caracterización de una muestra de sedes Web españolas bajo dominio .es. Boletín de RedIRIS,(64): 33-40.

Andreesen, M : NCSA Nosaic for X 0.10 available [Online]. Accesible en: http://groups.google.com/groups?selm=MARCA.93Mar14225600%40wintermute.ncsa.uiuc.edu. (14 de Marzo, 1993)

Arasu, A., Cho, J., García-Molina, H., Paepcke, A., Raghavan, S. (2001). Searching the Web. ACM Transactions on Internet Technology, 1 (1): 2-43.

AT&T (1995). AT&T to include FrontPage in Easy World Wide Web Service. AT&T [Online]. Accesible en: http://www.att.com/news/1195/951121.bsa.html

Baeza-Yates, R. Ribeiro-Neto, B. (1999). Searching the Web. In Modern Information Retrieval (pp. 367-396). Harlow: Pearson Education.

Baeza-Yates, R. (2002). The Web of Spain . UPGrade [Online]. Accesible en: http://www.upgrade-cepis.org/issues/2002/3/upgrade-vIII-3.html (21 de Octubre, 2003)

Baeza-Yates, R. Saint-Jean, F. (2003). Análisis de consultas a un buscador y su aplicación a la jerarquización de páginas web. BiD [Online]. Accesible en: http://www2.ub.es/bid/consulta_articulos.php?fichero=10baeza.htm (23 de Septiembre, 2003)

Baeza-Yates, R. (2004). Excavando la Web. El Profesional de la Información, 13 (1): 4-10.

Baeza-Yates, R. (2003). Information retrieval in the Web: beyond current search engines. International Journal of Approximate Reasoning, 34 (2-3): 97-104.

Bailey, P., Craswell, N., Hawking, D. (2003). Engineering a multi-purpose test collection for Web retrieval experiments. Information Processing and Management, 39 (6): 853-871.

Bar-Ilan, J. (1998). On the overlap, the precision and estimated recall of search engines. A case study of the query 'Erdos'. Scientometrics, 42 (2): 207-228.

Bar-Ilan, J. (1999). Search Engine Results over Time: A Case Study on Search Engine Stability. Cybermetrics, 2-3 (1): 1.

Bar-Ilan, J. (2003). How much information do search engines disclose on the links to a web page? A longitudinal case study of the 'cybermetrics' home page. Journal of Information Science, 28 (6): 455-466.

Baró i Queralt, J.(1997): Cerca i recuperació d'informació al World Wide Web: una aproximació a les eines disponibles. Sisenes Jornades Catalanes de Documentació. 23 de Octubre de 1997. Barcelona: FESABID; SOCADI.

Bates, M. (2002). After the Dot-Bomb: Getting Web Information Retrieval Right This Time. First Monday [Online]. Accesible en www.firstmonday.dk/issues/issue7_7/bates/ (20 de septiembre, 2002)

Beaver, A. (1998). Evaluating Search Engine Models for Scholarly Purposes: A report from the Internet Applications Laboratory. D-Lib Magazine [Online]. Accesible en: http://www.dlib.org/dlib/diciembre98/12beavers.html (20 de septiembre, 2002)

Beckett, D.(1997): 30% Accessible - A Survey of The UK Wide Web. 6th World Wide Web Conference. Santa Clara (California), International World Wide Web Consortium.

Behlendorf, B : MCC's EINet(TM) Introduces Galaxy, an Internet Directory Service [Online]. Accesible en: http://groups.google.com/groups?q=einet+galaxy&hl=es&lr=&ie=UTF-8&oe=UTF-8&selm=2i2l2f%24goc%40agate.berkeley.edu&rnum=1. (20 de enero, 1994)

Bellardo Hahn, T. (1998). Text Retrieval Online: Historical Perspective on Web Search Engines. Bulletin of the American Society for Information Science, 24 (4): 7-10.

Bergman, M. (2001). The Deep Web: Surfacing Hidden Value. Journal of Electronic Publishing [Online]. Accesible en: http://www.press.umich.edu/jep/07-01/bergman.html (11 de julio, 2003)

Bergonneau, M. (2002). The French Connection: Minitel meets the Web. Onlie Journalism Review [Online]. Accesible en: http://www.ojr.org/ojr/business/1017968245.php (11 de enero, 2004)

Berners-Lee, T. (1989). Information Management: A Proposal. W3 Archive [Online]. Accesible en: http://www.w3.org/History/1989/proposal.html (11 de julio, 2003)

Berners-Lee, T (1991): WorldWideWeb: Summary [Online]. Accesible en: http://groups.google.com/groups?selm=6487@cernvax.cern.ch. (6 de agosto, 2003)

Berners-Lee, T., Caillou, R., Groff, J., Pollermann, B. (1992). World-Wide Web: The Information Universe . Electronic Networking: Research, Applications and Policy, 1 (2): 78-84.

Berners-Lee, T. (1996). The World Wide Web: Past, Present and Future. W3 Archive [Online]. Accesible en: http://www.w3.org/People/Berners-Lee/1996/ppf.html (15 de julio, 2003)

Berners-Lee, T. (1998). Semantic Web Road map. World Wide Web Consortium [Online]. Accesible en: http://www.w3.org/DesignIssues/Semantic.html (17 de septiembre, 2003)

Berners-Lee, T., Hendler, J., Lassila, O. (2001). The Semantic Web. Scientific American (mayo, 2001).

Berrocal, J., Figuerola, C., Zazo, A., Rodríguez, E.(2002): La Cibermetría en la recuperación de información en el Web. Primeras Jornadas de Tratamiento y Recuperación de la Información. 4 y 5 de julio de 2002, Valencia.

Berrocal, J., Figuerola, C., Zazo, A., Rodríguez, E. (2003). Agentes inteligentes: recuperación autónoma de la información en la Web. Revista Española de Documentación Científica, 26 (1): 11-20.

Bharat, K. Broder, A.(1998): A technique for measuring the relative size and overlap of public Web search engines. 7th International WWW Conference. 14 de abril de 1998. Brisbane.

Bharat, K (2001): Ranking search results by reranking the results based on local inter-connectivity. United States Patent 6,526,440

Borlund, P. (2000). Experimental components for the evaluation of interactive information retrieval systems. Journal of Documentation, 56 (1): 71-90.

Borlund, P. (2003). The IIR evaluation model: a framework for evaluation of interactive information retrieval systems. Information Research [Online]. Accesible en: http://informationr.net/ir/8-3/paper152.html (15 de enero, 2004).

Bowman, C., Danzig, P., Hardy, D., Manber, U., Schwartz, M.(1995): The Harvest Information Discovery and Access System.1 de Octubre de 1994. Chicago: National Center for Supercomputing Applications.

Bray, T. (1996). Measuring the Web. Computer Networks and ISDN Systems, 28 (7-11): 993-1005.

Brewington, B. Cybenko, G. (2000). How dynamic is the Web ? Computer Networks, 33 (1-6): 257-276.

Brin, S. Page, L. (1998). The anatomy of a large-scale hypertextual Web search engine. Computer Networks and ISDN Systems, 30 (1-7): 107-117.

Broder, A. (2000). Graph structure in the Web. Computer Networks, 33 (1-6).

Broder, A. (2002). A taxonomy of web search. SIGIR Forum, 36 (2).

Broder, A., Najork, M., Wiener, J.(2003): Efficient URL Caching for World Wide Web Crawling. Twelfth International World Wide Web Conference. 20 de mayoo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Brooks, T. (2003). Web search: how the Web has changed information retrieval. Information Research [Online]. Accesible en: http://informationr.net/ir/8-3/paper154.html (15 de enero, 2004).

Bruce, H. (1998). User satisfaction with information seeking on the Internet. Journal of the American Society for Information Science, 49 (6): 541-556.

Bumgarner, J. (2002). The Great Renaming: 1985 - 1988. James Madison University [Online]. Accesible en: http://www.vrx.net/usenet/history/rename/ (3 de julio, 2003)

Burrows, M (1998): Method for statistically projecting the ranking of information. Unites States Patent 5,765,150

Bush, R. (1993). FidoNet: technology, tools, and history. Communications of the ACM, 36 (8): 31-35.

Butler, D. (1999). The writing is on the Web for Science journals in print. Nature, 397 (6716): 195-200.

Caillou, R. (2002). A Little History of the World Wide Web: from 1945 to 1995 Rev 1.39. Web Consortium [Online]. Accesible en: http://www.w3.org/History.html (14 de julio, 2003)

Calanag, M. L. (2003). Public libraries in the information society: what do information policies say. World Library and Information Congress: 69th IFLA General Conference and Council . 1 de agosto, 2003. Berlin, IFLA. [Online]. Accesible en http://www.ifla.org/IV/ifla69/papers/112e-Calanag.pdf (5 de febrero, 2004)

Can, F., Nuray, R., Sevdik, A. B. (2004). Automatic performance evaluation of Web search engines. Information Processing Management, 40 (3): 495-514.

Castells, M. (2001). Internet y la sociedad red: Lección inaugural del programa de doctorado sobre la sociedad de la información y el conocimiento. Universitat Oberta de Catalunya [Online]. Accesible en: http://www.uoc.edu/web/esp/articles/castells/print.html (7 de abril, 2004)

Castillo Blasco, L., Martínez de Pablos, M., Server, G. (1999). Evaluación de la información contenida en seis sedes web de las Escuelas Universitarias y Facultades de Biblioteconomía y Documentación españolas. Revista Española de Documentación Científica, 22 (3): 325-332.

Castillo Sobrino, M. d., Serrano Moreno, J., Sesmero Llorente, M.(2003): Arquitectura multiagente para la asignación de categorías a textos. Segundas Jornadas de Tratramiento y Recuperación de la Información. 8 de Septiembre de 2003. Leganés: Universidad Carlos III.

Cerf, V., Dalal, Y., Sunshine, C. (1974). RFC 675: Specification of Internet transmission control program. Network Information Center Network Working Group [Online]. Accesible en: http://www.cis.ohio-state.edu/cgi-bin/rfc/rfc0675.html (29 de enero, 2003)

Chankhunthod, A., Danzig, P., Neerdaels, C., Schwartz, M., Worrel, K., c (1996). A Hierarchical Internet Object Cache. Proceedings of the 1996 Usenix Technical Conference [Online]. Accesible en: http://www.usenix.org/publications/library/proceedings/sd96/full_papers/danzig-html/cache.html (22 de enero, 1996)

Cho, J. García-Molina, H.(2000): The Evolution of the Web and Implications for an Incremental Crawler. VLDB Conference.1 de Septiembre de 2000. El Cairo, Very Large Data Base Endowment Inc. [Online]. Accesible en: http://www.vldb.org/dblp/db/conf/vldb/ChoG00.html (15 de agosto, 2003)

Claffy, K. (2000). Measuring the Internet. IEEE Internet Computing, 4 (1): 73-75.

Clarke, S. Willett, P. (1997). Estimating the recall perfomance of Web search engines. ASLIB Proceedings, 49 (7): 184-189.

Clever Project (1999). Hypersearching the Web. Scientific American,(junio, 1999).

Codina, L. (2003). La Web semántica: una visión crítica. El Profesional de la Información, 12 (2): 149-152.

Comisión del Mercado de las Telecomunicaciones (2001). Estudio sobre la presencia de las entidades españolas (.es) en Internet. Novatica,(152): 42-44.

Computer Museum History Center (2002). Timeline of Computer History. Computer Museum History Center [Online]. Accesible en: http://www.computerhistory.org/timeline/ (5 de febrero, 2003)

Corbalán, L. M. Amat, C. B. (2003). Vocabulario de información y documentación automatizada. Valencia: Universitat de València.

Corchuelo, R., Arjona, J., Toro, M. (2002). Automatic Extraction of Semantically-Meaningful Information from the Web. UPGrade, 3 (3).

Corporation for Research and Educational Networking (1997). CREN History and Future. Corporation for Research and Educational Networking [Online]. Accesible en: http://www.cren.net/cren/cren-hist-fut.html (7 de febrero, 2003)

Courtois, M. Berry, M. (1999). Results ranking in Web search engines. Online Magazine, 23 (3): 39.

Craven, T. C. (2004). Variations in use of meta tag descriptions by Web pages in different languages. Information Processing Management, 40 (3): 479-493.

Crimmins, F., Smeaton, A., Dkaki, T., Mothe, J. (1999). TétraFusion: Information Discovery on the Internet. IEEE Intelligent Systems, 14 (4): 55-62.

Croft, W. Turtle, H.(1989): A Retrieval Model Incorporating Hypertext Links. Proceedings of the second annual ACM conference on Hypertext. 1 de Noviembre de 1989. Pittsburgh, ACM.

Culliss, G (1999): Method for organizing information. United States Patent 6,006,222

Danzig, P., Obraczka, K., Li, S. (1993). Internet Resource Discovery Services. IEEE Computer, 26 (9): 8-22.

Dasen, M. Wilde, E.(2001): Keeping Web indices up-to-date. Tenth International World Wide Web Conference.1 de Mayo de 2001. Hong Kong, International World Wide Web Consortium.

Davila, R. (2000). History and Development of the Internet. San Antonio Public Library: Government Documents [Online]. Accesible en: http://www.sat.lib.tx.us/Displays/itintro.htm (31 de Enero, 2003)

Dekkers, M. Weibel, S. (2003). State of the Dublin Core Metadata Initiative, Abril 2003. D-Lib Magazine [Online]. Accesible en: http://www.dlib.org/dlib/april03/weibel/04weibel.html (15 de enero, 2004).

Deutsch, P. Emtage, A.(1992): Archie: An Electronic Directory Service for the Internet. Proceedings of Usenix.1 de Enero de 1992. San Francisco, USENIX.

Dhyani, D, Keong Ng, W, Bhowmick, SS (2002). A survey of Web Metrics. ACM Computing Surveys, 34 (4): 469-503.

Digital Equipment Corporation : Digital develops Internet's first "Super Spider" [Online]. Accesible en: http://groups.google.com/groups?selm=9512151806.AA02246%40raptor.pa.dec.com. (15 de diciembre, 2003)

Dill, S., Kumar, R., Mccurley, K., Rajagopalan, S., Sivakumar, D., Tomkins, A. (2002). Self-similarity in the web. ACM Transactions on Internet Technology, 2 (3): 205-223.

Douglis, F., Feldmann, A., Krishnamurthy, B., Mogul, J. (1997). Rate of Change and other Metrics: a Live Study of the World Wide Web. USENIX Symposium on Internet Technologies and System. 8 de diciembre, 1997. Monterrey, USENIX.

Dublin Core Metadata Initiative (2003). Dublin Core Metadata Element Set, Version 1.1: Reference Description. OCLC DCMI [Online]. Accesible en: http://www.dublincore.org/documents/dces/ (16 de septiembre, 2003)

Eckmann, J. Moses, E. (2002). Curvature of co-links uncovers hidden thematic layers in the World Wide Web. Proceedings of the National Academy of Sciences USA, 99 (9): 5825-5829.

Eiron, N. Mccurley, K.(2003): Analysis of anchor text for web search. Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval. 28 de Julio de 2003. Toronto, ACM.

Emtage, A : Announcing "Archie 1.0": The Archive Server Server [Online]. Accesible en: http://groups.google.com/groups?q=archie+emtage&hl=es&lr=&ie=UTF-8&oe=UTF-8&selm=1990Nov15.045448.2861%40ox.com&rnum=1. (14 de noviembre, 1990)

Enos, L. (2001). Excite@Home is raising funds to improve its bottom line while at the same time taking steps to cut costs. E-Commerce Times [Online]. Accesible en: http://www.ecommercetimes.com/perl/story/11148.html (20 de agosto, 2002)

Escalona, M., Mejías, M., Torres, J. (2002). Methodologies to develop Web Information Systems and Comparative Analysis. UPGrade, 3 (3).

ESNIC (2003). Estadísticas del ES-NIC: Dominios registrados en los últimos años. ESNIC [Online]. Accesible en: https://www.nic.es/documentacion/estadisticas.html (30 de julio, 2003)

Faloutsos, M., Faloutsos, P., Faloutsos, C. (1999). On Power-Law Relationships of the Internet Topology . ACM SIGCOMM Computer Communication Review , Proceedings of the conference on Applications, technologies, architectures, and protocols for computer communication, 29 (4): 251-262.

Federal Networking Council (1995). FNC Resolution: Definition of "Internet" Federal Networking Council. [Online]. Accesible en http://www.hpcc.gov/fnc/Internet_res.html (11 de septiembre, 2002).

Fernández Beobide, C. González Obiol, A. (1992). Videotex e Ibertex: Experiencias y realizaciones. Telos,(29).

Fetterly, D., Manasse, M., Najork, M., Wiener, J.(2003): A Large-Scale Study of the Evolution of Web Pages. Twelfth International World Wide Web Conference. 20 de Mayo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Fichter, D. (2003). Exploiting intranet search engines for data discovery. Online, 27 (6): 47.

Fidel, R., Davies, R., Douglas, M., Holder, J., Hopkins, C., Kushner, E. et al. (1999). A visit to the information mall: Web searching behavior of high school students. Journal of the American Society for Information Science, 50 (1): 24-37.

Ford, G. (2001). Theory and Practice in the Networked Environment: A European Perspective. In C.McClure J. Bertot (Eds.), Evaluating Networked Information Services. Techniques, Policy and Issues (pp. 1-22). Melford: Information Today.

Ford, N. Miller, D. M. N. (2001). The role of individual differences in Internet searching: An empirical study. Journal of the American Society for Information Science and Technology, 52 (12): 1049-1066.

Foster, S : Veronica: an Archie for Gopher [Online]. Accesible en: http://groups.google.com/groups?q=veronica+nevada+university+group:comp.infosystems.gopher&start=20&hl=es&lr=&ie=UTF-8&oe=UTF-8&scoring=d&selm=9211180514.AA01778%40pyramid&rnum=25. (17 de noviembre, 2003)

Fox, E. Urs, S. (2002). Digital Libraries. Annual Review of Information Science and Technology, 36: 503-589.

Fragoudis, D. Likothanassis, S.(1999): Retriever: an agent for intelligent information recovery. Proceedings of the 20th International Conference on Information Systems.12 de Diciembre de 1999. Charlotte (NC).

García Barriocanal, H., Sicilia Urbán, M., Aedo Cuevas, I. (2003). Ontology-Based Annotation of Usability Evaluation-Related Resources: Design and Retrieval Mechanisms . UPGrade, 4 (1): 12-17.

García Santiago, M. (2000). Topología de la información en la World Wide Web: Modelo metodológico de visualización en una red hipertextual nacional. Tesis doctoral. Universidad de Granada.

García, J. (1998). IRIS-NEWS: la aventura de la Usenet en RedIRIS. Boletín de RedIRIS,(44).

Garratt, A., Jakson, M., Burden, P., Wallis, J. (2001). A survey of alternative designs for a search engine storage structure. Information and Storage Technology, 43 (11): 661-677.

Glover, E., Tsioutsiouliklis, K., Lawrence, S., Pennock, D., Flake, G.(2002): Using Web Structure for Classifying and Describing Web Pages. Eleventh International World Wide Web Conference. 7 de Mayo de 2002. Honolulu. International World Wide Web Consortium.

Google Groups Team (2001). Google Groups Archive Information. google.public.support.general [Online]. Accesible en: http://groups.google.com/groups?selm=90cbefb1.0112211728.4cfe9bb%40posting.google.com (8 de julio, 2003)

Gorbunov, A. (2002). Relevance of Web documents: Ghosts consensus method. Journal of the American Society for Information Science and Technology, 53 (10): 783-788.

Gordon, M. Pathak, P. (1999). Finding information on the world wide web: the retrieval efectiveness of search engines. Information Processing and Management, 35 (2): 144-180.

Gómez Díaz, R. (2003). La evaluación en recuperación de la información. Hipertext.net [Online]. Accesible en: http://www.hipertext.net/web/pag188.htm (5 de noviembre, 2003)

Gravano, L., Chang, K., García Molina, H., Lagoze, C., Paepcke, A. (1997). STARTS: Stanford Protocol Proposal for Internet Retrieval and Search. Digital Library Project Stanford University [Online]. Accesible en: http://www-db.stanford.edu/~gravano/starts.html (15 de septiembre, 2003)

Greco, G., Greco, S., Zumpano, E. (2001). A Probabilistic Approach for Distillation and Ranking of Web Pages. World Wide Web, 4: 189-207.

Griffiths, R. (2002). History of Internet, Internet for Historians (and just about everyone else). Leiden University [Online]. Accesible en: http://www.let.leidenuniv.nl/history/ivh/frame_theorie.html (2 de julio, 2003)

Guha, R., McCool, R., Miller, E.(2003): Semantic Search. Twelfth International World Wide Web Conference. 20 de Mayo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Gurrin, C. Smeaton, A. (2004). Replicating Web Structure in Small-Scale Test Collections. Information Retrieval, 7 (3-4): 239-263.

GVU's WWW Surveying Team (1998). GVU's Tenth WWW User Survey (Conducted Octubre 1998). Georgia Institute of Technology [Online]. Accesible en: http://www.gvu.gatech.edu/user_surveys/survey-1998-10/ (30 de septiembre, 2003)

Haas, S. Grams, E. (2000). Readers, Authors, and Page Structure: A Discussion of Four Questions Arising from a Content Analysis of Web Pages. Journal of the American Society for Information Science, 51 (2): 181-192.

Hald, A. (1952). Statistical Tables and Formulas. (s.l.): Wiley.

Han, Y., Loke, S., Sterling, L. (1996). Agents for Citation Finding on the World Wide Web . Technical Report 96/40. Parkville, University of Melbourne.

Hardy, D., Schwartz, M., Wessels, D. (1996). Harvest User's Manual Version 1.4 patchlevel 2. Internet Research Task Force Research Group on Resource Discovery [Online]. Accesible en: http://harvest.sourceforge.net/harvest-1.4.pl2-docs/user-manual.html (15 de septiembre, 2003)

Hardy, H. (1993). The History of the Net v8.5. Master Thesis. School of Communications, Grand Valley State University.

Harter, S. Hert, C. (1997). Evaluation of Information Retrieval Systems: Approaches, Issues and Methods. Annual Review of Information Science and Technology, 32: 3-94.

Hauben, M. Hauben, R. (1996). Netizens: On the History and Impact of the Net. Columbia University [Online]. Accesible en: http://www.columbia.edu/~rh120/ (2 de julio, 2003)

Hausherr, T. (2001). Xenu's Link Sleuth (Version 1.1c) [Programa informático]. Berlin.

Hawking, D., Craswell, N., Thistlewaite, P., Harman, D. (1999). Results and challenges in Web search evaluation. Computer Networks, 31 11-16.

Hawking, D., Craswell, N., Bailey, P., Griffiths, K. (2001). Measuring Search Engine Quality. Information Retrieval, 4 (1): 33-59.

Hawking, D. Robertson, S. (2003). On Collection Size and Retrieval Effectiveness. Information Retrieval, 6 (1): 99-105.

Heery, R. (1996). Review of Metadata Formats. Program, 30 (4): 345-373.

Hendler, J. (1999). Web Matters: Is there an Intelligent Agent in Your Future ? Nature [Online]. Accesible en: http://www.nature.com/nature/webmatters/agents/agents.html (10 de diciembre, 2003)

Hendler, J. (2001). Agents and the Semantic Web. IEEE Intelligent Systems, 16 (2): 30-37.

Henzinger, M., Heydon, A., MIzenmacher, M., Najork, M. (1999). Measuring index quality using random walks on the Web. Computer Networks, 31 1291-1303.

Henzinger, M., Bay-Wei Chang, Brian Milch, Sergey Brin(2003): Query-Free News Search. Twelfth International World Wide Web Conference. 20 de Mayo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Hermans, B. (1996). Intelligent Software Agents on the Internet: an inventory of currently offered functionality in the information society and a prediction of (near-)future developments. Doctoral Dissertation Tilburg University [Online]. Accesible en: http://www.broadcatch.com/agent_thesis/ (24 de septiembre, 2003)

Hermans, B. (1997). Intelligent Software Agents on the Internet. First Monday [Online]. Accesible en: http://www.firstmonday.dk/issues/issue2_3/index.html (24 de septiembre, 2003)

Hermans, B. (1998). Desperately Seeking: Helping Hands and Human Touch. First Monday [Online]. Accesible en: http://www.firstmonday.dk/issues/issue3_11/index.html (24 de septiembre, 2003)

Herring, S. (2002). Computer-Mediated Communication on the Internet. Annual Review of Information Science and Technology, 36: 109-168.

Hípola, P. Vargas Quesada, B. (1999). Agentes inteligentes, definición y tipología. Los agentes de información. El Profesional de la Información, 8 (4): 13-21.

Hölscher, C. Strube, G.(2000): Web Search Behavior of Internet Experts and Newbies. Ninth International World Wide Web Conference. 15 de Mayo de 2000. Amsterdam: Centre for Mathematics and Computer Science; International World Wide Web Consortium.

Hsieh-Yee, I. (1998). The retrieval power of selected search engines: how well do they address general reference questions and subject questions? Reference Librarian, 60 27-47.

Huberman, B., Pirolli, P., Pitkow, J., Lukose, R. (1998). Strong Regularities in World Wide Web Surfing. Science, 280 (5630): 95-97.

Huberman, B. Adamic, L. (1999). Growth dynamics of the World-Wide Web. Nature, 401 (6749): 131.

Huberman, B. (2002). Patterns in the World Wide Web. Libray of Economics and Liberty [Online]. Accesible en: http://www.econlib.org/library/Columns/Hubermanpatterns.html (5 de febrero, 2004)

Internet Society (2002). What is the Internet ? Internet Society [Online]. Accesible en: http://www.isoc.org/internet/index.shtml (3 de marzo, 2003)

Jansen, B. (1997). Using an intelligent agent to enhace search engine perfomance. First Monday [Online]. Accesible en: http://www.firstmonday.dk/issues/issue2_3/jansen/index.html (24 de septiembre, 2003)

Jansen, B. Pooch, U. (2001). A Review of Web Searching Studies and a Framework for Future Research. Journal of the American Society for Information Science, 52 (3): 235-246.

Jansen, B., Spink, A., Saracevic, T. (2002). Real life, real users, and real needs: a study and analysis of user queries on the web. Information Processing and Management, 36 (2): 207-227.

Jansen, B. Spink, A. An analysis of Web searching by European AlltheWeb.com users. Information Processing and Management, (en prensa).

Delort, J.Y., Bouchon-Meunier, B., Rifqi, M. (2003): Web Document Summarization by Context. Twelfth International World Wide Web Conference. 20 de Mayo de 2003. Budapest: Computer and Automation Research Institute of the Hungarian Academy of Sciences ; International World Wide Web Consortium.

Jenkins, C., Jackson, M., Burden, P., Wallis, J. (1998). Searching the World Wide Web: an evaluation of available tools and methodologies. Information and Storage Technology, 39 (14-15): 985-994.

Johnson, F., Griffiths, J., Hartley, R. (2001). DEVISE. A framework for the evaluation of Internet search engines (Rep. No. 100). London: British Library.

Johnstone, B. Carlson, D. (2002). History of Electronic Publishing: Teletext and Videotext. Applied Interactive Newspapers Syllabus, Univ of Florida [Online]. Accesible en: http://iml.jou.ufl.edu/carlson/professional/new_media/history/ehistory.htm (17 de julio, 2003).

Kahle, B. (1989). Wide Area Information Server Concepts v4 Draft. Thinking Machines Corporation [Online]. Accesible en: http://nti.uji.es/software/Simple/docs/wais-concepts.txt (20 de julio, 2003).

Kahle, B. Medlar, A. (1991). An Information System for Corporate Users: Wide Area Information Servers v3. Universidad de Heidelberg [Online]. Accesible en: http://www.urz.uni-heidelberg.de/Netzdienste/internet/tools/info/wais/corporate.html (23 de julio, 2003).

Kannan, N : Qualifiers on Hypertext links... [Online]. Accesible en: http://groups.google.com/groups?selm=1991Aug2.115241@ardor.enet.dec.com. (2 de agosto, 2003).

Kantor, B. Lapsley, P. (1986). RFC 977: Network News Transfer Protocol: A Proposed Standard for the Stream-Based Transmission of News. Network Working Group [Online]. Accesible en: ftp://ftp.isi.edu/in-notes/rfc977.txt (8 de julio, 2003).

Kessler, J. (1995). The French Minitel: Is There Digital Life Outside of the "US ASCII" Internet? A Challenge or Convergence? D-Lib Magazine [Online]. Accesible en: http://www.dlib.org/dlib/diciembre95/12kessler.html (5 de septiembre, 2002).

Khan, M. Khor, S. (2004). Enhanced Web document retrieval using automatic query expansion. Journal of the American Society for Information Science and Technology, 55 (1): 29-40.

Khare, R. Rifkin, A.(1998): The origin of (document) species. 7th International World Wide Web Conference. 14 de abril de 1998. Brisbane.

Kirsch, ST (1997): Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents. United States Patent 5,659,732.

Kleinberg, J. (1999). Authoritative sources in a hyperlinked environment. Journal of the ACM, 46 (5): 604-632.

Kleinberg, J (2000): Method and system for identifying authoritative information resources in an environment with content-based links between information resources. United States Patent 6,112,202.

Kleinberg, J. Lawrence, S. (2001). The Structure of the Web. Science, 294 1849-1850.

Kobayashi, M. Takeda, K. (2000). Information Retrieval on the Web. ACM Computing Surveys, 32 (2): 144-173.

Koch, T., Ardo, A., Brümer, A., Lundberg, S. (1996). The building and maintenance of robot based internet search services: A review of current indexing and data collection methods. NetLab Lund University Library [Online]. Accesible en: http://www.lub.lu.se/desire/radar/reports/D3.11/ (1 de septiembre, 2001).

Koehler, W. (1999). An Analysis of Web Page and Web Site Constancy and Perfomance. Journal of the American Society for Information Science, 50 (2): 162-180.

Koehler, W. (2002). Web page change and persistence: A four-year longitudinal study. Journal of the American Society for Information Science and Technology, 53 (2): 162-171.

Koehler, W. (2004). A longitudinal study of Web pages continued: a consideration of document persistence. Information Research [Online]. Accesible en: http://informationr.net/ir/9-2/paper174.html (5 de febrero, 2004)

Koster, M : ALIWEB (Archie-Like Indexing for the Web) [Online]. Accesible en: http://groups.google.com/groups?q=koster+aliweb+group:comp.infosystems.www+author:koster&hl=es&lr=&ie=UTF-8&oe=UTF-8&selm=1993Nov30.093536.28554%40cs.nott.ac.uk&rnum=1. (30 de noviembre, 2003).

Koster, M.(1994): ALIWEB - Archie-Like Indexing in the WEB. First International Conference on the World-Wide Web. 25 de mayoo, 1994. Geneva: CERN.