Acceso y recuperación de información en la World Wide Web. Análisis de motores de búsqueda y metabuscadores

Merlino-Santesteban, Cristian Acceso y recuperación de información en la World Wide Web. Análisis de motores de búsqueda y metabuscadores., 2001 Licenciatura, BSc thesis, Universidad Nacional de Mar del Plata. Facultad de Humanidades. [Thesis]

[img]
Preview
PDF
merlino-santesteban_c.pdf

Download (475kB) | Preview

English abstract

describes and analyzes the access and the information retrieval in the World Wide Web. First of all, it studies the operation of the motors search and the metasearchers. Secondly, it is shown the state of situation of the information retrieval at the Web, through tríad system-document-user. And finally, it evaluates the performance of search and metasearch motors in two preexperiments. The first one analyzes, emulating the conduct of the user, the arrangement by relevance of first the ten and twenty results of five motors search of greater cover in response to expressions search nonstructures. And the second, calculates the traditional measures of precision and thoroughness, determines the sly proportion of URLs and similarity between five finders and three metabuscadores using for its interrogation little frequent words.

Spanish abstract

Se describe y analiza el acceso y la recuperación de información en la World Wide Web. En primer lugar, se estudia el funcionamiento de los motores de búsqueda y los metabuscadores. En segundo lugar, se presenta un estado de situación de la recuperación de información web a través de tríada sistema-documento-usuario. Y por último, se evalúa el desempeño de motores de búsqueda y metabuscadores en dos preexperimentos. El primero, analiza, emulando la conducta del usuario, la ordenación por relevancia de los primeros diez y veinte resultados de cinco motores de búsqueda de mayor cobertura en respuesta a expresiones de búsqueda no estructuras. Y el segundo, calcula las medidas tradicionales de precisión y exhaustividad, determina la proporción de URLs solapados y similitud entre cinco buscadores y tres metabuscadores usando para su interrogación palabras poco frecuentes.

Item type: Thesis (UNSPECIFIED)
Keywords: Recuperación de la información, Motores de búsqueda, Metabuscadores, Rendimento, World Wide Web, Information retrieval, Search engines, Metasearch engines, Performance
Subjects: L. Information technology and library technology > LS. Search engines.
L. Information technology and library technology > LC. Internet, including WWW.
Depositing user: Cristian Merlino-Santesteban
Date deposited: 07 Jul 2008
Last modified: 02 Oct 2014 12:12
URI: http://hdl.handle.net/10760/11881

References

1. Aigrain, Philippe; Longueville, Véronique. A model for the evaluation of

expansion techniques in information retrieval systems. Journal of the American

Society for Information Science. 45(4), 1994. p. 225-234.

2. Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier, eds. Modern information

retrieval. New York : ACM Press, 1999. citado por Kobayashi, Mei; Takeda,

Koichi. Information retrieval on the Web, 2000. Disponible en:

<http://www.trl.ibm.co.jp/projects/s7710/dl/trlrep/rt347.ps>. (Consultado 4

octubre 2000)

3. Bar-llan, Judith. Search engine results over time : a case study on search

engine stability. Cybermetrics. 2/3, issue 1, paper 1, 1999. Disponible en:

<http://www.cindoc.csic.es/cybermetrics/articles/v2i1p1.html>. (Consultado 2

septiembre 2000).

4. Beaulieu, Micheline; Robertson, Stephen; Rasmussen, Edie. Evaluating

interactive systems in TREC. Journal of the American Society for Information

Science. 47(1), 1996. p. 85-94.

5. Bharat, Krishna; Broder, Andrei. Mirror, mirror on the Web : a study of host

pairs with replicated content, 1999. Proceedings of Eighth International World

Wide Web Conference, (1999, may 11-14 : Toronto). Disponible en:

<http://decweb.ethz.ch/WWW8/data/2147/html/index.htm>. (Consultado 20 abril

2000).

6. Blair, David C. STAIRS redux : thoghts on the STAIRS evaluation, ten years

after. Journal of the American Society for Information Science. 47(1), 1996. p.

4-22.

7. Brin, Sergey : Page, Lawrence. The anatomy of a large-scale hypertextual Web

search engine. Computer Networks and ISDN Systems. 30, 1998. p. 107-117.

8. Broder, Andrei [y otros]. Graph structure in the web: experiments and models,

2000. Proceedings of the Ninth International World Wide Web Conference,

(2000, may 15-19 : Amsterdan). Disponible en: <http://www9.org/w9cdrom/160/

160.html> (Consultado 7 octubre 2000).

9. Carriere, J; Kazman, R. Webquery : searching and visualizing the web through

connectivity, 1997. Proceedings of the Sixth International World Wide Web

Conference, (1997, april 7-11 : Santa Clara). Disponible en:

<http://decweb.ethz.ch/WWW6/Technical/Paper096/Paper96.html>. (Consultado

30 febrero 1999).

10. Chakrabarti, Soumen [y otros]. Mining the link structure of the World Wide Web.

IEEE Computer. 32(8), 1999.

11. Chen, Hsinchun [y otros]. A concept space approach to addressing the

vocabulary problem in scientific information retrieval : an experiment on the

Worm Community System, 1996. Disponible en: <http://ai.bpa.arizona.edu/

papers/wcs96/wcs96.html> (Consultado 2 octubre 2000).

12. Chu, Heting T.; Rosenthal, Marilyn. Search engines for the World Wide Web : a

comparative study and evaluation methodology, 1996. Proceedings of the 59th

ASIS Annual Meeting, (1996, oct. 21-24 : Baltimore). Disponible en:

<http://www.asis.org/annual-96/ElectronicProceedings/chu.html>. (Consultado

14 febrero 1999).

13. Courtois, Martin P.; Berry, Michael W. Results ranking in web search engines.

Online. 23(3), 1999, p. 39-46.

14. De Vocht, Josep. Experiments for the characterization of hypertext structures,

Eindhoven University of Technology, 1994. Disponible en: <http://wwwis.win.

tue.nl/~debra/joep/ >. (Consultado 10 marzo 1999).

15. Dean, J., and Henzinger, M. R. Finding related pages in the World Wide Web,

1999. Proceedings of Eighth International World Wide Web Conference, (1999,

may 11-14 : Toronto). Disponible en: <http://decweb.ethz.ch/WWW8/data/

2148/html/index.htm>. (Consultado 20 abril 2000).

16. Efe, Kemal [y otros]. The shape of the Web and its implicationes for searching

the Web, 2000. Disponible en: <http://www.cacs.usl.edu/Publications/

Raghavan/ERCB00.ps.Z>. (Consultado 20 septiembre 2000).

17. Feldman, Susan. NLP meets the jabberwocky: natural language processing in

information retrieval. Online. May 1999. Disponible en: <http://www.onlineinc.

com/onlinemag/OL1999/feldman5.html>. (Consultado 11 julio 2000).

18. Frants, Valery I. [y otros]. Boolean search : current state and perspectives.

Journal of the American Society for Information Science. 50(1), 1999. p. 86-95.

19. Gauch, Susan; Wang, Guijun. Information fusion with ProFusion, 1996.

Disponible en: <http://www.ittc.ukans.edu/~sgauch/papers/WebNet96.ps>.

(Consultado 28 junio 2000).

20. Gil Leiva, Isidoro. La automatización de la indización de documentos. Gijón :

TREA, 1999.

21. Graphic, Visualization, and Usability Center. GVU's tenth WWW user survey

report, 1998. Disponible en: <http://www.gvu.gatech.edu/user_surveys/survey-

1998-10/>. (Consultado 15 abril 1999).

79

22. Gudivada, Ventat N. [y otros]. Information retrieval on the World Wide Web.

IEEE Internet Computing. 1(5), 1997. p. 58-68.

23. Harman, D. Relevance feedback and others query modification techniques.

Information retrieval : data structures and algorithms, New Jersey : Prentice-

Hall, 1992.

24. Harter, Stephen P. Psychological relevance and information science. Journal of

the American Society for Information Science. 43(9), 1992. p. 602-615.

25. Hawking, David [y otros]. Results and challenges in web search evaluation,

1999. Proceedings of Eighth International World Wide Web Conference, (1999,

may 11-14 : Toronto). Disponible en: <http://decweb.ethz.ch/WWW8/data/2150/

html/index.htm >. (Consultado 20 abril 2000).

26. Hearst, Martin A. Interfaces for searching the Web. Scientific American. (3),

1997. Disponible en: <http://www.sciam.com/0397issue/0397hearst.html>.

(Consultado 3 marzo 1999).

27. Heinonen, Oskari; Hätönen, Kimmo; Klemettinen, Mika. WWW robots and

search engines. April 1996. Disponible en: <http://www.cs.helsinki.fi/

~oheinone/publications/ WWW_Robots_and_ Search _Engines.ps.gz>.

(Consultado 3 marzo 1999).

28. Henninger, Scott; Belkin, Nicholas J. Interface issues and interaction strategies

for information retrieval systems, 1996. Proceedings of CHI '96, (1996, april 13-

18 : Vancouver). Disponible en: <http://www.acm.org/sigchi/chi96/proceedings/

tutorial/Henninger/njd_txt.htm>. (Consultado 23 noviembre 1999).

29. Hölscher, Christoph; Strube, Gerhard. Web search behavior of Internet experts

and newbies, 2000. Proceedings of the Ninth International World Wide Web

Conference, (2000, may 15-19 : Amsterdan). Disponible en: <http://www9.org/

w9cdrom/81/81.html>. (Consul-tado 7 octubre 2000).

30. Hou, M. Comparison of three Internet search tools : Yahoo, AltaVista, Lycos,

1998. Disponible en: <http://vered.rose.utoronto.ca/people/ming/report.html>.

(Consultado 13 junio 2000)

31. Huberman, Bernando A.; Adamic, Lada A. Evolutionary dynamics of the World

Wide Web, 1999. Disponible en: <http://www.parc.xerox.com/istl/groups/iea/

www/growth.html>. (Consultado 4 marzo 2000).

32. Jansen, Bernard J.; Spink, Amanda; Saracevic, Tefko. Real life, real users, and

real needs : a study and analysis of user queries on the web. Information

Processing and Management. 36(2), 2000. p. 207-227.

80

33. Kleinberg, Jon M. Authoritative sources in hyperlinked enviroment. Proceedings

of ACM-SIAM Symposium on discrete algorithms, 1998. p. 668-677.

34. Kobayashi, Mei; Takeda, Koichi. Information retrieval on the Web, 2000.

Disponible en: <http://www.trl.ibm.co.jp/projects/s7710/dl/trlrep/rt347.ps>. (Consultado

4 octubre 2000).

35. Koehler, Wallace. An analysis of web page and web site constancy and

permanence. Journal of the American Society for Information Science. 50(2),

1999. p. 162-180.

36. Koeneman, Jürgen; Belkin, Nicholas J. A case for interaction : study of

interactive information retrieval behavior and effectiveness, 1996. Proceedings

of CHI '96, (1996, april 13-18 : Vancouver). Disponible en: <http://www.acm.org

/sigchi/chi96/proceedings/papers/Koeneman/jkl_txt.htm>. (Consultado 23 noviembre

1999).

37. Koll, Matthew B. Automatic relevance ranking : a searcher's complement to

indexing. Proceedings of the 25th Annual Meeting of the American Society of

Indexers, (1993, may 20-22 : Alexandria), 1993. p. 55-60, citado por Courtois,

Martin P.; Berry, Michael W. Results ranking in web search engines. Online.

23(3), 1999, p. 39-46

38. Koster, Martijn. Robots in the Web: threat or treat?. ConneXions. 9(4), april

1995. Disponible en: <http://info.webcrawler.com/mak/projects/robots/ threat-ortreat.

html>. (Consultado 14 marzo 1999).

39. Landoni, Monica; Bell, Steven. Information retrieval techniques for evaluating

search engines : a critical overview. Aslib Proceedings. 52(3), 2000. p. 124-

129.

40. Lawrence, Steve; Bollacker, Kurt; Giles, C. Lee. Indexing and retrieval of

scientific literature, 1999. Eighth International Conference on Information and

Knowledge Management. (1999, november 2-6 : Kansas City). p. 139-146.

41. Lawrence, Steve; Giles, C. Lee. Accessibility of information on the web. Nature.

400, july 1999. p. 107-109.

42. Lawrence, Steve; Giles, C. Lee. Searching the Web : general and scientific

information acces. IEEE Communications. 37(1), 1999. p. 116-122.

43. Lawrence, Steve; Giles, C. Lee. Searching the World Wide Web. Science.

280(5360), 1998. p. 98-100.

44. Leighton, H. Vernon; Srivastava, Jaideep. First 20 precision among World Wide

Web search services (search engines). Journal of the American Society for

Information Science. 50(10), 1999. p. 870-881.

81

45. Leighton, H. Vernon; Srivastava, Jaideep. Precision among World Wide Web

search services (search engines) : Altavista, excite, HotBot, Infoseek, Lycos,

1997. Disponible en: <http://www.winona.msus.edu/library/webind2/

webind2.htm >. (Consultado 27 febrero 1999)

46. Leighton, H. Vernon. Performance of four World Wide Web (WWW) index

services : Infoseek, Lycos, WebCrawler and WWWorm, 1995. Disponible en:

<http://www.winona.msus.edu/library/webind.htm>. (Consultado 27 febrero

1999).

47. Liddy, Elizabeth D. Enhanced text retrieval using natural language processing.

Bulletin of the American Society for Information Science. 24(4), 1988.

Disponible en: <http://www.asis.org/Bulletin/Apr-98/liddy.html> (Consul- tado 11

julio 2000).

48. Ljosland, Mildridz. Evaluation of web search engines and the search for better

ranking algorithms, July 1999. Disponible en: <http://www.dei.unipd.it/~ims/

sigir99/papers/4-ljosland.ps>. (Consultado 10 abril 2000).

49. Moore, Alvin; Murray, Brian H. Sizing the Internet, 2000. Disponible en:

<http://www.cyveillance.com >. (Consultado 13 octubre 2000).

50. Moya Anegón, Félix de. Los sistemas integrados de gestión bibliotecaria :

estructuras de datos y recuperación de información. Madrid : ANABAD, 1995.

51. Nicholson, Scott. Raising of web search tool reseach through replication and

chaos theory. Journal of the American Society for Information Science. 51(8),

2000. p. 724-729.

52. Notess, Greg R. Search engine showdown : the users' guide to web searching.

Disponible en: <http://searchengineshowdown.com/>. (Consultado 1999-2000).

53. OCLC. Web Characterization Project, 2000. Disponible en:

<http://wcp.oclc.org/>. (Consultado 7 octubre 2000).

54. Olvera Lobo, María D. Métodos y técnicas para la indización y recuperación de

los recursos de la World Wide Web. Boletín de la Asociación Andaluza de

Bibliotecarios. (57), 1999. p. 11-22.

55. Olvera Lobo, María D. Rendimiento de los sistemas de recuperación de

información en la Web : evaluación de servicios de búsqueda (search engines).

Revista Española de Documentación Científica. 23(3), 2000. p. 303-317.

56. Olvera Lobo, María D. Rendimiento de los sistemas de recuperación de

información en la World Wide Web : revisión metodológica. Revista Española

de Documentación Científica. 23(1), 2000. p. 63-77.

82

57. Rousseau, Ronald. Daily time series of common single word searches in

AltaVista y Northern Light. Cybermetrics. 2/3, issue 1, paper 2, 1999.

Disponible en: <http://www.cindoc.csic.es/cybermetrics/articles/v2i1p2.html>.

(Consultado 2 septiembre 2000).

58. Sander-Beuermann, Wolfgang; Schomburg, Mario. Internet information retrieval

: the further development of meta-search engine technology, 1998.

Proceedings of Internet Society Conference, (1998, july). Disponible en:

<http://www.isoc.org/inet98/proceedings/lc/lc_2.htm>. (Consultado 10 abril

2000).

59. Schlichting, Carsten; Nillsen, Erik. Signal detection of WWW search engines.

Disponible en: http://www.lclark.edu/~nilsen/ms/searchengine.HTM (Consultado

30 marzo 2000).

60. Schwartz, Candy. Web search engines. Journal of the American Society for

Information Science. 49(11), 1999. p. 973-982.

61. Selberg, Erik; Etzioni, Oren. Multi-service search and comparison using the

MetaCrawler, 1995. Proceedings Fourth International World Wide Web

Conference, (1995, octuber). Disponible en: <http://w3j.com/1/selberg.169/

paper/169.html>. (Consultado 27 febrero 1999).

62. Selberg, Erik; Etzioni, Oren. On the instability of web search engines, 2000.

Disponible en: <http:// www.cs.washington.edu/homes/pjallen/papers/riao2.ps>.

(Consultado 18 enero 2001).

63. Silverstein, Craig [y otros]. Analysis of a very large AltaVista query log, 1998.

Disponible en: <ftp://ftp.digital.com/pub/DEC/SRC/technical-notes/SRC-1998-

014.ps.gz>. (Consultado 18 agosto 2000).

64. Spinak, Ernesto. Diccionario enciclopédico de bibliometría, cienciometría e

informetría. Caracas : Unesco, 1996.

65. Su, Louise T. The relevance of recall and precision in user evaluation. Journal

of the American Society for Information Science. 45(3), 1994. p. 207-217.

66. Sullivan, Daniel. How to use meta HTML tags?. Disponible en:

<http://www.searchenginewatch.com/webmasters/meta.html>. Consultado (17

septiembre 2000).

67. Sullivan, Danny, ed. Search engine watch : tips about Internet search engines

& search engine submission. Disponible en:

<http://www.searchenginewatch.com>. (Consultado 1999-2000).

68. van Rijsbergen, C.J. Information retrieval. London : Butterworth, 1979.

69. Weinstock, Melvin. Citation indexes. Encyclopedia of library and information

science. New York : Marcel Dekker. Vol.5, c1971. p. 16-40.

70. Wiley, Deborah L. Beyond information retrieval : ways to provide content in

context. Database. August 1998. Disponible en: <http://www.onlineinc.com/

database/DB1998/wiley8.html>. (Consultado 11 julio 2000).

71. Yu, Clement; Meng, Weiyi. Search engine, [1999]. Disponible en:

<http://panda.cs.binghamton.edu/~meng/pub.d/se.ps.gz>. (Consultado 9 septiembre

2000)

72. Zhang, Dell; Dong, Yisheng. An efficient algorithm to rank web resources, 2000.

Proceedings of the Ninth International World Wide Web Conference, (2000,

may 15-19 : Amsterdan). Disponible en: <http://www9.org/w9cdrom/

251/251.html> (Consultado 7 octubre 2000).

73. Zorn, Peggy [y otros]. Advanced searching : tricks of the trade. Online. 21(3),

1996. Disponible en: <http://www.onlineinc.com/onlinemag/MayOL/zorn5.html>

(Consultado 29 agosto 2000).


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item