Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWWSuchmaschinen

Lewandowski, Dirk Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWWSuchmaschinen., 2004 [Preprint]

[img]
Preview
PDF
isko2004.pdf

Download (69kB) | Preview

English abstract

This article discusses link-based ranking algorithms in web search engines. User studies show that users usually only look at the first few hits on the search engine results pages, which underlines the importance of results ranking. Documents which do not appear in the first few results are often omitted by the users and receive only a small attention. To list the “best” documents on top of the results pages, all web search engines use link-based ranking algorithms. These are described in this article. The main question is whether there are factors implied in these algorithms that prefer certain kinds of pages.

German abstract

Nutzerstudien haben gezeigt, dass in der Regel nur die erste Seite der von WWW-Suchmaschinen ausgegebenen Trefferlisten Beachtung findet. Dies unterstreicht die Bedeutung des automatischen Rankings durch die Suchmaschinen: Dokumente, die es nicht auf eine Top-Position der Trefferliste schaffen, finden keine oder wenigstens nur eine geringe Beachtung. Alle bedeutenden Suchmaschinen setzen deshalb als einen wesentlichen Faktor des Rankings linktopologische Verfahren ein. Diese bewerten die Qualität von Webseiten anhand ihrer Verlinkungsstruktur, wobei nicht nur die Zahl der eingehenden Links als Votum gewertet wird, sondern auch die Reputation der verweisenden Seite. Die wichtigsten linktopologischen Ansätze werden erläutert. Dabei wird insbesondere auf die Frage eingegangen, ob bestimmte Arten von Webseiten bevorzugt werden bzw. welche das sind.

Item type: Preprint
Keywords: search engines pagerank hits hilltop relevance ranking
Subjects: L. Information technology and library technology
Depositing user: Dirk Lewandowski
Date deposited: 10 Dec 2004
Last modified: 02 Oct 2014 11:59
URI: http://hdl.handle.net/10760/5731

References

Bharat, K.; Mihaila, G. A.: When Experts Agree: Using Non-Affiliated Experts to Rank Popular Topics. WWW10, May 1-5, 2001, Hong Kong. http://www10.org/cdrom/papers/pdf/p474.pdf [1.4.2004]

Brin, S., Page, L.: The Anatomy of a Large-Scale Hypertextual Web Search Engine. http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm

Broder, A. (2002): A taxonomy of web search. SIGIR Forum 36(2). http://www.acm.org/sigir/forum/F2002/broder.pdf [12.7.2004]

Chakrabarti, S. (2003): Mining the web: Discovering knowledge from hypertext data. Amsterdam (u.a.): Morgan Kaufmann

Culliss, G. (2000): The Direct Hit Popularity Engine Technology. A White Paper. http://web.archive.org/web/20010619013748/www.directhit.com/about/products/technology_whitepaper.html [10.2.2004]

Davison, B. D.; Gerasoulis, A.; Kleisouris, K.; Lu, Y.; Seo, H.; Wu, B.: DiscoWeb: Applying Link Analysis to Web Search. http://www.cse.lehigh.edu/~brian/pubs/1999/www8/www99.pdf [26.10.2004]

Dean, J. A.; Gomes, B.; Bharat, K.; Harik, G.; Henzinger, M.: Methods and Apparatus for employing Usage Statistics in Document Retrieval / Google Inc. US Patent Application Nr. US2002/0123988 A1 (2002)

Griesbaum, J. (2004): Evaluation of three German search engines: Altavista.de, Google.de and Lycos.de. Information Research 9(4) paper 189. http://informationr.net/ir/9-4/paper189.html [3.8.2004]

Griesbaum, J., Rittberger, M., Bekavac, B. (2002): Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de. In: Hammwöhner, R., Wolff, C., Womser-Hacker, C. (Hrsg.): Information und Mobilität. Optimierung und Vermeidung von Mobilität durch Information. Proceedings des 8. Internationalen Symposiums für Informationswissenschaft, 201-223

Harman, D.: Ranking algorithms. – In: Frakes, W. B.; Baeza-Yates, R. (Hrsg.): Information Retrieval. Data Structures & Algorithms. – Upper Saddle River, NJ: Prentice Hall PTR, 363-392 (1992)

Haveliwala, T. H. (2002): Topic-Sensitive PageRank: A Context-Sensitive Ranking Algorithms for Web Search. WWW 2002, May 7–11, 2002, Honolulu, Hawaii, USA.

http://ranger.uta.edu/~alp/ix/readings/topicSensitivePageRank.pdf [10.11.2004]

Kleinberg, J. (1999): Authoritative Sources in a Hyperlinked Environment. Journal of the ACM 46(5), 604-632

Lewandowski,, D. (2004a): Abfragesprachen und erweiterte Funktionen von WWW-Suchmaschinen. IWP - Information: Wissenschaft und Praxis 55(2), 97-102 (2004)

Lewandowski, D. (2004b): Technologie-Trends im Bereich der WWW-Suchmaschinen. Information Professional 2011: 26. Online-Tagung der DGI; Frankfurt am Main 15. bis 17. Juni 2004; Proceedings, 183-195

Lewandowski, D. (2004c): Datumsbeschränkungen bei WWW-Suchanfragen: Eine Untersuchung der Möglichkeiten der zeitlichen Einschränkung von Suchanfragen in den Suchmaschinen Google, Teoma und Yahoo. In: Bekavac, B.; Herget, J.; Rittberger, M.: Information zwischen Kultur und Marktwirtschaft: Proceedings des 9. Internationalen Symposiums für Informationswissenschaft (ISI 2004), Chur, 6.-8. Oktober 2004, S. 301-316

Lewandowski, D. (2005): Web Information Retrieval. IWP - Information: Wissenschaft und Praxis 56(1) [i. Dr.]

Lexis-Nexis (2004): Pressemitteilung vom 5.4.2004. http://www.lexisnexis.de/downloads/040405pressemitteilung.pdf [9.7.2004]

Machill, M.; Welp, C. (Hrsg.) (2003): Wegweiser im Netz: Qualität und Nutzung von Suchmaschinen. Gütersloh: Verlag Bertelsmann Stiftung

Mandl, T. (2003): Projekt Automatische Qualitätsabschätzung von Internet Ressourcen (AQUAINT). Arbeitsbericht 3/2003, Universität Hildesheim, Informationswissenschaft. http://www.uni-hildesheim.de/~mandl/Publikationen/Ab_aquaint02.pdf [2.11.2004]

Mintz, A. P. (ed.) (2002): Web of Deception: Misinformation on the Internet. Medford, NJ: Information Today

Narsingh, D.; Gupta, P. (2001): Graph-Theoretic Web Algorithms: An Overview. In: Thomas Böhme, Herwig Unger (Eds.): Innovative Internet Computing Systems, International Workshop IICS 2001, Ilmenau, Germany, June 21-22, 2001, Proceedings. Lecture Notes in Computer Science 2060 Springer, 91-102

Notess, G. (2003a): Search Engine Statistics: Database Total Size Estimates. http://www.searchengineshowdown.com/stats/sizeest.shtml [10.11..2004]

Notess, G. (2003b): Search Engine Statistics: Relative Size Showdown. http://www.searchengineshowdown.com/stats/size.shtml [10.11..2004]

Page, L., Brin, S., Motwani, R., Winograd, T. (1998): The PageRank citation ranking: Bringing order to the Web. http://dbpubs.stanford.edu:8090/pub/1999-66 [26.10.2004]

Pennock, D. M., Flake, G. W., Lawrence, S., Glover, E. J., Giles, C. L. (2002): Winners don’t take it all: Charecterizing competition for links on the web. Proceedings of the National Academy of Sciences of the United States of America 99(8), 5207-5211

Savoy, J.; Rasolofo, Y. (2000): Report on the TREC-9 Experiment: Link-Based Retrieval and Distributed Collections. http://trec.nist.gov/pubs/trec9/papers/unine9.pdf [6.7.2004]

Spink, A.; Jansen, B. J.: Web Search: Public Searching of the Web. Dordrecht: Kluwer Academic Publishers

Sullivan, D. (2003): Search Engine Sizes. http://searchenginewatch.com/reports/article.php/2156481 [2.7.2004]


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item