Características de la Web de España

Baeza-Yates, Ricardo and Castillo, Carlos and López, Vicente Características de la Web de España. El profesional de la información, 2006, vol. 15, n. 1, pp. 6-17. [Journal article (Paginated)]

[img]
Preview
PDF
vol15_1.2.pdf

Download (470kB) | Preview

English abstract

In September and October 2004, a massive harvesting of pages from the web of Spain was carried out. This effort permitted us to find over 16 million pages, on approximately 300,000 web sites, which have been analysed in terms of contents, connectivity and technologies. The analysis of the data reveals several statistical similarities with observations made about the characteristics of the web by other studies conducted on subsets of the global web, mostly related to the presence of power laws. On the qualitative side, the role of academic and governmental centres is fundamental for enhanced connectivity in navigating among the sites of the web of Spain.

Spanish abstract

En septiembre y octubre de 2004 se llevó a cabo una recolección masiva de páginas de la Web de España. Esto permitió encontrar más de 16 millones de páginas en alrededor de 300.000 sitios, que fueron analizadas en términos de contenido, conectividad y tecnologías. El análisis de estos datos entrega numerosas similitudes estadísticas con las observaciones sobre las características de la Web de otros estudios realizados sobre subconjuntos de la Web global, fundamentalmente relacionados con la presencia de leyes de potencia. En el plano cualitativo se aprecia que el rol de centros académicos y de la administración pública es fundamental para articular la conectividad de la navegación entre sitios de la Web de España.

Item type: Journal article (Paginated)
Keywords: Caracterización de la Web, Análisis de enlaces, Web de España. Web characterisation, Link analysis, Spanish Web.
Subjects: L. Information technology and library technology
B. Information use and sociology of information > BB. Bibliometric methods
H. Information sources, supports, channels. > HQ. Web pages.
Depositing user: Estrella Rentero Castillo
Date deposited: 29 Apr 2007
Last modified: 02 Oct 2014 12:07
URI: http://hdl.handle.net/10760/9292

References

Alonso, J.; García, L.; Zazo, F. Cibermetría: nuevas técnicas de estudio aplicables al web. España: Ediciones Trea, 2003. Isbn 84-9704-114-3.

Amat, C. B. «Caracterización de una muestra de sedes web españolas bajo dominio .es». En: Boletín de la RedIris, 2003, abril, n. 64, pp. 2014.

Baeza-Yates, R. «The web of Spain». En: Upgrade, 2003, v. 3, n. 3, pp. 82-84.

Baeza-Yates, R.; Castillo, C. «Caracterizando la Web chilena». En: Encuentro chileno de ciencias de la computación, 2000.

Baeza-Yates, R.; Castillo, C. «Relating web characteristics with link based web page ranking». En: String processing and information retrieval (Spire), 2001, pp. 21-32.

Baeza-Yates, R.; Castillo, C. «Características de la Web chilena 2004». Informe técnico, Center for web Research, Universidad de Chile, 2005(a).

Baeza-Yates, R.; Castillo, C. «Characterization of national web domains». Informe técnico, Universitat Pompeu Fabra, 2005(b).

Baeza-Yates, R.; Lalanne, F. «Characteristics of the korean web». Informe técnico, Korea-Chile IT Cooperation Center ITCC, 2004.

Barabási, A. Linked: the new science of networks. EUA: Perseus Books Group, 2002, Isbn 0-738-20667-9.

Barr, D. RFC 1912: common DNS operational and configuration errors, 1996. Consultado en: 01-10-05. http://www.ietf.org/rfc/rfc1912.txt

Bharat, K.; Chang, B. W.; Henzinger, M.; Ruhl, M. «Who links to whom: mining linkage between web sites». En: International conference on data mining (ICDM), 2001.

Boldi, P.; Codenotti, B.; Santini, M.; Vigna, S. «Structural properties of the african web». En: Poster session, eleventh international conference on world wide web, 2002.

Broder, A.; Kumar, R.; Maghoul, F.; Raghavan, P.; Rajagopalan, S.; Stata, R.; Tomkins, A.; Wiener, J. «Graph structure in the web: experiments and models». En: Ninth conference on world wide web, 2000, pp. 309-320.

Da Silva, A. S.; Veloso, E. A.; Golgher, P. B.; Laender, A. H. F.; Ziviani, N. «Cobweb-a crawler for the brazilian web». En: String processing and information retrieval (Spire), 1999, pp. 184-191.

Davison, B. D. "Topical locality in the web". En: 23rd annual international ACM Sigir conference on research and development in information retrieval, 2000, pp. 272-279.

Dill, S.; Kumar, R.; Mccurley, K. S.; Rajagopalan, S.; Sivakumar, D.; Tomkins, A. «Self-similarity in the web». En: ACM transactions on internet technology, 2002, v. 2, n. 3, pp. 205-223.

Fetterly, D.; Manasse, M.; Najork, M. «Spam, damn spam, and statistics: using statistical analysis to locate spam web pages». En: Seventh workshop on the web and databases (webDB), 2004, pp. 1-6.

Fetterly, D.; Manasse, M.; Najork, M. «Detecting phrase-level duplication on the world wide web». En: 28th annual international ACM Sigir conference on research and development in information retrieval, 2005, pp. 170-177.

Gomes, D.; Silva, M. J. «A characterization of the Portuguese web». En: 3rd ECDL workshop on web archives, 2003.

Gulli, A.; Signorini, A. «The indexable web is more than 11.5 billion pages». En: Poster session, 14th international conference on world wide web, 2005, pp. 902-903.

Gyöngyi, Z.; García-Molina, H. «Web spam taxonomy». En: First international workshop on adversarial information retrieval on the web, 2005.

Modesto, M.; Pereira, Á.; Ziviani, N.; Castillo, C.; Baeza-Yates, R. «Um novo retrato da web brasileira». En: XXXII Semish, 2005, pp. 2.0052.017.

Pandurangan, G.; Raghavan, P.; Upfal, E. «Using Pagerank to characterize web structure». En: 8th Annual international computing and combinatorics conference (Cocoon), 2002, pp. 330-390.

Rauber, A.; Aschenbrenner, A.; Witvoet, O.; Bruckner, R. M.; Kaiser, M. «Uncovering information hidden in web archives". En: D-Lib magazine, 2002, v. 8, n. 12. Doi: 10.1045/december2002-rauber

Sanguanpong, S.; Nga, P. P.; Keretho, S.; Poovarawan, Y.; Warangrit, S. «Measuring and analysis of the thai world wide web». En: Asia Pacific advance network conference, 2000, pp. 225-230.

Thelwall, M. Link analysis: an information science approach. EUA: Elsevier Academic Press, 2004, Isbn 0-12-088553-0.

Thelwall, M.; Wilkinson, D. «Graph structure in three national academic webs: power laws with anomalies». En: Journal of the American Society for Information Science and Technology, 2003, v. 54, n. 8, pp. 706-712.

Veloso, E. A.; de Moura, E.; Golgher, P.; da Silva, A.; Almeida, R.; Laender, A.; Ribeiro-Neto, B.; Ziviani, N. «Um retrato da Web brasileira». En: Simpósio brasileiro de computacão, 2000.

Zipf, G. Human behavior and the principle of least effort: an introduction to human ecology. EUA: Addison-Wesley, 1949, Isbn 0-58-220471-3.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item