Marcado semántico automático en gestores de contenidos: integración y cuantificación

Pastor-Sánchez, Juan-Antonio and Orduña-Malea, Enrique and Saorín, Tomás Marcado semántico automático en gestores de contenidos: integración y cuantificación. El profesional de la información, 2013, vol. 22, n. 5, pp. 381-391. [Journal article (Paginated)]

[img]
Preview
Text
2013 EPI Pastor-Orduña-Saorin CMS Semanticos.pdf - Published version

Download (1MB) | Preview

English abstract

A general overview of the different semantic markup formats and the existing technologies to incorporate explicit semantic information (microformats, microdata and RDFa) is provided. Services are described that automate, to some extent, semantic annotation processes (Sindice, Calais, AlchemyAPI and DBPedia Spotlight), while characterizing the complete cycle of this process in a particular CMS (Wordpress) using a specialized plugin (RDFaCE-Lite). Finally, in order to quantify the creation and connectivity of semantically marked content on the Web, the space formed by all Spanish universities (and a selection of 25 international institutions) is analysed with Sindice. Semantic page count and visibility indicators (inlinks, outlinks, internal and third party) are calculated for the sample. The results indicate limited presence of semantically marked content in the universities and highly isolated web visibility of this content.

Spanish abstract

Se ofrece en primer lugar una visión general de los diferentes formatos de marcado semántico así como de las tecnologías existentes para incorporar información semántica explícita (microformatos, microdatos y RDFa). Posteriormente se describen algunos servicios que permiten automatizar los procesos de anotación semántica (Sindice, Calais, AlchemyAPI y DBPedia Spotlight) al tiempo que se caracteriza el ciclo completo de este proceso en un CMS concreto (Wordpress) mediante un plugin especializado (RDFaCE-Lite). Finalmente, con el propósito de cuantificar la creación y la conectividad del contenido marcado semánticamente en la Web, se analiza el conjunto de universidades españolas (y una selección de 25 universidades internacionales) mediante Sindice. Para ello se calculan indicadores de tamaño semántico y de enlaces entrantes, salientes, internos y de terceros (third party links) en los datasets de las universidades de la muestra. Los resultados indican la todavía escasa presencia de contenido marcado semánticamente en las universidades, así como el alto aislamiento en visibilidad web de estos contenidos.

Item type: Journal article (Paginated)
Keywords: Semantic web, Semantic markup, Content management systems, RDFaCE-Lite, Sindice, Universities, Web semántica, Linked data, Marcado semántico, Gestores de contenidos, Wordpress, Universidades, Webometría.
Subjects: I. Information treatment for information services > IB. Content analysis (A and I, class.)
Depositing user: Tomas Saorin
Date deposited: 13 Oct 2013 09:37
Last modified: 09 Mar 2017 11:12
URI: http://hdl.handle.net/10760/20371

References

"SEEK" links will first look for possible matches inside E-LIS and query Google Scholar if no results are found.

Balmin, Andrey; Hristidis, Vagelis; Papakonstantinou, Yannis (2004). “Objectrank: authority-based keyword search in databases”. En: Procs of the 30th intl conf on very large data bases, v. 30, pp. 564-575.

http://www.vldb.org/conf/2004/RS15P2.PDF

Franz, Thomas; Schultz, Antje; Sizov, Sergej; Staab, Steffen (2009). “TripleRank: ranking semantic web data by tensor decomposition”. En: Bernstein, Abraham et al. (ed.). The semantic web. ISWC 2009. Springer, v. 5823, pp. 213-228.

http://data.semanticweb.org/pdfs/iswc/2009/paper279.pdf

http://dx.doi.org/10.1007/978-3-642-04930-9_14

García-García, Alicia (2012). Datos abiertos enlazados linked open data (LOD) en documentación científica. Valencia: Universidad Politécnica de Valencia.

http://riunet.upv.es/handle/10251/18272

Jeh, Glen; Widom, Jennifer (2002) “SimRank: a measure of structural-context similarity”. En: Procs of the 8th ACM Sigkdd intl conf on knowledge discovery and data mining. New York, pp. 538-543.

http://ilpubs.stanford.edu:8090/508/1/2001-41.pdf

http://dx.doi.org/10.1145/775107.775126

Khalili, Ali; Auer, Sören; Hladky, Daniel (2012). “The RDFa content editor: from wysiwyg to wysiwym”. En: Computer software and applications conf (Compsac), 2012 IEEE 36th Annual, pp. 531-540.

http://svn.aksw.org/papers/2012/COMPSAC2012_RDFaCE/public.pdf

http://dx.doi.org/10.1109/COMPSAC.2012.72

Khare, Rohit; Çelik, Tantek (2006). “Microformats: a pragmatic path to the semantic web”. En: Procs of the 15th intl conf on world wide web. ACM: New York, pp. 865-866.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.307.7135&rep=rep1&type=pdf

http://dx.doi.org/10.1145/1135777.1135917

Kleinberg, John M. (1999). “Authoritative sources in a hyperlinked environment”. Journal of the ACM, v. 46, n. 5, pp. 604-632.

http://www.cs.cornell.edu/home/kleinber/auth.pdf

http://dx.doi.org/10.1145/324133.324140

Longqing, Shi; Qingfeng, Zhao (2011). “Data sources of webometrics”. En: 7th Intl conf on computational intelligence and security, pp. 1312-1315.

http://dx.doi.org/10.1109/CIS.2011.291

Mendes, Pablo N.; Jakob, Max; García-Silva, Andrés; Bizer, Christian (2011). “DBpedia spotlight: shedding light on the web of documents”. En: Procs of the 7th Intl conf on semantic systems, 1-8.

http://goo.gl/JQ2DEs

http://dx.doi.org/10.1145/2063518.2063519

Meymandpour, Rouzbeh; Davis, Josep G. (2013). “Ranking universities using linked open data”. En: LDOW2013.

http://events.linkeddata.org/ldow2013/papers/ldow2013-paper-09.pdf

Oren, Eyal; Delbru, Renaud; Catasta, Michele; Cyganiak, Richard; Tummarello, Giovanni (2008). “Sindice.com: a document-oriented lookup index for open linked data”. En: Intl journal of metadata, semantics and ontologies, v. 3, n. 1, pp. 37-52.

http://dx.doi.org/10.1504/IJMSO.2008.021204

Pastor-Sánchez, Juan-Antonio (2011). Tecnologías de la web semántica. Barcelona: UOC-EPI. ISBN: 978 84 9788 474 7

Pastor-Sánchez, Juan-Antonio. (2012). “Los CMS como pieza fundamental en el despliegue de la web semántica”. Anuario ThinkEPI, v. 6, pp. 184-189.

Saorín, Tomás; Peset, Fernanda; Ferrer-Sapena, Antonia (2013). “Factores para la adopción de linked data e implantación de la web semántica en bibliotecas, archivos y museos”. Information research, v. 18, n. 1.

http://InformationR.net/ir/18-1/paper570.html

Sellés-Carot, Alicia; Orduña-Malea, Enrique; Serrano-Cobos, Jorge (2013). “Estrategias y oportunidades tecnológicas en la generación de linked data en las bibliotecas”. Mi biblioteca, pp. 54-59.

Shirky, Clay (2010). Cognitive surplus: creativity and generosity in a connected age. New York: Penguin Press. (edición en castellano: El excedente cognitivo: creatividad y generosidad en la era conectada. Barcelona: Ediciones Deusto, 2012. ISBN: 978 8423428632). ISBN: 978 0143119586

Stuart, David (2012). “FOAF within UK academic web space: a webometric analysis of the semantic web”. En: Widén, Gunilla; Holmberg, Kim (ed.). “Social information research”. Emerald Group Publishing Ltd., v. 5, pp. 173-191. ISBN: 978 1 78052 832 8


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item