Baños-Moreno, María-José, Felipe, Eduardo R, Pastor-Sánchez, Juan-Antonio and Lima, Gercina-Angela-Borém Metadatos en noticias: un análisis internacional para la representación de contenidos en periódicos., 2015 . In II Congreso ISKO España y Portugal / XII Congreso ISKO España, Murcia, 19 y 20 de noviembre de 2015. [Conference paper]
![]() |
Archive
43_Baños.pdf - Published version Download (789kB) |
English abstract
Newspapers use a large volume of information that must be described adequately. To do this, the tags “title”, “keywords” and “description” are widely used in the source code of online-news items. However, these are not descriptive enough for the news items. So, metadata standards are created in order to facilitate the interoperability and make a deeper description of them. Currently, HTML tags and several standards live together in the newspaper industry, with different degrees of implementation. In this paper, we analyze the source code of international generalinformation newspapers. Moreover, we conducted an in-depth literature review on metadata standards. The aim is to analyze what standards exist and how they are used in a sample of newspapers’ source codes. For that, we identify the semantic metadata in the source codes and design the software MetadadosHTML. As conclusions, the great distance between metadata standards identified in the literature review and those in the source codes is clearly shown. In the former, the most cited metadata are NewsML and NITF formats, implemented at least in an internal level by some media and press agencies. By the contrary, schema.org and two social media schemas (Open Graph Protocol for Facebook and Twitter Cards) are the most common in the latter one. The coexistence of different metadata standards in the media sector is exhibited, stressing the lack of uniformity in their use. To achieve the ideal of interoperability between contents, the use of Web Semantic technologies is needed. In this regard, to define ontologies and RDF vocabularies for the different proposals analyzed should be a tendency
Spanish abstract
Los periódicos trabajan con un gran volumen de información que necesita ser descrita adecuadamente. Para ello, las etiquetas “title”, “keywords” y “description” son muy utilizadas en el código fuente de las noticias online. Sin embargo, estas no resultan suficientemente descriptivas. Así, surgen estándares de metadatos, con el fin de facilitar la interoperabilidad y profundizar en la descripción. Actualmente, las etiquetas HTML y diversos estándares conviven en el sector periodístico, con diversos grados de implantación. Se analiza el código fuente de diarios internacionales de información general y se lleva a cabo una profunda revisión bibliográfica sobre estándares de metadatos. El propósito es conocer qué estándares existen, y evaluar su uso en los códigos fuente de una muestra de periódicos. Para ello se identifican los metadatos de contenido semántico de los códigos fuente. Además se desarrolla el software MetadadosHTML. Como conclusiones destacan la gran distancia entre los estándares recogidos en la bibliografía y los mostrados en los código fuente. En el primer caso, los más referenciados son los formatos NewsML y NITF, implementados por algunos medios y agencias de prensa, al menos a nivel interno. Por el contrario, en el código fuente los más habituales son schema.org y dos esquemas para mostrar información en redes sociales, Open Graph Protocol (usado por Facebook) y Twitter Cards. Esto, evidencia la convivencia de diversos estándares de metadatos en el ámbito de los medios de comunicación y pone de relieve la falta de uniformidad en su uso. Para alcanzar el ideal de interoperabilidad de los contenidos, es preciso utilizar tecnologías de la Web Semántica. En este sentido, se debería tender a definir ontologías o vocabularios RDF para las diferentes propuestas analizadas
Item type: | Conference paper |
---|---|
Keywords: | Newspapers, metadata, schema.org, Open Graph Protocol, NITF, NewsML, Periódicos, metadatos |
Subjects: | H. Information sources, supports, channels. > HA. Periodicals, Newspapers. I. Information treatment for information services > IC. Index languages, processes and schemes. I. Information treatment for information services > ID. Knowledge representation. |
Depositing user: | María-José Baños-Moreno |
Date deposited: | 13 Dec 2015 21:04 |
Last modified: | 13 Dec 2015 21:04 |
URI: | http://hdl.handle.net/10760/28589 |
References
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |