Inventario de palabras clave temáticas para la clasificación automática de noticias de televisión (Lexicon of thematic keywords for the automatic classification of TV news)

Rodríguez-Bravo, Ángel and Mas-Manchón, Lluís Inventario de palabras clave temáticas para la clasificación automática de noticias de televisión (Lexicon of thematic keywords for the automatic classification of TV news). Anales de Documentación, 2011, vol. 14, n. 2. [Journal article (Unpaginated)]

[img]
Preview
PDF
Ad 142 Rodriguez Bravo Anales de Documentacion.pdf

Download (214kB) | Preview

English abstract

In the framework of a research project funded by CAC, a communication approach was taken to the problem of keywords selection for the themes indexing of TV news by word spotting. This is, we apply discourse theories (concept of “themes”), news theory and lexicometry and information retrieval techniques, for the definition of a complex Protocol of Keywords Selection. The work of 4 researchers with this protocol on a 698 transcript news sample resulted in a lexicon of 1000 keywords distributed in 15 themes, which is contrasted statistically with Lambda of Wilks.

Spanish abstract

En el marco de un proyecto financiado por el CAC (Consell de l’Audiovisual de Catalunya), se realizó una aproximación comunicológica al problema de la selección de palabras clave para la clasificación temática de noticias de televisión a partir de sistemas de reconocimiento automático. Aplicamos análisis del discurso (entorno al concepto “tema”), teoría de la noticia y técnicas lexicométricas y de recuperación de la información, para definir un Protocolo Integral de Selección de Palabras clave. Del trabajo de 4 investigadores con este protocolo sobre una muestra transcrita de 698 noticias ha resultado un lexicon de 1000 palabras clave distribuidas en 15 temas, contrastado mediante el estadístico Lambda de Wilks.

Item type: Journal article (Unpaginated)
Keywords: Información audiovisual; clasificación temática; palabras clave; temas de noticias televisivas; lexicometría; sistema de clasificación; Audiovisual information; Themes indexing; Keywords; Themes in TV news; Lexicometry; Retrieval system; Topics; Matters; Subjects
Subjects: H. Information sources, supports, channels. > HH. Audio-visual, Multimedia.
I. Information treatment for information services > IB. Content analysis (A and I, class.)
I. Information treatment for information services > IC. Index languages, processes and schemes.
Depositing user: Anales de Documentación Revista
Date deposited: 11 Nov 2011
Last modified: 02 Oct 2014 12:20
URI: http://hdl.handle.net/10760/16238

References

ABBERLEY, D.; KIRBY, D.; RENALS, S. y ROBINSON, T. The This broadcast news retrieval System. Sheffield: University of Sheffield. Department of Computer Science, 2006, [en línea], URL: <http://svr-www.eng.cam.ac.uk/~ajr/esca99/Abberley.pdf> [Consulta: 17 de marzo de 2006].

ARIKI, Y. y MATSUURA, K. Automatic Classification of TV News Articles based on telop Character Recognition. Japón: Ryukoku University, Department of Science and Technology, 1999, [en línea], URL: <http://ieeexplore.ieee.org/iel5/6322/16898/ 00778210.pdf?isnumber=&arnumber=778210> [Consulta: 8 de marzo de 2011].

BERTALANFFY, L.V. Teoría General de Sistemas. México: Fondo de Cultura Económica, 1968.

BROWN, G. y YULE, G. Análisis del Discurso. Madrid: Visor, 1993.

CEBRIÁN HERREROS, M. Información radiofónica. Mediación técnica, tratamiento y programación. Madrid: Síntesis, 1994.

CHARAUDEAU, P. El discurso de la información: la construcción del espejo social. Barcelona: Gedisa, 2003.

DIMITROVA, N. Multimedia Content Analysis and Indexing for Filtering and Retrieval Applications. En Informing Science. Special issue on Multimedia Informing Technologies, Part 1. Vol. 2, nº 4, 1999, [en línea] URL: <http://inform.un/ Articles/Vol2/v2n4p87-100.pdf> [Consulta: 20 de mayo de 2005].

DONOUGH, J.; SIU, M. y GISH, H. Reducing word error rate on conversational speech from the Switchboard corpus. En ICASSP 95, 53(56), 1995, [en línea]. URL: <http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=00479271> [Consulta: 8 de marzo de 2011].

LIU, Z.; HUANG, J. y WANG, Y. Classification of TV programs based on audio information using Hidden Markov Model. Nueva York: Department of Electrical Engineering. Polytechnic University, Brooklyn, 1998a, [en línea]. URL: <http://ieeexplore.ieee.org/iel4/5958/15944/00738908.pdf?arnumber=738908> [Consulta: 10 de octubre de 2006].

LIU, Z.; WANG, Y. y CHEN, T. Audio Feature Extraction and Analysis for Scene Segmentation and Classification. Nueva York: Polytechnic University, Brooklyn. Carnegie Mellon University, Pittsburgh, 1998b, [en línea]. URL: <http:// portal.acm.org/citation.cfm?id=302295> [Consulta: 8 de marzo de 2011].

MANIEZ, J. Los lenguajes documentales y de clasificación. Concepción, construcción y utilización en los sistemas documentales. Madrid: Pirámide, 1993.

MARTÍNEZ ALBERTOS, J.L. Curso General de redacción periodística. Madrid: Paraninfo, 1998.

MAS MANCHÓN, LL. Modelos Entonativos para la Segmentación Automática de los Programas Informativos en Unidades-Noticia. Tesis Doctoral. Barcelona: Dpto. Comunicación Audiovisual y Publicidad II, UAB, 2011.

MILLER, M.M. y RIECHERT, B.P. 1994, [en línea] URL: <http://excellent.com.utk.edu/ ~mmmiller/pestmaps.txt> [Consulta: 11 de mayo de 2011].

MIZOGUCHI, R.; TSUNEKAWA, T. y YAMASHITA, Y. Topic Recognition for News Speech based on Keyword Spotting. I.S.I.R. Osaka University. 1-8 Mihogaoka, Ibaraki-shi. Osaka, 567-0047, Japón, Ritsumeikan University. 1-1-1 Noji- Higashi. Kusatsu-shi. Shiga, 525-8577, Japón: 5th International Conference on Spoken Language Processing (ICSLP '98), Sydney, 3, 1998, [en línea] URL: <http://www.slp.is.ritsumei.ac.jp/~yama/pubs/icslp98.pdf> [Consulta: 8 de marzo de 2011].

NAKAMURA, Y. y KANADE, T. Semantic Analysis for Video Contents Extraction- Spotting by Association in News Video. ACM Multimedia – Electronics Proceedings. Crowne Plaza Hotel, Seattle, USA, 8-14 noviembre, 1997, [en línea] URL: <http://www.image.esys.tsukuba.ac.jp/~yuichi/online-paper/ACM1997/main.html> [Consulta: 27 de mayo de 2005].

NAPHADE, M.R. y HUANG, T.S. Semantic filtering of Video Content. 2005. [en línea]. URL: <http://www-scf.usc.edu/~csci586/papers/video/BPtemp13402.pdf> [Consulta: 18 de mayo de 2005].

NAPHADE, M.R.; KOZINTSER, I.V. y HUANG, T.S. A factor Graph Framework for Semantinc Video Indexing, 2004. [en línea] URL: <http://www.kozintsev.net/ papers/jounal_02.pdf> [Consulta: 8 de marzo de 2011].

PINTO, M. Manual de Clasificación Documental. Madrid: Síntesis, 1997.

RENALS, S.; ABBERLEY, D.; KIRBY, D. y ROBINSON, T. Indexing and Retrieval of Broadcast News. IEEE Signal Processing Society 1999 Workshop on Multimedia Signal Processing, 13-15 de septiembre, 1999, [en línea] URL: <http:// homepages.inf.ed.ac.uk/srenals/pubs/1999/mmsp99-54/mmsp99-54.html> [Consulta: 8 de marzo de 2011].

RODRÍGUEZ BRAVO, A. et al. Clasificador Automático de Información Sonora. Proyecto financiado por el CAC. Barcelona: Depósito del Laicom, Edifici I, UAB, Bellaterra, Barcelona, y en el Consell de l’Audiovisual de Catalunya, 2006.

RODRÍGUEZ BRAVO, A. La investigación aplicada: una nueva perspectiva para los estudios de recepción. Quaderns de Comunicación i cultura, 2003, nº 30, p. 17-36.

RODRÍGUEZ BRAVO, A. Fundamentos para una teoría de la eficacia comunicativa. Actas del Congresso Brasileiro de Ciências da Comunicação (Intercom). Natal, RN. Del 2 al 6 de septiembre, 2008, [en línea]. URL: <http://www.intercom.org.br/ papers/nacionais/2008/resumos/R3-0572-1.pdf> [Consulta: 8 de marzo de 2011].

SHANON, C.E. y WEAVER, W. Teoría Matemática de la Información. Madrid: Forka, 1981.

SIERRA BRAVO, R. Técnicas de investigación social. Madrid: Paraninfo, 2001.

VAN DIJK, T.A. La noticia como discurso: comprensión, estructura y producción de la información. Barcelona: Paidós, 1990.

WIENER, N. Cibernética y sociedad. Buenos Aires: Sudamericana, 1969.

YANG, C.; DONG, M. y FOTOHUI, F. Learning the semantics in image retrieval – A natural language processing approach. Estados Unidos: Computer Science Department, Wayne State University, 2004, [en línea]. URL: <http://ieeexplore.ieee.org/iel5/9515/30163/01384934.pdf?arnumber=1384934> [Consulta: 8 de marzo de 2011].


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item