PuertoTex: un software de minería textual para la creación de resúmenes automáticos en el dominio de ingeniería de puertos y costas basado en ontologías

Leiva-Mederos, Amed and Domínguez-Fernández, Sandor and Senso, Jose A. PuertoTex: un software de minería textual para la creación de resúmenes automáticos en el dominio de ingeniería de puertos y costas basado en ontologías. TransInformação, 2012, vol. 24, n. 2. [Journal article (Unpaginated)]

This is the latest version of this item.

[img]
Preview
Text
TR-2011-463.pdf - Published version

Download (243kB) | Preview

English abstract

The aim of this word to develop and evaluate the results of the implementation of an ontology-based software capable of generating automatic summaries in the field of Ports and Coastal Engineering. For the development of the tool has been used several techniques emanating from the analysis of discourse and cognitive techniques for generating rules for the treatment of the texts. It also calls for the construction of an ontology that facilitates the processes of labeling from the potential of Resource Description Framework and Extensible Makup Language. It has built a set of agents acting on the ontology, which declared its main elements. Are presented as a product generated, Puertotex, software for the construction of ontology-based automatic summaries. The evaluation of the summaries generated reflects the quality of the system, which is limited only by your ability to work with the domain under investigation.

Spanish abstract

El objeto de este trabajo es elaborar y evaluar los resultados de la implementación de un software basado en ontologías, capaz de generar resúmenes automáticos en el campo de la Ingeniería de Puertos y Costas. Para el desarrollo de la herramienta se emplean diversas técnicas emanadas del análisis de discurso así como técnicas cognitivas, que permiten generar reglas para el tratamiento de los textos. También se apela a la construcción de una ontología que facilite los procesos de etiquetado a partir de las potencialidades de Resource Description Framework y Extensible Makup Language. Se construye un conjunto de agentes que actúa sobre la ontología, de la cual se declaran sus principales elementos. Como producto generado se presenta Puertotex, un software para la construcción de resúmenes automáticos basado en ontologías. La evaluación de los resúmenes generados refleja la calidad del sistema, que tiene como única limitación su capacidad para trabajar con el dominio objeto de investigación.

Item type: Journal article (Unpaginated)
Keywords: Autómatas, Desambiguación de textos científicos, Minería de texto, Ontologías, Resumen automático, Automata. Disambiguation of scientific texts. Data mining. Ontologies. Automatic summarization.
Subjects: I. Information treatment for information services
Depositing user: Jose A. Senso
Date deposited: 01 Mar 2013 12:27
Last modified: 02 Oct 2014 12:25
URI: http://hdl.handle.net/10760/18519

Available Versions of this Item

References

AGUIRRE, E. Formalization of concept-relatedness using ontologies: applications in the construction of lexical knowledge bases, word sense disambiguation and automatic spelling correction. 1998. Tesis (Doctoral) - Universidad de País Vasco, San Sebastián, 1998.

D’CUNHA, I. Hacia un modelo lingüístico de resumen automático de artículos médicos en español. 2006. Tesis (Doctoral) - Universidad Pompeu Fabra, Barcelona, 2006.

DIJK, T.; KINTSCH, W. Strategies of discourse comprehension. Orlando: Academic, 1983.

DOMÍNGUEZ, S. Calculus copora. Santa Clara: Universidad Central Marta Abreu de las Villas, 2011.

ENDRES-NIGGEMEYER, B. Simsum: an empirically founded simulation of summarizing. Information Processing and Management, v.36, n.4, p.659-682, 2005.

ENDRES-NIGGEMEYER, B.; MAIRE, E.; SIGEL, A. How to implement a naturalistic model of abstracting: four core working steps of an expert abstractor. Information Processing & Management, v.31, n.5, p.631-674, 1995.

FABER, P.; MÁRQUEZ, C.; VEGA, M. Framing terminology: a process-oriented approach. Meta, v.50, n.4, p.189-213, 2005.

HERNÁNDEZ, A. Indización y resumen. La Habana: Universidad de la Habana, 2006.

HERNÁNDEZ, A. Organización y representación del conocimiento:paradigmas, hipertextos y fundamentación metamodélica. 2007. Tesis (Doctoral Bibliotecología y Ciencia de la Información) - Universidad de la Habana, La Habana, 2007a.

HERNÁNDEZ, A Paradigmas dominantes de la representación de la información y el conocimiento. La Habana: Universidad de la Habana, 2007b.

HERRERA, R. Formatos de comunicación. 2007. Disponible en: <http://fcom.uh.edu.cu>. Acceso en: 16 jul. 2011.

LEIVA, A. et al. An automat for the semantic processing of structured information. In: INTERNATIONAL CONFERENCE OF DESING OF SOFTWARE AND APLICACTIÓN, 9., 2009, Pisa, Italy. Proceedings… Pisa: IEEE, 2009. p.85-89.

LIN, C.; HOVY, E. Automatic evaluation of summaries using n--gram co-ocurrence statistic. In: HUMAN TECHNOLOGYCONFERENCE, 2003, Edmonton, Canada. Proceedings… Edmonton, Canada: HLT-NAACL, 2003. p.71-78.

LUNH, H. The automatic creation of literature abstracts. Journal of Research of Development, v.2, n.2, p.59-165, 1958.

MANCHÓN, E. Evaluación por criterios o heurística. 2002. Disponible en: <http://www.ainda.info/evaluacion_heuristica.html>. Acceso en: 1 enero 2011.

MANN, W.; THOMPSON, S. Rhetorical structure theory: a theory of text organization. Los Angeles: Information Sciences Institute, 1990.

MATHIS, B.; RUSH, J.; YOUNG, C. Improvement of automatic abstracts by the use of structural analysis. Jounal of the American Sciety for Information Science, v.24, n.2, p.101-109, 1973.

METZELTIN, M. De la retórica al análisis del discurso. Revista Electrónica de Estudios Filológicos, n.6, 2003. Disponible en: <http://www.tonosdigital.es/ojs /index.php/tonos/article/view/506>. Acceso en: 1 marzo 2012.

NIELSEN, J. Heuristic evaluation. In: NIELSEN, J.; MACK, R. (Ed.). Usability inspection methods. New York: John Wiley 1994. p.25-52.

NIELSEN, J. How to conduct a heuristic evaluation. 2002a. Available from: <http://www.useit.com/papers/heuristic/heuristic_evaluation.html>. Cited: 26 Jan. 2011.

NIELSEN, J. Ten usability heuristics. 2002b. Available from: <http://www.useit.com/papers/heuristic/heuristic_list.html>. Cited: 21 Jan. 2011.

ONO, K.; SUMITA, K.; MIIKE, S. Abstract generation based on rhetorical structure extraction. In: INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS, 15., 1994, Kyoto, Japan. Proceedings… Kyoto, Japan: DBLP, 1994.

PANECA, F. La prensa remediana del siglo XIX: reflejo de la cultura popular tradicional de la localidad. 2009. Tesis (Doctoral) - Facultad de Humanidades, Universidad Central Marta Abreu de las Villas, Santa Clara, 2009.

PILLEUX, M. Competencia comunicativa y análisis del discurso. Estudios Filológicos, n.36, p.143-152, 2001. Disponible en: <http://www.scielo.cl>. Acceso en: 1 marzo 2012.

PINTO, M. El resumen documental: principios y métodos. Madrid: Fundación Germán Sánchez Ruipérez, 2001.

PINTO, M. Interdisciplinary approaches to the concept and practice of written text documentary content analysis. Journal of Documentation, v.50, n.2, p.405-418, 2004.

RIGAU, G. Resolución automática de la ambigüedad semántica de palabras. Soria, España: Fundación Duques de Soria, 2002.

SALTON, G. On the application of syntactic methodologies in automatic text analysis. Information Processing and Management, v.26, p.73-92, 1996.

SÁNCHEZ-CUADRADO, S. et al. Definición de una metodología para la construcción de sistemas de organización del conocimiento a partir de un corpus documental en lenguaje natural. Procesamiento del Lenguaje Natural, n.39, p.213-220, 2007.

SENSO, J. Representación del conocimiento en la ingeniería de puertos y costas: proyecto investigador. Granada, España: Universidad de Granada, 2009.

SIDOROV, G.; ZAZUETA, O.O. Resolución de anáfora pronominal para el español usando el método de conocimiento limitado. In: ENCUENTRO NACIONAL DE CIENCIAS DE LA COMPUTACIÓN, 7., 2006, San Luís Potosi, Mexico. Anales… San Luís Potosi, Mexico: SMCC, 2006. p.276-281.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item