Die Suche nach Informationen unter sprachwissenschaftlichen Gesichtspunkten: das Potenzial von Anaphern

Schmolz, Helene Die Suche nach Informationen unter sprachwissenschaftlichen Gesichtspunkten: das Potenzial von Anaphern. Mitteilungen der Vereinigung Österreichischer Bibliothekarinnen & Bibliothekare, 2014, vol. 67, n. 2, pp. 249-262. [Journal article (Paginated)]

[img]
Preview
Text
vöb-mitteilungen_67 (2014) 2_beitrag_schmolz_anaphern.pdf - Published version

Download (1MB) | Preview

English abstract

Searching for information from a linguistic point of view: the potential of anaphors (translation of the title). Information science tends to use predominantly quantitative analyses and also qualitative methods that are easy to implement, in order to solve natural language tasks. However, the integration of linguistics on an equal footing could improve such tasks decisively. One promising approach are anaphors, which connect the texts in a semantic-syntactic way and thereby reflect the content of texts on the surface. Based on a comprehensive definition and categorisation, it is shown by means of a corpus that the type of anaphor which has so far never been regarded is in fact the most frequent. This knowledge offers high potential if it is applied to search engines, where anaphors have generally attracted little attention to date.

German abstract

Die Informatik tendiert dazu, zur Lösung von natürlichsprachigen Anwendungen vor allem quantitative Analysen zu verwenden sowie qualitative Methoden, die einfach umzusetzen sind. Doch könnte eine Einbeziehung der Sprachwissenschaft auf Augenhöhe solche Anwendungen entscheidend verbessern. Ein vielversprechender Ansatz sind Anaphern, die den Text semantisch-syntaktisch verknüpfen und dadurch den Inhalt eines Textes an der Oberfläche spiegeln. Auf Basis einer umfassenden Definition und Kategorisierung zeigt sich an einem Korpus, dass die Anaphernart, die bisher noch nie beachtet wurde, am häufigsten auftritt. Diese Erkenntnisse bergen großes Potenzial, wenn sie bei Suchmaschinen, wo Anaphern bisher generell kaum Beachtung finden, angewandt werden.

Item type: Journal article (Paginated)
Keywords: Text Retrieval, anaphor, anaphora resolution, corpus linguistics, search engines, ranking, Text Retrieval, Anapher, Anaphernauflösung, Korpuslinguistik, Suchmaschinen, Ranking
Subjects: A. Theoretical and general aspects of libraries and information. > AC. Relationship of LIS with other fields .
L. Information technology and library technology > LS. Search engines.
Depositing user: Austrian E-LIS editors
Date deposited: 17 Oct 2014 07:52
Last modified: 17 Oct 2014 07:52
URI: http://hdl.handle.net/10760/23850

References

Agarwal, Amit (06.02.2012), "A Google Search Operator That You May Not Know About!", Digital Inspiration, http://www.booleanblackbelt.com/2011/06/beyond-boolean-search-proximity-and-weighting/ (letzter Zugriff: 28.03.2014).

Baldwin, Breck (1997), "CogNIAC: High Precision Coreference with Limited Knowledge and Linguistic Resources", in Ruslan Mitkov & Branimir Boguraev, Hg., Proceedings of the ACL'97/EACL'97 Workshop on Operational Factors in Practical, Robust Anaphora Resolution for Unrestricted Texts, S. 38–45.

Eberle, Kurt (2003), "Anaphernresolution in flach analysierten Texten für Recherche und Übersetzung", in Ute Seewald-Heeg, Hg., Sprachtechnologie für die multilinguale Kommunikation. Textproduktion, Recherche, Übersetzung, Lokalisierung, Sankt Augustin: Gardez!, S. 216–232.

"Exalead: Web Search Syntax" (2014), http://www.exalead.com/search/web/search-syntax/ (letzter Zugriff: 26.03.2014).

Fuhr, Norbert (2011), "Einführung in Information Retrieval. Skriptum zur Vorlesung im WS 2011/12", http://www.is.informatik.uni-duisburg.de/courses/ir_ws11/folien/skript_1-6.pdf (letzter Zugriff: 28.03.2014).

Haghighi, Aria & Dan Klein (2009), "Simple Coreference Resolution with Rich Syntactic and Semantic Features", Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, S. 1152–1161.

Henrich, Andreas (2007), Information Retrieval 1. Kurs im Wintersemester 2007/2008 (Skript zum VHB-Kurs), 2008 publiziert als Information Retrieval 1. Grundlagen, Modelle und Anwendungen, Bamberg: Otto-Friedrich-Universität Bamberg, http://www.uni-bamberg.de/minf/ir1-buch/ (letzter Zugriff: 16.03.2014).

Hobbs, Jerry R. (1976), "Pronoun Resolution" (Forschungsbericht), New York: City University of New York, http://www.isi.edu/~hobbs/PronounResolution.pdf (letzter Zugriff: 04.04.2014).

Jackson, Peter & Isabelle Moulinier (2002), Natural Language Processing for Online Applications. Text Retrieval, Extraction and Categorization, Amsterdam – Philadelphia: Benjamins.

Jurafsky, Daniel & James H. Martin (2009), Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (2. Aufl.), Upper Saddle River, New Jersey: Pearson.

Lappin, Shalom & Herbert J. Leass (1994), "An Algorithm for Pronominal Anaphora Resolution", Computational Linguistics, 20 (4), S. 535–561.

Levene, Mark (2010), An Introduction to Search Engines and Web Navigation (2. Aufl.), Hoboken, NJ: Wiley.

Liddy, Elizabeth DuRoss (1990), "Anaphora in Natural Language Processing and Information Retrieval", Information Processing & Management, 26 (1), S. 39-52.

Mitkov, Ruslan (2002), Anaphora Resolution, London et al.: Longman.

Mitkov, Ruslan & Catalina Hallett (2007), "Comparing Pronoun Resolution Algorithms", Computational Intelligence, 23 (2), S. 262–297.

Pirkola, Ari (1999), "Studies on Linguistic Problems and Methods in Text Retrieval. The Effects of Anaphor and Ellipsis Resolution in Proximity Searching, and Translation and Query Structuring Methods in Cross-Language Retrieval" (Doktorarbeit), Tampere: University of Tampere, http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.138.8052&rep=rep1&type=pdf (letzter Zugriff: 27.03.2014).

Schmolz, Helene & David Coquil (2014), "Anaphernresolution im Text Retrieval – Ein sprachwissenschaftlich-informationstechnologischer Ansatz zur qualitativen Verbesserung von Suchmaschinen", in Institut für interdisziplinäre Medienforschung, Suchmaschinen, Berlin: Logos, S. 63–84.

Schmolz, Helene, Mario Döller & David Coquil (2012), "In-Depth Analysis of Anaphora Resolution Requirements", Proceedings, TIR-Workshop, DEXA-Konferenz (Wien), Los Alamitos et al.: IEEE, S. 174–179.

Siddiqui, Tanveer & Uma S. Tiwary (2008), Natural Language Processing and Information Retrieval, New Delhi: Oxford University Press.

Soon, Wee Meng, Hwee Tou Ng & Daniel Chung Yong Lim (2001), "A Machine Learning Approach to Coreference Resolution of Noun Phrases", Computational Linguistics, 27 (4), S. 521–544.

Stock, Wolfgang (2007), Information Retrieval. Informationen suchen und finden, München – Wien: Oldenbourg.

Stoyanov, Veselin et al. (2010), "Coreference Resolution with Reconcile", Proceedings of the ACL 2010 Conference Short Papers, S. 156–161.

Strube, Michael (2010), "Anaphernresolution", in Kai-Uwe Carstensen et al., Hg., Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Aufl.), Heidelberg: Spektrum, S. 399–409.

Uryupina, Olga (2010), "Corry: A System for Coreference Resolution", Proceedings of 5th International Workshop on Semantic Evaluation, S. 100–103.

Versley, Yannick et al. (2008), "BART: A Modular Toolkit for Coreference Resolution", Proceedings of the ACL-08: HLT Demo Session, S. 9–12.


Downloads

Downloads per month over past year

Actions (login required)

View Item View Item