Authors: Cramer, Irene
Title: Definitionen in Wörterbuch und Text
Other Titles: Zur manuellen Annotation, korpusgestützten Analyse und automatischen Extraktion definitorischer Textsegmente im Kontext der computergestützten Lexikographie
Language (ISO): de
Abstract: Obwohl gute Suchmaschinen heute bereits den Zugang zu Dokumenten erleichtern, bleibt das Bedürfnis nach intelligenten, zielgerichteten Suchfunktionen innerhalb von Dokumenten. Die große Zahl der Dokumente und vor allem die rasche Zunahme und geringe Halbwertszeit der Daten verbietet die rein manuelle Auszeichnung. Alternativ entwickeln Computerlinguisten Methoden, die auf der Grundlage eines kleinen Ausschnitts manuell aufbereiteter Daten Verfahren zur automatischen Extraktion implementieren. Gegenstand der vorliegenden Dissertation ist es, den Begriff der Definition im Sinn von Annotationsrichtlinien zu operationalisieren sowie Ressourcen und Methoden zur automatischen Extraktion definitorischer Textsegmenten zu untersuchen. Auf der Basis eines mit diesen Annotationsrichtlinien manuell aufbereiteten Korpus wurden Merkmale zum Aufspüren und Auszeichnen von definitorischen Textsegmenten abgeleitet. Diese Merkmale wurden in einem System implementiert, das zur automatischen Extraktion von Definitionen eingesetzt werden und z. B. als Hilfsmittel für die lexikographische Arbeit dienen kann. Im Zusammenhang mit den verschiedenen Extraktionsexperimenten wurde zudem eine Sammlung von mehr als 3.000 Textsegmenten zusammengetragen, die entsprechend der in den Annotationsrichtlinien erarbeiteten Operationalisierung als Definitionen interpretiert und als eigenständiges Korpus verwendet werden können. Die verschiedenen Experimente des Dissertationsprojekts zeigen allerdings, dass es sich bei Definitionen häufig um syntaktisch, semantisch und pragmatisch äußerst komplexe Textsegmente handelt, die nicht nur schwer zu extrahieren, sondern vor allem schwer zu annotieren sind. Ob also ein Textsegment von einem Rezipienten als Definition interpretiert und genutzt wird, hängt daher von individuellen Faktoren wie der Bildung und teilweise auch der Einstellung ab.
Subject Headings: Definition
automatische Extraktion von Definitionen
manuelle Annotation von Definitionen
computergestützte Lexikographie
Informationsextraktion
Subject Headings (RSWK): Computerunterstützte Lexikographie
Definition
URI: http://hdl.handle.net/2003/27628
http://dx.doi.org/10.17877/DE290R-8780
Issue Date: 2011-02-18
Appears in Collections:Sonstige Veröffentlichungen

Files in This Item:
File Description SizeFormat 
Dissertation.pdfDNB3.37 MBAdobe PDFView/Open


This item is protected by original copyright



This item is protected by original copyright rightsstatements.org