Automatische Kategorisierung von Volltexten unter Anwendung von NLP-Techniken

dc.contributor.authorSchewe, Sandrade
dc.date.accessioned2004-12-06T12:53:41Z
dc.date.available2004-12-06T12:53:41Z
dc.date.created1997de
dc.date.issued1999-10-29de
dc.description.abstractDie vorliegende Arbeit befasst sich mit der Informationsgewinnung aus Daten, wie sie das World Wide Web zur Verfügung stellt. Dabei liegt der Schwerpunkt auf der Verarbeitung von Volltexten, denn ein grosser Anteil der Daten ist im WWW in dieser Form verfügbar. Zur Unterstützung der Informationsgewinnung werden die Volltexte kategorisiert, so dass ein Benutzer entweder gezielt in einer Kategorie nach bestimmten Informationen suchen kann, oder so dass ihm nach Themen sortierte Texte vorgelegt werden können, aus denen er nach Interesse Themengebiete auswählen kann. Zur Kategorisierung der Texte werden Techniken aus dem Bereich Natural Language Processing, kurz NLP-Techniken, herangezogen. Überlegungen zu den besonderen Eigenschaften der deutschen Sprache führen zu der hier vorgestellten Verfahrensweise. Experimente werden zeigen, in wie weit der Einsatz von NLP-Techniken und damit die Berücksichtigung von Sprache von Nutzen ist. The paper is written in German.de
dc.format.extent1993783 bytes
dc.format.extent875630 bytes
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/postscript
dc.identifier.issn0943-4135de
dc.identifier.urihttp://hdl.handle.net/2003/2594
dc.identifier.urihttp://dx.doi.org/10.17877/DE290R-5096
dc.language.isodede
dc.publisherUniversität Dortmundde
dc.relation.ispartofseriesForschungsberichte des Lehrstuhls VIII, Fachbereich Informatik der Universität Dortmund ; 22de
dc.subject.ddc004de
dc.titleAutomatische Kategorisierung von Volltexten unter Anwendung von NLP-Technikende
dc.typeTextde
dc.type.publicationtypereport
dcterms.accessRightsopen access

Files

Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
report22_ps.pdf
Size:
855.11 KB
Format:
Adobe Portable Document Format
Description:
DNB
No Thumbnail Available
Name:
report22_ps.ps
Size:
1.9 MB
Format:
Postscript Files