Authors: Schewe, Sandra
Title: Automatische Kategorisierung von Volltexten unter Anwendung von NLP-Techniken
Language (ISO): de
Abstract: Die vorliegende Arbeit befasst sich mit der Informationsgewinnung aus Daten, wie sie das World Wide Web zur Verfügung stellt. Dabei liegt der Schwerpunkt auf der Verarbeitung von Volltexten, denn ein grosser Anteil der Daten ist im WWW in dieser Form verfügbar. Zur Unterstützung der Informationsgewinnung werden die Volltexte kategorisiert, so dass ein Benutzer entweder gezielt in einer Kategorie nach bestimmten Informationen suchen kann, oder so dass ihm nach Themen sortierte Texte vorgelegt werden können, aus denen er nach Interesse Themengebiete auswählen kann. Zur Kategorisierung der Texte werden Techniken aus dem Bereich Natural Language Processing, kurz NLP-Techniken, herangezogen. Überlegungen zu den besonderen Eigenschaften der deutschen Sprache führen zu der hier vorgestellten Verfahrensweise. Experimente werden zeigen, in wie weit der Einsatz von NLP-Techniken und damit die Berücksichtigung von Sprache von Nutzen ist. The paper is written in German.
URI: http://hdl.handle.net/2003/2594
http://dx.doi.org/10.17877/DE290R-5096
Issue Date: 1999-10-29
Provenance: Universität Dortmund
Appears in Collections:LS 08 Künstliche Intelligenz

Files in This Item:
File Description SizeFormat 
report22_ps.pdfDNB855.11 kBAdobe PDFView/Open
report22_ps.ps1.95 MBPostscriptView/Open


This item is protected by original copyright



This item is protected by original copyright rightsstatements.org