Intelligence Service

Baumann, Björn; Böhmer, Martin; Firstein, Roman; Fritsch, Regina; Günal, Emel; Güner, Mustafa; Kaz, Erkan; Koloch, Rafael; Kubatz, Marius; Viefhues, Alexander; Zhu, Qingchui

Full metadata record

DC Field	Value	Language
dc.contributor.author	Baumann, Björn	-
dc.contributor.author	Böhmer, Martin	-
dc.contributor.author	Firstein, Roman	-
dc.contributor.author	Fritsch, Regina	-
dc.contributor.author	Günal, Emel	-
dc.contributor.author	Güner, Mustafa	-
dc.contributor.author	Kaz, Erkan	-
dc.contributor.author	Koloch, Rafael	-
dc.contributor.author	Kubatz, Marius	-
dc.contributor.author	Viefhues, Alexander	-
dc.contributor.author	Zhu, Qingchui	-
dc.date.accessioned	2009-01-05T11:48:59Z	-
dc.date.available	2009-01-05T11:48:59Z	-
dc.date.issued	2009-01-05T11:48:59Z	-
dc.identifier.uri	http://hdl.handle.net/2003/25958	-
dc.identifier.uri	http://dx.doi.org/10.17877/DE290R-5085	-
dc.description.abstract	Ziel der PG ist das automatische Erstellen eines Pressespiegels für eine bestimmte Person (z.B. einen Politiker) oder eine bestimmte Firma aus dem Internet bzw. aus Datenbanken. Daraus sollen dann gezielt Antworten auf bestimmte Fragen extrahiert werden. Methoden zu einem solchen Intelligence Service werden untersucht und implementiert. Allerdings ist das Spektrum der Informationen für eine einzige Anfrage hierbei zu gross. Das Problem ist, die interessanten Daten zwischen den uninteressanten Daten herauszufinden. Dies ist das Problem des Information Retrieval. Der zu entwickelnde Intelligence Service soll natürlich über das Information Retrieval von Suchmaschinen hinausgehen. Das grundsätzliches Problem ist, dass Suchmaschinen nicht konkrete Antworten liefern. Vielmehr wird eine Auswahl an Dokumenten geliefert, die die Antwort zu gestellten Anfrage höchstwahrscheinlich enthält. Was man aber oft möchte, ist auf eine Frage wie: Welcher Bundeskanzler stellte als letztes das Misstrauensvotum? Antwort: Gerhard Schröder (zusammen mit der URL, auf der die Information gefunden wurde, zu erhalten.) Für solche Fragebeantwortung muss man nicht nur die relevanten Dokumente finden, sondern auch die relevanten Passagen,dies ist ein weiterer Punkt, der von Suchmaschinen nicht erbracht wird. Wenn die Dokumente durch eine Auszeichnungssprache (XML) annotiert sind, ist die Suche in den relevanten Dokumenten erleichtert, so dass gezielt etwa nach Investitionen, Erfolgen, neuen Produkten, Börsenzahlen gesucht werden kann. Die meisten Dokumente sind aber nicht annotiert. Man muss also algorithmisch nach Entitäten eines bestimmten Typs (z.B. Person, Ort, Firma) suchen. Das Gebiet, das sich mit der Erkennung der Entitäten eines inhaltlichen Typs in Texten befasst, ist die Named Entity Recognition (NER) und verwendet statistische Verfahren und solche des maschinellen Lernens bzw. Data Mining. Somit ist die NER ein weiterer Bereich, mit dem sich die PG befassen muss. Die Abfolge von Anfragen sollte jedoch automatisiert erfolgen, um ein allgemein nutzbares System zu scha en. Für Politiker bietet sich hierfür beispielsweise die Internetseite Bundestag.de an. Hier sind zu jedem Abgeordneten die jeweiligen Biographien hinterlegt. Zusätzlich zu diesen offensichtlichen Daten kann man jedoch auch noch die digital vorliegenden Drucksachen (z.B. Anträge) und Protokolle verarbeiten. Nach durchgeführter NER über diesen Dokumenten sollen dann konkrete Fragen beantwortet werden.	de
dc.language.iso	de	de
dc.subject.ddc	004	-
dc.title	Intelligence Service	en
dc.type	Text	de
dc.type.publicationtype	StudyThesis	de
dcterms.accessRights	open access	-
Appears in Collections:	Projektgruppenberichte

Files in This Item:

File	Description	Size	Format
PG520_Endbericht.pdf	DNB	11 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record

This item is protected by original copyright rightsstatements.org