TGU IS2

Dr. Bernd Bohnet
Azenbergstraße 12
70174 Stuttgart

Telefon:   +49 711 685 8135-8
eMail:   bohnet@informatik.uni-stuttgart.de

Die Tätigkeitsfelder des Unternehmens umfassen die Textgenerierung und Textanalyse. Bei der automatischen Textgenerierung werden aus Daten Texte erzeugt. Dazu werden Daten analysiert und wichtige Informationen ausgewählt. Anhand der Informationen wird der rhetorische Aufbau eines Dokuments erstellt, Informationen zusammengefasst und der Inhalt zunächst formal repräsentiert. Aus diesen Repräsentationen werden durch Grammatiken der jeweiligen Zielsprache die Syntax, Wortstellung und Wortformen generiert. Daraus werden Sätze und Texte gebildet. In die Texte können Tabellen und Grafiken automatisch eingebettet werden, sodass multimodale Dokumente entstehen. Das Einsatzgebiet der automatischen Textgenerierung liegt vor allem in der sprachlichen Aufbereitung von regelmäßig anfallen Daten. Einsatzgebiete sind beispielsweise die Generierung von Wetterberichten, Luftschadstoffberichten und Börseninformationen.

Bei der Textanalyse werden Informationen aus Texten automatisch extrahiert. Dies reicht von einer einfachen Aufteilung des Texts in Paragrafen, Sätze und Wörter, über die Analyse der Wortformen und der syntaktischen Analyse bis hin zur Extraktion von Bedeutungsinhalten. Das Einsatzgebiet der Textanalyse liegt vor allem in der Informationsgewinnung und Unterstützung bei der Texterstellung. Die Textanalyse ist Basistechnologie beispielsweise für Suchmaschinen, zur Aufbereitung von linguistischen Ressourcen und für die automatischen Rechtschreibkorrektur. Die Textanalyse und Textgenerierung lassen sich sehr gut kombinieren in Systemen zur maschinellen Übersetzung, automatischen Textzusammenfassung und Dialogsystemen.