ICRA
                   INSTITUTE FOR COMPUTER-ASSISTED RESEARCH IN ASTRONOMY

SUMMARIZER - automatische Zusammenfassung von Dokumenten (1998)

Problemstellung:

Dokumente (Angebot, Bericht, Beschreibung, Vertrag, etc.), erfordern meist zuviel Zeit zum Lesen. Gleiches trifft zu mit dem Resultat einer Suche innerhalb einer Datenbank. Diese Dokumente hätte man gerne in verkürzter Form und nach den wesentlichen Inhalten sortiert vorliegen, um eine Entscheidung treffen zu können. Eine solche Zusammenfassung wird vom Menschen erstellt, der das Dokument liest, wesentliche Inhaltsbegriffe sich notiert und einen Abstract schreibt. Dieser Vorgang ist langwierig und teuer und birgt in sich die Gefahr der Interpretation des Lesenden: er produziert seine Sicht auf die Dinge.
 

Lösung:

Mit dem Modul Summariser kann eine automatische Zusammenfassung von relevanten Inhalten eines Dokumentes nach linguistischen Gesichtspunkten erstellt werden. Vorausgehend ist eine Suche in strukturierter oder unstruk­turierter Form (Volltext oder relationale Suche in den Attributen). Treffer werden als Dokumente gemeldet, mittels Summariser erfolgt die Erstellung einer Zusammenfassung nach Benutzer­vorgabe:

·         Sprache (deutsch, englisch und französisch)

·         Präsentation als Datei und/oder Anzeige am Bildschirm

·         Anzahl oder Prozentsatz von Begriffen

·         Anzahl oder Prozentsatz von relevanten Sätzen.

Die gefundenen Begriffe und Sätze werden nach ihrer "Wertigkeit" oder Relevanz angeordnet und in einem Fenster gegenüber dem Originaltext angezeigt. In den meisten Fällen liest  sich das Resultat wie eine gut formulierte Zusammenfassung. Die Anzeige kann auch als Funktion der Wertigkeit der einzelnen Sätze / Begriffe eingestellt werden, so dass ein Benutzer sofort die Relevanz eines gefundenen Satzes oder Begriffes sieht. Durch Anklicken erfolgt der Verweis auf die Stelle im Dokument selbst.

Einschränkungen: Gedichte ergeben keinen Sinn im Summarizer!