Die Korpusverteilung macht sichtbar welche Einflussfaktoren auf ein Korpus wirken. Was sind das für Faktoren. Bei Zeitungstexten sind es Autoren, Verlage oder auch das Datum (z. B. ändert sich bei Skandalen zu einem gewissen Zeitpunkt das Sprechen über den Skandalgegenstand). Diese Kriterien gilt es zu identifizieren um darauf aufbauend weitere Analyse durchzuführen.
Starten Sie das Analysemodul - Korpusverteilung - Tabelle
Sie sehen eine ähnliche Tabelle:
Ziehen Sie den Spaltenkopf "Kategorie" per [Drag&Drop] auf die Zeile "Drag a column here to group...". Die Tabelle wird dann gruppiert und Sie können die Gruppen aufklappen (Gruppe anklicken).
Damit die Ergebnisse sortiert sind klicken Sie auf den Spaltenkopf "Token" und sortieren Sie die Tabelle absteigend (von groß nach klein). Die Sortierung wird für alle Gruppen durchgeführt.
Notieren Sie sich aus allen aus ihrer Sicht sinnvollen Gruppen die häufigsten 5-10 Einträge (Kategorie, Metadaten und Token).
Tipp: Bei einigen Kategorien kann es auch interessant sein nach der Spalte "Dokumente" zu sortieren. So finden Sie z. B. schnell Zeitungen mit vielen Artikeln oder ein Datum an dem besonders viele Artikel erstell, wurden.