Tagger (de)

Ein Tagger weist sprachlichen Einheiten ein Etikett (Tag) zu, das aus einer gegebenen (endlichen) Menge von Etiketten (Tagset) stammt.

Kommentare
Die Mehrzahl der verfügbaren Tagger weisen einzelnen Wortformen bzw. Token Tags zu, die morpho-syntaktische Informationen (Wortart, Genus, Numerus, etc.) repräsentieren. Aber es gibt auch Tagger, die die semantischen Rollen von Nominal- und Präpositionalphrasen (sense tagging) oder die Diskursstruktur von Texten (discourse structure tagging) identifizieren sollen.

Konzeptuell kann Tagging als ein dreistufiger Prozess betrachtet werden: (i). Identifikation der Einheiten (ii). Zuordnung der möglichen Lesarten und (iii). Disambiguierung.

Man unterscheidet zwischen regelbasierten und stochastischen Taggern. Allerdings gibt es Tagger, die Regel und stochastische Informationen verwenden.

Die von morpho-syntaktischen Tagger erzielte Genauigkeit (Korrektheit) liegt in der Regel bei mindestens 95%.

Subtypen

 * Brill Tagger
 * HMM Tagger
 * Memory-based Tagger
 * TreeTagger

Herkunft
englisch to tag - markieren, mit einem Etikett versehen

Andere Sprachen

 * Englisch tagger