Stemming

From Glottopedia
Revision as of 11:29, 12 July 2007 by WikiLingua (talk | contribs)
Jump to navigation Jump to search

Definition

Stemming nennt man den Vorgang, bei dem versucht wird, den Stamm eines Wortes zu isolieren. Dazu werden die Präfixe und Suffixe eines Wortes in einem Dokument oder einer Anfrage abgetrennt. Im Gegensatz zur Lemmatisierung wird beim Stemming nicht versucht, den linguistisch korrekten Stamm zu finden.

Stemming wird oft im Bereich des Information Retrievals verwendet, da dadurch verschiedene Wörter auf dieselbe Repräsentation projeziert werden können, was den Speicherbedarf verkleinert und die Verarbeitungszeit verkürzt. Die Internet-Suchmaschinen Lycos und Google verwenden Stemming.

Beispiele

Durch Stemming wird computation und auch computer auf compute reduziert.

Herkunft

engl. stem - Stamm