Lemma

Ein Lemma bezeichnet in der Linguistik den Repräsentanten eines Lexems. Dies bezieht sich in der Lexikografie auf ein sprachliches Nachschlagewerk. In der Psycholinguistik wird der Begriff in Zusammenhang mit dem mentalen Lexikon verwendet.

Wortherkunft
Der Begriff „Lemma“ findet sich sowohl in der lateinischen Sprache, wo er „Überschrift“ bedeutet, als auch in der Griechischen Sprache, wo er mit „alles, was man nimmt“ übersetzt werden kann.

Die Verwendung des Begriffes „Lemma“ in der Psycholinguistik wurde (ebenso wie die Verwendung des Begriffes „Lexem“) von Kempen und Huijbers als erstes verwendet und etabliert.

Das Lemma in Nachschlagewerken
In der Lexikografie werden Lemmata dazu genutzt, um die Suche nach Begriffen zu erleichtern. So sind Begriffe in Nachschlagewerken, also in Lexika und Wörterbüchern, in alphabetischer Reihenfolge in Form ihres Lemmas eingetragen. Die Festlegung der Grundform, also des Lemmas eines Wortes, bezeichnet man als Lemmatisierung. Dabei erscheinen üblicherweise Substantive in ihren Nominativ Singular, Verben im Infinitiv. Die lateinische Bedeutung des Wortes kann somit wörtlich genommen werden: Unter der Überschrift eines Lemmas sind die Informationen zu einem Begriff zusammengefasst, die diesen ausmachen. Das Lemma an sich enthält also schon die in Nachschlagewerken ausführlich dargelegte Bedeutung.

Das Lemma im mentalen Lexikon
In der Psycholinguistik ist häufig davon die Rede, dass Wörter auf zwei verschiedene Arten im mentalen Lexikon gespeichert sind: als Lemma und als Lexem, oder Form. Während das Lexem die morphologischen und phonologischen Informationen eines Wortes enthält, enthält das Lemma die bedeutungsrelevanten (semantischen) und syntaktischen Informationen.

Speicherung
In der Linguistik gibt es zwei verschiedene Ansätze, in welchem Verhältnis Lemma und Lexem im mentalen Lexikon zueinander stehen könnten. In einem modularen zwei-Phasen-Modell, wie etwa von Garrett 1988 postuliert, würden in der Sprachverarbeitung nacheinander zwei verschiedene Phasen durchlaufen, die eine getrennte Verarbeitung von Lemma und Lexem ermöglichen würden. In einem vernetzten, interaktiven Modell, wie etwa 1981 von Dell und Reich vorgeschlagen, gäbe es zwar die Trennung von Lemma und Lexem, diese stünden aber durch neuronale Verbindungen in ständigem Kontakt zueinander und würden somit gleichzeitig verarbeitet.

In einem Experiment von Schriefers, Meyer und Levelt bestätigte sich tatsächlich ein Zweiteilung von Lemma und Lexem, die auf eine serielle Verarbeitung hindeutete: Versuchspersonen sollten in diesem Experiment Bilder benennen, die auf einem Computerbildschirm angezeigt wurden. Dabei wurde den Versuchspersonen jeweils entweder 150 ms vor dem Erscheinen des Bildes, zusammen mit dem Erscheinen des Bildes, oder 150 ms nach dem Erscheinen des Bildes per Lautsprecher ein Störwort präsentiert. Dieses Störwort war entweder phonologisch oder semantisch ähnlich zu dem abgebildeten Begriff. Gemessen wurde die Reaktionszeit der Versuchspersonen. Dabei stellte sich heraus, dass ein semantisch ähnliches Wort die Bildbenennung hemmt, wenn es 150 ms vor dem Bild präsentiert wird. Ein phonologisch ähnliches Wort dagegen erleichtert die Bildbennenung, wenn es 150 ms nach dem Erscheinen des Bildes präsentiert wird. Diese Ergebnisse wurden als Evidenz dafür gedeutet, dass erstens Lemma und Lexem getrennt voneinander gespeichert sind und dass zweitens der Zugriff auf das Lemma bei der Sprachproduktion vor dem Zugriff auf das Lexem erfolgt, da die gemessenen semantischen Effekte zeitlich vor den phonologischen Effekten liegen. Es wird also dementsprechend zunächst der semantische und syntaktische Gehalt von Sprache kodiert, bevor die äußere Form generiert wird.

Diese Zweiteilung wird auch im Blueprint-Modell von Willem Levelt aufgegriffen. Dieses Modell ist modular aufgebaut. Vom Gedanken zum Sprachsignal müssen verschiedene Stadien durchlaufen werden: Nachdem im Conceptualizer ein Konzept der sprachlichen Borschaft, eine so genannte präverbale Nachricht (preverbal message) generiert wird, wird diese im Formulator in einen phonetischen Plan (phonetic plan) umgewandelt. Dies geschieht in zwei Schritten: Zunächst wird während der grammatischen Enkodierung auf die jeweiligen Lemmata zugegriffen. In der phonologischen Enkodierung werden dann den Lemmata die entsprechenden Lexeme zugeordnet und miteinander verbunden. Anschließend wird im Formulator das tatsächliche Sprachsignal generiert. Während in der frühen Version des Blueprint-Modells nur ein sehr begrenzter Austausch zwischen der grammatischen und der phonologischen Enkodierung angenommen wurde, geht die neuere Version davon aus, dass diese beiden Module zumindest miteinander in Verbindung stehen.

Lemmazugriff
Eine häufig gestellte Frage in der Psycholinguistik ist die Frage, wie eine Verbindung zwischen Wortform und Bedeutung hergestellt werden kann. Dabei spielt die Art des Zugriffs auf Lemmata eine wichtige Rolle. Vor allem in den 1980er und 1990er Jahren kursierten diesbezüglich verschiedene Theorien. Zumeist wird davon ausgegangen, dass der semantische Gehalt, der ein wichtiger Bestandteil des Lemmas eines Begriffes ist, in kleinere Bestandteile, so genannte Seme, dekomponiert werden kann. Allerdings kommt es bei dieser Betrachtungsweise zu Komplikationen, will man Sprachverarbeitung erklären und modellieren.

So machte Willem Levelt darauf aufmerksam, dass es einen Mechanismus geben müsse, der bei der Sprachproduktion dafür sorgt, dass nicht das Hyperonym eines Lemmas ausgewählt werde, sondern das Lemma selbst. Dieses so genannte Hyperonym-Problem entsteht dadurch, dass es mit den herkömmlichen Möglichkeiten wie Fragen oder Tabellen nur schwer möglich ist, ein konkretes Lemma zu bestimmen und einem abstrakten, höherrangigen Lemma vorzuziehen, da Hyperonyme immer auch die Seme ihrer Hyponyme beinhalten. Ein Lösungsvorschlag kommt unter anderem von Roelofs, welcher postuliert, dass jedem lexikalischen Konzept genau ein Netzknoten in einem neuronalen Netzwerk zugeordnet sei. Auf der nächsten Ebene seien die Lemmata mit diesen Konzepten verbunden und würden von ihnen Aktivation erfahren. Somit wäre der semantische Gehalt eines Lemmas nicht zwingend dekompositional zu betrachten, sondern könnte pro Lemma an jeweils ein Konzept gebunden sein. Beispielsweise wäre der Begriff Vater(X,Y) nicht mehr in die Bestandteile männlich(X) und Elternteil(X,Y) zerlegbar, sondern könnte als eigenständiges Konzept aktiviert werden. Damit wären die semantischen Bestandteile männlich(X) und Elternteil(X,Y) zwar noch immer durch Vater(X,Y) aktivierbar, wären aber für das Verständnis dieses Konzeptes nicht zwingend notwendig.

Die konnektionistische Sichtweise auf Spracherkennungsprozesse ist in der aktuellen Forschung fortgeführt und erweitert worden. Allerdings veränderte sich mit dem Fortschritt der modernen Technik auch die Herangehensweise an Fragestellungen, die neuronale Netzwerke betreffen, da es nun möglich ist, noch viel komplexere Netze zu verstehen und zu simulieren. Theorien des Embodiment etwa gehen davon aus, dass die einzelnen Bereiche des Gehirns nicht separat arbeiten, sondern ebenfalls miteinander vernetzt sind. Somit sei es möglich, durch Aktivierung von Motorregionen die Bedeutung von Wörtern aufzurufen. Die Verbindung zwischen Spracherkennung und Aktivation von Motorregionen wurde unter anderem in den EEG-Experimenten von Friedemann Pulvermüller nachgewiesen. Hierbei hörten Versuchspersonen Aktionsverben, die Handlungen bezeichneten, die mit typischen Körperpartien ausgeführt werden (beispielsweise „kick“; deutsch: „treten“). Das EEG zeigte eine Aktivation in den Hirnregionen, die für die Ausführung der Bewegung zuständig sind (beispielsweise für die Bewegung des Beines und Fußes), und das nur 30 ms nach der Aktivation der Sprachregion. Diese frühe Aktivierung ist nicht als Folge des Sprachverstehens zu verstehen, sondern deutet an, dass die Aktivierung bestimmter Motorregionen notwendig für das Verstehen entsprechender Wörter ist. Daraus lässt sich schließen, dass auch für die Sprachproduktion der Zugriff auf die Bedeutung eines Wortes durch die Aktivierung entsprechender Neuronen geschieht, die mit dem sinnlichen Erleben der mit dem Wort verbundenen Bedeutung zusammenhängen. Das Lemma könnte also diesen neuen Erkenntnissen zufolge als eine Kombination sinnlicher Erinnerungen gespeichert sein, die zusammen die Bedeutung eines Wortes ausmachen.

Diese Sichtweise ist mit älteren Theorien, nach denen das Lemma ein Mediator zwischen Konzepten und der sprachlichen Oberfläche ist, teilweise deckungsgleich. Als ein solcher Mediator zwischen Konzepten, die mit Hilfe von Aktivierung perzeptiv wichtiger Hirnregionen aufgerufen werden können, und der sprachlichen Generierung, könnten nach neuesten Erkenntnissen eventuell Spiegelneuronen dienen, die im Broca-Zentrum des Gehirns zu verorten sind.

Literatur

 * Dell, G. S., & Reich, P. A. (1981). Stages in sentence production: An analysis of speech error data. Journal of verbal learning and verbal behavior, 20(6), 611-629.


 * Garrett, M. F. (1989). 3 Processes in language production. Linguistics: The Cambridge Survey: Volume 3, Language: Psychological and Biological Aspects, 3, 69.


 * Kempen, G., & Huijbers, P. (1983). The lexicalization process in sentence production and naming: Indirect election of words. Cognition, 14(2), 185-209.


 * Levelt, W. J. (1993). Speaking: From intention to articulation (Vol. 1). MIT press.


 * Pulvermüller, F. (2005). Brain mechanisms linking language and action. Nature Reviews Neuroscience, 6(7), 576-582.


 * Roelofs, A. (1992). A spreading-activation theory of lemma retrieval in speaking. Cognition, 42(1), 107-142.


 * Schriefers, H., Meyer, A. S., & Levelt, W. J. (1990). Exploring the time course of lexical access in language production: Picture-word interference studies. Journal of Memory and Language, 29(1), 86-102.