Piotrowski-Gesetz

Piotrowski-Gesetz ist die Bezeichnung für das in der quantitativen Linguistik verwendete Sprachwandelgesetz. Es ist ein Modell für die Verbreitung neuer sprachlicher Formen in einer Sprachgemeinschaft. Es baut dabei auf dem der Epidemiologie entlehnten Modell der Krankheitsverbreitung auf.

Eine Veränderung in einer Sprachgemeinschaft fängt dem Modell nach bei einer oder einigen wenigen Personen an. Ähnlich einem Virus verbreiten sich diese Veränderungen einer sprachlichen Form durch Interaktion. Die die neue Form bereits benutzenden, "infizierten", Individuen treten durch Kommunikation in Kontakt mit jenen Individuen, die noch die alte Form benutzen, also noch nicht "infiziert" sind. Nun besteht die Möglichkeit, dass die Person, mit der kommuniziert wird, die neue Form ebenfalls annimmt. Die Ausbreitung fängt langsam an, beschleunigt, sobald sie beginnt allgemein akzeptiert zu werden, und verlangsamt sich dann wieder, sobald es weniger ansteckbare Personen gibt.

Intuitiv kann man sich den Graph eines Diagramms für die Ausbreitung der neuen Form über die Zeit folglich s-förmig vorstellen.

Der von Piotrowski erarbeitete Ansatz wurde von Altmann aufgegriffen und auf unvollständige und rückläufige Prozesse erweitert.

Geschichte
Bereits in den 60er Jahren stellten verschiedene Autoren qualitative Annahmen über den Verlauf der beschriebenen Kurve an.

1974 wurde der Sachverhalt erstmals von dem Sankt Petersburger Linguisten Rajmund G. Piotrowski in Zusammenarbeit mit seiner Frau A. A. Piotrowskaja genauer untersucht. Sie stellten erstmals die unten angegebenen Formeln auf. Belege für diese erbrachten sie anhand von Messdaten zur Änderung des Anteils der endungslosen Genitivformen im Russischen.

1983 wurde dieser Ansatz von Gabriel Altmann aufgegriffen und die besagten Formeln erstmals als Piotrowski-Gesetz bezeichnet. Im Rahmen seiner Arbeit wurde das Gesetz dahingehend verallgemeinert, dass auch unvollständige Ausbreitungen und rückläufige Anpassungsprozesse damit modelliert werden können. Die resultierende Formel (ohne die Verallgemeinerungen) ist nur noch auf den zweiten Blick zu jener von Piotrowskaja und Piotrowski gleich.

Das ursprüngliche Piotrowski-Gesetz
Piotrowskaja und Piotrowski verwendeten zur erwähnten Modellierung des Anteils der endungslosen Genitivformen im Russischen über die Zeit zwei verschiedene Funktionen. Zum Einen einen Arcustangens:

$$p(t) = \frac{1}{\pi} * arctan \, \mu (t - t_1) + \frac{1}{2}$$

Zum Anderen einen hyperbolischen Tangens:

$$p(t) = \frac{1}{2} * tanh \, \mu (t - t_1) + \frac{1}{2}$$

In beiden Formeln steht $$t$$ für die Zeit, und $$t_1$$ ist die Konstante für den Zeitpunkt, an dem der Anteil der neuen Form 50% beträgt. Wir überspringen eine eingehendere Beschäftigung mit dieser Formel, insbesondere mit der Bestimmung der Parameter $$\mu$$ und $$t_1$$, um uns ausführlicher mit den Verallgemeinerungen Altmanns auseinanderzusetzen. Diese wird eine detailliertere Beschäftigung mit der Bestimmung der Parameter beinhalten, welche auch auf die Formeln von Piotrowskaja und Piotrowski rückübertragen werden können.

Altmanns Verallgemeinerungen
Auf dem epidemiologischen Ansatz der Interaktion aufbauend definiert Altmann eine Ausbreitungsgeschwindigkeit $$p'(t)$$. Ähnlich der physikalischen Geschwindigkeit wird hier die Ausbreitungsgeschwindigkeit als Ableitung nach der Zeit betrachtet. Die Ausbreitungsgeschwindigkeit ist proportional zu den Anteilen der neuen Formen $$p(t)$$ und der alten Formen $$1 - p(t)$$. Mit einem Proportionalitätsfaktor $$r$$ stellt Altmann folgende Differentialgleichung auf:

$$p'(t) = r * p(t) * (1 - p(t))$$

Die Lösungsmenge dieser Differentialgleichung ist gegeben durch:

$$p(t) = \frac{1}{1 + a * e^{-rt}}$$

Bei Altmanns Formeln ist der Parameter $$a$$ eine positive Zahl, welche den Graph der Funktion auf der Zeitachse verschiebt. Wählt man $$a = 1$$, so liegt der Zeitpunkt, an welchem die neue Form einen Anteil von 50% erlangt hat ($$p(t) = \frac{1}{2}$$), bei $$t = 0$$. Der Parameter $$r$$ ist positiv (exklusive 0!) und modelliert die Steilheit der Kurve, also die Geschwindigkeit mit der sich die neue Form ausbreitet. Ein hoher Faktor bedeutet hierbei eine schnelle Ausbreitung. Diese Differentialgleichung für $$p'(t)$$ kann die abgeleitete Grundformel für $$p(t)$$ erklären, die, wie wir gleich sehen werden, analog zur Ursprungsformel von Piotrowski betrachtet werden kann. Des weiteren vermag die Differentialgleichung auch, die im Weiteren vorgestellten Verallgemeinerungen zu beschreiben.

Vergleich von Altmanns Formel mit der Ursprungsformel
Der Parameter $$a$$ der Formel von Altmann gleicht in der Funktion dem Parameter $$t_1$$ der Ursprungsformel (Verschiebung des Graphen auf der Zeitachse). Hierbei hat der Wert $$a = 1$$ den Effekt von $$t_1 = 0$$, also einen Wert $$p(t) = \frac{1}{2}$$ an der Stelle $$t = 0$$. Der Parameter $$r$$ für die Steilheit der Kurve kann analog zum Faktor $$\mu$$ in der Formel von Piotrowskaja und Piotrowski betrachtet werden. Die Gleichheit der Formel von Altmann und der ursprünglichen Formel mit hyperbolischem Tangens ergibt sich mit $$\mu = 1$$ und $$t_1 = \frac{ln(a)}{r}$$:

$$\frac{1}{1 + a * e^{-rt}} = \frac{1}{2} * tanh \, 1 * (t - \frac{ln(a)}{r}) + \frac{1}{2}$$

Bisher stellt Altmanns Formel also nur eine alternative Schreibweise zu Piotrowskis Formel dar. Im Folgenden werden nun seine darauf aufbauenden Erweiterungen vorgestellt.

Unvollständige Ausbreitung
Für ein Modell mit unvollständiger Ausbreitung einer neuen Form und daraus resultierender Koexistenz beider Versionen führt Altmann einen Parameter $$c$$ ein. Dieser Parameter gibt den finalen Anteil der neuen Form in der Sprachgemeinschaft an. Formal ist dieser gegeben als der Limes für t gegen unendlich. Ein Wert von $$c = \frac{1}{2}$$ kennzeichnet also beispielsweise eine Koexistenz beider Formen zu gleichen Anteilen nach Abschluss des Wandlungsprozesses. Er stellt hierzu in analoger Herangehensweise folgende Differenzialgleichung für die Ausbreitungsgeschwindigkeit auf:

$$p'(t) = r * p(t) * (c - p(t))$$

Auch hier erhält man analog aus der Lösung der Differentialgleichung die Formel zur Verbreitung einer neuen sprachlichen Form nach der Zeit:

$$p(t) = \frac{c}{1 + a * e^{-rct}}$$

Man sieht leicht, dass bei einer vollständigen Ersetzung der alten durch die neue Form, also einem Parameter $$c = 1$$, die erweiterten Gleichungen mit den vorhergehenden übereinstimmen.

Rückläufige Anpassungsprozesse
Als zweite Verallgemeinerung des Piotrowski-Gesetzes betrachtet Altmann Prozesse, bei denen eine neue Form zunächst angenommen, jedoch vor ihrer vollkommenen oder teilweisen Akzeptanz wieder abgestoßen wird.

Beispiele für solche Entwicklungen sind Sprachbereiche die Moden folgen, wie beispielsweise Vornamen oder auch Jugendsprache.

Um die Abnahme des Anteils einer sprachlichen Form modellieren zu können - zunächst alleinstehend betrachtet, getrennt von der vorhergehenden Zunahme ihres Anteils in der Sprachgemeinschaft - müssen wir einen negativen Parameter $$r$$ erlauben. Formal unproblematisch widerspricht diese Annahme jedoch dem epidemiologischen Ansatz, nach welchem sich eine neue Form in einer Gemeinschaft durch Interaktion bis hin zu einem Maximalwert verbreitet und bei diesem verweilt. Altmann führt hierzu einen Verweis zur synergetischen Linguistik auf, in welcher auch die Ersetzung einer Form durch eine funktional äquivalente – einem so genannten Synonym - modelliert wird. Die Ausbreitung einer solchen funktional äquivalenten Form kann wiederum mit den bisher vorgestellten Formeln hinreichend beschrieben werden. Formal erweitert sich also der Wertebereich von $$r$$ auf negative Werte. Ein Parameter $$r = 0$$ bleibt jedoch weiter ausgeschlossen, da er keine Veränderung modelliert.

Weiterhin war der Parameter bisher eine Konstante, was in der vorgestellten Differentialgleichung von Altmann keine Möglichkeit für eine Änderung der Ausbreitungsgeschwindigkeit im Verlauf des Veränderungsprozesses lässt. Nun soll jedoch zugelassen werden, dass sich die Ausbreitungsgeschwindigkeit mit der Zeit verändert. Demzufolge muss $$r$$ nun, wie $$p$$ selbst, ebenfalls als eine Funktion der Zeit betrachtet werden:

$$p'(t) = r(t) * p(t) * (c - p(t))$$

Die Lösung der Gleichung ergibt wiederum folgende Formel:

$$p(t) = \frac{c}{1 + a * e^{-cR(t)}}$$

In dieser Formel steht $$R(t)$$ erwartungsgemäß für die Stammfunktion von $$r(t)$$ aus der zugehörigen Differentialgleichung.

Zur Wahl der Parameter a, c und r
In "Das Piotrowski-Gesetz und seine Verallgemeinerungen" gibt Altmann verschiedene Wege an, aus gegebenen empirischen Daten die vorgestellten Funktionen aufzustellen, also für den Einzelfall die angegeben Parameter festzulegen. Je nachdem, ob man eine vollständige oder eine partielle Ausbreitung modellieren möchte, gibt es zwei (a und r) oder drei (a, c und r) Unbekannte. Für händisches Rechnen gibt er in seiner Arbeit von 1984 mehrere Methoden an, aus den gegebenen Daten zwei oder drei (t, p(t))-Paare zu bekommen. Mit diesen kann man dann ein entsprechendes Gleichungssystem mit zwei oder drei Unbekannten aufstellen und es händisch lösen. Altmann gibt sowohl Verfahren an, tatsächliche Messpunkte "intelligent" auszuwählen, als auch Verfahren, aus den empirischen Daten künstliche, bessere "Messpunkte" zu berechnen. Zur computergestützten Berechnung gibt er Anweisungen zur Bestimmung der Parameter mit Methoden der kleinsten Quadrate sowie mit Taylorreihen.

Zur Wahl von r(t)
Für $$r(t)$$ gibt es theoretisch unendlich viele Funktionen, die in die Formel eingesetzt werden können. Jedoch sollte $$r(t)$$ einigen Einschränkungen genügen:

Ein transparenteres Modell ergibt sich vor allem dann, wenn man Zu- und Abnahme einer sprachlichen Form getrennt modelliert. Hintergrund dessen ist, dass die beiden Prozesse zumeist auch auf unterschiedliche Systembedürfnisse zurückzuführen sind. Im weiteren Verlauf führen diese unterschiedlichen Systembedürfnisse auch zu unterschiedlichen Ausbreitungs- und Rückgangsgeschwindigkeiten und somit unterschiedlichen Parametern. So fußt beispielsweise die Ausbreitung des epithetischen e wohl auf einem Bedürfnis nach Reduktion von Komplexität, dessen Rückgang wahrscheinlich auf einem Bedürfnis nach Reduktion von Artikulationsaufwand (vgl. hierzu Imsiepen 1983). Bei einer getrennten Modellierung muss man darauf achten, dass die für $$r(t)$$ eingesetzten Funktionen jede für sich keinen Vorzeichenwechsel besitzen.

Einen geeigneten allgemeinen Parameter zu finden ist unmöglich, vor allem da die Faktoren auf realen Gegebenheiten wie zum Beispiel der Kultur fußen, die außerhalb linguistischer Kompetenz liegen.

Anwendungsbereiche
Eine Fülle von Untersuchungen zum morphologischen und syntaktischen Wandel ebenso wie zu Entlehnungsprozessen und Änderungen orthographischer Gewohnheiten zeigt, dass dieser Ansatz sich eignet, um den Verlauf von Sprachwandelvorgängen zu modellieren. Auch die Entwicklung des Wortschatzes von Sprachen unterliegt diesem Gesetz; dies gilt sowohl für den Verlust als auch für die Erweiterung des Wortschatzes. Das gleiche Modell bewährt sich aber auch als Spracherwerbsgesetz: Der Erwerb des Wortschatzes der Muttersprache und etliche andere Lernprozesse vollziehen sich auf diese Weise.

Die weitaus meisten Sprachwandel, die bisher beobachtet wurden, zeigen einen erstaunlich „glatten“ Verlauf mit nur geringen Abweichungen von einer berechneten Ideallinie. Wenn das einmal nicht der Fall ist, kann dies zwei Ursachen haben: 1. Es kann ein Problem sein, das lediglich auf Datenmangel zurückzuführen ist; 2. Es kann aber auch ein Sprachphänomen sein, dessen „unregelmäßiger“ Verlauf systematische Gründe hat, die man in die Modellierung einbeziehen muss.

Eine viel zitierte Anwendung des Piotrowski-Gesetzes findet sich im Artikel "Der Wandel von ward zu wurde" von Karl-Heinz Best und Jörg Kohlhase. An diesem Beispiel werden gleich zwei Wandlungen verfolgt. Zum Einen die Ersetzung des Stammvokals a zu u, zum Anderen die Epithese eines Endungs-e. Mit Hilfe der Anleitungen Altmanns erstellen sie eine Formel, von der die Messpunkte kaum abweichen.

Prognosen in der Linguistik
Wenn man gut erforschte Sprachwandelprozesse betrachtet, kann man die Frage stellen, wie sie sich in der Zukunft entwickeln werden. Das Problem wird jetzt in Best (2009) am Beispiel der Entlehnungen aus dem Lateinischen und dem Englischen ins Deutsche diskutiert. Die Grundlagen dazu bilden Computerexperimente. Bei Prozessen, die ihren Wendepunkt deutlich überschritten haben (Lateinisch), sind Vorhersagen über die weitere Entwicklung offenbar nicht allzu gewagt, in anderen Fällen (Englisch) wesentlich problematischer.

Kritik
Edda Leopold weist in ihrem Artikel "Das Piotrowski-Gesetz" darauf hin, dass Altmann ein Modell aus der Epidemiologie nutzt, seine Interpretation dieses Modells im linguistischen Bereich aber nicht hinreichend darlegt. Sie bezeichnet das Modell daher wissenschaftstheoretisch eher als intuitive Heuristik, die allerdings empirischen Überprüfungen standhält. Weitere wissenschaftstheoretische Kritik an der Formel erwächst daraus, dass weder Altmann noch Piotrowskaja und Piotrowski eine konkrete Definition des Definitionsbereiches für $$t$$ gegeben haben. Einem Vorschlag Leopolds folgend vergeht eine Zeiteinheit mit jeder Möglichkeit, entweder die alte oder die neue Form einer im Wandel befindlichen sprachlichen Einheit zu benutzen. Somit schreitet für häufig verwendete Formen dieser Zeitbegriff schneller voran als für seltenere. Auch sind Fälle denkbar, in denen sich die Häufigkeit der Benutzung beider Formen im Allgemeinen verändert. Diese "Zeit" stimmt somit nicht notwendigerweise mit dem physikalischen Zeitbegriff überein. Zuletzt kritisiert Leopold die ungenaue Definition des Wertebereichs von $$p(t)$$. Man kann den Anteil neuer Formen als Anteil der Sprecher einer Sprachgemeinschaft deuten, welche die neue Form verwenden. Man kann ihn aber auch als den Anteil der Verwendungen bei etwaigen Anwendungsgelegenheiten der Formen ansehen. Letztere Definition wirft jedoch Probleme bei der Modellierung von Synonymen auf. Die Klärung dieser Probleme ist maßgeblich, da sie über die Art und Weise bestimmen, wie empirische Daten erhoben und verwendet werden sollten.

Best und Kohlhase bemängeln für die praktische Anwendung des Gesetzes, dass über einen gewählten Zeit- und Ausbreitungsraum in einer Sprachgemeinschaft kaum eine repräsentative Auswahl der zu verwendenden Daten getroffen werden kann. Einzelne Sprachregionen und verschiedene Textarten müssen in angemessenem Verhältnis eingehen, hinreichende Streuung über Autoren und Werke muss gewährleistet sein. Es muss definiert werden was ein Zeitabschnitt ist und aus jedem muss eine möglichst große aber konstante Zahl empirischer Daten erhoben werden können. Diese Kritikpunkte zu erfüllen lässt sich nicht immer gewährleisten.

Literatur

 * Piotrowskaja, A. A., Piotrowski, R. G.: Matematičeskie modeli diachronii i tekstoobrazovanija. In: Statistica reči i avtomatičeskij analiz teksta, Leningrad: Nauka, 361-400
 * Gabriel Altmann: Das Piotrowski-Gesetz und seine Verallgemeinerungen. In: Karl-Heinz Best, Jörg Kohlhase (Hrsg.): Exakte Sprachwandelforschung. edition herodot, Göttingen 1983, S. 54–90. ISBN 3-88694-024-1
 * Karl-Heinz Best, Jörg Kohlhase (Hrsg.): Exakte Sprachwandelforschung. edition herodot, Göttingen 1983, S. 54–90. ISBN 3-88694-024-1
 * Edda Leopold: Das Piotrowski-Gesetz. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/New York 2005, S. 627–633. ISBN 3-11-015578-8
 * Imsiepen, Ulrike: Die e-Epithese bei starken Verben im Deutschen. In: Karl-Heinz Best, Jörg Kohlhase (Hrsg.): Exakte Sprachwandelforschung. edition herodot, Göttingen 1983, S. 54–90. ISBN 3-88694-024-1

Andere Sprachen
Englisch Piotrowski's Law