Textverständlichkeit

Allgemeines
Die Verständlichkeit ist eine notwendige Eigenschaft eines Textes. Diese beruht auf bestimmten Charakteristiken des Textes und der Fähigkeit des Lesers, diesen zu verstehen. Somit muss der Autor eines Textes sich nicht nur mit dem Inhalt seines Textes beschäftigen, sondern auch mit der Verständlichkeit. Er muss berücksichtigen, an was für eine Lesergruppe der Text gerichtet ist. Wird ein Text nicht verstanden, so ist das Ziel der Informationsübermittlung nicht erreicht worden - was eine der wichtigsten Funktionen eines Textes ist.

Dass Textverständlichkeit eine große Bedeutung hat sieht man daran, wie lange sich Menschen mit diesem Problem schon beschäftigen. Platon und Aristoteles hatten sich damals mit der Verständlichkeit von Reden beschäftigt.

Die modernere Geschichte der Textverständlichkeit begann mit Thorndikes Frequenzwörterbuch von 10.000 Wörtern im Jahre 1920. B.A. Lively und S.L. Pressey stellten ihre 'Index Number' basierend auf Wortfrequenzen im Wörterbuch 1923 vor. Dieser Index kann als erste Lesbarkeitsformel (Forschung der Lesbarkeit und der Textverständlichkeit stehen in enger Beziehung zueinander) angesehen werden (Mikk 2005). Eine ergiebige Forschung der Textverständlichkeit wurde von Jeanne S. Chall (1958; 1988), George Klare (1963; 1984) und anderen aufgenommen. Weiter kann auch die Begründung der Psycholinguistik als Anstoß für die Beschäftigung mit dem Thema Textverständlichkeit gesehen werden. Hier beschäftigte man sich zum einen mit den Wissensstrukturen und dem Verstehensprozess an sich (Hielscher 1996) oder aber mit der Verbesserung von Schulbüchern (oft handelt es sich hier um Büchern für Fremdsprachenlerner)(Mikk 1995; Mikk/Elts 1999). Denn wenn Texte zu kompliziert sind, kann das dazu führen, dass Schüler das Fach nicht bestehen. Aus diesem Grund sollte darauf geachtet werden, dass der Schwierigkeitsgrad des Textbuchs für die Klassenstufe angemessen ist.

Textverständlichkeit
Die Verständniskeitsforschung beschäftigt sich mit dem Ermitteln eines „übergeordneten Prinzips“ der Verständlichkeit (Andersen 1985, S.17). Eine eindeutige Definition von Verständlichkeit ist bis jetzt nicht gegeben. Dazu kommt, dass Verständlichkeit nicht immer gebraucht wird. In den Bereichen, in denen die Sprache als eine Form von Kunst benutzt wird, wie in der Poetik, ist die Informationsübermittlung zweitrangig. Wenn Sprache aber in kommunikativer Form erscheint, wird der Verständlichkeit der Nachricht ein Wert zugewiesen. Die momentane Forschung versucht also, dieses Problem zu lösen und einzukreisen. Dies geschieht mit Hilfe von Lesbarkeitsformeln (mehr dazu später).

Zuerst muss aber abgesteckt werden, was für Größen/Messwerte von Nöten sind, um zu entscheiden, ob ein Text schwierig ist oder nicht. Nämlich was vom Sender einer Nachricht (in unserem Fall Text) beim Empfänger ankommen muss, damit dieser das Geschriebene versteht. Missverständnisse können auftreten, 1) wenn der Sender sich nicht klar genug ausdrückt, 2) der Empfänger die Gedanken des Senders nicht klar nachvollziehen kann, 3) das angesprochene Thema dem Empfänger Schwierigkeiten bereitet (Andersen 1985).

Zu beachten sind auch die verschiedenen Textcharakteristiken, von denen es eine große Vielfalt gibt. Diese werden jedoch immer nach der jeweiligen Formel gewählt., z.B. die Anzahl der Fremdwörter und ob diese von bereits bekannten Wörtern umgeben sind. Oder wie sich der Satzaufbau gestaltet: komplex mit vielen Nebensätzen, oder einfach. Auch Wort- und Satzlänge sowie die Anordnung der Wörter im Satz. Ist das Vokabular des Textes den Lesern bekannt und sind die Leser fähig, den beschriebenen Sachverhalt zu abstrahieren? Demnach liegt die Schwierigkeit einen Text zu verstehen nicht nur bei der geistigen Leistung und Aufnahmefähigkeit des Lesers. Es kommt vor allem auch darauf an, ob die verwendeten Sprachmittel auch passend sind (Mikk/Elts 1999; Mikk 2005; Andersen 1985).

An den zuvor genannten Faktoren wird also die Verständlichkeit gemessen. Dies wird oft mit Programmen getan, denn so kann man eine große Anzahl von Texten schnell verarbeiten. Die Werte, die sich daraus ergeben, lassen sich zudem gut weiterverarbeiten (z.B. zum Erstellen von Tabellen oder Graphen).

Ein Beispiel zur Messung von Satzlänge und Wortlänge: Das Verhältnis von Satzlänge zu Wortlänge ist linear. Daraus folgt, dass je kürzer die Wörter und die Sätze sind, desto einfacher sind diese vom Leser zu verstehen (Mikk 1995).

Kurze Sätze sind also an sich nicht schlecht, trotzdem sollte der Text für den Lerner eine angemessene Schwierigkeitsstufe haben. (Bsp.: Ein Text aus einem Lehrbuch für die Grundschule ist für einen Schüler der 9. Klasse zu einfach und fordert ihn nicht).

Dann wiederum ist es ebenfalls unwahrscheinlich, dass nur die Satzkomplexität der alleinige Grund für eine schlechte Textverständlichkeit ist. Es kommt auch auf den Leser an. Oft haben Leser eine schwache Aufmerksamkeitsspanne zum Zweck der Wortwiedererkennung. Zur Komplexität tragen (laut Lesbarkeitsformeln) außerdem lange und wenig frequente Wörter bei. Diese Wörter sind meistens morphologisch komplex. Dies muss aber nicht immer dazu führen, dass man einen Text weniger gut versteht. Es gibt Annahmen, dass morphologisch komplexe Wörter Kindern beim Verstehen helfen können; nämlich durch ihre Subteile (Präfixe, Affixe, etc.). Die Kinder lernen dann etwas über die syntaktischen Informationen, wenn sie Affixe wie -er kennen. Dadurch lassen sich Wörter auseinander nehmen in Teile, die sie verstehen, was bei nicht morphologisch komplexen Wörter nicht möglich ist (Davidson/Green 1988).

Wie man optimale Werte aufstellt:
Expertenmeinungen über die Optimalität von Texten'''
 * Leute können Texte verstehen, die dem Schwierigkeitsgrad der selbst verfassten Texte entsprechen
 * Errechnen von Werten der Textcharakteristiken, die es ermöglichen, einen optimalen Grad der Textverständlichkeit zu erreichen
 * Werte, die auf der elementaren Idee von optimalen Werten der Verständlichkeitsmessung basieren
 * Werte, die auf dem Korrelationskoeffizienten zwischen dem Prozentsatz an zu großen Sätzen und dem Grad der Verständlichkeit des Textes basieren; der Korrelationskoeffizient ist am höchsten, wenn die Grenzlinie der zu großen Sätze für den Leser optimal ist

Weiter können Messwerte für die Verständlichkeit von Text zuverlässig ermittelt werden, wenn die Methoden zum Ermitteln valide sind. Man kann Methoden zum Berechnen von Text-Lesbarkeit nutzen, wie z.b. die relative Fülle des Vokabulars von Texten oder den Index der Rarität. Welche Textcharakteristiken zur Ermittlung der Textverständlichkeit beitragen, kann wie folgt ermittelt werden: Berechnen des Korrelationskoeffizienten zwischen hypothetischen Werten der Textverständlichkeit und einigen experimentell evaluierten Indizes der Textverständlichkeit. Es existieren auch verschiedene Tests zum Ermitteln der Schwierigkeit von Texten: die Werte von Texten ermitteln; wie bekommt man ein gutes Set an Fragen, welche die Verständlichkeit ermitteln: dafür gibt es verschiedene Vorschläge für Kriterien, wobei es schwer ist, eine Untersuchung zu finden, die alle Kriterien berücksichtigt (Mikk 2005).

Lesbarkeitsformeln (readability formulae)
Bei den Lesbarkeitsformeln handelt es sich um eine andere Anwendung von Maßnahmen zum Ermitteln der Textverständlichkeit. Der Beginn der Forschung war in den 1920er. Dabei stand das Problem in Vordergrund, wie Sprache verarbeitet und effektiv verstanden wird (Davison/Green 1988). In den 1940er wurden dann viele dieser Formeln entworfen. Eine intensive Nutzung von Programmiersprachen/Programmen bei der Umsetzung von den Lesbarkeitsformeln fand 1980 statt. Oft sind diese auch Teil von Editierprogrammen. Das darauf folgende Jahrzehnt der Textverständlichkeit beachtete dann beim Erstellen der Formeln auch die „Lesercharakteristiken“ (Mikk/Elts 1999).

Die Lesbarkeitsformeln sind außerdem schon seit mehr als 50 Jahren in den USA sehr populär und werden weit verbreitet genutzt (Mikk 1995). Diese Formeln gibt es natürlich nicht nur für das Englische, sondern auch für viele andere Sprachen, wobei der Hauptanteil trotzdem für die englische Sprache zu finden ist. Deshalb kommt es öfter vor, dass eine Formel für das Englische auf eine andere Sprache angewandt wird, um deren Texte zu untersuchen. Hierbei sollte man jedoch beachten, dass bestimmte Textcharakteristiken der Textverständlichkeit von Sprache zu Sprache verschieden sein können.

Die neuesten Entwicklungen gehen in die Richtung Formeln aufzustellen, die ein selten genutztes Argument beinhalten (Indizes/Messwerte der Termdichte).

Trotz allem unterliegen Lesbarkeitsformel auch Kritik. Meist wegen schlechten Resultaten, die oft auf eine falsche Benutzung der Formel zurückzuführen ist. Oder gegen die Formeln, die nochmal hätten überarbeitet und/oder verbessert werden müssen (Mikk/Elts 1999).

Formeln
Es gibt mehr als 100 entwickelte Formeln auf der ganzen Welt. Dabei ist die Anwendung von vielen dieser Lesbarkeitsformeln computerisiert, was es den Forschern ermöglicht, die Formeln mit vielen Prädiktorvariablen zu verwenden. Im Normalfall hat eine Formel 2 Prädiktorvariablen: (1) Schwierigkeit des Textinhalts, (2) Schwierigkeit der Struktur. Ein weiterer Vorteil der Formeln ist es, dass man sie nicht 'betrügen' kann. Ein Text kann zwar in kurzen Sätzen und mit kurzen Wörtern umgeschrieben werden, aber dabei muss man nicht unbedingt die Komplexität des Textes ändern. D. h. mit den Lesbarkeitsformeln kann man solche Texte aufspüren und gegebenenfalls verbessern.

Zum Erstellen von Formeln werden Kriterien und Textcharakteristiken benötigt, an denen man die Textverständlichkeit messen kann. Dabei muss man sich überlegen, was man genau untersuchen will, da es eine große Menge an Kriterien gibt. Charakteristiken, die man am besten voraussagen kann, werden dann genommen, um mit ihnen die Formel zu bilden.Eine Möglichkeit, an die Charakteristiken zu gelangen, ist Proben von Texten zu nehmen, die repräsentativ für die Texte stehen in deren Umfeld man die Formel anwenden will. Oder man entwirft Lückentexte, die auf die Problemstellung angepasst sind. Eine weitere Möglichkeit ist es aber auch, Experten heran zu ziehen und diese nach geeigneten Kriterien zu befragen.

Kritik an den Lesbarkeitsformeln ist oft, dass diese schlecht implementiert sind, oder dass diese an sich schlecht sind und erst noch verbessert werden müssen. Beim Verbessern müssen dann wieder die quantitativen Textcharakteristiken in Betracht gezogen werden. Lange Zeit wurden bei den Lesbarkeitsformeln die Lesercharakteristiken nicht beachtet, obwohl diese genauso wichtig sind wie Textcharakteristiken (Mikk 1995; Mikk/Elts 1999).

Flesch Reading Ease Readability Formula (RE) (Flesch-Lesbarkeits-Test)
Diese Formel ist die am weitesten verbreitete. Sie wurde 1948 von Rudolph Flesch entwickelt. Die spezifische mathematische Formel sieht wie folgt aus:

$$\text{RE}=206.835-(1.015\cdot \text{ASL})-(84.6\cdot \text{ASW})$$

wobei:


 * RE
 * Reading Ease (Lesbarkeitsindex)


 * ASL
 * Average Sentence Length (durchschnittliche Satzlänge) - lässt sich bestimmen durch die Anzahl der Wörter im Text dividiert durch die Anzahl der Sätze des Textes


 * ASW
 * Average number of syllables per word (durchschnittliche Silbenanzahl pro Wort) - lässt sich bestimmen durch die Anzahl der Silben im gesamten Text dividiert durch die Anzahl der Wörter des Textes

Das Ergebnis ist dann eine Zahl zwischen 0-100 und je höher das Ergebnis ist, desto einfacher ist der Text zu lesen. Dazu muss aber gesagt werden, dass die Formel auf das Englische abgestimmt ist. Die Werte für z.B. das Deutsche können dadurch ungenauer sein.

Für die deutschsprachige Übertragung ist Toni Amstad (Amstad 1978) verantwortlich. Hierbei musste der Wortfaktor neu berechnet werden, da die Wörter im Deutschen im Schnitt länger sind. Die Sätze dagegen sind etwa gleich lang. Die Definition seiner Formel ist wie folgt:

$$\text{R}{{\text{E}}_{\text{deutsch}}}=180-\text{ASL}-\text{ASW }\cdot \text{ }58.5$$

Dale-Chall Lesbarkeitsformel
Diese Formel wurde von Edgar Dale und Jeanne S. Chall entwickelt und 1948 in ihrem Buch „A formula for predicting readability“ veröffentlicht. Mit dieser Formel wird ein grobe Punktzahl, die sogenannte Reading Grade Score (RGS) (Engl. für Lesbarkeitsindex), errechnet. Dabei werden Texte auf U.S. Grundschulniveau gemessen. Die Motivation dahinter ist, dass je mehr bekannte Wörter im Text enthalten sind, dieser umso einfacher zu lesen und zu verstehen ist. Das gilt auch für die darin enthaltenen Ideen.

Die Dale-Chall Lesbarkeitsformel ist weit verbreitet und wird noch heute oft genutzt.

Um diese Formel zu benutzen, müssen drei 100 Wörter lange Texteinheiten aus einem Buch ausgesucht werden. Dabei wird in den ausgesuchten Teilen der Prozentsatz an unbekannten Wörter gemessen (anhand einer Liste mit 3000 bekannten Wörtern für Schüler der 4. Klasse) und die durchschnittliche Anzahl der Wörter im Satz. Die zwei berechneten Werte werden dann nach folgender Gleichung kombiniert:

$$\text{RGS}=(0.1579\text{ }\cdot \text{ DS})+(0.0496\text{ }\cdot \text{ ASL})+3.6365$$

wobei:


 * RGS
 * Reading Grade Score


 * DS
 * Dale Score, oder % der Wörter, die nicht in der Dale-Chall-Liste enthalten sind


 * ASL
 * Durchschnittliche Satzlänge (die Zahl der Wörter geteilt durch die Zahl der Sätze)

Anschließend benutzt man folgende Tabelle (orientiert am amerikanischem Bildungssystem) um die Punktzahl ihrer korrespondierender Klassenstufe zuzuordnen:

SMOG (Simple Measure of Gobbledygook)
Dies ist eine Lesbarkeitsformel, die 1969 von G. Harry McLaughlin veröffentlicht wurde. Sie schätzt die Jahre der Bildung, die ein Leser haben muss, um einen Text zu verstehen. SMOG wird noch heute häufig benutzt, vor allem, um Gesundheitsnachrichten zu überprüfen. Da damals die Benutzung von Computern noch nicht gebräuchlich war, hatte McLaughlin die Formel so aufgebaut, dass sie einfach zu benutzen war.


 * 1) Man nimmt den ganzen zu bewertenden Text
 * 2) Zähle 10 aufeinander folgende Sätze am Anfang des Textes, 10 aus der Mitte und 10 am Ende. Am Ende sollte man insgesamt 30 Sätze haben.
 * 3) Zähle jedes Wort mit drei oder mehr Silben in jeder Gruppe von Sätzen. Das gilt auch für Wörter, die mehr als einmal vorkommen.
 * 4) Berechne von der in Schritt 3 erreichten Zahl die Quadratwurzel und runde sie auf den nächst gelegenen Zehner.
 * 5) Addiere dann 3 zu der Zahl aus Schritt 4 und erhalte dadurch den SMOG Grad; dies entspricht dem Lesegrad, den eine Person haben muss, um den Text komplett zu verstehen.

$$\textrm{grade}=1.043\sqrt{30\times\left(\frac{\textrm{number\, of\, polysyllables}}{\textrm{number\, of\, sentences}}\right)+3.1291}$$

Die SMOG Formel erbringt eine Korrelation von 0.985 mit einen Standardfehler von 1.5159 für die geschätzte Klassenstufe.

Literatur

 * Amstad, Toni [1978]. Wie verständlich sind unsere Zeitungen? Universität Zürich, Dissertation.
 * Andersen, Simone [1985]. Sprachliche Verständlichkeit und Wahrscheinlichkeit - Quantitative Linguistics, Vol. 29. Bochum: Studienverlag Brockmeyer.
 * Dawkins, John [1975]. Syntax and Readability. Newark, Delaware: International Reading Association.
 * Rudolf Flesch [1948]. A New Readability Yardstick. In: Journal of Applied Psychology 32(3), S.221-233.
 * Hielscher, Martina [1996]. Emotionen und Textverstehen - Eine Untersuchung zum Stimmungskongruenzeffekt. Opladen: Westdeutscher Verlag, Dissertation.
 * McLaughlin, G. Harry [1969]. SMOG grading: A new readability formula. In: Journal of Reading 12(8), S.639-646.
 * Mikk, Jaan [2005]. Text Comprehensibility. In: Quantitative Linguistik - Ein internationales Handbuch/Quantitative Linguistics - An international Handbook. Berlin, New York: de Gruyter, S.909-921.
 * Mikk, Jaan [1995]. Methods for Determining Optimal Readability of Texts. In: Journal of Quantitative Linguistics 2(2), S.125-132.
 * Mikk, Jaan / Elts, Jaanus [1999]. A Reading Comprehension Formula of Reader and Text Characteristics. In: Journal of Quantitative Linguistics 6(3), S.214-221.

Internet Quellen (Stand: 28.10.2014)


 * Flesch Reading Ease Readability Formula: http://www.readabilityformulas.com/flesch-reading-ease-readability-formula.php und http://de.wikipedia.org/wiki/Lesbarkeitsindex
 * Dale-Chall Lesbarkeitsformel: http://rfptemplates.technologyevaluation.com/dale-chall-list-of-3000-simple-words.html
 * Artikel von G. Harry McLaughlin: http://webpages.charter.net/ghal/SMOG_Readability_Formula_G._Harry_McLaughlin_(1969).pdf