Wie funktioniert der Test?

Wortschatz ist das, was Wortschatztests messen

Vor mehreren Jahren erklärte mir eine Psychologin die „offizielle“ Definition von Intelligenz: sie sei nämlich das, was die IQ-Tests messen. Ähnlich ist es auch mit dem Wortschatz. Den Begriff eindeutig zu definieren ist unmöglich, aber die Existenz von Tests, die statistisch sinnvolle Ergebnisse liefern, spricht dafür, dass man unter Wortschatz doch etwas wirkliches verstehen kann. Wenn wir etwas messen können, muss es auch wohl existieren.

Die Probleme

Die Schwierigkeiten beginnen mit der Frage: Was ist ein Wort? Zählen die Formen Buch, Buchs, Buches, Bücher und Büchern als fünf Wörter oder als nur eines? Wir spüren intuitiv, dass es hier um ein einziges Wort geht, und mit solchen Wortformen können zum Glück sogar Rechner ganz gut klarkommen. Schwieriger wird es bei abgeleiteten Formen wie formlos, Zusammensetzungen wie Bettdecke und einer Reihe ähnlicher Erscheinungen. Die sind manchmal ganz transparent und man hat das Gefühl, sie gehören keinesfalls in einem Wörterbuch. Andere Exemplare wirken hingegen weniger mechanisch: man denke nur an den kaum wahrnehmbaren (und dabei ziemlich argen) Zusammenhang zwischen Dame und dämlich

Die Entscheidung also, ob ein Wort als solches existiert oder eher Zufall/sprachliche Improvisation ist, ist von Natur aus subjektiv. Es gibt aber Menschen, die beruflich solche Entscheidungen treffen: das sind die Lexikologen, die über den Inhalt und die Struktur von Wörterbüchern nachdenken. Da ich bei der Entwicklung dieses Tests nur öffentlich verfügbare Quellen benutzten konnte, basiert die Wortliste (das effektive Wörterbuch) hinter dem Test auf OpenThesaurus und auf der Grundformenliste des Deutschen Referenzkorpus. Auf meiner Wortliste stehen circa 55 tausend Wörter, das ist also der hypothetische Gesamtwortschatz, dessen Kenntnis der Test messt.

Das zweite große Problem ist: Was genau heißt „kennen“? Ein Deutschlernender mag die Bedeutung eines Hauptwortes wohl kennen, an das Genus oder die Pluralform aber schon Zweifel haben. Es ist auch unklar, ob jemand ein Wort wirklich kennt, wenn ihm nur eine Bedeutung unter mehreren bekannt ist. Und es geht weiter bis hin zu den feineren Schattierungen, wie z.B. das Umfeld anderer Wörter, die gerne zusammen mit einem Wort auftreten: Hände werden mehrmals am Tag gedrückt, aber eher selten gepresst. Zum Schluss bleibt der Unterschied zwischen aktivem und passivem Wissen: ich mag manche Vokabeln gleich verstehen, wenn ich sie höre oder lese, aber sie würden mir beim Sprechen oder Schreiben von sich selbst nicht einfallen.

Dieser Wortschatztest bleibt bewusst simplistisch und rezeptiv. Die Definition von „kennen“ ist die Behauptung des Benutzers, dass er die angezeigten Wörter kennt. Es gibt auch Versuche, das aktive Wissen und die tieferen Dimensionen des Lexikons zu messen, aber die Entwicklung solcher Tests ist extrem aufwendig, während ihre Verlässlichkeit manchmal umstritten ist.

Statistische Stichprobe

Wir haben also die zwei wichtigsten Voraussetzungen geklärt: ein Wort ist, was auf einer gewissen Liste mit circa 55 tausend Einträgen steht, und „kennen“ basiert auf den Behauptungen der Teilnehmer. Der Rest ist reine Statistik.

Wenn das System dem Benutzer nicht alle 55 tausend Wörter präsentieren soll, wie kann es den Anteil der bekannten Vokabeln einschätzen? Eine einfache, aber trotzdem verlässliche Methode ist eine Stichprobe. Für den Test habe ich insgesamt 120 Wörter zufällig ausgewählt. Wenn ein Teilnehmer 76 von den 120 Wörtern als bekannt markiert, extrapoliert der Test, dass er auch von der gesamten Liste 63,3% kennt, was von 55 tausend ungefähr 35 tausend Wörter bedeutet.

In Wirklichkeit ist das ein wenig (aber wirklich nur ein wenig) komplizierter. Einerseits ist das Ergebnis ja eine Schätzung, und man kann mit Recht fragen, wie genau sie ist. Bei dem obigen Beispiel können wir behaupten, dass der Teilnehmer mit 95% Warhscheinlichkeit zwischen 30.260 und 39.740 Wörter kennt. Präzise gesagt, das 95% Konfidenzintervall ist 35.000 ± 4740.

Dann spielt die Auswahl der 120 Wörter eine äußerst wichtige Rolle. Solange die Auswahl „zufällig genug“ ist, funktioniert der Test, aber ich habe eine ganz besondere Definition des Zufalls verwendet. Zuerst habe ich die Wörter nach Häufigkeit sortiert (laut den Angaben der DeReWo Frequenzliste), und dann Wörter zu gleichen Abstanden ausgewählt. Aus der Sicht der Stichprobe ist diese Methode vollkommen zufällig: ich hätte genausogut das erste Wort auf jeder 50. Seite eines gedruckten Wörterbuchs wählen können.

Hinzu kommt noch, dass der Test eigentlich nicht eine einzige Stichprobe ist, sondern aus drei unabhängigen Teilen besteht. Die drei Teile umfassen jeweils 9 tausend, 18 tausend und 28 tausend Wörter, und zwar so, dass die kleineren Gruppen häufigere Vokabeln enthalten. Für alle drei Gruppen besteht die Probe aus jeweils 40 Wörtern, damit die Schätzung relativ genauer ist für jemand, dessen Wortschatz geringer ist, dafür aber vermutlich aus häufigeren Vokabeln besteht.

Zum Schluss habe ich nicht alle Wörter in den Test aufgenommen, die der Zufall der Häufigkeit vor mir warf: in vielen Fällen habe ich ein anderes Wort aus der engen Häufigkeitsgegend ausgewählt. Der Grund dafür ist einerseits, internationale Wörter, die ein Deutschlernender aus seiner eigener Sprache vermutlich schon kennt, aber im Deutschen relativ selten sind, zu vermeiden. Andererseits waren viele Wörter Zusamennsetzungen oder auf eine andere Weise transparent aus viel häufigeren Wörtern abgeleitet. Ich ging davon aus, dass ein rein rezeptiver Test bei diesen Vokabeln unrealistisch hohe Scores liefern würde.

Analyse und Weiterentwicklung

Am Anfang habe ich behauptet, der Wortschatztest habe einen Wirklichkeitsbezug, insofern er statististisch sinnvolle Ergebnisse liefert. Das heißt, unter anderen, dass die Ergebnisse von einer großen Anzahl Teilnehmer eine Normalverteilung aufweisen. Darüber hinaus haben ähnliche Tests für andere Sprachen spannende Zusammenhänge aufgedeckt zwischen Wortschatzgröße einerseits und Alter, Bildung oder die Dauer des Aufenthalts im sprachlichen Milieu andererseits. Ich bin weiterhin gespannt zu erfahren, genau welcher Zusammenhang zwischen Wortschatzgröße und der Häufigkeit der bekannten Wörter besteht. Eine solche Analyse kann möglicherwiese hilfreich sein sowohl für den Sprachunterricht als auch für die Entwicklung von praxisnahen Wörterbüchern und Lehrmaterialien.

Sobald genug Menschen den Test gemacht haben, wird es auch möglich sein, beim letzten Schritt neben der Score auch einen statistischen Vergleich anzuzeigen.

Diese Webseite verwendet Cookies für einige Funktionen. Indem Sie die Webseite benutzen, stimmen Sie der Nutzung von Cookies zu.
OK Mehr erfahren