Robert Klatt
Eine Mathematikstudentin hat mit einer Markow-Kette und einem umfassenden Datensatz das ultimative Schimpfwort ermittelt.
London (England). Sophie Maclean, die aktuell am Kings College London (KCL) ihren Master of Science (M.Sc.) in Mathematik absolviert, hat mit einem mathematischen Modell das ultimative Schimpfwort berechnet. Sie nutzte die Markow-Kette, einen stochastischen Prozess, den der russische Mathematiker Andrei Andrejewitsch Markow entwickelte.
Das Anwenden von Markow-Ketten dient dem Zweck, Prognosen über die Wahrscheinlichkeiten künftiger Ereignisse zu erstellen. Die Besonderheit einer Markow-Kette besteht darin, dass sie es ermöglicht, genauso präzise Vorhersagen über zukünftige Abläufe zu treffen, wenn man nur über einen begrenzten Ausschnitt der Historie verfügt, wie wenn man den gesamten Geschichtsverlauf des Prozesses kennt.
Das Prinzip der Markow-Kette ist in der Allgemeinbevölkerung vor allem als Autovervollständigung (Autocomplete), auch bezeichnet als Predictive Text, bekannt.
Als Datenbasis der Markow-Kette nutzte die Studentin den Ofcom's Leitfaden für beleidigende Ausdrücke im britischen Rundfunk und Fernsehen. Dieser Leitfaden klassifiziert übliche Beleidigungen nach ihrer Intensität. Maclean wählte allerdings nicht alle Wörter aus, sondern schloss diejenigen aus, die sie für übermäßig heftig hielt, darunter speziell rassistische Begriffe. Auf diese Weise reduzierte sie eine ursprüngliche Anzahl von 186 englischen Begriffen auf 45.
In ihrer Anfangsphase generierte Macleans Software zwar Resultate, doch waren diese nicht stabil. Unter den vielen neu entstandenen Schimpfwörtern war zum Beispiel "ditwat". So entschied sie sich, dem Programm spezifische Richtlinien zu geben. Da ein Großteil der 45 Schimpfwörter mit "b" beginnt, legte sie fest, dass dies auch der Anfangsbuchstabe sein sollte. Da Beleidigungen häufig auf "er" enden, wurde die Wahrscheinlichkeit hierfür im Vorhersagemodell angehoben.
Die Software zeigte, dass die Wahrscheinlichkeit, dass nach dem "b" entweder ein "a" oder ein "e" folgt, gleich hoch ist. Dies resultierte in einem Patt in der Berechnung, zwischen "banger" und "ber". Da "banger" bereits ein Wort mit neutralen und negativen Bedeutungen ist, kürte Maclean letztendlich "ber" zum ultimativen Schimpfwort.
Ob sich "ber" als Beleidigung im Englischen etablieren wird, ist eher fraglich. Auch andere erfundene Schimpfwörter haben es trotz ihrer Präsenz in TV und Film nicht geschafft, sich im alltäglichen Sprachgebrauch zu verankern. Analysen für andere Sprachen hat Maclean bisher nicht durchgeführt.