Wie bewertet man eigentlich schlechte Medien?

Screenshot von Metacritic mit Blindtext
Anonymisierter Screenshot von Metacritic

Ende 1998 kaufte ich mein erstes Computerspielemagazin, die PC Player 12/98. Half Life war gerade erschienen und erhielt mit 92 von 100 Punkten Spielspaß die beste Bewertung des Hefts sowie die Auszeichnung „Platin Player“. Ein phänomenales Spiel, wegweisend für die Zukunft! Knapp dahinter folgten Unreal mit 89 Punkten und der Anmerkung, dass es in den meisten anderen Monaten ein eigenes Feature bekommen hätte. Auf dem dritten Platz lag Caesar 3 mit immer noch respektablen 83 Punkten, welches mit Pharao und Zeus zwei sehr erfolgreiche Fortsetzungen erhielt.

2012 unterhielt ich mich mit einem Freund, welcher beiläufig erwähnte, dass er überlege, ob er sich den neuen Teil der Zelda-Videospielereihe holen solle, da dieser nur mit 8,5 von 10 Punkten bewertet worden sei. Ich stockte. „Nur“ 8,5 von 10 Punkte?

Meiner Wahrnehmung nach bedeutete dies ein sehr gutes Spiel, welches andere Titel aber nicht überragt oder von einer Schwäche zurückgehalten wurde. „Eine 8,5 heute ist wie früher eine 7“, belehrte mein Freund mich. Aha.

Mir fiel schon 1998 auf, dass die untere Hälfte der Skala, egal ob diese nun 10 oder 100 Punkte umfasste, kaum genutzt wurde. Fast alle Titel sortieren sich irgendwo zwischen 60 und 90 ein. Um die 50 gab es ein paar Stinker und in jedem Heft vielleicht ein oder zwei Verrisse deutlich darunter.

Als ich Jahre später endlich Half Life und Caesar 3 spielte, war ich von beiden sehr angetan. Half Life war genial, Caesar 3 „nur“ sehr gut, aber wie groß der Unterschied nun war konnte ich nicht quantifizieren. Was macht es überhaupt für einen Unterschied, ob 9 oder 6 Punkte dazwischen lagen?

Gute Frage. Was macht es für einen Unterschied?

Berechtigte Kritik und Fehlentwicklungen

Die Kritik an der 100-Punkte-Skala ist nicht neu. In jüngster Zeit geht der Trend zu gröberen Skalen, von Amazons 5 Sternen (welche auf Zehntelsterne genau gemittelt und so zu einer 50-Punkte-Skala werden) bis hin zu Netflix, wo es nur den Daumen hoch und runter gibt. Auf TV-Tropes findet sich ein Eintrag zu einer impliziten 4-Punkte-Skala.

Aggregiert man Bewertungen verschiedener Systeme, dann wird es richtig bizarr, denn eine Bewertung mit 2 von 5 Sternen (40% der erreichbaren Punkte) entspricht gefühlsmäßig einer 4 bis 6 auf einer 10er-Skala (40 bis 60% der erreichbaren Punkte). Rechnet man die Bewertungen noch auf eine andere Skala um, kommen dabei die wildesten Ergebnisse heraus.

Das Hauptargument hinter dieser Vereinfachung lautet, dass ein großer Teil der Skala sowieso ungenutzt bleibt. Wenn die meisten Produkte sowieso zwischen 60 und 90 landen, wieso überhaupt eine 100 Punkte-Skala nutzen? Außerdem könne niemand sagen, was ein Unterschied von 1 Punkt überhaupt bedeutet.

Ich kann fast allen Argumenten folgen, außer dass die untere Hälfte der Skala nutzlos sei. Es gibt verschiedene Grade von „schlecht“, aber es ist ganz natürlich, dass die meisten Bewertungen in der oberen Hälfte liegen. Schlechte Medien werden seltener konsumiert, empfohlen und bewertet. Wir entwickeln deswegen auch kein Gefühl dafür, ob es etwas nun sehr oder nur etwas schlecht ist. Könntet Ihr spontan den Unterschied zwischen einem 3/10 Film von einem 4/10 Comic benennen? Ich nicht.

Der feine Unterschied zwischen schlecht und meh

Wenn schlechte Medien kaum rezipiert werden, stellt sich die Frage nach der Nützlichkeit einer Differenzierung. Ob eine Serie nun „meh“ oder „ziemlich meh“ ist, ist den meisten Zuschauer*innen gleich. Beides mit 2 von 5 Sternen zu bewerten liegt daher nahe. Betrachtet mein ein Werk jedoch nicht (nur) als Konsument, sondern will verstehen warum etwas funktioniert oder nicht, dann muss man unterscheiden, ob es prinzipiell schlecht ist, nicht zusammen passt oder nur mangelhaft umgesetzt wurde.

Besonders gut zeigt sich das bei der Adaption aus anderen Medien. Ein interaktives Computerspiel stellt andere Anforderungen an den Spannungsaufbau, als ein zeitlich linearer Film, ein immersiv-imaginäres Buch oder ein launiges Gesellschaftsspiel. Adaptionen scheitern oft schon daran, dass sie diese Unterschiede nicht berücksichtigen. Das ist eine andere Art von schlecht, als wenn die Handlung an sich nicht funktioniert.

Ein weiteres Problem ist der verschwimmende Unterschied zwischen „schlecht“ und „nicht gut“. Schlechte Werke haben fundamentale Schwächen, die sich durch Anwendung von Regeln beheben lassen. Im Gegensatz dazu kommt kaum ein*e Kreativschaffende*r darum herum, dass seine*ihre Werke zu Beginn „nicht gut“ sind, egal ob wir die Grundlagen drauf haben. Es mangelt an Erfahrung, Routine, Wissen, Inspiration, etc. Die Lektionen daraus sind aber völlig unterschiedlich.

„System for your Goals“ von Isaac Smith via Unsplash

Die Schnitt-Methode

Mein bevorzugter Weg, ein mittelmäßiges Werk von einem schlechten zu unterscheiden, ist die Frage wie viel besser es wird, wenn Teile ersatzlos gestrichen werden. Zu vielen Filmen gibt es Fancuts, welche genau diesen Ansatz verfolgen und ihre anhaltende Beliebtheit bezeugt wie effektiv dieser ist.

Bekannte Filme, die durch Kürzung besser werden, sind Blade Runner (der erklärende Monolog am Ende), Star Wars Episode 1 (diverse Szenen rund um Jar Jar Binks und Anakin) sowie die Hobbit Filme (viele Actionsequenzen und große Teile des Legolas-Subplots). Diese Elemente beißen sich mit dem Rest des Films und können fast ohne Konsequenzen entfernt werden.

Müssen hingegen integrale Bestandteile ersetzt werden, um ein Werk zu retten, dann ist das eine andere Art von schlecht und sollte anders bewertet werden. Während Star Wars Episode 1 ein solider Film mit unnötigen Elementen ist, müssten in Episode 2 große Teile eines Handlungsstrangs geändert werden, um daraus einen guten Film zu machen.

Historische Bewertungsinflation

Auch der obere Teil der Bewertungsskala ist zusammengeschrumpft. Als ich in den 90ern mein erstes Magazin erwarb, galt eine Bewertung von 60 von 100 Punkten als Titel mit Schwächen, welcher für Genrefans interessant sein könnte. 70 Punkte waren bereits ganz passabel.

Mittlerweile bedeutet eine Bewertung unter 70 von 100 so viel wie „Finger weg!“ Als Grund dafür wird das Bewertungssystem in amerikanischen Schulen angeführt, wo 60 Punkte gerade so zum Bestehen ausreichen und 75 Punkt einer durchschnittlichen Note 3 entsprechen. Hierzulande gelten etwas andere Maßstäbe, weshalb die inflationäre Verwendung hoher Bewertungen besonders seltsam wirkt. In der gymnasialen Oberstufe reichen beispielsweise bereits 46 von 100 Punkten zum Bestehen einer Prüfung aus. Dem amerikanischen Einfluss konnten wir uns trotzdem nicht entziehen und so entspricht eine 8,5 von 10 heutzutage etwa einer 2 minus. Eine Enttäuschung für neue Titel großer Reihen.

Die Skala sollte also auch oben wieder breiter werden. Ebenso wie es schlechte und mittelmäßige Werke gibt, können wir unterschieden, ob ein Werk „nur“ gut, hervorragend oder sogar beispielhaft ist. Insbesondere der Raum um „gut“ birgt viel Potenzial für Differenzierung, denn hier treffen die rundherum guten aber nicht herausragenden Werke auf inhaltlich uninteressante aber handwerklich hervorragende Vertreter sowie auf inspirierte aber nur mäßig ausgeführte Exemplare.

Nicht zuletzt braucht auch „okay“ Raum auf der Skala. Erstaunlich viele Dinge in unserem Leben sind okay, ohne dass uns das stört. Sie erfüllen ihren Zweck, mehr aber auch nicht. Für einen faulen Samstagnachmittag reicht „okay“ allemal.

Fazit

Eine 100-Punkte-Skala halte ich für zu kleinteilig. Die 5 Sterne können funktionieren, erfüllen jedoch nicht meinen Wunsch nach Präzision in der Mitte. So sehr sie kritisiert wird, halte ich eine 10-Punkte-Skala weiterhin für den besten Kompromiss, insbesondere mit dem Verständnis, dass 6 von 10 bereits annehmbar ist, 4 von 10 immer noch interessante Aspekte haben kann und 8 von 10 merklich überdurchschnittlich ist.

Es wird niemals harte Kriterien geben, um danach eine persönliche und somit subjektive Bewertung zu erstellen. Aber ich kann meine Kriterien transparent darlegen und versuchen mich daran zu halten und so Vergleichbarkeit zu schaffen. Dementsprechend findet sich im Anschluss meine Definition der Bedeutung aller Bewertungen von 1 bis 10, nach denen ich selbstverständlich auch schlechte Dinge bewerten möchte…

…wenn ich sie denn konsumiere 😉

Und ja, dieser Artikel wurde in Vorbereitung auf einen Star Wars-Reviewathon geschrieben. Macht euch auf etwas gefasst.

Mein Bewertungsschema

  • 1 von 10 Punkten: Diese Werke sind nicht zu retten, stoßen mich aktiv ab und haben nicht einmal gute Ansätze. Die Frage, wer auf die Idee kam so etwas umzusetzen und veröffentlichen, drängt sich auf. Ich habe es durchlitten, damit ihr es nicht tun müsst.
  • 2 von 10 Punkten: Rundherum mangelhaft ohne rettende Qualitäten. Es ist nervig bis anstrengend zu konsumieren und regt mich eher auf, als zu unterhalten.
  • 3 von 10 Punkten: Ab hier sind Ansätze von guten Ideen oder kompetenter Umsetzung zu erkennen, die jedoch von schlechten Aspekten so überschattet werden, dass das Endprodukt unerträglich bleibt.
  • 4 von 10 Punkten: Unausgereift, stümpferhaft, inkonsequent, aber nicht mehr komplett fürchterlich. Die besten Vertreter dieser Klasse kann man sich als Fan antun, wenn man auf Katastrophentourismus steht.
  • 5 von 10 Punkten: Ein seufzendes „Okay“. Vielleicht langweilig, vielleicht schon tausendmal (besser) gesehen. Nicht schlecht genug, um sich darüber aufzuregen. Mit ein bisschen Kreativität kann ich mir eine bessere Version davon vorstellen, aber die Zeit ist es selten wert.
  • 6 von 10 Punkten: Annehmbar. Ich bereue meine Zeit damit nicht, sehe vielleicht sogar Potenzial darin, aber zu mehr reicht es einfach nicht. Möglicherweise im positiven Sinne „langweilig“, vielleicht sogar eigentlich gut mit unnötigen Schwächen.
  • 7 von 10 Punkten: Erfüllt meine Erwartungen, für kleines Geld sogar empfehlenswert (insbesondere für Fans). Kein Aspekt fällt wirklich negativ auf und so ist es im schlechtesten Fall immer noch schmerzfrei.
  • 8 von 10 Punkten: Wirklich gut und auch für nicht-Fans interessant. Erfüllt entweder alle Erwartungen sehr gut oder hat einige Aspekte, die es über diese Schwelle heben. Kann Schnitzer enthalten, die das Gesamtbild aber nicht stören.
  • 9 von 10 Punkten: Ein herausragendes Produkt, sowohl im Konzept als auch in der Umsetzung. Andere Werke der gleichen Gattung können daran gemessen werden und möglicherweise vorhandene Fehler fallen kaum auf.
  • 10 von 10 Punkten: Prägendes Produkt für seine Gattung mit Vorbildfunktion für die Zukunft. Gleichbleibend hervorragende Qualität in allen Aspekten. Eher ein Ideal, als ein wirklich erreichbarer Standard, aber man darf träumen…

Eine Antwort zu “Wie bewertet man eigentlich schlechte Medien?”

  1. […] Hinzu kommt die seltsame Tendenz, Produkte und Erlebnisse in Superlativen zusammenzufassen und entsprechend zu bewerten. Dinge sind in den Augen vieler entweder fantastisch oder unglaublich schlecht. Man vergibt 1 Stern oder 5 Sterne. Autorenkollege Marco M. Anders hat das ungefähr zur gleichen Zeit gut analysiert und veröffentlicht im Blogeintrag: Wie bewertet man eigentlich schlechte Medien? […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert