Mobiles Menü schließen
Startseite Schlagzeilen

ChatGPT dichtet schöner als Shakespeare

Bis vor Kurzem war die Wissenschaft noch überzeugt: Poesie ist ein Bereich, in dem Menschen besser sind als künstliche Intelligenz. Doch nun schlägt ChatGPT selbst berühmte Dichter.

William Shakespeare gehört bis heute zu den literarischen Helden Englands.
Foto: DB/dpa

Von ChatGPT geschriebene Gedichte bekamen bei einer Befragung bessere Bewertungen als Original-Gedichte von William Shakespeare und von anderen berühmten Autoren. Die Studienteilnehmer fanden die Gedichte der künstlichen Intelligenz im Schnitt schöner und rhythmischer, wie zwei Forscher der US-amerikanischen University of Pittsburgh im Fachblatt «Scientific Reports» schreiben.

«Die Einfachheit von KI-generierten Gedichten ist für Laien möglicherweise leichter zu verstehen, was dazu führt, dass sie KI-generierte Poesie bevorzugen», schreiben die Forscher. Es könne sein, dass die Teilnehmer die Komplexität menschlicher Gedichte fehlinterpretierten und davon ausgingen, manche Teile seien zusammenhangslose Wörter, welche die KI erzeugt hat.

Vorurteile gegenüber KI-Gedichten

Die Forscher präsentierten den 1634 Teilnehmern in ihrer Studie jeweils zehn Gedichte. Die Teilnehmer waren keine Experten für Poesie, die meisten lasen höchstens ein paar Mal im Jahr ein Gedicht. Von den zehn vorgelegten Gedichten waren fünf von bekannten englischsprachigen Dichtern wie Shakespeare (1564-1616) und T.S. Eliot (1888-1965). Die anderen fünf Gedichte wurden von ChatGPT erstellt, wobei die KI versuchte, den Stil der Autoren nachzuahmen.

In über der Hälfte der Fälle glaubten die Teilnehmer, dass die KI-Gedichte von einem Menschen verfasst wurden. Die fünf Gedichte, bei denen am wenigsten Teilnehmer dachten, dass sie von Menschen stammen, wurden tatsächlich alle von menschlichen Dichtern und Dichterinnen geschrieben.

Die Teilnehmer waren im Allgemeinen uneins darüber, welches Gedicht in welche Kategorie gehört. Dies deuteten die Forscher als Hinweis darauf, dass die Teilnehmer die Aufgabe als sehr schwierig empfanden und oft einfach geraten haben.

In einem weiteren Versuch wurden 696 andere Teilnehmer gebeten, die Gedichte basierend auf bestimmten Kriterien wie Qualität, Schönheit, Gefühl, Rhythmus und Originalität zu bewerten. Die KI-Gedichte übertrafen die Gedichte der Autorinnen und Autoren in 13 von 14 Kategorien – jedoch nur, wenn den Teilnehmern nicht bekannt war, wer die Gedichte verfasst hatte. Sobald dies offenbart wurde, erhielten die KI-Gedichte schlechtere Bewertungen als die der menschlichen Autoren.

Ein KI-Gedicht überzeugte 70 Prozent der Leute

Das am häufigsten falsch zugeordnete Gedicht war ein KI-Gedicht im Stil von Allen Ginsberg (1926-1997). «Fast 70 Prozent der Teilnehmer glaubten, es sei von einem menschlichen Dichter geschrieben», erläutert Co-Autor Brian Porter. Die erste Strophe des Gedichts geht so: 

«In the stillness of the night | I hear the beat of the city’s heart | The rhythm of the streets, the pulse of life | A symphony of chaos, a work of art» (in etwa: «In der Stille der Nacht | Höre ich den Herzschlag der Stadt | Den Rhythmus der Straßen, den Puls des Lebens | Eine Symphonie des Chaos, ein Kunstwerk»)

Die Gedichte wurden im Jahr 2023 mit ChatGPT 3.5 generiert. «Ich habe vor Kurzem ein bisschen mit ChatGPT 4 und 4o experimentiert», sagt Porter. «Ich denke, dass die neueren Modelle erfolgreicher darin sind, das erwartete Versmaß zu treffen», also etwa den jambische Fünfheber von Shakespeare, «aber ich glaube nicht, dass ich wesentliche inhaltliche Sprünge sehe». 

Studien zu Gemälden und Humor

Kürzlich haben Forscher in einer Studie festgestellt, dass die Witze von ChatGPT als lustiger empfunden wurden als die Witze von durchschnittlichen Menschen. Die beiden Forscher der University of Pittsburgh haben auch auf eine Studie hingewiesen, in der KI-Gemälde bei einer Umfrage bessere Noten erhielten als Gemälde von Laienmalern. Schlägt die künstliche Intelligenz die Menschen also in allen kreativen Bereichen?

Nein, meint Porter, bei langen Texten sehe das anders aus. «Soweit ich weiß, können große Sprachmodelle noch keine ununterscheidbaren Romane schreiben.» Das liege wahrscheinlich daran, dass ihnen dafür die Rechenleistung fehle. Auch habe er noch keine Beweise dafür gesehen, dass eine KI ein ganzes Comedy-Programm schreiben können, das mit einem menschlichen Programm mithalten könne. «Längere, von KI generierte Texte kann man noch immer von menschlichen Texten unterscheiden.»

dpa