Über Lesen und künstliche Intelligenz
Kann Lesen automatisiert werden?
Die Entstehung des Informations-Basars
Seit den 1990er Jahren des zwanzigsten Jahrhunderts ist die Menge der im Internet verfügbaren Informationen geradezu explosionsartig gewachsen. Es begann 1990, als der britische Wissenschaftler Tim Berners-Lee das World Wide Web mit der ersten öffentlichen Webseite startete. Zu dieser Zeit war er an der Europäischen Organisation für Kernforschung in der Nähe von Genf, kurz CERN, tätig. Heute gibt es weltweit schätzungsweise 1,3 bis 1,4 Milliarden Webseiten, von denen derzeit 15 bis 20 % aktiv sind.
Mit Internetzugang kann heute jeder auf eine Fülle von Seiten zugreifen, die nahezu jedes erdenkliche Wissens- und Interessengebiet abdecken. Einzelpersonen und Gruppen tragen zum kontinuierlichen Wachstum des World Wide Web bei, indem sie Bilder, Videos, Texte und Audiodateien auf sozialen Plattformen oder eigenen Seiten veröffentlichen. Nutzer können online auf wissenschaftliche Arbeiten, Kunstwerke und politische Einblicke zugreifen. Seltene Bücher aus alten Bibliotheken werden gescannt und online veröffentlicht. Abgesehen von Fragen zum Urheberrecht und zum geistigen Eigentum: Wer hat die Zeit, sich mit all diesem hochwertigen Material auseinanderzusetzen? Die Antwort lautet: Niemand! Selbst Spezialisten mit einem Schwerpunkt auf einem Bereich wie Softwareentwicklung oder Quantenphysik stehen vor der Herausforderung, Informationen zu filtern, um nicht in einer Flut von Informationen unterzugehen.
Diejenigen, deren Interessen sich über mehrere nicht miteinander verbundene Bereiche erstrecken, stehen vor einer noch größeren Herausforderung. Ich bin einer von ihnen. In den letzten zwanzig Jahren habe ich zurzeit 5165 Lesezeichen zu Quellen im Internet gesammelt. Von Tag zu Tag werden es mehr. Immer wenn ich eine interessante Seite auf Plattformen sehe, speichere ich sie als Beitrag in Apple Notes. Das ist eine schnelle Möglichkeit, ein Thema festzuhalten, mit dem ich hoffe, mich beschäftigen zu können, wenn ich Zeit habe. Ehrlich gesagt habe ich die meisten dieser Notizen seitdem nie wieder angerührt. Einige Links verweisen auf sehr interessante Dokumente. Gelegentlich lade ich E-Books herunter oder kaufe sie und speichere sie in Kindle oder Apple Books. Ich würde ein Leben lang brauchen, um nur einige davon vollständig zu lesen und zu verstehen.
Künstliche Intelligenz und synthetische Daten
KI-Anwendungen wie Grok, Claude oder Gemini können den Inhalt eines Buches in einem Bruchteil der Zeit zusammenfassen, die ein Mensch zum Lesen benötigt. Als ich zum ersten Mal mit diesen Agenten in Kontakt kam, war das eine erstaunliche Erfahrung.
Im Internet finde ich ein Buch über die theoretischen Grundlagen der künstlichen Intelligenz. Da ich seit jeher neugierig auf Themen bin, über die ich bisher wenig weiß, bat ich Gemini, Auszüge aus diesen Artikeln zusammenzustellen. Der Gemini-Agent lieferte mir in weniger als einer Minute eine überzeugend wirkende Inhaltsangabe. Ich erhielt einen durchaus aussagekräftigen Eindruck, ohne das Buch selbst studieren zu müssen. Für diejenigen, die ungeduldig sind oder einfach keine Zeit für ausführliches Lesen haben, kann KI eine komfortable Möglichkeit bieten, sich Inhalte anzueignen. Mittlerweile verfüge ich über eine stetig wachsende Sammlung von KI-generierten Buchzusammenfassungen. Allerdings lese ich selbst diese Auszüge nicht. Ich besitze sie, und mehr auch nicht. Die Ironie ist bitter: Ich habe KI eingesetzt, um mein Problem der Informationsüberflutung zu lösen, und jetzt habe ich eine Überflutung von Zusammenfassungen.
Das Problem ist nicht die Menge an Inhalten, sondern meine Beziehung zu den Inhalten selbst. KI kann ein Buch zusammenfassen, aber sie kann nicht die Zeit und Aufmerksamkeit ersetzen, sich mit dem Buch auseinanderzusetzen.
Mit KI konnte ich lediglich eine langwierige Beschäftigung mit dem Inhalt des Buches vermeiden. Die Menge an KI-generierten Inhalten, darunter Artikel, Bilder, Videos und sogar umfangreiche wissenschaftliche Arbeiten nimmt stetig zu. Wenn mein eigenes Verhalten ein Indikator für eine allgemeine Entwicklung ist, dann betreten wir einen bisher unbekannten Bereich. Bald werden KI-Inhalte die im Internet verfügbaren Daten vervielfachen und den Anteil der noch nie zuvor von KI verarbeiteten Daten zugunsten von KI-generierten Inhalten verschieben. Die Entwicklung von KI-Modellen ist jedoch zurzeit noch auf den kontinuierlichen Strom aktueller, bisher unverarbeiteter Daten angewiesen. Das Training von KI-Modellen erfordert neben enormer Rechenleistung ständig neue Impulse. Das Internet ist die derzeit ergiebigste Quelle für die Gewinnung von Daten als Rohstoff. Was aber, wenn der Zustrom neuer Daten zugunsten von KI-generierten Inhalten abnimmt? In diesem Fall wird das Training zunehmend mit synthetischen Daten durchgeführt, also Daten, die nie den Kreislauf aus nicht KI beeinflusster Benutzerinteraktion und Verarbeitung innerhalb der Modellbildung verlassen haben. Dies könnte die Modellqualität auf Dauer erheblich beeinträchtigen und möglicherweise zu einem „Modell Kollaps“ führen. In ihrem Artikel AI models collapse when trained on recursively generated data (Nature, Juli 2024) beschreibt eine Gruppe von Wissenschaftlern (Shumailov I, Shumaylov Z, Zhao Y, Papernot N, Anderson R, Gal Y) den Modell Zusammenbruch wie folgt:
Analysen zeigen, dass das willkürliches Training generativer künstlicher Intelligenz mit realen und generierten Inhalten, was in der Regel durch die Verwendung von Daten aus dem Internet erfolgt, zu einem Zusammenbruch der Fähigkeit der Modelle führen kann, vielfältige und hochwertige Ergebnisse zu erzeugen.1
Um einen „Modell Kollaps” zu verhindern, muss KI also über die bloße Dekonstruktion und Neukombination bestehender Artefakte hinausgehen und zu echter autonomer Innovation gelangen, indem sie neue Inhalte hervorbringt, anstatt bestehende lediglich zu variieren. Doch können Maschinen erfinden? Um diese Frage zu beantworten, muss betrachtet werden, was menschliche Kreativität bisher von maschineller Verarbeitung unterscheidet: Das Bewusstsein selbst.
Bewusstsein
Was bedeutet Bewusstsein eigentlich, und können Maschinen es entwickeln? Eine Arbeitsdefinition versteht Bewusstsein als Oberbegriff für die verschiedenen Ebenen des menschlichen Geistes: Wahrnehmung, Verstand, Intelligenz, Gedächtnis und Emotion. Diese Ebenen interagieren miteinander und mit der Außenwelt. Das verbindende Element zwischen ihnen ist die Selbstreflexion. Ein bewusstes Wesen hält eine Verbindung zu sich selbst aufrecht, wodurch es die Auswirkungen seines Verhaltens auf Objekte in seiner Umgebung und auf andere Wesen, ob ähnlich oder unähnlich, verstehen kann. Durch Selbstreflexion schafft das Bewusstsein ein internes Modell dessen, was es war, ist oder werden könnte. Dieses interne Modell wird als das Selbst bezeichnet. Selbstmodellierung impliziert Erfahrung. Menschen lernen aus primären, subjektiven Erfahrungen, aber auch aus der Beobachtung, dem Lesen und dem Studium von Quellen Dritter. Eine wesentliche Eigenschaft des Menschen ist es, sich in die Erfahrung eines anderen Individuums hineinversetzen zu können. Der Geschmack eines Kekses kann eine Welt voller Erinnerungen wachrufen. Der Erzähler in Marcel Prousts Auf der Suche nach der verlorenen Zeit kostet eine in Tee getauchte „Madeleine“ und erlebt plötzlich seine gesamte Kindheit in lebhaften Details wieder. Diese Szene veranschaulicht, wie Sinneserfahrungen Erinnerungen auslösen und eine gegenwärtige Empfindung auf eine für jeden Menschen einzigartige Weise mit vergangenen Emotionen verbinden. In Prousts Roman interagieren drei unterschiedliche Perspektiven: Erstens der Autor Marcel Proust (1871–1922) selbst, der auf seine eigenen Erfahrungen in der Belle Époque zurückgreift. Zweitens der fiktive Erzähler Marcel, dessen Bewusstseinsstrom ich als Leser mitverfolgen kann. Drittens die Perspektive der lesenden Person, die von ihrer individuellen Geschichte, Stimmung und Situation geprägt ist. Diese Ebenen verschmelzen beim Lesen und schaffen so ein einzigartiges Leseerlebnis. Ein kranker Mensch, der im Krankenhaus liegt und einen Keks als Beilage seiner Krankenhauskost isst, wird das Buch anders wahrnehmen als jemand, der an einem heißen Sommertag in einem Café sitzt und zum Kaffee köstliches Gebäck serviert bekommt. Beim Lesen eines Buches geht es nicht nur darum, den in einem Sprachsystem verkörperten Inhalt zu entschlüsseln. Wenn Menschen Bücher lesen, interagiert der Text mit persönlichen Erinnerungen, der Umgebung, der Bildung und dem kulturellen Hintergrund des lesenden Individuums. Auch die Tageszeit, die Pausen, die jemand einlegt, und die Stimmung, in der gelesen wird, beeinflussen das Leseerlebnis. Eine künstliche Intelligenz, die wirklich mit dem menschlichen Verstand konkurriert oder ihn übertrifft, muss in der Lage sein, ein internes Modell von sich selbst zu entwickeln, das den Turing-Test auf jeder der oben genannten Ebenen bestehen kann.
Im Jahr 1950 veröffentlichte der britische Mathematiker Alan Turing seine Abhandlung Computing Machinery and Intelligence. Während des Zweiten Weltkriegs verwendeten deutsche U-Boote eine Maschine namens Enigma, um verschlüsselte Nachrichten mit ihren Kommandozentralen auszutauschen. Alan Turing half dabei, die Enigma-Codes zu entschlüsseln, und legte damit einen der Grundsteine für das Computerzeitalter. Er sagte voraus, dass Maschinen bis zum Jahr 2000 in der Lage sein würden, ein menschliches Gegenüber in 30 % der Fälle während eines fünfminütigen Gesprächs zu täuschen, sodass Mensch und Maschine in fast einem Drittel der Fälle nicht mehr zu unterscheiden wären.
Der Test muss hinsichtlich der ersten Ebene erfolgreich sein: Wahrnehmung. Kann eine Maschine ein Objekt wie ein Mensch erkennen? Kann sie sowohl offensichtliche als auch verborgene Beziehungen zwischen Gegenständen und Wesen in einer Umgebung verstehen? Kann sie Intelligenz entwickeln, die aus spezifischen Beobachtungen allgemeine Prinzipien formuliert? Kann sie Erinnerungen speichern, die über das reine „Merken“ von Daten hinausgehen? Und schließlich: Kann eine Maschine Ereignisse erleben, wie es Menschen tun? Millionen Jahre Evolution haben das menschliche Gehirn durch Lernen, Versuch und Irrtum, Misserfolge und Katastrophen geprägt.
Viele unserer Vorstellungen sind nicht das Ergebnis aktueller Erfahrungen, sondern tief in unserem Erbgut verankerte evolutionäre Anpassungen. Darüber hinaus prägen die Kindheit und darauf folgende Ausprägungen die Persönlichkeit eines Menschen. Folglich müsste eine Maschine eine ähnliche Entwicklung durchlaufen, von der Geburt über die Kindheit bis hin zum Tod. Was den Menschen von anderen Säugetieren unterscheidet, ist die Tiefe und Vielschichtigkeit, mit der wir Erfahrungen speichern, uns an sie erinnern und sie immer wieder in neue Zusammenhänge stellen können. Nur wenige Aktivitäten erfordern zeitliche Tiefe mehr als das Lesen, da es vornehmlich eine passive Tätigkeit ist, während der Mensch das Gelesene in der eigenen Vorstellung Gestalt annehmen lässt. Lesen ist eine intensive, komplexe Tätigkeit. Lesen bedeutet Gedanken, Bilder und Stimmungen verstehen, die über ein Zeichensystem vermittelt werden. Das Auge tastet das Blatt ab, auf dem Buchstaben zu Wörtern und Wörter zu Sätzen zusammengestellt sind. Das Auge sendet die gesehenen Zeichen an das Hirn, indem eine Vorstellung entsteht von dem, was aus den gelesenen Worten spricht. Der Vorgang ist umso vielfältiger, da eine innere Zwiesprache entsteht zwischen dem gelesenen Text und der lesenden Person.
Der Proust Test
Lesen fordert die Vorstellungskraft und damit die Fähigkeit heraus, flüchtige Erfahrungen zu schaffen, die nur im Kopf der lesenden Person existieren. Im besten Fall verschmilzt der Inhalt des Gelesenen mit eigenen Gedanken und Emotionen während des Lesens. Mit Blick auf meine KI-generierten Buchzusammenfassungen allerdings stelle ich fest, dass für bestimmte Arten des Lesens Zusammenfassungen tatsächlich ausreichen. Wissenschaftliche Literatur, technische Handbücher und Geschäftsberichte sind zweckorientiert. Man muss wissen, wie man den Server konfiguriert, die Quartalsergebnisse versteht oder die Grundlagen einer Forschungsmethodik begreift. Das Ziel ist die Extraktion von Informationen, nicht deren Transformation. Wir müssen eine Bedienungsanleitung nicht erleben. Wir müssen ihre Anweisungen befolgen. Manches Lesen aber ist nicht instrumentell, sondern transformativ. Der Unterschied liegt nicht in der Schwierigkeit des Textes, sondern in Ihrer Beziehung zu ihm. Das Handbuch für eine Maschine verstehe ich nicht besser, wenn ich es über Tage, wenn nicht gar Wochen lese. Das Lesen von Prosa oder Gedichten aber steht als Erfahrung für sich selbst, wobei die Lesezeit für die Intensität der Erfahrung von großer Bedeutung sein kann. Solche Erfahrungen können in der Vorstellung der lesenden Person Bilder, wenn nicht gar ganze Welten entstehen lassen.
Ein KI-Agent kann eine prägnante Zusammenfassung von Marcel Prousts Auf der Suche nach der verlorenen Zeit liefern und dadurch Interessierten Wochen oder sogar Monate Lesezeit ersparen. Allerdings kann der Agent das Leseerlebnis selbst nicht ersetzen. Lesen erfordert Zeit, es ist eine Reise mit unerwarteten Wendungen und Ereignissen. Sich in einen komplexen Roman zu vertiefen, ist nicht nur eine Frage der Zusammenstellung von Fakten.
Das Werk umfasst etwa 1,2 Millionen Wörter. Es beschreibt die Reise des Erzählers von der Kindheit über die Jugend bis zum Leben in der Belle Époque in Frankreich. Ein Zitat, das angeblich von Anatole France stammt, bringt die Herausforderung auf den Punkt: „Das Leben ist zu kurz und Proust ist zu lang.“ Ob Anatole France dies tatsächlich gesagt hat, ist umstritten. Wer jedoch etwa die zehn Bände der deutschen Ausgabe sieht, kann dem angesichts des Umfangs durchaus zustimmen. Die Bilder und Emotionen, die beim Verfolgen der Handlung über Wochen hinweg entstehen, hängen von der Vorstellungskraft ab. In diesem Prozess verschmerzen die Lebensumstände des Lesers mit der Erzählung und schaffen so ein einzigartiges Erlebnis, in dem persönliche Erinnerungen mit Betrachtungen des Lebens von Aristokraten, Bohemien und Künstlern im Frankreich des späten 19. und frühen 20. Jahrhunderts zusammenkommen.
Angenommen, ein KI-Agent würde langsam lesen, um sich über Wochen hinweg anzupassen und so das menschliche Lesen nachzuahmen. Was wäre der Gewinn für einen Menschen, der das Lesen einer KI überlassen würde? Vielleicht entsteht eine ausgefeilte Zusammenfassung des Buches mit einem Bruchteil des Umfangs des Originals. Ein Mensch, dem dies ausreicht, wird aber niemals die Spannung des selbständigen Lesens erfahren. Der Wert liegt nicht nur in einer kompakten Darstellung der Fakten.
Der Wert liegt darin, den Prozess der anhaltenden Aufmerksamkeit, der Auseinandersetzung und des reflektierenden Denkens zu durchleben. Ein Monat mit Proust verändert den Leser. Der Mensch, der das Buch zu Ende liest, ist nicht mehr ganz derselbe wie der, der begonnen hat. Diese Verwandlung im Laufe der Zeit ist wesentlich für das menschliche Lernen. Es ist unmöglich, diese Erfahrung zu automatisieren. Dabei geht es nicht nur um literarische Belletristik.
Das gleiche Prinzip gilt für jede intensive Auseinandersetzung mit komplexen Stoffen über einen längeren Zeitraum hinweg: das Erlernen eines Musikinstruments, das Erlernen einer Programmiersprache oder das Studium der Mathematik. KI kann die Prinzipien der Klaviertechnik oder der Matrixmultiplikation erklären. Aber sie kann weder die jahrelange Übung ersetzen, durch die die Musik Teil des Lebens wird, noch die gesammelten Erfahrungen aus Versuch und Scheitern, die nötig sind, um eine funktionierende Software zu erhalten. In einer Zeit, in der Technologien wie KI in fast alle Lebensbereiche dringen und das menschliche Dasein durch Automation komfortabler und effizienter macht, stellt sich die Frage, welche Erfahrungen, Maschinen niemals optimieren oder automatisieren können.
Zeit erleben
Die subjektive Wahrnehmung von Zeit hängt von der körperlichen, geistigen und seelischen Verfassung eines Menschen ab. Wenn eine künstliche Intelligenz die Ebene des menschlichen Bewusstseins erreichen oder sogar übertreffen will, muss sie lernen, Zeit zu erleben, anstatt sie nur zu verarbeiten. Automatisierung kann einen Prozess beschleunigen, um schneller zu einem Ergebnis zu gelangen. Aber was ist das Ergebnis eines ganzen Lebens? Ist es sinnvoll oder überhaupt möglich, eine gelebte Erfahrung zu beschleunigen? Die Entwicklung der nächsten Generation künstlicher Intelligenz muss sich mit diesen Fragen auseinandersetzen, sofern das Ziel darin besteht, etwas zu schaffen, das dem menschlichen Verstand ähnlich oder überlegen ist. Die Unersetzlichkeit des Menschen liegt nicht in der Effizienz seiner Leistungsfähigkeit, sondern in der Singularität seiner Erfahrung. Menschen verarbeiten Informationen nicht nur, sie leben mit ihnen, durchleben sie und werden im Laufe der Zeit durch sie verändert. Kein automatisiertes System, egal wie ausgeklügelt, kann dies nachbilden oder ersetzen. Menschliche Intelligenz wird nicht daran gemessen, wie schnell jemand Auf der Suche nach der verlorenen Zeit lesen kann, sondern ob ein Mensch es in seiner eigenen Zeit durchlebt, unabhängig von der Dauer des Lesens. Das Hier und Jetzt des Lesens ist der Wert des Lesens selbst.
Analysis shows that indiscriminately training generative artificial intelligence on real and generated content, usually done by scraping data from the Internet, can lead to a collapse in the ability of the models to generate diverse high-quality output.

