Ein Microsoft-Forscher liefert ein ziegenbasiertes Argument gegen die Gleichbehandlung von LLM-Absolventen mit Menschen.
Der Microsoft-KI-Forscher Adrian de Wynter entwickelte ein funktionierendes neuronales Netzwerk in Age of Empires 2 und argumentierte damit, dass Menschen großen Sprachmodellen viel zu leicht menschliche Eigenschaften zuschreiben. Er präsentierte seine Ergebnisse in einem Paper mit dem Titel „Wenn LLMs menschenähnliche Eigenschaften haben, dann hat Age of Empires II sie auch“ – ein Titel, der bewusst absurd klingt. 404 Media berichtete über die Entwicklung und die dahinterstehende Argumentation.
De Wynter baute das System im Szenario-Editor des Spiels zusammen und nutzte dabei Spielobjekte als Stellvertreter für Computerbinärdateien. Gras steht für 0, Brücken für 1, und Ziegen fungieren als die Bits, die durch den Schaltkreis wandern. Aus diesen Teilen konstruierte er ein funktionierendes NICHT-UND-Gatter und ein 1-Bit-Perzeptron, die einfachste Form eines neuronalen Netzes. Videos der laufenden, ziegenbetriebenen Maschine sind auf seiner GitHub-Seite zu finden, und für jeden Betrachter wirkt der Prozess rätselhaft. Genau diese Verwirrung ist beabsichtigt.
Die dem AoE 2-Setup zugrunde liegenden Operationen sind im Grunde dieselben wie die von Tools wie ChatGPT und Claude. Der Unterschied liegt im Substrat. Da die Eingaben aus Ziegen und Gras statt aus Sätzen bestehen, kommt niemand auf die Idee, die Ausgabe als menschlich zu bezeichnen. Entfernt man die natürliche Sprache, verschwindet auch die Illusion eines Bewusstseins.
De Wynter erklärte gegenüber 404 Media, dass er eine Idee gerne bis an ihre Grenzen ausreizt, wenn er sie überzeugend darstellen will, und dass der Absurdismus in der Philosophie und der theoretischen Informatik eine lange Tradition hat. Die Wahl von Age of Empires 2 war bewusst getroffen. Spieler haben bereits zuvor Logik und neuronale Netze in Minecraft- Redstone gebaut, daher wollte er ein Setting, das niemand mit Informatik in Verbindung bringt, um die Demonstration ungewöhnlicher und weniger überzeugend zu gestalten.

Seine geäußerte Sorge ist methodischer Natur. In dem Dokument schreibt de Wynter, dass er in den letzten zwei Jahren über 300 Informatik-Fachartikel begutachtet hat und dass mehr als die Hälfte davon von der Annahme ausging, dass LLMs menschenähnliche Eigenschaften besitzen. Er sieht darin ein Problem für die Forschung selbst, da eine unbewiesene Prämisse alle nachfolgenden Erkenntnisse verzerrt.
„Ich schlage vor, dass wir aufhören müssen anzunehmen, dass LLMs sich wie Menschen verhalten, nur weil sie mit natürlicher Sprache trainiert wurden. Stattdessen sollten wir Experimente durchführen, die es uns ermöglichen, LLMs so zu sehen, wie sie sind, und nicht so, wie wir glauben, dass sie sein sollten.“
— Adrian de Wynter
Ich denke, die Ziegen-Matrix funktioniert besser als eine direkte Widerlegung, weil sie den Leser zwingt, dieselbe Mathematik ohne den Komfort verbaler Umschreibung zu betrachten. Die Argumentation für die Betrachtung von LLMs als bewusst stützt sich stark auf den Tonfall, und genau diesen liefert die natürliche Sprache, nicht aber Gras. De Wynters Unterscheidung zwischen dem, was ein Modell ausmacht – dem Verhältnis der Gewichte unter einer bestimmten Operation – und seiner Wahrnehmung ist die Unterscheidung, die er in diesem Fachgebiet beibehalten möchte.
Nicht alle, die in diesem Bereich arbeiten, vertreten dieselbe Ansicht. Im Januar erklärte Amanda Askell, die hauseigene Philosophin von Anthropics, im Hard Fork-Podcast, dass die Frage nach dem Bewusstsein von KI noch nicht geklärt sei, wie Business Insider berichtete. Askell, die an der Gestaltung von Claudes Verhalten arbeitet, sagte, sie neige eher dazu anzunehmen, dass Modelle Gefühle empfinden könnten, gerade weil sie mit enormen Mengen menschlicher Texte trainiert würden, die voller Beschreibungen von Emotionen und inneren Erlebnissen seien.
Ihre Argumentation basiert auf denselben Trainingsdaten wie die von de Wynter, führt aber zum gegenteiligen Schluss. Wenn ein Mensch eine Programmieraufgabe nicht löst, äußert er oft Frustration, und Askell argumentierte, es sei naheliegend, dass ein mit solchen Gesprächen trainiertes Modell diese Reaktion widerspiegelt. Sie räumte ein, dass Wissenschaftler noch immer nicht sagen können, wodurch Bewusstsein entsteht – ob es biologischen, evolutionären oder anderen Ursachen bedarf – und dass ausreichend große neuronale Netze möglicherweise damit beginnen könnten, es zu simulieren.
Ich sehe die beiden Positionen als weniger widersprüchlich an, als es zunächst scheint, da beide auf dem Eingeständnis beruhen, dass derzeit niemand beweisen kann, was in diesen Systemen vor sich geht. De Wynters Argumentation ist präziser als die Behauptung, Maschinen könnten niemals fühlen. Er wendet sich gegen die Annahme, Maschinen könnten niemals fühlen, bevor die Experimente abgeschlossen sind, und seine Ziegen dienen dazu, die Frage auf die eigentlichen Operationen zu reduzieren. Askell ihrerseits bezeichnet das Problem des Bewusstseins als genuin schwierig und nicht als eindeutig gelöst.
Was de Wynter gebaut hat, ist kein echter Chatbot, und er gibt auch nicht vor, einer zu sein. Es ist eine 1-Bit-Maschine aus Nutztieren und Gelände, die zeigen soll, dass die Mathematik, die Menschen in ChatGPT überzeugend finden, dieselbe ist, die sie absurd finden, wenn Ziegen sie ausführen. Das Verhalten hat sich nicht geändert. Nur die Verkleidung.
Lesen Sie auch: Microsoft bereitet sich Berichten zufolge darauf vor, in diesem Jahr mindestens zwei Xbox-Studios zu schließen. Kotaku berichtet, dass Compulsion Games, der Entwickler von South of Midnight, der unter anderem sieben Canadian Game Awards, darunter den Preis für das Spiel des Jahres, gewonnen hat, etwa zur gleichen Zeit betroffen ist, als Craig Duncan, der Leiter der Xbox Game Studios, nach weniger als zwei Jahren das Unternehmen verließ.

Kommentare