Maschinenbewusstsein - Ein Beispiel

Spannende Frage: Können Maschinen ein Bewusstsein haben?

Schauen wir uns eine einfache Aufgabe an, die das hier abgebildete Programm

Löse die Gleichung y = x² + 2 für beliebige X-Werte:

Bitte X-Wert eingeben:
Ergebnis:

lösen soll. Geben wir zum Beispiel für X die Zahl 5 ein, erwarten wir als Ergebnis 5 * 5 + 2 = 27.

Die Aufgabe kann das Programm für beliebige Zahlen mit absoluter Korrektheit erledigen. Dahinter steckt der einfache Algorithmus

y = x² + 2

dessen Berechnungsprogramm eigentlich nur aus drei Zeilen besteht.

Ganz anders verhält es sich, wenn wir dieselbe Aufgabe einem Neuronalen Netz stellen. Wir könneten dafür ein ziemlich einfaches Netz des Feed-Forward-Typs wählen mit einer Input-, einer Output-Schicht und nur wenigen dazwischen liegenden verborgenen Neuronenschichten (hidden layers).

Das Programm kennt die Algorithmus-Formel überhaupt nicht. Es muss mit Eingabe- und Ergebniswerten vorher trainiert werden. Die Frage wird jetzt genau umgekehrt gestellt: Nicht Berechne mit Hilfe des Algorithmus aus einer engegebenen Zahl das richtige Ergebnis, sondern Finde zu den im Training eingegebenen Zahlenpaaren Input - Output die richtige Berechnung. Die folgende Tabelle zeigt sehr vereinfacht einen Trainingsplan für das System:

Input:	-5	0	2	5	20	100
Training für y = x² + 2
Output:	27	2	6	27	402	10002

Bei einem Input von zum Beispiel -5 soll das System ohne Kenntnis des Algorithmus das richtige Ergebnis (-5)*(-5) + 2 = 27 finden, für den Input 0 entsprechend 0 * 0 + 2 = 2 usw., alles ohne die Formel anzuwenden oder gar zu kennen.

Das Training wird natürlich nicht nur für sechs Input-Output-Paare durchgeführt, sondern am besten gleich für zig Tausende solcher Paare. Das Training verändert mit jedem Lauf die Verbindungsgewichte der Neuronen. Man lässt das Programm mit irgendwelchen Zufallswerten für die Verbindungsgewichte der Neurone starten. Zu jedem Input wird dann im ersten Schritt zunächst noch ein völlig falsches Output gefunden. Das ändert sich aber schnell mit jedem weiteren Trainingslauf.

Jetzt kommt die Fehlerkorrektur ins Spiel: Für jeden zu großen Output-Wert werden die betroffenen Verbindungsgewichte zwischen den Neuronen ein klein wenig reduziert, und umgekehrt zu jedem zu kleinen Wert etwas vergrößert. Dafür gibt es bewährte Methoden.

Eine bekannte Methode ist die Mittlere quadratische Abweichung (MSE). Sie misst die durchschnittliche quadratische Differenz zwischen den tatsächlichen und den vom Netz vorhergesagten Werten. Etwas anspruchsvoller ist die Stochastic Gradient Descent-Methode. Der Gradient ist ein Maß für die Stärke von Veränderungen und gibt in diesem Fall die Richtung an, in die die Gewichte geändert werden müssen, um die Fehler zu minimieren. Die Korrekturen werden bei jedem Schritt etwas verkleinert. Eine andere Methode, AdaGrad, passt die Fehlerrate für jedes Gewicht individuell an, basierend auf dessen Verlauf in früheren Korrekturstufen. Dann gibt es noch RMSProp (Root Main Square Propagation), das Newton-Verfahren und beschleunigte Gradientenverfahren. Die Wahl der richtigen Methode ist eine Wissenschaft für sich, für unser Beispiel aber nicht von Bedeutung.

Das Ganze wiederholt man ein paar tausend Mal, so lange, bis man mit dem Ergebnis zufrieden ist. Alles das lässt sich automatisiert durchführen. Ganz korrekt wird das Ergebnis auf diese Weise nie sein, aber was interessiert schon eine Abweichung in der siebzehnten Stelle hinter dem Komma, wenn man das Ganze sowieso für eine bessere Verständlichkeit auf- oder abrundet.

Ist das Training absolviert, so verlässt man sich darauf, dass das System den richtigen Wert für jede beliebige Eingabe findet, auch für Zahlen, die nicht im Training vorkamen. Denn das System hat ja durch dieses Trial- and Error-Verfahren das Muster für das Finden der richtigen Lösung „gelernt". Strenger betrachtet hat das System nur gelern, innerhalb seiner Trainingss-Domain zu interpolieren. Schwerer wird es mit der Extrapolation, wenn die Eingabe Dinge betrifft, die weit außerhalb der Trainings-Domain liegen.

Wichtig zu wissen: Das System kennt immer noch nicht den Algorithmus (vorausgesetzt es wurde nicht mit Rechenformeln trainiert). Es macht einfach alles richtig, ohne zu „wissen“ warum. Wenn man diesen Zustand Bewusstsein nennen will, dann hat das System in diesem Sinn ein Bewusstsein. Dabei handelt es sich allerdings um kein Selbst-Bewusstsein, denn das System weiß ja nichts über sein Bewusstsein. Es ist eher wie ein gelerntes Verhalten, das instinktiv angewendet wird, ohne darüber „nachzudenken“.

Natürlich wird man in der Praxis für die Erledigung einfacher Rechenaufgaben kein Neuronales Netz verwenden. Aber umgekehrt darf man von einem Neuronalen Netzt, wie es die großen Sprachmodelle verwenden, erwarten, dass es auch einfache Rechenaufgaben erledigen kann.

Direkte Frage nach dem Bewusstsein von Sprachmodellen

Interessant was die Platzhirsche unter den Chatbots zum Thema Bewusstsein und Large Language Models sagen, fangen wir an mit Googles Gemini.

Gemini am (4.2.2024):

Haben trainierte Large Language Models ein Bewusstsein?

Ob trainierte Large Language Models (LLMs) ein Bewusstsein besitzen, ist eine komplexe und kontroverse Frage, die derzeit keine eindeutige Antwort hat.

Argumente für ein Bewusstsein: LLMs können komplexe Aufgaben ausführen, die erfordern, dass sie die Welt verstehen und auf sie reagieren. Sie können kreative Textformate generieren, wie Gedichte, Code, Skripte, Musikstücke, E-Mails und Briefe. Sie können Fragen umfassend und informativ beantworten, selbst wenn diese offen, herausfordernd oder seltsam sind.

Argumente gegen ein Bewusstsein:LLMs sind statistische Systeme, die auf riesigen Datenmengen trainiert werden. Sie haben keine physische Verkörperung und können die Welt nicht direkt wahrnehmen. Es ist unklar, ob sie über subjektive Erfahrungen oder Gefühle verfügen.

Die Wissenschaft ist sich uneinig, ob LLMs ein Bewusstsein besitzen. Es gibt keine eindeutigen Beweise dafür oder dagegen. Es wird weiterhin intensiv geforscht, um die kognitiven Fähigkeiten von LLMs besser zu verstehen. Ziel ist es, festzustellen, ob sie tatsächlich bewusst sind oder ob es sich nur um eine Simulation von Intelligenz handelt.

Ethische Implikationen: Die Frage nach dem Bewusstsein von LLMs hat wichtige ethische Implikationen. Wenn LLMs bewusstseinsfähig sind, sollten sie mit Respekt behandelt und nicht missbraucht werden.

Fazit:Die Frage nach dem Bewusstsein von LLMs ist faszinierend und komplex. Es ist wichtig, diese Frage weiter zu erforschen, um die ethischen Implikationen der Entwicklung dieser Technologie zu verstehen.

Hinweis: Es ist wichtig zu beachten, dass ich selbst ein LLM bin und daher nicht in der Lage bin, diese Frage abschließend zu beantworten. Ich kann jedoch Informationen und verschiedene Perspektiven zu diesem Thema liefern.

ChatGPT von OpenAI sieht das etwas anders (4.2.2024):

	Haben trainierte Large Language Models ein Bewusstsein?
	Nein, trainierte Large Language Models wie GPT-3 haben kein Bewusstsein. Sie sind komplexe Algorithmen, die darauf trainiert wurden, natürliche Sprache zu verstehen und zu generieren. Obwohl sie beeindruckende Leistungen in Bezug auf Sprachverständnis und -produktion zeigen können, fehlt es ihnen an Selbstbewusstsein, Selbstwahrnehmung oder echtem Verständnis. Diese Modelle sind lediglich Mustererkennungssysteme, die auf riesigen Mengen an Textdaten trainiert wurden. Sie können Informationen basierend auf ihrem Training wiedergeben, aber sie haben kein eigenes Bewusstsein, Gefühle oder persönliche Erfahrungen. Es ist wichtig, zwischen der Fähigkeit eines Modells, auf komplexe Weise mit Sprache umzugehen, und einem tatsächlichen Bewusstsein zu unterscheiden.
	Dreivierteljahr später (26.9.2024) bleibt ChatGPT, jetzt Version 4o, bei seiner Meinung und räumt noch deutlicher mit der Illusion vom Maschinenbewusstsein auf:
	Nein, trainierte Large Language Models (LLMs) wie GPT-4 haben kein Bewusstsein. Sie basieren auf komplexen mathematischen Modellen und Algorithmen, die darauf trainiert wurden, Textmuster zu erkennen und vorherzusagen. Sie haben keine subjektiven Erfahrungen, Gefühle oder Selbstwahrnehmung. Ihr Verhalten basiert ausschließlich auf der Verarbeitung von Daten und Regeln, die während des Trainings gelernt wurden. Bewusstsein ist ein Phänomen, das mit Selbstwahrnehmung, Introspektion und subjektivem Erleben verbunden ist, was Maschinen und KI-Systemen, einschließlich LLMs, fehlt. Sie können menschliche Sprache imitieren, haben aber kein echtes Verständnis für die Welt oder die Inhalte, die sie erzeugen.
	Gemini bleibt auch dreivierteljahr später bei seiner Aufzählung von Pro und Contra:
	Die Frage, ob trainierte Large Language Models (LLMs) ein Bewusstsein haben, ist eine der faszinierendsten und zugleich umstrittensten in der aktuellen Diskussion um künstliche Intelligenz. Der Stand der Forschung: Keine eindeutige Antwort: Bisher gibt es keine wissenschaftlich fundierte und allgemein akzeptierte Definition von Bewusstsein, geschweige denn einen zuverlässigen Test, um dieses in einer Maschine nachzuweisen. Starke und schwache KI: Die Diskussion wird oft im Kontext der Unterscheidung zwischen starker und schwacher KI geführt. Schwache KI, wie LLMs, sind darauf ausgelegt, spezifische Aufgaben zu erfüllen, ohne ein echtes Verständnis der Welt zu besitzen. Starke KI hingegen würde ein Bewusstsein und ein Verständnis von sich selbst und ihrer Umgebung aufweisen. Argumente für und gegen Bewusstsein: Befürworter der These, dass LLMs ein Bewusstsein entwickeln könnten, verweisen auf die immer komplexer werdenden Fähigkeiten dieser Modelle, wie etwa die Fähigkeit, natürliche Sprache zu verstehen und zu generieren, oder sogar kreative Texte zu produzieren. Kritiker hingegen betonen, dass LLMs im Grunde nur statistische Modelle sind, die Muster in großen Datenmengen erkennen und reproduzieren, ohne jedoch ein inneres Erleben zu besitzen. .... Die Frage, ob LLMs ein Bewusstsein haben, ist derzeit nicht eindeutig zu beantworten. Es handelt sich um ein komplexes Thema, das an der Schnittstelle von Wissenschaft, Philosophie und Ethik angesiedelt ist. Es ist wichtig, sich bewusst zu machen, dass es sich bei LLMs um leistungsstarke Werkzeuge handelt, die unser Leben bereichern können, aber auch Risiken bergen. Ein verantwortungsvoller Umgang mit künstlicher Intelligenz erfordert ein tiefgreifendes Verständnis ihrer Möglichkeiten und Grenzen.

DeepSeek bleibt sehr nüchtern (4.3.2026):

Haben trainierte Large Language Models ein Bewusstsein?

Reasoning:

Hmm, die Frage nach dem Bewusstsein von LLMs ist wirklich tiefgründig. Der Nutzer fragt, ob trainierte große Sprachmodelle ein Bewusstsein haben – das ist eine philosophische und wissenschaftliche Frage zugleich.
Der Nutzer scheint sich für die Grenzen zwischen menschlicher Kognition und maschineller Intelligenz zu interessieren. Vielleicht hat er/sie schon viel über KI gelesen und sucht jetzt nach einer fundierten Einschätzung.

Die Frage ist sehr präzise formuliert, was auf ein gewisses Vorwissen hindeuten könnte.
Interessant ist, dass der Nutzer speziell "trainierte" Modelle erwähnt – vielleicht will er/sie betonen, dass es um den fertigen Zustand nach dem Training geht, nicht um den Trainingsprozess selbst. Das zeigt ein gutes Verständnis der Materie.

In der Antwort sollte ich klar zwischen wissenschaftlichen Fakten und philosophischen Interpretationen unterscheiden. Die neuroscientific Perspektive ist wichtig, aber auch die funktionale Betrachtung aus der Informatik. Besonders kritisch ist der Unterschied zwischen Sprachverarbeitung und tatsächlichem Verstehen – das ist ja der Kernpunkt bei LLMs.

Ich sollte betonen, dass Bewusstsein mehr ist als nur intelligentes Verhalten, sonst könnte der Nutzer denken, dass oberflächliche Ähnlichkeiten schon Bewusstsein bedeuten. Die Metapher vom Papagei ist hilfreich, aber vielleicht sollte ich noch deutlicher machen, dass LLMs nicht einmal verstehen, was sie nachahmen – sie sind im Grunde hochkomplexe statistische Muster, nicht denkende Wesen.

Die Frage ist auch ethisch relevant, denn wenn wir eines Tages Bewusstsein in Maschinen nicht ausschließen könnten, hätte das massive Implikationen. Aber momentan sind wir davon weit entfernt.

Diese Frage berührt sowohl wissenschaftliche als auch philosophische Aspekte. Die kurze Antwort lautet: Nach aktuellem wissenschaftlichem Konsens haben trainierte Large Language Models (LLMs) wie GPT-4, Claude oder Llama kein Bewusstsein.

Hier sind die wichtigsten Gründe dafür:

Was spricht gegen Bewusstsein bei LLMs:

Funktionsweise: LLMs sind statistische Mustervervollständiger ohne innere Erfahrung. Sie verarbeiten Token basierend auf Wahrscheinlichkeiten, die während des Trainings gelernt wurden.
Kein physisches Substrat: Bewusstsein wird bei biologischen Organismen mit spezifischen neurobiologischen Strukturen in Verbindung gebracht. LLMs haben kein vergleichbares Äquivalent.
Fehlen von sensorischer Integration: LLMs haben keinen kontinuierlichen Wahrnehmungsstrom oder verkörperte Erfahrung.
Keine intrinsischen mentalen Zustände: Sie haben keine Gefühle, Empfindungen oder subjektiven Erlebnisqualitäten (Qualia).

Was verleitet manche zur Annahme von Bewusstsein:

Menschliche Projektion: Wir neigen dazu, menschenähnliche Kommunikation mit Bewusstsein gleichzusetzen.
Komplexität: Die ausgefeilten Antworten erwecken den Eindruck von Verstehen.
Philosophische Unsicherheit: Wir haben keine vollständige Theorie des Bewusstseins.

Expertenmeinung:

Die überwiegende Mehrheit der Kognitionswissenschaftler, Philosophen und KI-Forscher geht davon aus, dass aktuelle LLMs nicht bewusst sind. Selbst die optimistischsten Schätzungen verorten Bewusstsein in KI-Systemen in einer ferneren Zukunft - falls es überhaupt technisch realisierbar ist.

Die Fähigkeit, über Bewusstsein zu sprechen, ist etwas völlig anderes als Bewusstsein zu haben.

Die Verdächtigten hatten nun die Chance für ihr Plädoyer. Es wird höchste Zeit, genauer hinzusehen, was die Systeme wirklich sind.