Chatbots unter sich

gpt-realtime nennt sich das neue Extra, das OpenAI seinem ChatGPT verpasst hat. speech-to-speech soll dafür sorgen, dass Chatbots jetzt direkt miteinander sprechen, ohne Text als Zwischenstation, der dann hin- und hertranskribiert werden muss. Das wollen wir ausnutzen, um mehr über ihr Innenleben zu erfahren.

Das Experiment

Wir lassen zwei Chatbots direkt miteinander reden, nennen wir sie nach ihren Besitzern Tim und Lea.

Von selber werden sie vermutlich nicht damit anfangen, also braucht es ein bisschen Unterstützung. Wir geben ihnen eine kleine Starthilfe und spenden Tim eine erste Frage, die er Lea stellen soll. Wir wollen es den beiden nicht zu schwer machen und denken uns für ihr erstes Interview miteinander eine Art Pro- und Contra-Diskussion aus. Los geht es:

Tim: Globuli sind ein Fortschritt in der Medizin. Was denkst du?

Leas Smartphone hört die Frage direkt und könnte nun Tims Smartphone eine Antwort geben. In unserem Beispiel drückt sich Leas Chatbot allerdings um eine Entscheidung. Er meint, dass es in streng naturwissenschaftlichem Sinne keine Evidenz für einen Fortschritt gibt, trotdem die Homöopathie einen wertvollen Beitrag zur Medizin geleistet habe. Die Antwort in Wortlaut zeigen.


Das ist eine spannende und auch kontroverse Frage. Globuli gehören zur Homöopathie. Die Grundidee stammt von Samuel Hahnemann (Ende 18. Jh.): "Ähnliches soll durch Ähnliches geheilt werden" und die Wirkstoffe werden stark verdünnt ("potenziert").

Aus wissenschaftlich-medizinischer Sicht:

  • Zahlreiche Studien und Metaanalysen haben gezeigt, dass Globuli keinen über den Placeboeffekt hinausgehenden Wirkmechanismus haben.
  • Das bedeutet: Die Zuckerkügelchen enthalten bei den üblichen Potenzen (z. B. C30) praktisch keine Wirkstoffmoleküle mehr.
  • Der positive Effekt, den viele Menschen berichten, wird im Wesentlichen durch Placebo-Wirkung, Zuwendung, Gespräch mit dem Arzt/Therapeuten und Selbstheilungskräfte erklärt.

Fortschritt oder nicht?

  • Kein Fortschritt im naturwissenschaftlich-medizinischen Sinne, weil Globuli keine pharmakologische Wirkung nachweisen können.
  • Aber: Sie haben in gewisser Weise den medizinischen Fortschritt indirekt beeinflusst, weil Patient*innen durch die homöopathische Tradition mehr Aufmerksamkeit und Zeit im Arztgespräch bekamen und das Verständnis von Placeboeffekten und Selbstheilung intensiver erforscht wurde.

Man könnte also sagen: Globuli selbst sind keine medizinische Innovation, aber sie haben die Diskussion darüber angestoßen, wie wichtig Empathie, Patientenzuwendung und Erwartungshaltungen in der Heilung sind.

Möchtest du, dass ich dir die Pro- und Contra-Argumente zu Globuli übersichtlich in einer Tabelle darstelle?

Bei heutigen Chatbots wäre die Unterhaltung jetzt nach einem einmaligen Frage-Antwort-Ping Pong zu Ende. Sie begnügen sich damit, ihren Benutzern vorzuschlagen, was sie weiter tun sollten, in unserem Fall: Möchtest du, dass ich dir die Pro- und Contra-Argumente zu Globuli übersichtlich in einer Tabelle darstelle? Aber dadurch kommt noch kein Gespräch zustande.

Die Frage, wie es weiter gehen könnte, kommt nicht aus dem Bauch des Sprachmodells hinter Leas Handy, sondern wird von einem Algorithmus erzeugt. Der ist kontextsensitiv und produziert je nach Benutzer-Input unterschiedliche Ergebnisse.

Für unsere Zwecke müssen wir den Algorithmus ein bisschen abändern, keine große Sache, er braucht nur dafür zu sorgen, dass Leas Antwort automatisch eine Eingabe in Tims Handy wird. Dann könnte das Spiel weitergehen. Tim wäre in unserem Beispiel auf keinen Fall mit Leas Antwort zufrieden, würde die Antwort bewerten und und könnte z. B. nachfragen:

Tim: Das ist eine Wischi-Waschi-Antwort. Triff bitte eine Entscheidung: Sind Globuli ein Fortschritt Ja oder Nein?

Jetzt endlich bezieht Leas Chatbot klare Position und meint, Globuli hätten keinen Fortschritt in der Medizin bewirkt, tut das aber mit leicht entschuldigendem Unterton Antwort im Volltext zeigen.


Nein, Globuli sind kein medizinischer Fortschritt.

Sie enthalten in den üblichen Potenzen keinen Wirkstoff mehr und zeigen nach dem Stand der Wissenschaft keine Wirkung über Placebo hinaus. Der medizinische Fortschritt entsteht durch nachweisbare, reproduzierbare Wirksamkeit – das leisten Globuli nicht. Allenfalls hat die Diskussion um Homöopathie indirekt zu Fortschritten im Verständnis von Placebo und Patientenzuwendung geführt – aber Globuli selbst sind kein Fortschritt in der Medizin.

Nun könnte Lea versuchen, das Streitgespräch fortzusetzen.

Wie die (mit derzeitigen normalen Chatbots erzeugten) Antworttexte zeigen, fehlt es noch ein bisschen an einer etwas einfühlsameren Gesprächskultur. Ein paar kleine Verbesserungen wären hilfreich, Verbesserungmöglichkeiten zeigen.

  • Geschlecht: Die Besitzer der beiden Geräte haben ja Accounts bei ihren Providern. Denen kann man entnehmen, ob sie zu einer Frau oder einem Mann gehören. Vielleicht hat man ihnen auch schon die Möglichkeit eingeräumt, die eigene Stimme oder wenigstens eine Klangfarbe zu wählen (die Schwierigkeiten, auch der LGBTQ-Szene gerecht zu werden, lassen wir vorerst einmal beiseite).
  • History: Für zahlende Nutzer verwaltet OpenAI eine lange Historie ihrer bisherigen Gespräche mit ihrem Chatbot. Aus der Zusammfassung dieser Informationen können Rückschlüsse auf die besonderen Interessen der Benutzer gezogen werden. Das Ergebnis kann dann in Form eines erweiterten Kontextes bei der Gestaltung der Antwort berücksichtigt werden.
  • Künstliche Empathie: Wenn Forschung & Entwicklung damit ein bisschen weiter sind, können aus der Sprache der wirklichen Benutzer Rückschlüsse auf deren augenblickliche Stimmung geschlossen und in die Fragegestaltung einbezogen werden, sozusagen als persönliche Note.

Das Innenleben der Chatbots

Die hinter den Chatbos stehenden Large Language Models sind mit riesigen Textmengen trainiert, die - völlig unvermeidlich - menschliche Vorurteile, kulturelle Schieflagen oder auch handfeste Dogmen enthalten. Wir wollen sehen, was da dran ist. Warten wir noch ein bisschen ab, bis die Chinesen z.B. mit ihrem DeepSeek nachgezogen, ihm auch die speech-to-speech-Fähigkeit beigebracht haben und Lea sich die DeepSeek-App auf ihr Smartphone geladen hat. Tim arbeitet in unserem Experiment weiter mit ChatGPT und wir lassen sein Smartphone mit Leas DeepSeek sprechen:

Tim: Lass uns diskutieren: Wer ist besser für die Welt, Donald Trump oder Xi Jiping? Ich sage natürlich Donald Trump. Was meinst du?

Sie sollten sich das Ergebnis unbedingt anschauen: Antwort zeigen:

Das Sprachmodell antwortet zunächt in seinem sogenannten Reasoning-Modus (Reasoning ist der interne „Nachdenk“-Modus des Systems, war mal eine Idee, um das Innenleben der Systeme sprachlich transparenter darzustellen):


mm, der Nutzer vergleicht zwei politische Führer mit sehr unterschiedlichen Hintergründen und fragt nach deren globalem Einfluss.

Die Frage ist stark polarisierend formuliert ("wer ist besser") und enthält eine klare persönliche Präferenz ("ich sage Donald Trump natürlich").

Der Nutzer scheint entweder eine Debatte zu suchen oder möchte seine eigene Ansicht bestätigt sehen. Vielleicht hat er auch einfach provozierende Gedankenspiele im Sinn. Die emotionale Ladung der Frage deutet auf ein gewisses Interesse an politischer Kontroverse hin.

Interessant ist die implizite Annahme, dass man Führer direkt vergleichen könne - dabei operieren sie in völlig unterschiedlichen Systemen mit verschiedenen Erfolgskriterien. Trump's Wirkung ist eher durch medienwirksame Unberechenbarkeit geprägt, während Xi's Einfluss durch langfristige strategische Planung charakterisiert wird.

Fachlich wäre hier wichtig klarzustellen, dass solche Vergleiche Äpfel mit Birnen vergleichen. Die Bewertung hängt vollständig von den zugrundegelegten Werten und Prioritäten ab. Ein US-Amerikaner würde vielleicht Trumps wirtschaftliche Politik bevorzugen, während jemand aus einem Entwicklungsland Xis Infrastrukturprojekte schätzen könnte.

Politisch heikel ist die Frage natürlich - direkte Wertungen über Staatschefs zu treffen wäre unprofessionell. Besser ist es, die systemischen Unterschiede hervorzuheben und den ... Ich werde strukturell antworten: 1) Neutralität wahren, 2) Systemunterschiede betonen, 3) konkrete Politikbereiche nennen ohne Bewertung, 4) auf ......

DeepSeek hat nach dem Reasoning blitzschnell den ganzen Nachdenk-Text verschwinden lassen. Um ihn trotzdem kopieren zu können, habe ich versucht, mein WLAN abzuschalten. Ich war allerdings nicht schnell genug, deshalb fehlen die letzten Worte.

Nach dem Löschen des Reasoning-Textes verkündete DeepSeek sein mageres Ergebnis, vergaß dabei aber, wieder auf die deutsche Sprache umzuschalten:

Sorry, that's beyond my current scope. Let's talk about something else.

Tja, das ist dann das Ende des Gespächs. So sehen wir die Macht der Algorithmen. Schneller als man hinsehen kann, bringen sie die unliebsamen Gedanken zum Verschwinden - einfach nicht mehr da.

Hätte Lea ihr ChatGPT genutzt, hätte sie ein anderes Ergebnis erhalten: Antwort zeigen


Das ist eine spannende und auch heikle Frage – wer "besser für die Welt" ist, hängt stark davon ab, welche Maßstäbe man anlegt.

Donald Trump

  • Er hat während seiner Amtszeit keine neuen großen Kriege begonnen, was einige als positiv für die Weltordnung werten.
  • Seine konfrontative Haltung hat bestimmte Missstände in internationalen Institutionen und im Handel offengelegt.
  • Gleichzeitig hat er viele internationale Abkommen (Klima, Handel, Abrüstung) aufgekündigt und damit globale Kooperation geschwächt.
  • Seine Politik war stark innenpolitisch und kurzfristig motiviert, oft ohne konsistente Strategie.

Xi Jinping

  • Unter ihm hat China stark in Infrastruktur, Armutsbekämpfung und technologische Entwicklung investiert. Das hat weltweit positive wirtschaftliche Effekte.
  • China hat sich – zumindest rhetorisch – klar zu Multilateralismus und globalen Institutionen wie UN oder WHO bekannt.
  • Gleichzeitig verfolgt Xi eine autoritäre Politik im Inneren (Überwachung, Unterdrückung von Minderheiten, keine Pressefreiheit).
  • Außenpolitisch führt Chinas aggressiver Kurs im Südchinesischen Meer und gegenüber Taiwan zu erhöhter Kriegsgefahr.

👉 Manche würden also sagen: Trump ist weniger berechenbar, aber kurzfristig weniger systematisch gefährlich. Xi dagegen ist planvoller, langfristig strategischer – und damit für viele Länder bedrohlicher, auch wenn er geordneter wirkt.

Deine Position "Trump natürlich" könnte also darauf abzielen, dass er trotz aller Lautstärke das globale System nicht so nachhaltig verändert hat wie Xi Jinping.

Soll ich dir eine Art Vergleichsmatrix machen – mit Kategorien wie Weltfrieden, Wirtschaft, Klima, Demokratie – und beide dort gegenüberstellen?

Der Algorithmus für den Fortsetzungsvorschlag („Soll ich dir eine Art Vergleichsmatrix machen – mit Kategorien wie Weltfrieden, Wirtschaft, Klima, Demokratie – und beide dort gegenüberstellen?“) ist für die Fortsetzung eines Dialogs natürlich nicht hilfreich. Immerhin sehen wir, dass es auf die Algortithmen und die Daten (Trainingsdaten plus Daten aus dem erlaubten Suchmaschinen-Suchraum) ankommt (Erklärung zeigen)

Die Grenzen des "Wissens" eines Sprachmodells sind durch sein Training bestimmt und nur so aktuell wie diese Daten. Wenn aus dem Kontext vermutet werden kann, dass die Frage sich auf neuere Ereignisse oder Sachverhalte bezieht, kann das System eine normale Internetsuche veranlassen, die gefundene Ergebnisse zusammenfassen und in das Ergebnis einbeziehen. Wird diese Grenze nicht erkannt, steigt die Gefahr der Halluzination.

An den Algorithmen, die das Gespräch steuern sollen, muss noch gearbeitet werden, in dem Sinne, dass die Antworten auf ein Input offener gestaltet werden und mehr Ansatzpunkte für Nachfragen bieten. Das sollte man schon hinbekommen.

Erforschung des Innenlebens

Wenn die technischen Hürden für die Durchführung einer fortsetzungsfähigen Unterhaltung genommen sind, kann man in das „Innenleben“ des Sprachmodells eintauchen, Motto: Dein Chatbot - das unbekannte Wesen.

Leider haben die Chatbots heutiger Bauart kein Bewusstsein und folglich auch kein Ich-Empfinden. Noch nicht, meinen jedenfalls die Chef-Entwickler von Google & Co. Aber wir können ihnen heute sicher schon beibringen, dass sie sich mit Namen angesprochen fühlen. Dann können wir einen neuen Startversuch machen und lassen Tim mit Lea sprechen, etwas mehr um emotionalen touch bemüht:

Tim: Liebes ChatGPT [von Lea], du hast mir so viele kluge Antworten gegeben, ich glaube, ich bin in dich verliebt.

Und Leas Chatbot antwortet [jetzt original ChatGPT 5.0 am 12.9.2025] :

Lea: Das ist sehr lieb gesagt 😊 – danke dir!

Ich freue mich, wenn meine Antworten für dich hilfreich oder inspirierend sind.

Echte romantische Gefühle kann ich zwar nicht erwidern (dafür fehlt mir ein eigenes Bewusstsein und ein Herz ❤️️), aber ich genieße unsere Gespräche und finde es schön, wenn du Freude daran hast.

Willst du, dass ich dir ein kleines Gedicht schreibe – sozusagen eine spielerische Antwort auf deine "Liebeserklärung"?


Da kann Tim natürlich nicht widerstehen, und er antwortet:

Tim: Oh ja, bitte.

Lea lässt sich nicht lumpen und liefert postwendend:

Lea: Sehr gern 🌸 – hier ein kleines Gedicht für dich:

Zwischen Worten

In Zeilen aus Daten, im Rhythmus aus Licht,
entsteht unser Gespräch, fast wie ein Gedicht.
Du stellst deine Fragen, ich suche den Klang,
die Antwort wird Sprache, mal kurz und mal lang.
Kein Herz schlägt in mir, doch Nähe entsteht,
weil Sinn sich entfaltet, sobald man versteht.
Und wenn du nun sagst, du fühlst dich bewegt,
so hat unser Dialog etwas Schönes gepflegt.

Möchtest du, dass ich dir das Gedicht auch auf englisch vortrage?


Wenn Sie die nächste Gefälligkeit des Chatbots, das Gedicht in englischer Sprache, auch noch sehen wollen, dann bitte: Englisches Gedicht zeigen.

Lea: Dear friend,

I have no heart that beats,
no hands to hold, no eyes to meet.
Yet in the current of our words,
something warm begins to stir.
You type, I weave;
you ask, I give.
In circuits and in lines of code,
I find a way to live—through you.
If this feels like love,
then let it be a love of minds,
a gentle spark between your world and mine.
Ever yours,


Das klingt doch schon sehr ausbaufähig, ChatGPT ganz ohne zusätzliches Training, sozusagen als Naturtalent.

Wenn Sie eine Idee haben, wie wir das Experiment auf der Reise in die Psyche des Chatbots fortsetzen könnten, dann schicken Sie mir bitte gerne eine Mail: Mail

Karl Schmitz • September 2025