ChatGPT von OpenAI

ChatGPT (Aussprache: Tschät Tschi Pi Ti) wurde im November 2022 einer größeren Öffentlichkeit bekannt, als OpenAI den KI-Chatbot als Webapp veröffentlichte. Schon zwei Monate später hatte er über 100 Millionen Nutzer. Die Besonderheit von ChatGPT ist, dass man Gespräche in natürlicher Sprache führen kann und der Chatbot gefühlt auf alles eine Antwort hat. Anstatt eine klassische Internet-Suche mit einer beliebigen Suchmaschine durchzuführen, könnte man auch direkt ChatGPT befragen. Wenn die Antwort des Chatbots nicht ausreicht, kann man mit weiteren Fragen mehr Details in Erfahrung bringen.
Das ist aber nicht alles. ChatGPT kann nicht nur einfachen Text, sondern auch Dokumente und Bilder analysieren, gesprochene Anfragen verstehen und umgekehrt mit Sprache, Text und Bildern antworten. Man spricht von einem multimodalen Sprachmodell. Der Chatbot kann mit kurzen Anweisungen allgemeine Fragen beantworten und auch komplexe Aufgaben bewältigen, kreative Texte generieren, Programme schreiben und Unterstützung in einer Vielzahl von Themen bieten. Er eignet sich als vielseitiges Werkzeug für unterschiedliche Anwendungen, die eine Texteingabe und Textausgabe erwarten. Beides in natürlicher Sprache.

Hinweis: OpenAI entwickelt seine Sprachmodelle kontinuierlich weiter, weshalb die Nutzererfahrungen und die Bewertung der Ergebnisse relativ schnell veralten. Es kann sein, dass sich manches verbessert, aber möglicherweise auch verschlechtert. Es handelt sich um einen kontinuierlichen Prozess, bei dem das Sprachmodell mit der Zeit tendenziell bessere Ergebnisse liefert.

Anwendungen

  • Anweisungen in natürlicher Sprache annehmen
  • Beantworten von allgemeinen und häufigen Fragen
  • Kreative Texte erstellen
  • Umstellen und Übersetzen von Text
  • Einfache Rechenaufgaben lösen
  • Kurze Programme schreiben

Sprachmodell hinter ChatGPT

Der Chatbot ChatGPT von der Firma OpenAI basiert auf einem großen, generativen Sprachmodell (Large Language Models, LLM). Das ist eine Software auf Basis einer künstlichen Intelligenz (KI). Diese künstliche Intelligenz ist ein sogenannter „Transformer“, der mit einer riesigen Menge an Texten trainiert wurde. Die in diesem Rahmen verwendeten Begriffe, wie GPT-3.5 und GPT-4 (Generative Pretrained Transformer), sind die sich weiterentwickelnden Versionen dieses generativen Sprachmodells.
Durch ChatGPT hat OpenAI sein Sprachmodell zur allgemeinen Nutzung freigegeben, wodurch es sofort eine große Popularität erreichte. Durch ChatGPT wurde OpenAI zu einem Vorreiter bei großen Sprachmodellen.

Jeder kann ChatGPT unter der URL https://chat.openai.com/ nach einer kurzen Registrierung kostenlos nutzen.
Wer sich nicht registrieren will, der kann ChatGPT auch kostenlos unter https://frag.elektronik-kompendium.de/ ausprobieren.

Wie funktioniert ChatGPT?

Der Chatbot ChatGPT basiert auf einem großen Sprachmodell und einem als Transformer bezeichneten Algorithmus. Das Sprachmodell wurde mit einer sehr großen Menge an Text trainiert. Zusätzlich ist ChatGPT darauf optimiert, wichtige Begriffe in einer Eingabe zu erkennen und Analogien zu bilden. Dadurch ist ChatGPT in der Lage auf unterschiedliche Eingaben ähnliche Ausgaben zu generieren. Der Nutzer ist nicht gezwungen sich spezifische Keywords zu überlegen. Dadurch vermittelt ChatGPT den Eindruck zu verstehen, was wir meinen oder wollen.

Hierbei stellt sich natürlich die Frage, ob ChatGPT bzw. der Algorithmus die Antwort irgendwo in seinem Datenbestand nachgeschlagen hat? Nein, der Ausgabe-Algorithmus generiert mit statistischen Mitteln immer wieder neue Texte, wodurch die Ausgabe nie exakt identisch ist.

ChatGPT: Was es kann und was nicht

Wer ChatGPT ausprobiert, der ist im ersten Moment begeistert. Denn ChatGPT kann eine Vielzahl von Aufgaben bewältigen. Im einfachsten Fall das Beantworten von Fragen, Umstellen und Übersetzen von Text, Rechenaufgaben lösen und sogar kurze Programme schreiben.

Die Besonderheit von ChatGPT ist, dass es ein Sprachinterface bereitstellt, in das man ein Problem in natürlich formulierter Sprache eingeben kann. Die Ausgabe der Lösung erfolgt wiederum in verständlich formulierter Sprache. In der herkömmlichen IT müsste man spezialisierte Programme bedienen und Formeln oder Kommandos formulieren können, um das Problem zu lösen.

ChatGPT ist im Prinzip der erste Schritt in die Richtung, dass Software in der Lage ist, die Anweisung eines Menschen in natürlicher Sprache zu verstehen. Für die Bedienung spezialisierter Software braucht man keine IT-Kenntnisse mehr. Geschickterweise liefert ChatGPT die Antwort gleich zurück, liefert eine Erklärung dazu und übersetzt bei Bedarf.

Leider ist das Ergebnis nicht zwangsläufig vertrauenswürdig. ChatGPT und das dahinterliegende Sprachmodell, was für alle anderen Sprachmodelle ebenso gilt, basiert auf dem Training mit einer großen Menge an Text. Dabei kennt ein Sprachmodell keine Fakten, sondern setzt nur Worte und Satzteile zu verständlichen Sätzen zusammen, die es gelernt trainiert hat. Dabei kommen wohlformulierte Sätze heraus. Inhaltlich kann es richtig, aber auch falsch sein. Das heißt, der Wahrheitsgehalt der von ChatGPT getroffenen Aussagen ist in Frage zu stellen. Je freier man sich mit ChatGPT unterhält, desto weniger fällt das auf. Sobald man ChatGPT nach Wissen und Fakten fragt, treten Ungereimtheiten auf, die ChatGPT selbstsicher und überzeugend formuliert. Ist in den Trainingsdaten etwas nicht oder in nicht ausreichendem Maße enthalten, dann flunkert ChatGPT die Informationen zusammen und wird zum Lügenbaron. Man spricht dabei von Halluzinieren.

Zur Recherche von Informationen ist ChatGPT in seiner Grundform als Chatbot also völlig ungeeignet. Was dagegen gut funktioniert, wenn man sich etwas erklären lassen will. Dabei muss man mit einer gewissen Kreativität in der Antwort rechnen. Man muss die Ausgabe von ChatGPT also immer kritisch hinterfragen.

Weiterentwicklung

Bei den genannten Einschränkungen muss man berücksichtigen, dass sich ChatGPT weiterentwickelt und sich in Zukunft eine Vielzahl unterschiedlicher Aufgaben mit dem gleichen oder weiterentwickelten Sprachmodell lösen lassen, die vorher nicht möglich waren.
Durch Function Calling kann der Anwender eine Funktion einer dritten Anwendung einbeziehen. Beispielsweise übersetzt ChatGPT auf Wunsch des Nutzers die Ausgabe in eine andere Form oder Sprache, die eine dritte Anwendung versteht und übergibt den entsprechenden Befehl an eine Schnittstelle dieser Anwendung.

ChatGPT sinnvoll nutzen

ChatGPT ist in seiner Grundform alles andere als perfekt. Es kann keine Fakten liefern, sondern nur dynamisch Anweisungen verarbeiten und in der Regel das Ergebnis in Textform ausgeben. Dabei stellt sich die Frage, wie ChatGPT zu sinnvoll nutzbar ist.

  1. Im ersten Schritt muss einem klar sein, was ein KI-Sprachmodell, insbesondere ChatGPT kann und was nicht.
  2. m zweiten Schritt kann man sich überlegen, wie ChatGPT zu optimieren ist, um die Ausgabequalität zu verbessern.

Es gibt hierfür verschiedene Lösungsansätze:

  • Nutzung der OpenAI-API mit zusätzlichem Finetuning und Einstellung der KI-Parameter in Abhängigkeit der Anwendung.
  • Benutzerspezifische Eingaben mit konkreten Anweisungen.

Wie jede Software will auch die Bedienung von ChatGPT gelernt sein. Der große Vorteil ist, dass das im einfachsten Fall nur eine konkret formulierte Anweisung in natürlicher Sprache sein muss.

Weitere verwandte Themen:

Frag Elektronik-Kompendium.de

Die Computertechnik-Fibel, das Computer-Buch
Computertechnik-Fibel

Alles was Sie über Computertechnik wissen müssen.

Die Computertechnik-Fibel ist ein Buch über die Grundlagen der Computertechnik, Prozessortechnik, Halbleiterspeicher, Schnittstellen, Datenspeicher, Laufwerke und wichtige Hardware-Komponenten.

Das will ich haben!

Artikel-Sammlungen zum Thema Kommunikationstechnik

Collection: Trends in der IT

Was du über IT-Trends wissen solltest.

eBook kaufen

Collection: Crashkurs IT

Was du über IT wissen solltest.

eBook herunterladen

Die Computertechnik-Fibel, das Computer-Buch
Computertechnik-Fibel

Alles was Sie über Computertechnik wissen müssen.

Die Computertechnik-Fibel ist ein Buch über die Grundlagen der Computertechnik, Prozessortechnik, Halbleiterspeicher, Schnittstellen, Datenspeicher, Laufwerke und wichtige Hardware-Komponenten.

Das will ich haben!