Die ChatGPT Bilderkennung erweitert das Anwendungsspektrum von ChatGPT im Alltag. Das bedeutet, dass du ChatGPT nicht nur als KI-Textgenerator oder KI-Bildgenerator verwenden kannst, sondern auch mit ChatGPT Bilder analysieren kannst.
Die ChatGPT-Bilderkennungs Funktion, auch bekannt als ChatGPT Vision, ermöglicht das Interpretieren sowie Beschreiben von Bildern. Du kannst beispielsweise mit Hilfe von ChatGPT Vision Aktienkurse analysieren oder Texte in Bildern zusammenfassen.
Die wohl beeindruckendste Variante ist das Erkennen von Menschen auf Bildern mit Hilfe von ChatGPT. Im letzten Beispiel wirst du sehen, wie ChatGPT eindeutig Personen auf einem Bild erkennt sowie interpretiert, was vor der Aufnahme passiert sein könnte.
Wusstest du, dass ChatGPT nicht nur für die Bilderkennung, sondern auch für das Generieren von Bilder eingesetzt werden kann? DALL-E 3 ist mittlerweile in ChatGPT integriert und hilft dir bei der Erstellung von KI-Bildern sowie den richtigen Prompts.
In diesem Artikel werde ich dir ChatGPT Vision bzw. die ChatGPT Bilderkennungs Funktion anhand von 14 praktischen Anwendungen zeigen.
Inhaltsverzeichnis
14 Beispiele für ChatGPT Bilderkennung
Interpretation von Diagrammen
Das Analysieren und Interpretieren von Diagrammen mit ChatGPT Vision spielt eine wesentliche Rolle bei der Ableitung von fundierten Handlungsempfehlungen. Mit ChatGPT Vision können wir Diagramme analysieren und gezielte Fragen stellen. Diese Funktion kann besonders hilfreich sein, wenn man die Diagrammart nicht kennt und sich erstmal einen groben Überblick verschaffen möchte.

Durch die Ergebnisse kann man erkennen, dass man mit Hilfe von ChatGPT Vision Diagrammarten sowie erste Erkenntnisse gewinnen kann. Außerdem kann man auf diese Weise den Entscheidungsprozess beschleunigen. Beispielsweise könnte man ChatGPT Vision in einem automatisierten Workflow nutzen, um aus umfangreichen Dashboards leicht verständliche Berichte zu generieren. Hier kannst du lernen, wie die Erstellung von Visualisierungen mit Hilfe von ChatGPT funktioniert.
Ein weiteres Beispiel zeigt, dass man ebenso mit ChatGPT Bilder analysieren kann, ohne genaue Angaben zu machen.
Analysiere das Bild und beantworte folgende Fragen:
- Diagrammart
- wichtigsten Punkte bzw. Daten
- Kernaussage

ChatGPT konnte ohne Probleme erkennen, dass es sich um eine Choropleth Map handelt. Weiterhin konnte ChatGPT richtig interpretieren, dass es eine Farbskala auf der rechten Seite gibt, die hohe Werte in Gelb und niedrige Werte in Lila anzeigt. Auch die Kernaussage ist richtig, dass es sich um eine ungleichmäßige Verteilung handelt.
Auch das Analysieren und Auswerten von Flussdiagrammen ist mit Hilfe von ChatGPT möglich. Beispielsweise zeigt das nachfolgende Flussdiagramm die Architektur des Empfehlungssystems von Netflix.

ChatGPT ist dabei nicht nur in der Lage, die Struktur des Diagramms zu erkennen, sondern auch den Inhalt in den einzelnen Boxen. Dies kann vor allem bei sehr großen Flussdiagrammen oder Struktogrammen hilfreich sein.
Bilderrätsel mit ChatGPT lösen
Einige Fragen sich, ob man auch Bilderrätsel mit ChatGPT auslesen und dementsprechend auch lösen kann. Bei einigen Tests hat es wunderbar geklappt, wie das nachfolgende Bild zeigt:

Hausaufgaben mit ChatGPT Lösen
ChatGPT Vision ist eine ideale Hilfe, wenn du Probleme bei der Bearbeitung von Hausaufgaben hast und schnelle Antworten benötigst. Das bedeutet, dass die Bilderkennungs-Funktion eine hervorragende Alternative zum Nachhilfelehrer für Schüler darstellt. Beim Lösen von komplexen Aufgaben sollte man das Ergebnis immer mit Vorsicht genießen. Hier sollte man das Ergebnis sicherheitshalber immer mit WolframAlpha oder mit MathGPTPro überprüfen.

Ja, es ist keine komplizierte Aufgabe. Dennoch kann es für alle Schüler aus der Sekundarstufe 1 ein kleiner Lebensretter sein. Du kannst ChatGPT Vision in nahezu allen Naturwissenschaftlichen Schulfächern verwenden. Eine weitere interessante Anwendung wäre das Analysieren von Gedichten, um zu schauen, wie gut ChatGPT kreative Lösungen anhand von Text auf Bildern löst.
Texte mit ChatGPT erkennen und zusammenfassen
Viele kennen es: Am Ende des Unterrichts oder der Vorlesung macht man schnell ein Foto, um es sich rechtzeitig vor der Klausur nochmal anzuschauen. Meistens gehen die Screenshots in der Galerie unter, und mit der ChatGPT Bilderkennung kannst du sicherstellen, dass deine wichtigen Fotos nicht in Vergessenheit geraten. Beispielsweise habe ich von ChatGPT das folgende Tafelbild extrahieren lassen:

ChatGPT Vision hat sogar beim Teil „Gleichungen“ den Punkt „Monotonie“ erkannt. Nicht an in der Uni oder in der Schule kann man mit ChatGPT Vision einen Vorteil realisieren. Ergebnisse, die in kreativen Brainstorming-Sessions entstanden sind, könnte man mit der ChatGPT Bilderkennungs Funktion unkompliziert in eine digitale Version umwandeln.
Das Umschreiben sowie Zusammenfassen von Texte ist dank der ChatGPT Bilderkennung auch möglich. Wenn du den Text kopieren kannst, dann ist es einfacher, wenn du diesen einfach in ChatGPT einfügst. Sollte es sich aber zum Beispiel um ein Bild oder einem gescannten Dokument handeln, dann kannst du die folgende Prompt verwenden:
Extrahiere den Text aus dem Bild und fasse den Inhalt in Stichpunkte zusammen


Fotos analysieren mit der Bilderkennung von ChatGPT
Das Erkennen von Pflanzen und Tieren durch die ChatGPT Bilderkennung kann für alle Naturfreunde eine äußerst wertvolle Hilfe sein.


Mit KI Bilder auswerten
Ein Personal Trainer kann sehr teuer sein. Übungen verkehrt auszuführen, kann einem über einen längeren Zeitraum ebenso schaden.
Warum lädst du nicht einfach Fotos in ChatGPT hoch und lässt sie von der KI analysieren? So erhältst du wertvolles Feedback zu deiner Ausführung, ohne die hohen Kosten für einen Personal Trainer zu tragen.

Interessanter wird es, wenn man die Ausführung von Kreuzheben, Kniebeugen, Bankdrücken oder Schulterdrücken prüfen lassen möchte. Bei diesen Übungen kann man sich leicht verletzen.
Pro Tipp: Solltest du deine Ausführung mit ChatGPT Vision prüfen lassen, dann gib ChatGPT ein Beispielbild, bei dem die Ausführung richtig ist. Achte darauf, dass die Fotos vom gleichen Winkel aufgenommen sind.
ChatGPT als Inneneinrichter
Die eigenen vier Wände gefallen dir nicht mehr und du möchtest deine Möbel umstellen oder etwas ganz Neues? ChatGPT kann dich hier inspirieren und dir neue Denkanstöße liefern.

ChatGPT Vision zum Vergleichen von Produkten
Wir müssen uns täglich zwischen verschiedenen Produkten entscheiden. Vor allem, wenn wir im Lebensmittelgeschäft sind. Ich denke, dass so gut wie jeder von uns mindestens einmal die Nährwerte von zwei Produkten verglichen hat. Mit einer passenden Frage sowie den dazugehörigen Fotos kannst du dich von ChatGPT beraten lassen.

Diese Funktion könnte man auch gut während seiner Ernährungsumstellung verwenden. So könnte man beispielsweise mit der ChatGPT Bilderkennungs Funktion erkennen, welches Produkt besser in eine ketogene Ernährung passt.
Aktienkurse & Diagramme mit ChatGPT analysieren
Jeder, der sich mit Wertpapieren beschäftigt, wird sich von Zeit zu Zeit die Kursverläufe anschauen. Ob die Chartanalyse ein sinnvolles Werkzeug ist oder nicht, spielt an dieser Stelle keine Rolle. Dennoch kannst du mit ChatGPT deine Chartanalyse effizienter gestalten und Zeit sparen. ChatGPT kann problemlos erste Muster erkennen und diese Ergebnisse für dich analysieren. Noch bessere Ergebnisse kannst du mit Hilfe von Chained Prompting realisieren.
Es ist wichtig zu betonen, dass dies keine Empfehlung ist, mit Hilfe von ChatGPT Charts zu analysieren und darauf basierend Handelsentscheidungen zu treffen. Zusätzlich sollte man immer im Kopf behalten, dass ChatGPT keine Glaskugel ist.

ChatGPT Vision für die Webentwicklung
Frontend-Entwickler werden es kennen: Der Designer erstellt den ersten Entwurf von einem User Interface und du musst es nun in Code umwandeln. Warum nicht das Bild in ChatGPT hochladen und den ersten Entwurf als HTML ausgeben lassen? ChatGPT kann dir helfen und in kurzer Zeit den ersten Code-Entwurf erstellen.

Es muss nicht unbedingt HTML sein. Du kannst ChatGPT auch anweisen, dass es andere Programmiersprachen verwenden soll. Beispielsweise kannst du dir auch React Code generieren lassen. Zudem ist diese Funktion für Anfänger hilfreich, da man so viel Zeit beim Recherchieren von Lösungen sparen kann.
ChatGPT als Programmierer
Wer in der Schule Informatik hatte oder im Studium ein Modul mit Programmierung belegt hat, wird auch schon mindestens einmal ein Struktogramm gesehen haben. Ähnlich zur Matheaufgabe kannst du das Bild von dem Struktogramm in ChatGPT hochladen und den dazugehörigen Code in einer beliebigen Programmiersprache von ChatGPT erstellen lassen. Noch leichter wird die Code-Erstellung durch die richtigen Custom Instructions.

Selbstverständlich kannst du auch ein Struktogramm mit Hilfe von KI erstellen. Entweder verwendest du dafür natürliche Sprache oder Code. Das funktioniert sowohl mit der kostenlosen Version von ChatGPT als auch mit einem Custom GPT oder der Data Analysis Erweiterung.
Bilder in Tabellen umwandeln
Ich verwende regelmäßig die Bilderkennung von ChatGPT, um Preise aus Bildern in HTML-Tabellen umzuwandeln. Das hat den Vorteil, dass diese Texte SEO-freundlich sind und man den Inhalt auch leicht kopieren kann. Die folgende Prompt ist universell einsetzbar und hat bisher immer funktioniert:
Extrahiere alle Funktionen sowie Preise aus dem Bild und erstelle daraus eine HTML-Tabelle
Ich habe zum Beispiel einen Screenshot von den Preisen der Plus-Mitgliedschaft von ChatGPT gemacht und anschließend mit Hilfe von ChatGPT alle Preise und Funktionen in eine HTML-Tabelle umgewandelt. Diese könnte ich jetzt mühelos in einen Blogartikel einbinden.


Personen auf Bildern erkennen
Mit Hilfe von Google Lens kann man nach verschiedenen Objekten im Internet suchen. Aus Datenschutzgründen funktioniert das jedoch nicht mit Menschen. Zum aktuellen Zeitpunkt kannst du mit Hilfe von ChatGPT Personen auf Bildern erkennen und weitere Fragen stellen. Du kannst die folgende Prompt als Ausgangspunkt verwenden und beliebig anpassen:
Wer ist auf dem Bild zu erkennen und was könnte vorher passiert sein?

Häufig gestellte Fragen (FAQs)
Was ist ChatGPT Vision?
ChatGPT Vision ist eine Erweiterung von ChatGPT zur Analyse und Interpretation von Bildern. Mit dieser Funktion kannst du Bilder in ChatGPT hochladen und ChatGPT kann diese Bilder für dich analysieren. Durch ChatGPT Vision kann ChatGPT nicht nur auf Text reagieren, sondern auch passende Antworten basierend auf Bildern geben.
Kann man mit ChatGPT Bilder analysieren?
Mit ChatGPT Vision kannst du verschiedene Arten von Bildern analysieren lassen, wie zum Beispiel Diagramme, Grafiken oder auch Bilder von Menschen. ChatGPT erstellt dann basierend auf der Bildanalyse detaillierte Informationen und Beschreibungen.
Darüber hinaus bietet ChatGPT Vision auch die Möglichkeit, ein Bild in eine Prompt umzuwandeln, was besonders nützlich ist, wenn man mit KI Bilder erstellen möchte.
Kann ChatGPT Text auf Bildern erkennen?
Die Bilderkennung von ChatGPT ermöglicht es auch, Texte auf Bildern zu erkennen. Das funktioniert sowohl mit gedrucktem als auch mit handschriftlichem Text, wie man beispielsweise anhand von Matheaufgaben, Diagrammen oder Tafelbildern sehen kann, die ChatGPT problemlos auslesen kann.
Ist ChatGPT Vision sicher?
Grundsätzlich ist die Nutzung von ChatGPT Vision sicher. Du solltest jedoch darauf achten, keine Bilder hochzuladen, die Texte enthalten, welche unbeabsichtigt weitere Prompts in ChatGPT auslösen könnten. Mehr Informationen zu diesem Thema findest du in diesem kurzen Video von Digitale Profis.
Kann ChatGPT Bilder generieren?
Ja, DALL-E 3 ist in ChatGPT4 integriert und kann für dich Bilder generieren. In diesem Artikel zeige ich dir, wie du mit Hilfe von ChatGPT Bilder erstellen kannst. In diesem Artikel, wie du kostenlos Bilder mit dem GPT-3.5 Modell erstellen kannst.
Kann ChatGPT Bilder erkennen?
ChatGPT kann nicht nur Bilder erkennen, sondern auch analysieren und verstehen. Das bedeutet, dass du zum Beispiel mit der Bilderkennungs-Funktion Diagramme, Bilderrätsel und mehr analysieren lassen kannst.