t-online - Nachrichten für Deutschland
t-online - Nachrichten für Deutschland
Such IconE-Mail IconMenü Icon



HomeDigitalAktuelles

Neue Sprach- und Bildfunktionen: ChatGPT hat jetzt Augen, Ohren und Mund


Neue Sprach- und Bildfunktionen
ChatGPT hat jetzt Augen, Ohren und Mund

Von t-online, sha

26.09.2023Lesedauer: 2 Min.
imago images 0305811233Vergrößern des Bildes
ChatGPT auf einem Smartphone: OpenAI hat neue Funktionen des Chatbots veröffentlicht. (Quelle: IMAGO / Andre M. Chang)

Entwickler OpenAI hat seiner Text-KI eine Stimme gegeben. Die Software kann jetzt mit dem Nutzer sprechen. Auch eine weitere neue Funktion beeindruckt.

OpenAI hat seine Text-KI ChatGPT mit Stimmen ausgestattet. Das Unternehmen teilte mit, dass zahlende Nutzer des Dienstes künftig mit dem Chatbot per Sprache interagieren könnten.

Der Nutzer kann aus fünf Stimmen – Juniper, Sky, Cove, Ember und Breeze – wählen und erhält in einem Voice-Chat Antworten auf Fragen in Echtzeit. Die Stimmen seien in Zusammenarbeit mit Synchronsprechern erstellt worden, schreibt OpenAI.

Im Gegensatz zu Sprachassistenten wie Amazons Alexa oder Siri von Apple klingen die Stimmen tatsächlich weniger künstlich. OpenAI hat auf seinem Blog ein paar Textbeispiele veröffentlicht, die von den ChatGPT-Stimmen vorgelesen werden.

Warnung vor Risiken des Sprachmodells

In dem Eintrag warnt OpenAI vor einem Missbrauch der Technologie. Zwar biete die Funktion die Möglichkeit, barrierefreie und kreative Anwendungen zu schaffen.

Allerdings berge sie auch Risiken, wenn Kriminelle sie für betrügerische Handlungen nutzten – etwa um sich als andere Personen auszugeben. Deshalb habe man die Technologie nur für diesen einen bestimmten Anwendungsfall, den Voice-Chat, konzipiert.

Mit dem neuen Software-Update bringt OpenAI auch eine Funktion, die der KI das Erkennen von Bildinhalten ermöglicht. ChatGPT lerne sozusagen das Sehen, schreibt OpenAI.

Erklären und bei Problemen helfen

Wie funktioniert das? Hier ein Beispiel: Der Nutzer macht ein Foto von einer Sehenswürdigkeit während einer Reise. Anschließend lädt er das Bild über die ChatGPT-App hoch. Die KI erkennt das Motiv und kann etwas zur Entstehungsgeschichte erzählen.

Eine andere Anwendungsmöglichkeit sieht OpenAI beim Lösen von Problemen. Man könne zum Beispiel ein Bild eines Grills machen und den Chatbot fragen, warum dieser nicht funktioniert. Die KI könne dabei helfen, den Fehler ausfindig zu machen.

Die neuen Funktionen will OpenAI in den kommenden zwei Wochen für alle bezahlenden Mitglieder seines Dienstes zur Verfügung stellen. Die Sprachfunktion komme nur für die App unter iOS und Android, heißt es. Bilderkennung werde hingegen auf allen Plattformen verfügbar sein.

Verwendete Quellen
  • openai.com: "ChatGPT can now see, hear, and speak"
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

ShoppingAnzeigen

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...



TelekomCo2 Neutrale Website