OpenAI präsentiert ChatGPT-4o: Die nächste Revolution beginnt

Was ist eine Meinung?

Die subjektive Sicht des Autors auf das Thema. Niemand muss diese Meinung übernehmen, aber sie kann zum Nachdenken anregen.

Was Meinungen von Nachrichten unterscheidet.

Tagesanbruch
Die nächste Revolution beginnt

MeinungVon Florian Harms

Aktualisiert am 15.05.2024Lesedauer: 7 Min.

Aufnahme aus einem neuen Produktvideo der KI-Schmiede OpenAI. (Quelle: OpenAI/YouTube)

Schlagzeilen

Alle

Mordfall Hanna: BGH hebt Urteil auf

Fußballer stürzt aus Hochhaus

Warnung vor neuen Betrugsmaschen

TV-Star verkündet neues Projekt

Tech-Riese steht gehörig unter Druck

Frau tötet Belästiger: Urteil gefallen

Spritpreise in Deutschland fallen weiter

Drohnen treffen russische Militärbasis

Tennisprofi fordert Deo für Gegnerin

Gericht verurteilt Lilly Becker

Erdbeben auf Urlaubsinsel

Aus für Getränk nach über 40 Jahren

Darf man trotz Sozialhilfe eine Sterbegeldversicherung besitzen?

Alle Schlagzeilen anzeigen

Symbolbild zum aus- und einklappen des Inhaltes

Guten Morgen, liebe Leserin, lieber Leser,

mit einem zweischneidigen Schwert herumzuspielen, kann großen Spaß machen – jedenfalls, solange man sich dabei nicht blöde in den Finger ritzt. Ungefähr so dürfte im Mittelalter der Herold die Produktpräsentation zusammengefasst haben, als er die News aus der innovativen Schmiede überbrachte: die Schwerter jetzt noch schärfer und mit dem neuen, revolutionären Omni-Griff! Überall einsetzbar! Aber aufpassen!

Tausend Jahre später hat sich daran nicht viel geändert. Zwar haben sich die Hi-Tech-Schmieden mittlerweile vom alten Eisen verabschiedet und auf die neuesten Innovationen umgesattelt. Das kann in diesen aufregenden Tagen – Sie werden es erahnen – nur eines sein: die Künstliche Intelligenz, kurz KI. Revolutionär, sensationell, epochal! Zwei Schneiden hat das Endprodukt aber immer noch.

Embed

Die Platzhirsche der Branche lassen es in diesen Tagen krachen. Vorgestern OpenAI mit seinem ChatGPT, gestern Google: Es hagelt Vorführungen und atemberaubende Ankündigungen. Die Demonstrationen für das weltweite Publikum sind selbstverständlich vorteilhaft gewählt und lassen die digitalen Produkte nach Kräften glänzen. Aber selbst wenn man das berücksichtigt, lässt uns das Ergebnis noch immer mit den Ohren schlackern.

Es ist ja so: Vor anderthalb Jahren hat ChatGPT mit einem Paukenschlag die Künstliche Intelligenz aus den Zirkeln der Spezialisten herausbefördert und uns Normalos eine Vorstellung davon gegeben, was möglich ist. Seither überschlägt sich die Entwicklung. Kein Produkt in der Geschichte der Menschheit hat sich jemals so rasant verbreitet, und falls Sie das für eine Übertreibung halten, hören Sie sich mal auf einem Schulhof um: Schnell eine Frage ins Handy tippen, fertig sind der Aufsatz/die Rechenaufgabe/die Gedichtinterpretation. Anders als beim Googeln sind die Ergebnisse maßgeschneidert und frei formuliert.

Bahnbrechend war schon der Einsatz der Vorgängerversion von ChatGPT. Die neueste Generation agiert jedoch – bitte festhalten – multimodal und mit neuem Mensch-Maschine-Interface. Falls Sie das in dieser technokratischen Form nicht gleich vom Hocker reißt, lassen Sie es mich in einfachen Worten ausdrücken. Auch bisher schon konnte man ChatGPT nicht nur schreiben, sondern mit ihm sprechen: Die Algorithmen verwandelten die gesprochene Frage dabei in schriftlichen Text, den die Künstliche Intelligenz ebenfalls in geschriebener Form beantwortete, die der eines Menschen oft täuschend ähnelte. Diesen Text wiederum hat die Maschine dann in gesprochene Sprache zurückverwandelt und mit seelenloser Sprachassistenten-Stimme vorgelesen.

Dieses umständliche Prozedere hatte drei gewaltige Haken. Der erste: Es dauert. Man spricht, man wartet … man wartet immer noch … ah, die Antwort. Der zweite: Wenn die Antwort kommt, muss man sie erdulden. Unterbrechen, reinquatschen, die Frage rasch präzisieren? Geht nicht. Man wartet brav, bis die Maschine mit dem Quasseln fertig ist. Unnatürlich ist das, womit wir beim dritten Haken wären: So beeindruckend die Künstliche Intelligenz auch sein mag, von unserer Stimmung bekam sie bisher nichts mit. Tonlage, Gemütsverfassung, Aussehen – nichts davon schaffte es zum Elektronenhirn. Dieses nährte sich bisher nur von Worten ohne Klang. Es erhaschte keinen Blick auf unser Gesicht, hatte keine Ahnung von der Umgebung. Sitzt ein Erwachsener im Büro oder ein Schulkind an seiner Hausaufgabe? Sofa oder proppenvolle U-Bahn? Jemand, mit dem man gerne spricht, würde das berücksichtigen. Der olle Automat nicht.

ChatGPT 4o kommuniziert wie ein Mensch. (Quelle: imago images)

Das aber ist jetzt vorbei, und die Bedeutung dieses scheinbar kleinen Schrittes kann man kaum überbewerten. Es ist eine bahnbrechende Revolution, die bald das Leben von Abermillionen Menschen prägen dürfte. Denn multimodal bedeutet: Die KI kann nun viele ("multi") Arten ("modes") von Eingaben erfassen, sogar gleichzeitig. Sie lauscht also dem Ton, beäugt zugleich das Live-Videobild aus der Handykamera und reichert den nackten Text blitzschnell mit den gewonnenen Informationen an. Das Vibrieren in der Stimme, der Hintergrund, das Umfeld, der Gesichtsausdruck – alles fließt ein. Als wäre die Maschine wirklich mit allen Sinnen anwesend.

Eine gut trainierte KI reagiert auf die Fülle der Signale von nun an mit simulierter Stimmung und einem scheinbaren, aber täuschend echten Einfühlungsvermögen. Sie antwortet mal launig und mit Witzchen garniert, mal sachlich, tröstend, ruhig oder lebhaft, und wenn Ihnen das gerade nicht passt, lässt sich die Stimmung per Kommando korrigieren: "Sprich bitte in tiefem Ernst und in Reimform!" Ja, das geht. Oder als Einschlaflied, leise gesungen oder geflüstert? Auch das ist kein Problem. Sarkastische Tonlage? Bitte sehr.

Die Wirkung ist erstaunlich. Wer hätte gedacht, dass ein statistisches Modell, das bloß die Wahrscheinlichkeit von Wortabfolgen und Stimm-Modulationen berechnet, auf die Situation angemessen reagiert, wenn man ihr einfach mal seinen Hund vorstellt? Oder dass sie dank eigener Beobachtungsgabe – mit der Handykamera als Auge – einem blinden Menschen ermöglicht, das nächste vorbeifahrende freie Taxi heranzuwinken? Das alles sind, um es noch einmal zu betonen, handverlesene Demonstrationen des Herstellers, die nicht neutral informieren sollen, sondern dem Marketing dienen. Es lohnt sich trotzdem, sie anzusehen. Denn selbst beim bloßen Zuschauen provoziert das Verhalten der KI eine Reaktion: Es fühlt sich an, als spräche ein Mensch aus dem Handy. Das ist der Kern der neuen Technik. Sie soll das Vergessen befördern. Wir sollen nicht mehr merken, dass wir uns mit toter Software auf einem Server austauschen – so lautet das Ziel. Genauer: das Zwischenziel.

Das digitale Phantom wird sich als Organisator, Alltagsassistent und Problemlöser betätigen und dabei als Person rüberkommen, mit der wir uns gerne austauschen. Es wird womöglich auch Zeitungen, Homepages, Suchmaschinen ersetzen. Das humane Gebaren reißt die emotionalen Barrieren nieder und macht den Weg dafür frei, dass der Mensch sich der KI hilfe- und ratsuchend an den Hals wirft. Die neue, nun tatsächlich menschelnde Maschine wird uns durchs Leben steuern, Kinder als Hausaufgabenhelfer unterstützen, das Erlernen neuer Sprache beflügeln, Einkäufe übernehmen und Reisen planen. Sie wird erklären können, in welchem Museum sich die Statue befindet, die in den antiken Ruinen, die wir gerade besichtigen, einstmals stand. Den Vorschlag, noch rasch ins Museum zu fahren, wird sie aber nicht machen. Denn als Besitzer des Handys wirken wir ja schon so gehetzt, was die KI natürlich bemerkt – und uns stattdessen lieber vor einem beginnenden Sonnenbrand warnt. Multimodal in Aktion: So sieht das aus.

Täglich mehr wissen

Abonnieren Sie kostenlos den kommentierten Überblick über die Themen, die Deutschland bewegen. Datenschutzhinweis

Es geht aber noch weiter. Denn die KI wird uns dann womöglich rasch zu einem Supermarkt lotsen, in dem wir die rettende Sonnencreme bekommen. Auf dem Weg dorthin fahren wir nichts ahnend an dem Laden um die Ecke vorbei, der die Tube auch gehabt hätte, bloß hat der halt für seine virtuelle Präsenz nicht so gut bezahlt wie die Supermarktkette. Egal, auf die paar Kilometer kommt es nicht an, und wir wissen ja auch gar nichts von unserem Umweg. Den Tipps unseres einfühlsamen Freundes werden wir bald blind vertrauen. Gar nicht mehr darüber nachdenken. Hätte der allerdings eine schneidende Stimme, scharf wie ein Schwert, dann wären wir wohl doch manchmal misstrauisch. Und das wäre dringend angebracht.

Ohrenschmaus

Misstrauisch? Als ich sah, was die neue KI kann, kam mir dieser Klassiker ins Ohr.

Klinikreform im Kabinett

Gesundheitsminister Karl Lauterbach will den Klinikbetrieb umkrempeln. (Quelle: John MacDougall/AFP POOL/dpa)

Ursprünglich wollte das Bundeskabinett heute das Rentenpaket II beschließen – jenen Gesetzentwurf, den FDP-Finanzminister Christian Lindner und SPD-Arbeitsminister Hubertus Heil Anfang März in demonstrativer Eintracht vorgestellt hatten. Weil aber die FDP in ihrem jüngsten Haushaltskonzept die Rente mit 63 wieder infrage stellt, wurde die Verabschiedung erst mal verschoben.

Deshalb kommt nun ein anderer Minister zum Zuge, dessen Reformprojekt ebenfalls schon ein paar Mal vertagt wurde: Heute schlägt die Stunde von Karl Lauterbach und seiner Krankenhausreform. Der Gesetzentwurf des Gesundheitsministers sieht unter anderem einen Systemwechsel bei der Finanzierung vor: Künftig sollen Kliniken nur noch 40 Prozent ihrer Einnahmen durch Fallpauschalen erwirtschaften, 60 Prozent sollen die Krankenkassen über eine Grundfinanzierung decken, sogenannte Vorhaltepauschalen. Das soll gewährleisten, dass Ärzte keine überflüssigen Operationen mehr durchführen, nur damit die Bilanz stimmt. Weil die Konfliktlinien bei diesem Projekt ausnahmsweise nicht innerhalb der Ampelkoalition, sondern zwischen Bund und Ländern verlaufen, will Lauterbach sein Krankenhausversorgungsverbesserungsgesetz so formulieren, dass der Bundesrat gar nicht erst zustimmen muss. Gibt das Kabinett heute grünes Licht, beginnt die Beratung im Parlament. Schnell ist hier gut.

Urteil im Brokstedt-Prozess

Angeklagter Ibrahim A. im Gerichtssaal. (Quelle: Marcus Brandt/dpa)

Nach mehr als zehn Monaten Verhandlung fällt das Landgericht Itzehoe sein Urteil im Prozess um die Messerattacke im Regionalzug im schleswig-holsteinischen Brokstedt.
Angeklagt wegen zweifachen Mordes und vierfachen versuchten Mordes ist der 34-jährige Palästinenser Ibrahim A. Seinen Werdegang vom Flüchtling zum mutmaßlichen Doppelmörder, das unsägliche Leid der Opfer-Angehörigen und das haarsträubende Versagen deutscher Behörden hat die ARD zu einem berührenden Film verarbeitet. Während die Staatsanwaltschaft eine lebenslange Freiheitsstrafe und die Feststellung der besonderen Schwere der Schuld fordert, plädieren die Verteidiger dafür, den Mann in einer psychiatrischen Einrichtung unterzubringen. Ein Sachverständiger hat jedoch eine Psychose bei Ibrahim A. verneint und ihm volle Schuldfähigkeit bescheinigt.

Mehr aus dem Ressort

Urlauber sollten "im Zweifel lieber frühzeitig abreisen"

Deutsch in der Videokonferenz des Staatsrats: Putin verstand und anwtortete.

Plötzlich spricht Putin deutsch

Friedrich Merz: Seine künftige Regierung ringt schon jetzt um einen außenpolitischen Kurs.

Ein Sturm zieht auf

Lesetipps

Sebastian Striegel hat die Ermittlungen gegen Björn Höcke initiiert. (Quelle: Zoonar.com/Axel Kammerer/imago)

Björn Höcke ist verurteilt – was sagt der Mann dazu, der den AfD-Politiker angezeigt hat? Mein Kollege Lars Wienand hat mit ihm gesprochen.

Erst das Urteil gegen die AfD, nun gegen Höcke: Der Rechtsstaat zeigt den Rechtsextremisten die Zähne. Was daraus folgt, beschreibt unsere Reporterin Annika Leister.

Auch an deutschen Universitäten wettern vermeintlich linke Studenten gegen Israel. Welche irren Ideen die Aktivisten dabei ausbrüten, beschreibt die "taz" in einem schonungslosen Text.

Der DFB hat die Spielernamen für die Fußball-Europameisterschaft in Deutschland auf ungewöhnliche Weise verkündet. Damit macht er alles richtig, findet meine Kollegin Melanie Muschong.

Zum Schluss

Der Kanzler hat eine neue Idee.

Ich wünsche Ihnen einen gesunden Tag. Morgen kommt der Tagesanbruch von unserem Reporter Johannes Bebermeier.

Herzliche Grüße

Ihr

Florian Harms
Chefredakteur t-online
E-Mail: t-online-newsletter@stroeer.de

Mit Material von dpa.

Den täglichen Tagesanbruch-Newsletter können Sie hier kostenlos abonnieren.
Alle Tagesanbruch-Ausgaben finden Sie hier.
Alle Nachrichten lesen Sie hier.