Microsoft und Google haben ein neues Feld, um ihre Innovationsfähigkeit unter Beweis zu stellen. Nach dem Kampf um die Gunst der Nutzer bei Browsern, Suchmaschinen, Produktivitäts-Software, Smartphone-Betriebssystemen und Notebooks (Windows gegen Chrome OS) ist der nächste Schauplatz des Ringens die Entwicklung von KI-Technologien. Hier hat Microsoft durch die geschickte Partnerschaft mit OpenAI die Nase vorne - aber Google gibt deshalb längst nicht auf.
Gemini 1.5 analysiert Videos
Nach der Umbenennung seines KI-Angebots von Bard in "Gemini" hat Google jetzt mit Gemini 1.5 dessen Weiterentwicklung vorgestellt. Sie kann nicht nur Texte, sondern auch Videos auswerten kann. Als Test hat Google die Software nach lustigen Momenten im rund 400-seitigen Protokoll der Kommunikation der Apollo-11-Mission zum Mond suchen lassen.
Darin hat Gemini 1.5, das zunächst für Entwickler und Firmenkunden verfügbar sein wird, laut Google-CEO Sundar Pichai und Demis Hassabis, CEO von Google DeepMind, drei Stellen als lustig identifiziert. Generell könne Gemini 1.5 Pro nun bis zu einer Stunde lange Videos, bis zu elf Stunden lange Audioaufnahmen, Texte mit einer Länge bis zu 700.000 Wörtern sowie bis zu 30.000 Zeilen Software-Code erfassen und analysieren. Funktionen, um Videos KI-unterstützt zu verbessern, hatte Google bereits im September 2023 für YouTuber angekündigt.
Open AI generiert mit Sora Videos
OpenAI ist da schon einen Schritt weiter. Oder besser gesagt, hat einen anderen Weg eingeschlagen. Auf X hat OpenAI-Chef Sam Altman am selben Tag wie Google Gemini 1.5 das neue Angebot "Sora" angekündigt. Die Software kann Videos aus Text-Vorgaben erzeugen.
Erste Beispiel sind bereits auf einer Webseite zu sehen. Mit Sora erstellte Videos können zunächst maximal eine Minute lang sein. Allerdings soll das KI-Modell Sora zunächst nur "ausgewählten Kreativen zur Verfügung stehen.
Vor breiterer Verfügbarkeit sollen Experten mögliche Sicherheitsrisiken ausloten. Außerdem feilt OpenAI noch daran, dass Sora in den Videos die Gesetze der Physik immer korrekt umsetzt. Außerdem ist auch Sora nicht davor gefeit, Fehler zu machen, wie sie in herkömmlichen Filmen vorkommen - etwa Anschlussfehler. Es könne zum Beispiel passieren, dass im Video jemand von einem Keks abbeißt und der Keks später wieder vollständig dargestellt wird.
Künstliche Intelligenz als Chance und Risiko für den Channel
KI nicht nur von Tech-Giganten kontrollieren lassen