Google Gemini 1.5 Pro und Sora von OpenAI
Das Rennen um KI-Videos hat begonnen
Datum:16.02.2024
Autor(en):Peter Marwan
Noch mokieren sich Nutzer über falsche Antworten von KI-Chatbots oder Fehler in KI-generierten
Bildern. Die Anbieter lassen sich davon nicht aufhalten: Sie haben mit Gemini 1.5
und Sora bereits Videos fest im Blick.Von OpenAis KI Sora generertes Video mit Mammuts im Schnee.
Foto: Screenshot: Peter Marwan
Microsoft und Google haben ein neues Feld, um ihre Innovationsfähigkeit unter Beweis zu stellen. Nach dem Kampf um die Gunst der Nutzer bei Browsern, Suchmaschinen, Produktivitäts-Software, Smartphone-Betriebssystemen und Notebooks (Windows gegen Chrome OS) ist der nächste Schauplatz des Ringens die Entwicklung von KI-Technologien. Hier hat Microsoft durch die geschickte Partnerschaft mit OpenAI die Nase vorne - aber Google gibt deshalb längst nicht auf.
Gemini 1.5 analysiert Videos
Nach der Umbenennung seines KI-Angebots von Bard in "Gemini"1 hat Google jetzt mit Gemini 1.5 dessen Weiterentwicklung vorgestellt2. Sie kann nicht nur Texte, sondern auch Videos auswerten kann. Als Test hat Google die Software nach lustigen Momenten im rund 400-seitigen Protokoll der Kommunikation der Apollo-11-Mission zum Mond suchen lassen.
Darin hat Gemini 1.5, das zunächst für Entwickler und Firmenkunden verfügbar sein wird, laut Google-CEO Sundar Pichai und Demis Hassabis, CEO von Google DeepMind, drei Stellen als lustig identifiziert. Generell könne Gemini 1.5 Pro nun bis zu einer Stunde lange Videos, bis zu elf Stunden lange Audioaufnahmen, Texte mit einer Länge bis zu 700.000 Wörtern sowie bis zu 30.000 Zeilen Software-Code erfassen und analysieren. Funktionen, um Videos KI-unterstützt zu verbessern, hatte Google bereits im September 2023 für YouTuber angekündigt3.
Open AI generiert mit Sora Videos
OpenAI ist da schon einen Schritt weiter. Oder besser gesagt, hat einen anderen Weg eingeschlagen. Auf X hat OpenAI-Chef Sam Altman4 am selben Tag wie Google Gemini 1.5 das neue Angebot "Sora" angekündigt5. Die Software kann Videos aus Text-Vorgaben erzeugen.
Erste Beispiel sind bereits auf einer Webseite zu sehen6. Mit Sora erstellte Videos können zunächst maximal eine Minute lang sein. Allerdings soll das KI-Modell Sora zunächst nur "ausgewählten Kreativen zur Verfügung stehen.
Zu den von OpenAi bei der Vorsellung von Sora veröffentlichten Videos gehört auch
eines von einer Frau, die durch eine von Tokio inspirierte Stadt geht.
Foto: Screenshot: Peter Marwan
Vor breiterer Verfügbarkeit sollen Experten mögliche Sicherheitsrisiken ausloten. Außerdem feilt OpenAI noch daran, dass Sora in den Videos die Gesetze der Physik immer korrekt umsetzt. Außerdem ist auch Sora nicht davor gefeit, Fehler zu machen, wie sie in herkömmlichen Filmen vorkommen - etwa Anschlussfehler7. Es könne zum Beispiel passieren, dass im Video jemand von einem Keks abbeißt und der Keks später wieder vollständig dargestellt wird.
Künstliche Intelligenz als Chance und Risiko für den Channel8
KI nicht nur von Tech-Giganten kontrollieren lassen9
Personalchefs sehen Künstliche Intelligenz skeptisch10
KI als enormer Stromfresser 11
Links im Artikel:
1 https://www.channelpartner.de/a/google-bard-heisst-kuenftig-gemini,37286402 https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/
3 https://www.channelpartner.de/a/kuenstliche-intelligenz-soll-youtubern-bei-der-videoproduktion-helfen,3720894
4 https://www.channelpartner.de/a/altman-wird-wieder-chef-des-chatgpt-entwicklers-openai,3724350
5 https://twitter.com/sama/status/1758193609927721350
6 https://openai.com/sora
7 https://de.wikipedia.org/wiki/Filmfehler#Anschlussfehler
8 https://www.channelpartner.de/a/kuenstliche-intelligenz-als-chance-und-risiko,3617146
9 https://www.channelpartner.de/a/ki-nicht-nur-von-tech-giganten-kontrollieren-lassen,3721970
10 https://www.channelpartner.de/a/personalchefs-sehen-kuenstliche-intelligenz-skeptisch,3722415
11 https://www.channelpartner.de/a/forscher-sehen-ki-als-enormen-stromfresser,3722310
Alle Rechte vorbehalten. Jegliche Vervielfältigung oder Weiterverbreitung in jedem Medium in Teilen oder als Ganzes bedarf der schriftlichen Zustimmung der IDG Tech Media GmbH. dpa-Texte und Bilder sind urheberrechtlich geschützt und dürfen weder reproduziert noch wiederverwendet oder für gewerbliche Zwecke verwendet werden. Für den Fall, dass auf dieser Webseite unzutreffende Informationen veröffentlicht oder in Programmen oder Datenbanken Fehler enthalten sein sollten, kommt eine Haftung nur bei grober Fahrlässigkeit des Verlages oder seiner Mitarbeiter in Betracht. Die Redaktion übernimmt keine Haftung für unverlangt eingesandte Manuskripte, Fotos und Illustrationen. Für Inhalte externer Seiten, auf die von dieser Webseite aus gelinkt wird, übernimmt die IDG Tech Media GmbH keine Verantwortung.