Neues KI-Videotool von Alibaba lässt Bilder lebendig werden
01. März 2024, 07:53
| 1 Kommentar
Bild: Alibaba
Das KI-Tool Emo kombiniert Porträts mit Audiodateien, um die darauf abgebildeten Personen in Videos singen oder sprechen zu lassen
Nachdem das Jahr 2023 vor allem durch das Generieren von Texten und Bildern über künstliche Intelligenz geprägt war, dürfte das Jahr 2024 im Zeichen der KI-generierten Videos stehen. So hatte OpenAI, das Unternehmen hinter dem beliebten KI-Chatbot ChatGPT, mit Sora ein System gezeigt, das realistisch wirkende Videos auf Basis von Textbefehlen (Prompts) erstellen soll. Nun legt der chinesische Konzern Alibaba nach und präsentiert ein Tool, das Videos auf Basis von Porträts und Audiodateien generiert.
Das Tool trägt den Namen Emo (Emote Portrait Alive). Kommerziell verfügbar ist es noch nicht, allerdings haben die Forschenden von Alibaba erste
Demovideos auf Github veröffentlicht, Details zur Funktionsweise werden in einem
Paper (PDF) erläutert. Emo ermöglicht es, ein Porträtbild zu einem Video zu animieren, indem dieses mit einer Audiodatei kombiniert wird. So entsteht der Eindruck, die abgebildete Person würde sprechen oder singen.
Mehr dazu findest Du auf
derstandard.at