Neue Microsoft-KI kann Stimmen nach nur drei Sekunden imitieren

10. Januar 2023, 14:40 |  2 Kommentare


Bild: Pixabay

Bereits ein kleines Audiosample reicht, um ein verblüffend echt klingendes Stimmmodell zu erstellen, das beliebige Sätze sagen kann

Unter dem Namen VALL-E haben die Forscher von Microsoft eine neue KI präsentiert, die die Stimmen einzelner Personen imitieren kann. Verblüffend ist dabei vor allem, wie schnell das geht. Bereits ein Tonschnipsel in der Länge von drei Sekunden soll ausreichen, um eine Stimme nachahmen zu können. Dabei sollen sowohl die emotionale Färbung als auch der Ton der Umgebung erhalten bleiben.

Bei Microsoft sieht man für die Technologie eine Fülle von Anwendungsmöglichkeiten. So wären etwa hochqualitative Text-zu-Sprache-Funktionen denkbar, wo dann eine Textnachricht mit der Stimme des Gegenübers vorgelesen wird. Aber auch die Korrektur einer Aufnahme - etwa wenn eine Aussage angepasst werden muss - wäre denkbar.

Mehr dazu findest Du auf derstandard.at





Kurze URL:


Bewertung: 2.0/5 (6 Stimmen)


Das könnte Dich auch interessieren:


Ähnliche News:

Weitere News:

Einen Kommentar schreiben

Du willst nicht als "Gast" schreiben? Logg Dich Hier ein.

Code:

Code neuladen

Kommentare
(2)

Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.




Kommentare:

Du hast bereits für diesen Kommentar abgestimmt...

;-)

Top