Neue Microsoft-KI kann Stimmen nach nur drei Sekunden imitieren (10. Januar 2023/14:40) Bild: Pixabay Bereits ein kleines Audiosample reicht, um ein verblüffend echt klingendes Stimmmodell zu erstellen, das beliebige Sätze sagen kann Unter dem Namen VALL-E haben die Forscher von Microsoft eine neue KI präsentiert, die die Stimmen einzelner Personen imitieren kann. Verblüffend ist dabei vor allem, wie schnell das geht. Bereits ein Tonschnipsel in der Länge von drei Sekunden soll ausreichen, um eine Stimme nachahmen zu können. Dabei sollen sowohl die emotionale Färbung als auch der Ton der Umgebung erhalten bleiben. Bei Microsoft sieht man für die Technologie eine Fülle von Anwendungsmöglichkeiten. So wären etwa hochqualitative Text-zu-Sprache-Funktionen denkbar, wo dann eine Textnachricht mit der Stimme des Gegenübers vorgelesen wird. Aber auch die Korrektur einer Aufnahme - etwa wenn eine Aussage angepasst werden muss - wäre denkbar.
|
https://ress.at/neue-microsoftki-kann-stimmen-nach-nur-drei-sekunden-imitieren-news10012023144045.html
© by RessServerWorks, 2024