(g+) Text-zu-Video: Wie Videogeneratoren die Welt sehen

Damit ein neuronales Netzwerk aus einer Textbeschreibung ein plausibles Video macht, muss es verstehen, wie unsere Welt funktioniert. Wir erklären, wie es das schafft. Ein Deep Dive von Tim Elsner (KI, Maschinelles Lernen)
Quelle: Golem

Published by