След година и половина на гигантски стъпки, генеративните платформи за изкуствен интелект скоро ще разбият поредна бариера. Това обещават новите AI инструменти, които Meta представи. С тях всеки потребител ще може да се превъплъти в ролята на създател на анимации - и то само със силата на описанията, които въвежда.
Става дума за Emu Video и Emu Edit, които дават възможност за генериране на изображения, раздвижване на елементите в тях и прецизни корекции на елементите в сцената.
Ето ги в действие:
Emu Video стъпва на модела за създаване на изображения Emu, като работи в две стъпки - първо създава изображение по подаденото описание, а след това - видео, което взема под внимание както картината, така и допълнителното описание на действие, движение на камерата и т.н.
Както обясняват от Meta, това позволява да се избегне наложената до момента практика за AI видеа да се навързват множество различни модели. Emu Video в момента създава 4-секундна анимация с резолюция от 512х512 пиксела и 16 кадъра в секунда. Тестовете показват значително превъзходство спрямо конкурентна, но по-комплексна технология.
Като база може да се използва не само синтетично изображение, но и снимка или картина.
Emu Edit на свой ред адресира един от големите проблеми на създаването на AI съдържание - ако нещо дребно не ни харесва в синтезираното изображение, често е трудно да го коригираме без пълна промяна на резултата
Meta са тренирали изкуствения интелект с 10 млн. двойки изображения преди и след определен вид дигитална манипулация. Така Emu Edit може, например, да смени фона, да добави текст или да направи някаква по-радикална промяна в изображението без да засегне останалите елементи.
Към момента и двата AI инструмента са на равнище "фундаментално изследване". "Със сигурност те не са заместител на професионалните художници и аниматори, но Emu Video и Emu Edit и технологиите като тях могат да помогнат на хората да изразяват себе си по нов начин", коментират от Meta.