Стрийминг гигантът Netflix влезе в AI надпреварата и то с помощта на българския Институт за компютърни науки, изкуствен интелект и технологии към Софийския университет (INSAIT). Резултатът от тяхната колаборация е моделът VOID, който може реалистично да променя сцени от видеа, като премахва обектите от тях.
"За разлика от стандартните инструменти, които просто "запълват" изтритите части, VOID разбира как обектите си взаимодействат. Ако например човек държи предмет и бъде премахнат, моделът симулира как предметът пада или се движи естествено, сякаш сцената е заснета без него. Това може да даде много по-голяма свобода на производителите на видео съдържание и би спестило значителен финансов ресурс за презаснемане на различни сцени", пишат от института.
VOID стъпва върху китайски отворен модел на Alibaba - CogVideoX с 5 милиарда параметъра, като използва допълнително технологии на Google и Meta, за да се разграничат обектите, зоните на взаимодействие и фона и да се запази логиката и динамиката на сцената.
На сайта на проекта има и няколко доста впечатляващи демонстрации.
Експертите от INSAIT и Netflix са тренирали модела върху компютърно симулирани сцени. За да работи, той се нуждае от видеокарта с поне 40 гигабайта оперативна памет - например Nvidia A100. С 8 такива карти с по 80GB VRAM всяка е проведено и самото обучение.
За момента резолюцията на VOID не е висока (384x672 пиксела по подразбиране) и това вероятно ще ограничи използваемостта му в реални условия, но това е едва първа версия - както се вижда през последните години, в сферата на изкуствения интелект големите скокове идват бързо.
Моделът е с отворен код, което дава възможност на всеки да използва технологията или да я надгражда.
USD
CHF
EUR
GBP