Първо бяха текстовете. После дойдоха статичните изображения и музиката. По всичко изглежда, че идва редът и на видеото да бъде "овладяно" от изкуствения интелект. Както видяхме с ChatGPT през 2022 г., за целта не е достатъчно технологията да съществува - трябва да има и удобен продукт, който я използва.
Dream Machine на американския стартъп Luma AI има претенциите, че е именно това. Платформата генерира видеа по картинка или по текстово описание. Компанията работи и по програмен интерфейс за платформата си, както и по интеграции за някои от най-популярните креативни програми.
Може би най-важното качество на Dream Machine е, че вече е достъпна за всеки, който желае да я изпробва - всички сме виждали впечатляващите демонстрации на OpenAI Sora и на китайската Kling, но все още малцина реално могат да ги използват.
AI генераторът на Luma AI дава възможност за генерирането на 30 видеа безплатно, а абонаментните планове предлагат между 120 и 2000 клипа срещу 30-500 долара за месец. Не е случайно, че в първите дни след дебюта на платформата, трафикът към нея беше толкова голям, че се наложи потребителите да изчакват допълнително за видеата си (повече за това - по-долу).
Струва ли си?
AI видеа под една или друга форма има горе-долу откакто има и AI статични изображения. До момента, обаче, ситуацията при тях беше в рамките на един от следните три сценария:
- Относително сложна за редовия потребител ръчна интеграция на различни инструменти върху Stable Diffusion модела, като качеството на резултатите варира много силно.
- По-лесни платформи, които обаче най-често създават доста некачествени клипове.
- Нови и наиастина обещаващи проекти като Sora, които обаче все още не са масово достъпни.
В тази ситуация идва Dream Machine. Luma AI през миналата година пуснаха AI генератор на триизмерни модели и инвеститорите очевидно им имат доверие - все пак сред тях са Andreessen Horowitz, а до момента набраните от компанията средства са над 70 млн. долара.
Платформата определено не изглежда като бета версия и съдържа всичко, което едно приложение с изкуствен интелект очакваме да има - поле за заявката с възможност за добавяне на изображение към нея, профил с генерираните видеа и т.н.
Самите видеа са 5-секундни и стават готови за 2 минути... В добрия случай. Заради натоварването на сървърите, е много възможно да се окажете "на опашката" и да чакате минути или даже часове. В няколко случая даже платформата в крайна сметка (след половин ден чакане) даде грешка. При генеративния изкуствен интелект, който изисква много проби и грешки, това потенциално може да се окаже проблем - освен ако Luma AI не обезпечат допълнителен ресурс.
Що се отнася до качеството на кадрите - да, демонстрацията на Sora все още изглежда недостижима, но това не значи, че Dream Machine е пълен провал. Най-малкото защото не знаем от колко (хиляди) опита OpenAI са сглобили промо клипа си.
Dream Machine се справя много добре с плавността на движенията на камерата и на визуалните елементи пред нея. Анатомичната прецизност все още не е на върховно ниво и в някои случаи артефактите могат да бъдат дразнещи... докато в други резултатът е повече от задоволителен.
Този клип би стоял съвсем на място в някой VHS екшън от 90-те:
Братя/Сестри Уашовски няма да останат без работа, но все пак кадрите изглеждат прилично:
Това видео трябваше да е в стила на класическото японско аниме, но се получи твърде... експресивно:
При втория опит дефектът се превръща в ефект:
"Раздвижването" на статична снимка определено не е много успешно:
По повод провелите се избори за национален и европейски парламент:
Общото впечатление е, че синтетичните видеа от Dream Machine са на може би една генерация време от това да могат да се използват като "пълнеж" за по-непретенциозни продукции от наистина напредналите в писането на заявки потребители. Това не звучи като комплимент, но всъщност е.
Също така се повишават и шансовете комерсиалният дебют на Sora да се случи по-скоро - голям неин конкурент вече е на ринга.