Минулого тижня компанія Google представила Veo 3, нову модель генерації відео, яка може створювати 8-секундні кліпи з синхронізованими звуковими ефектами та діалогами. Це перший інструмент штучного інтелекту компанії, який забезпечує таку можливість. Модель генерує відео з роздільною здатністю 720p, спираючись на текстові описи або зображення.
Окрім Veo 3, Google також запустила Flow — онлайн-інструмент для створення фільмів, який поєднує Veo 3 з генератором зображень Imagen 4 і мовною моделлю Gemini. Це дозволяє творцям описувати сцени природною мовою та управляти персонажами, локаціями та візуальними стилями в зручному веб-інтерфейсі.
Обидва інструменти вже доступні для підписників Google AI Ultra, плану, що коштує $250 на місяць і надає 12,500 кредитів. Генерація відео за допомогою Veo 3 коштує 150 кредитів, що дозволяє створити 83 відео до вичерпання кредитів. Додаткові кредити можна придбати за 1 цент за кредит у блоках по $25, $50 або $200.
Veo 3 використовує технологію дифузії, схожу на ту, що застосовується в сучасних моделях генерації зображень, таких як Stable Diffusion. Процес навчання полягає в додаванні шуму до реальних відео, після чого нейронна мережа навчається відновлювати вихідні дані.