вівторок, 17 червня 2025 р.

Seedance 1.0 від ByteDance кидає виклик Veo 3 від Google

За даними ByteDance, Seedance 1.0 перевершує існуючі моделі у кількох важливих аспектах: точності виконання користувацьких запитів, якості руху та чіткості зображення. На платформі для порівняння моделей Artificial Analysis Seedance 1.0 посідає перше місце як у завданнях «текст у відео», так і «зображення у відео», випереджаючи таких конкурентів, як Veo 3 від Google, Kling 2.0 від Kuaishou та Sora від OpenAI.

Що вміє Seedance 1.0?
Seedance 1.0 здатна перетворювати прості текстові запити на складні відео. Модель опрацьовує не лише окремі сцени, а й довгі послідовності з різними ракурсами камер та сталими персонажами. ByteDance підкреслює, що їхній Seedance 1.0 краще за інших дотримується деталей із запиту — це може бути конкретний рух, зміна камери чи певний візуальний стиль.

Велика база даних і жорсткий відбір
Seedance 1.0 тренували на величезному масиві відеокліпів із публічних та ліцензійних джерел. Матеріали пройшли багатоетапне очищення: прибрали логотипи, субтитри, а також насильницький контент. Для навчання відео доповнювалися детальними описами рухів, зовнішнього вигляду та стилю — це допомогло моделі краще розуміти складні запити.

Процес навчання відбувався у кілька етапів: спочатку модель вивчала загальні зображення і відео, потім її адаптували спеціально для задач «зображення у відео». Після цього відбувалось тонке налаштування на вибраних кліпах, а також тренування з підкріпленням, де люди відбирали найкращі результати — наприклад, відео з природним рухом або максимально відповідні до запиту сцени. Цей зворотний зв’язок безпосередньо впливав на розвиток моделі.

Seedance 1.0 і швидкість роботи
Особливість Seedance 1.0 — це швидкість при високій якості. Генерація п’яти секунд Full HD відео займає близько 41 секунди, що за словами ByteDance, значно швидше за конкурентів. Однак із запуском Veo 3 Fast від Google ця перевага може зменшитись. Наразі Seedance 1.0 не підтримує генерацію звуку.

Плани ByteDance
Компанія планує інтегрувати Seedance 1.0 у власні платформи, такі як Doubao та Jimeng. Модель орієнтована як на професіоналів, так і на широку аудиторію, підтримуючи різні сценарії — від маркетингу та створення контенту до простого монтажу відео за допомогою голосових команд.

Авторка: Дар’я Бровченко


Джерело



Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.