Kling's Omni Launch Week: разбираем все анонсы
Kling провели свою «Omni Launch Week», в ходе которой ежедневно выкатывали по фиче. Закос под OpenAI перед рождеством в прошлом году очевиден, но здесь релиз был довольно затянутым, тк фишек не так уж и много.
Гвоздём программы стала, конечно же, новая Kling Video O1.
Это их ответ Nano Banana Pro, но для видео. O1 — это видеомодель, которая работает с разными входами: текст, картинки (до 7 шт), видео (до 10 сек) и Elements.
Главная фишка — редактирование видео такое же свободное как в Runway Aleph. По бенчмаркам — полный развал конкурентов, но есть нюанс. Заявленный винрейт в 240% над VEO 3.1 (то есть Kling побеждает в 4 раза чаще) заставляет усомниться в методологии. Даже по черипикам видно, что модель может немного артефачить в деталях и демонстрирует не на столько хорошую физику по сравнению с Veo. Но вот редактирует она действительно мощно, а отставание в качестве не такое уж и большое. Тем более, что модель поддерживает до 10 секунд видео на вход, что в два раза больше, чем у Runway, и на пару секунд больше, чем у Veo. Хотя сравнивать с Veo не совсем честно, так как у него значительно более ограниченный функционал.
Стоимость: 12.8 кредитов за секунду (~$0.1 за секунду), что не много и не мало в современных реалиях.
Kling Image O1 — это уже чистой воды Nano Banana или FLUX.2. Модель понимает семантику и может генерить пейзажи по скриншоту Google Карт. На вход — до 10 картинок. Черипики неплохие, но сравнивать с Nano Banana Pro нужно на практике. Главный плюс — всё в одном интерфейсе. Из минусов — в отличие от Gemini, сюда нельзя закинуть файл с текстом (например, презентацию). Что странно, нет и чата.
Kling Video 2.6 — это уже отдельная модель, обновление их флагмана. Главное нововведение — поддержка аудиовыхода: генерирует всё, от диалог, звуковых эффектов до музыки и пения. По качеству видео это всё ещё не уровень Veo, о чём косвенно говорит и отсутствие бенчмарков для этой версии.
Прочее:
- Avatar 2.0: Ответ HeyGen и прочим. Генерирует говорящую голову с движением рук и тела. Главная фишка — длина видео до 5 минут.
- O1 Elements: Загружаешь картинку объекта, и сервис автоматически генерит «элемент» — набор изображений с разных сторон для лучшей консистентности + он работает как продвинутая референс картинка.
Здорово, что Kling позиционирует себя как инструмент для AI-продакшена и идёт в качество, а не в шаблоны, как это делают Higgsfield и другие агрегаторы. Sora здесь стоит особняком: её не назовёшь ни агрегатором, ни инструментом для топового AI-продакшена.
Главный релиз — это, конечно же, Kling Video O1 с его SOTA-уровнем редактирования. Остальные модельки не так прорывны и имеют аналоги получше. Но так как Kling Image O1 очень похожа на Nano Banana, кажется, что скоро Google порадует нас своей ответочкой для видео.
@ai_newz
❤
35
👍
15
❤🔥
4
⚡
2
🔥
2
😍
1