Kandinsky 5.0 от Сбера выложили в открытый доступ — это крупнейший опенсорс релиз в Европе 😱
Сбер выложил всю линейку моделей под лицензией MIT. Только посмотрите на этот клад:
🟢 Video Pro — флагманская модель, генерирует HD-видео до 10 секунд, обучали на 250 млн видео. Это сейчас лучшая открытая модель, она превосходит Wan 2.2-A14B в Text-to-Video и Image-to-Video и равен Veo 3 по визуалу.
🟢 Video Lite — компактная модель, идеальна для GPU с 12ГБ VRAM, дает отличные результаты в динамике.
🟢Image Lite — модель генерации изображений и их редактирования, обучена на базе 520 млн картинок, включая 1 миллион с русским культурным кодом.
🟢 K-VAE 1.0 — вариационные автоэнкодеры, улучшенная сжимаемость для диффузионных моделей, превосходит все открытые альтернативы на открытых бенчмарках.
Все модели уже доступны на GitHub, Gitverse и HuggingFace.
Технический отчет тут 😄
@xor_journal
🔥
64
👍
22
🗿
9
😁
6
❤
5
😱
3