LongCat Image - еще одна опенсорсная Нанабанана.
Вслед за Зимажем (Z-Image) мы имеем еще одну легкую (6В!) опенсорсную китайскую модель для генерации картинок.
Сначала смешное: я уже писал про LongCat Video - тут можете почитать о том, что крупный китайский доставщик еды тренирует свои базовые модели(?!!).
И теперь они бахнули модель для генерации и редактирования картинок - LongCat Image. И примечательна он тем, что она во-первых, легкая (6B), а, во-вторых, имеет версию -EDIT для редактирования. И в отличие от Зимажа, редактирующая модель уже готова.
Я немного пощупал обе модели и мой спойлер такой:
- в генерации картинок LongCat Image воще не силен, похвастаться ему просто нечем.
- а вот в редактировании он оказался неожиданно неплох. Я, правда, погонял его в режиме раздеватора, и он справился без базара и цензуры. Более сложное редактирование оставляю вам, пишите в коментарии, как он по сравнению с Бананой.
На итоге у нас следующее:
Пока BFL выпускает монстроподобные Флюкс-модели на 60 гиг, пока мы ждем новый Qwen Edit и Z-Image Edit, у нас есть опенсорсная легкая модель для редактирования картинок от доставщика еды в Китае.
В интересное время живем...
Нашел для вас два демо-спейса:
https://huggingface.co/spaces/anycoderapps/LongCat-Image-Edit
https://huggingface.co/spaces/AiSudo/LongCat-Image
Есть еще чат:
https://longcat.chat/
Код тут:
https://github.com/meituan-longcat/LongCat-Image
Модели:
https://huggingface.co/meituan-longcat/LongCat-Image
https://huggingface.co/meituan-longcat/LongCat-Image-Dev (модель для файнтюга)
https://huggingface.co/meituan-longcat/LongCat-Image-Edit
Комфи? Какой-такой Комфи?
@cgevent