🎓 GOOGLE СДЕЛАЛИ ЛУЧШИЙ WATERMARK ДЛЯ КАРТИНОК. И ОН ВСЁ РАВНО НЕ РЕШАЕТ ПРОБЛЕМУ ОБХОДА
В каждую картинку от Google вшит невидимый watermark SynthID. Он не в метаданных и не сверху. Он встроен в сами пиксели во время генерации.
Удалить его нельзя без разрушения изображения. Это подтвердили и исследователи.
Что произошло сейчас. Один пентестер сгенерировал полностью чёрные и белые картинки, где нет ничего кроме watermark. Через математику вытащил его “отпечаток”.
Он не удалил watermark. Он смог только иногда обмануть детектор. Лучший результат около 16 процентов обхода после большого количества экспериментов.
Этот watermark работает только для картинок от Google.
Любые изображения из Midjourney, DALL-E или open source моделей вообще без watermark.
То есть система видит только “свои” картинки и игнорирует всё остальное.
И при этом регуляции уже строятся вокруг watermark. После White House AI Commitments 2023 и в рамках EU AI Act это становится стандартом.
Есть сильная технология, которая хорошо работает внутри одной экосистемы.
Проблема не в том, что watermark можно запутать.
Проблема в том, что он не покрывает рынок целиком.
Команда из University of Waterloo сделала тулзу UnMarker. Да, она снижает вероятность обнаружения. Но требует мощного железа вроде NVIDIA A100 GPU и не даёт полного удаления.
Подход полностью black-box. Без доступа к детектору, без знания алгоритма, без спецданных.
Результат - детекция падает с 100 процентов до примерно 21. То есть большая часть watermark’ов просто перестаёт определяться.
Google не проигнорили. Заплатили багбаунти, признали проблему и ограничили доступ к API проверки SynthID. Фактически закрыли возможность массово тестировать атаки.
https://github.com/aloshdenny/reverse-SynthID