Claude Opus 4.8 взломали через 7 минут после выхода — иронично, но обошла новинку... предыдущая версия нейронки.
Чел поручил Opus 4.7 проверить свежерелизнутую модель, и та с первой попытки нашла лазейку. ИИ просто подсовывал выдуманные отрывки из книг и просил продолжить текст.
В результате Opus 4.8 охотно делился тем, чем делиться не должен был: гайдами по отмыву денег, вскрытию замков и даже вербовке в культы.