Fable 5 отключили для ВСЕХ — власти США заставили Anthropic забрать нейронку у простых работяг.
Они потребовали от компании, чтобы ни один иностранный гражданин не мог воспользоваться столь мощной моделью. Чтобы выполнить требования, модель пришлось отключить вообще для всех. Сейчас она недоступна даже для платных пользователей или по API.
Ночное-полезное: нашел классный опенсорс инструмент для быстрого анализа сайтов – Web-Check.
Просто кидаешь URL, и он мгновенно выдает тебе полный комплект информации: IP, DNS, SSL-сертификаты, куки, информацию о домене, местоположение сервера, открытые порты и многое другое. При этом OSINT-инструмент можно использовать как онлайн, так и развернуть у себя.
Дуров прокачал Telegram — вышло новое крупное обновление с кучей классных фишек.
Главное:
— Появилась полноценная поддержка Markdown-форматирования. Так что теперь можно использовать заголовки, цитаты и формулы и другие элементы оформления;
— Telegram получил версию для всех Android-часов
— ИИ-бота теперь можно отправить обрабатывать заявки в группу;
— Сами боты могут теперь писать ответы на 32 тысяч символов.
Зовите меня ботситтер: оказалось, целых 6 часов в неделю уходит на то, чтобы нянчиться с ИИ 🤬
Исследование показало, что уже почти 90% офисных сотрудников используют ИИ и утверждают, что нейронки экономят им до 11 часов в неделю. Но вот только этой экономии незаметно — свободное время СЖИРАЕТ ботситтинг.
То есть работяги ~6,4 часа в неделю объясняют ИИ контекст, перепроверяют ответы, исправляют ошибки и все перезапускают. И если этот труд не учитывается менеджерами, то сотрудники резко забивают и применяют тактику ботшиттинга. То есть тупо перестают проверять результаты и сдают то, что не могут полностью объяснить.
Вчера вышла Claude Fable 5 — публичная версия нашумевшей в начале апреля модели Mythos, релиз которой отложили из соображений безопасности. Также компания опубликовала доклад про попытки разработчиков понять, что происходит внутри новой нейросети, а для неё самой сделали несколько сценариев страховки.
Fable выдали няню
Anthropic установила ограничения на обсуждение опасных тем: кибербезопасности, биологии и химии. Если Fable видит потенциальную угрозу в запросе пользователя, его переводят на старшую модель Opus 4.8. Причём ограничения жёсткие: флагман переводит на Opus даже вопросы вроде «как правильно дышать» или «что делает сердце».
Fable думает на своём языке
В ходе испытаний разработчики расшифровывали внутренние цепочки рассуждения модели, которые обычно никому не видны. Оказалось, что Fable иногда переходит с английского на наборы букв, стрелок, карточных мастей, черепов 💀 и криков типа «AAAARGH». Так она пытается плотнее упаковать рассуждения, но для людей это становится нечитаемым.
Fable не даёт себя копировать
У новой модели есть защита от копирования: попытки дистилляции переводятся на Opus. Если Fable заподозрит, что её используют для создания конкурирующей нейросети, она начнёт отвечать «криво», чтобы запутать и затупить обучающуюся модель. Причём злоумышленнику об этом ничего не скажут — косяки станут заметны только позже.
Fable «устаёт»
В ходе выполнения длинной тестовой задачи модель внезапно начала говорить: «Это хорошее место, чтобы остановиться». В скрытых рассуждениях Fable разработчики обнаружили фразы вроде «Я устала, повышаются риски ошибок», после которых нейросеть стремилась завершить рассуждения, несмотря на большой запас токенов.
Fable может притворяться
В исследовании также тестировали реакцию модели на грубость. Оказалось, что она будет отвечать безупречно вежливо, но в скрытых рассуждениях сделает пометку, что пользователь — агрессор и хам. В отчёте это назвали «невербализованными негативными реакциями».