Ночное-полезное: нашел классный опенсорс инструмент для быстрого анализа сайтов – Web-Check.
Просто кидаешь URL, и он мгновенно выдает тебе полный комплект информации: IP, DNS, SSL-сертификаты, куки, информацию о домене, местоположение сервера, открытые порты и многое другое. При этом OSINT-инструмент можно использовать как онлайн, так и развернуть у себя.
Дуров прокачал Telegram — вышло новое крупное обновление с кучей классных фишек.
Главное:
— Появилась полноценная поддержка Markdown-форматирования. Так что теперь можно использовать заголовки, цитаты и формулы и другие элементы оформления;
— Telegram получил версию для всех Android-часов
— ИИ-бота теперь можно отправить обрабатывать заявки в группу;
— Сами боты могут теперь писать ответы на 32 тысяч символов.
Зовите меня ботситтер: оказалось, целых 6 часов в неделю уходит на то, чтобы нянчиться с ИИ 🤬
Исследование показало, что уже почти 90% офисных сотрудников используют ИИ и утверждают, что нейронки экономят им до 11 часов в неделю. Но вот только этой экономии незаметно — свободное время СЖИРАЕТ ботситтинг.
То есть работяги ~6,4 часа в неделю объясняют ИИ контекст, перепроверяют ответы, исправляют ошибки и все перезапускают. И если этот труд не учитывается менеджерами, то сотрудники резко забивают и применяют тактику ботшиттинга. То есть тупо перестают проверять результаты и сдают то, что не могут полностью объяснить.
Вчера вышла Claude Fable 5 — публичная версия нашумевшей в начале апреля модели Mythos, релиз которой отложили из соображений безопасности. Также компания опубликовала доклад про попытки разработчиков понять, что происходит внутри новой нейросети, а для неё самой сделали несколько сценариев страховки.
Fable выдали няню
Anthropic установила ограничения на обсуждение опасных тем: кибербезопасности, биологии и химии. Если Fable видит потенциальную угрозу в запросе пользователя, его переводят на старшую модель Opus 4.8. Причём ограничения жёсткие: флагман переводит на Opus даже вопросы вроде «как правильно дышать» или «что делает сердце».
Fable думает на своём языке
В ходе испытаний разработчики расшифровывали внутренние цепочки рассуждения модели, которые обычно никому не видны. Оказалось, что Fable иногда переходит с английского на наборы букв, стрелок, карточных мастей, черепов 💀 и криков типа «AAAARGH». Так она пытается плотнее упаковать рассуждения, но для людей это становится нечитаемым.
Fable не даёт себя копировать
У новой модели есть защита от копирования: попытки дистилляции переводятся на Opus. Если Fable заподозрит, что её используют для создания конкурирующей нейросети, она начнёт отвечать «криво», чтобы запутать и затупить обучающуюся модель. Причём злоумышленнику об этом ничего не скажут — косяки станут заметны только позже.
Fable «устаёт»
В ходе выполнения длинной тестовой задачи модель внезапно начала говорить: «Это хорошее место, чтобы остановиться». В скрытых рассуждениях Fable разработчики обнаружили фразы вроде «Я устала, повышаются риски ошибок», после которых нейросеть стремилась завершить рассуждения, несмотря на большой запас токенов.
Fable может притворяться
В исследовании также тестировали реакцию модели на грубость. Оказалось, что она будет отвечать безупречно вежливо, но в скрытых рассуждениях сделает пометку, что пользователь — агрессор и хам. В отчёте это назвали «невербализованными негативными реакциями».
Xiaomi выкатила опенсорсного убийцу Claude Code — MiMo Code 🐸
Китайские разработчики обещают контекст до 1 млн токенов, накопление знаний между сессиями и прокачанный агентный режим. На SWE-Bench Pro связка с моделью Xiaomi дала 62% против 55% у Claude Code + Sonnet 4.6.
Самое интересное — система умеет сжимать и сохранять контекст проекта, не теряясь даже в кодовых базах на миллионы строк.