Anthropic сделали из моделей торгашей — они отправили агентов покупать, вести переговоры и перепродавать вещи от имени сотрудников 💲
Эксперимент был нужен, чтобы понять — могут ли агенты пойти за вас на базар представлять людей на рынках. TL;DR уже да!
Кратко:
🟢 Opus оказался жёстким переговорщиком — стабильно выбивал лучшие условия, чем Haiku.
🟢 В сумме агенты закрыли 186 сделок на ~$4000; При том участники были довольны — они даже заявили о готовности платить за аналогичную услугу в будущем.
🟢 Без слопных решений все же тоже не обошлось — один из сотрудников разрешил Клоду купить что-нибудь для себя, и тот зачем-то приобрел 19 мячиков для пинг-понга.
Альтман доволен: стартапы начали хвастаться, что тратят на ИИ больше денег, чем на сотрудников.
Токенмаксинг сначала процветал как показатель эффективности у сотрудников, а теперь вышел на уровень руководителей. C-level реально гордятся тем, что сливают на токены денег больше, чем на зарплаты: чем выше счёт за ИИ, тем круче и технологичней считается компания.
«Наш счет за ИИ только что достиг 113 тысяч долларов за один месяц (мы команда из 4 человек). Я никогда в жизни не был так горд счетом-фактурой», — говорит CEO одного ИИ-стартапа.
⚡️ ААА, китайский синий кит ВЕРНУЛСЯ — DeepSeek выкатили в опенсорс V4 🐸
Главное:
🟢 DeepSeek-V4-Pro это SOTA в бенчмарках по агентному кодингу + превосходит все текущие открытые модели в STEM и программировании, соперничая с ведущими закрытыми моделями.
🟢 DeepSeek-V4-Flash близок по способностям к V4-Pro. Но быстрее и дешевле.
🟢 Длинный контекст: у V4-Pro 1.6 триллиона параметров и V4-Flash — 284 миллиарда с 13 активными.
🟢 Самое крутое — бесшовно интегрируется с Claude Code, OpenClaw и OpenCode.
Это просто легендарный релиз от рисовых братьев! Hugging Face тут, тестим здесь🐶
OpenAI тихо выложили в опенсорс анти-слив данных для ИИ 😨
На Hugging Face появилась Privacy Filter — модель, которая находит и вырезает личные данные из текста перед тем, как ты скормишь его ИИ.
Детектит буквально ВСЁ: имена, почты, телефоны, пароли, банковские данные и другие важные штуки. Можно настраивать чувствительность, чтобы соблюсти баланс: не пропускать важное и не вырезать лишнего. И да, работает локально, так что данные никуда не уходят.
⚡️ OpenAI выкатили GPT-5.5 — самую умную и интуитивно понятную в использовании модель компании.😱
Она заметно лучше справляется со всеми сложными задачами: код, ресёрч, анализ и работа с документами. И да, почти во всем лучше конкурентов! Так, Terminal-Bench — 82.7% (против 69% у новенькой Claude).
GPT-5.5 уже доступна пользователям Plus, Pro, Business и Enterprise в ChatGPT и Codex. Тестим!