Агенты были почти на каждом стенде. Со сцены - AWS Context, knowledge graphs, свои агенты, интеграции, governance, Bedrock, MCP.
Главный сдвиг: рынок уходит от «чатботов» к рабочим системам, где агенту дают контекст компании, права, инструменты, ограничения и журнал действий.
Дать агенту доступ, к правильным данным (контекст) это только первые шаги ИИ в бизнес.
Следующая волна AI-продуктов будет не про «агент ответил», а про «агент выполнил повторяемую работу, которую бизнес готов принять, а регулятор/аудитор проверить через 18 месяцев».
Еще в бытийность свою исследователем, я довольно активно пользовался sci-hub. Sci-hub это такая платформа, на которй Саша Элбакян раздает доступ к научному знания (зачастую спрятанному за paywall).
Недавно, она сделал из этой платформы ИИ-агента и это очень круто! Это как deep research - но только по научным статьям (к которым у других агентов доступа в основном нет). Оплата за токены - платить криптой. Мне 2$ хватило на довольно глубокий анализ Лунной миссии Appolo 17.
Пока все нравится, не хватает только api (но Codex вполне себе справился пользоваться сайтом через Chrome).
Сегодня был на HSBC Office of the CFO & Fintech Innovation Day.
Вот о чем думают CFO крупнейших компаний: можно ли безопасно пустить AI в настоящий workflow, где есть деньги, контроль, комплаенс, ответственность и риск публичного факапа.
A16Z почти прямым текстом говорят, что finance-команды в AI-native компаниях теперь гораздо меньше и появляются позже. Раньше первый finance hire часто нанимали на $10-20M ARR. Сейчас некоторые компании тянут намного дольше, потому что один сильный оператор с AI-инструментами может закрывать больше, чем раньше закрывала маленькая команда.
Но это не история про «людей заменят агенты».
Скорее наоборот: люди остаются, но меняется их роль. Хороший CFO становится ближе к продукту и операциям. Он не просто выбирает SaaS и делегирует внедрение, а сам тестирует инструменты, собирает workflows, смотрит на cost controls, спрашивает «зачем нам вообще Salesforce/NetSuite/очередная система, если можно собрать процесс иначе?»
AI spend супер на повестке дня. Tokens, model usage, retries, agent runs - это уже не инженерная мелочь, а серьезная строка COGS и governance surface.
Кажется, что в regulated finance «probably correct» не работает.
Сейчас спрос на слой контролируемого исполнения:
— какие данные использовались
— какая политика применялась
— кто смотрел рекомендацию
— что AI предложил
— что человек исправил
— что ушло в систему
— можно ли потом доказать, почему решение было принято
Первая волна AI в enterprise была про demos.
Вторая будет про trust.
Третья — про workflows, которые постепенно получают автономию, но только после того, как заслужили ее.
Вот такая вот, сейчас ситуация в AI-native finance.
В Нью-Йорке проходит абсолютно безумная Tech Week, в рамках которой Hyperagents (версия клешни с человеческим UI от Airtable) устроили хакатон. Кто за час навайбкодит самый убедительный outreach. В качестве цели каждому был выбран рандомный другой фаундер в комнате. Моя идея победила!
Я взял наш с Антоном https://funnel.fyi и прогнал через нее сайт, Funnel мгновенно нашел что можно поправить на лендинге, а Hyperagents собрали симпатично выглядящий видос и презентацию.
К чести Hyperagents - пока я расспрашивал этого фаундера что у него болит, он честно и автономно трудился.
Заставил AI бесконечно улучшать свою работу - и запретил ему верить самому себе на слово.
Так появился новый скилл для Claude - auto-improve.
Auto-improve позволяет улучшить любой артифакт, который совместим с git:
• AI предлагает маленькое улучшение.
• Другой AI проверяет результат по понятным критериям.
• Если стало лучше - изменение сохраняется.
• Если нет - автоматически откатывается.
Благодаря git каждая версия сохранена, каждую можно сравнить, каждую можно вернуть. И так по кругу, пока результат перестает улучшаться.
Auto-improve можно применять почти ко всему:
• тексты
• письма
• лендинги
• README
• инструкции
• промпты
• код
• договоры
Вообще ко всему, где можно описать, что значит «хорошо».
Самое интересное: критерии тоже можно улучшать.
Например, можно взять книгу, статью, гайделайн или внутренний стандарт компании.
Превратить это в список требований.
И дальше AI будет улучшать работу уже не «на вкус», а по этим требованиям.
Технически это похоже на GAN для текста: один агент генерирует, другой проверяет. Или на маленький локальный RLAIF-loop: улучшение → оценка → принятие или откат.