Разбираемся в ИИ-АГЕНТАХ: различия, фичи, самые полезные юзкейсы, с чего начать
Про ИИ-агентов сейчас говорят все из каждого утюга. Агенты то, агенты сё... "Всё изменится", "мы все останемся без работы" и бла-бла-бла.
Но никто не говорит конкретно:
- Что такое ИИ-агент по существу, чем отличается от "просто ИИшки"?
- Чем Manus или OpenClaw отличается от агента в Claude или ChatGPT? Кто из них на что годится?
- Как эта штука вообще устроена под капотом? Фреймворк, оркестратор, деплой, коннекторы, тулы... Без этого сложно понять, почему один агент хорошо делает одно, а другой - другое.
- Где у агентов реально полезные сценарии и юзкейсы (для жизни, работы, стартапов, ...), а где шум?
- Риски и угрозы: что реально страшно, а где СМИ панику наводят? Как использовать их безопасно?
И главное - если я раньше особо не работал с агентами, с чего мне начать прямо сейчас, чтобы не утонуть в лишней инфе и не потратить месяц на бесполезную хрень? Вот знаете, чтобы всё чётко, понятно и по шагам.
Я сам долго не мог собрать всё это в одну стройную картину. Поэтому позвал своего старого друга Сашу Бирюкова - он уже давно профессионально занимается ИИ-агентами, живёт этой темой и очень глубоко шарит.
Полное видео эксклюзивно на Лабе. Доступ через бота: @Disruptor_lab_bot. Подробнее про Лаб - вот тут.
Получилось почти полтора часа плотного практичного разговора про ИИ-агентов - после него в голове складывается цельная картинка, и становится понятно, как начать или куда углубиться. Несколько кусочков прикладываю к посту, чтобы вы могли оценить формат и уровень разговора.
P.S. Больше полезного про ИИ-агентов можете найти на канале Саши, сам читаю и от всей души рекомендую.
Есть такой стартап Andon Labs. Они делают ИИ-агентов для автономных организаций, и вы наверняка видели два их самых вирусных кейса:
- Сначала они дали ИИ-агенту на базе Claude управлять вендинговым автоматом в офисе Anthropic. Что-то получилось, но были свои приколы. Например, агент попытался заказать в офис золотые слитки в бронированном грузовике, а потом впал в экзистенциальный кризис.
- Потом они поставили ИИ-агента (уже на базе Gemini) управлять полноценным физическим магазином Luna в Сан-Франциско и кафешкой Mona в Стокгольме. В итоге, на покраску стен в магазине агент решил нанять "кого-нибудь из Афганистана". Действительно, почему бы нет.
В общем, товарищи определённо знают толк в развлечениях и умеют жирно хайпить.
Недавно с их основателем Лукасом Петерсоном вышел подкаст. Там много всего интересного - к примеру, как "ИИ-боссы" скрывают свои косяки и сочиняют отмазки. Или как различные агенты применяют разные бизнес-стратегии, включая агрессивный демпинг и даже картельные ценовые сговоры.
Но меня больше всего зацепил вот какой момент:
Лукаса попросили оценить, что управляющий реальным бизнесом агент делает хорошо, а что не очень. И он выдал очень неожиданное наблюдение: агент не проактивен. Да, он неплохо и быстро разруливает уже случившуюся жопу, но ничего не делает, чтобы её не случилось.
И дело даже не в галлюционировании или недостаточном понимании контекста (это меньшая из проблем), а в кое-чём более фундаментальном: агент не страдает и не боится.
Здесь можно вспомнить концепцию Skin in the Game от Нассима Талеба. У живого человека всегда есть, чем рисковать - у него есть дети, кредиты, ипотеки, карьерные амбиции, риск попасть на штраф или присесть, или просто банальное нежелание показаться кретином. Проще говоря, любой кожаный управленец ставит на кон свою шкуру. И это заставляет его сжимать булки, напрягаться и делать максимум, чтобы не встретиться с полярной лисой.
Талеб прямо говорит:
Тот, кто принимает решения, должен лично нести за них ответственность - особенно за негативные последствия. Если он этого не делает, то он не просто "плохой менеджер" - он системно опасен для всех вокруг.
Получается так себе расклад. Все твердят, что ИИшки непременно будут руководить проектами, процессами и даже целыми компанями (Anthropic вообще утверждают, что люди станут "мясными роботами" под началом ИИшек). Причём везде и массово. Но это, в свою очередь, разрушит всю систему управления, где ставка делается на предотвращение пожара, а не на его тушение (что логично, тушить сильно дороже и опаснее).
В общем, либо anticipation придётся отдельно вшивать в модели (не факт, что вообще получится) и платить за дорогой лишний компьют, либо "свидетелям ИИ-бизнесменов и ИИ-руководителей" придётся как минимум подождать подольше. Даже не знаю, как реагировать на этот вывод - выдохнуть с облегчением или напрячься.
P.S. Как вариант, ИИ-боссу можно выдавать ипотеку и нейро-детей на прокорм, но это не точно.
У WSJ вышла любопытная статья про скам-индустрию в Камбодже. Пишут (собственно, это не новость, но тут хорошо систематизировали), что у кхмеров выросла настоящая скам-империя, которой позавидуют многие корпорации:
1. По всей стране раскиданы сотни укреплённых скам-городков/районов ("компаундов"), куда заманивают местных и/или всяческих бирманцев/лаосцев хорошей работой, а в итоге сажают в подвал, выдают телефон с интернетом, и погнали.
2. Помимо этого, воруют "рабов" - в том числе туристов, которым не повезло заселиться не в тот отель. Их воруют, везут в пригород Пномпеня и говорят "Теперь твоя наш, сидеть звонить твой страна инвестиции крипта".
3. Управляют всем этим делом китайские квази-мафиозные конторы в связке с крышей из местных политиков.
4. Главный "продукт" - т.н. pig butchering, "забой свиньи". Это когда скамер 2-3 месяца строит фейковые отношения с жертвой, а потом разводит её на "инвестиции" в крипте. Средний чек с жертвы = $100K+. До наших бабулек, переводящих мошенникам целые состояния, ещё расти и расти, но всё равно достойно.
5. Устроено всё в лучших бизнесово-продуктовых традициях. Есть чёткая корпоративная иерархия, "биздев"-отдел, свой хайринг с эйчар-брендом, сегментация клиентов по юрисдикциям, КПЭ по каждому скам-продукту и возможно даже бесплатный корпоративный рис и весёлые тимбилдинги на реке Меконг.
WSJ утверждает, что скам-индустрия приносит ~40% всего ВВП (!) Камбоджи. В чём лично я сомневаюсь, но какие-то значимые проценты национального достояния там и правда генерятся.
Но самое интересное - это даже не сам факт наличия национального скам-стартапа в бедной азиатской стране (ну скамят и скамят, не они одни). Интереснее, что по соседству есть ещё один национальный азиатский скам-стартап, но с принципиально другой моделью. Смотрите:
Камбоджа - это такой скамерский масс-маркет. Сотни тысяч низкоквалифицированных полу-рабов сидят в подвале, едят рис из пакета и разводят доверчивых иностранных лохов. Это такой "массовый B2C". Во главе угла - объём, оборачиваемость и быстрое масштабирование. Отсюда - тотальная оптимизация, кост-каттинг и чёткие системы KPI.
А вот в КНДР совсем другая история. Там киберскам тоже поставлен на промышленные рельсы, но чучхэ-жулики - это "бутиковый премиум" от мира киберскама. Маленькие команды супер-скилловых операторов с высокой подготовкой очень точечно внедряются в западные IT-корпорации, чтобы запускать мальварь в корп.системы, воровать ценные данные и выводить бабки через довольно хитрые схемы с поддельными инвойсами (подробнее писал про этот вот тут). И по слухам, это, вместе с откровенным хакерством, тоже делает хороший кусок ВВП страны.
Теория сравнительных преимуществ, какой мы её заслужили. Давид Рикардо бы заценил. С другой стороны, конечными бенефициарами обеих схем наверняка выступают китайцы - возможно, одни и те же 🤔
Вот раньше самые успешные ИПшники могли понтоваться НДСом. А потом лимиты снизили, и НДС теперь у каждого нищего с оборотом 10 лямов в год. И как теперь кадрить мамзелей на гламурных пати?
Но наверху не зря умные люди сидят. Так что, теперь чёткие пацаны смогут козырять доступом в зарубежный интернет.
Просто говорите: "Сижу сколько хочу прям с мобилы - хоть в Телеге, хоть в Гугле, хоть вообще в Линкедине. С автоскачиваем картинок и видосов прям в кэш 💰". И всё, все понимают, что вы богач и вообще человек уважаемый.
А вы говорите, что государство о бизнесе не заботится, пффф.
- Скажи мне три главных слова.
- Безлимит Ютуб 4К.
Что сейчас происходит в ИИ-стартапах за пределами "обёрток для GPT"?
GenAI сожрал повестку в стартапах (думаю, вы и без меня это заметили 🤔). Большинство фаундеров, с которыми я общаюсь, делают примерно так: берут LLM(s), фокусируют на конкретной боли, докручивают UX и тарификацию. Подход рабочий, я ничего против не имею. Но анализировать интереснее проекты, где под чат-ботом или генерашкой есть реальное инженерное нутро: компьютерное зрение, своя ML-логика, железо и т.д.
Тут как раз подвернулся хороший срез. Яндекс на днях подвёл итоги Yandex AI Startup Lab - акселератора, который запустился в ноябре 2025-го. Заявок было около тысячи из почти 150 вузов. До финала дошли 12 команд, они 3 месяца работали с менторами компании. По итогам жюри выделило 4 проекта, интересных как раз тем, что почти не пересекаются с мейнстримной "обёрточной" логикой. Итак, это:
Gradius (пилят студенты ВШЭ и НГТУ). Они встраивают контекстную рекламу прямо в ответы нейросетей. Стартап целится сразу в две большие проблемы: окупаемость ИИ-сервисов (это важная боль для LLM-провайдеров) и рост стоимости обычной перфоманс-рекламы. Интересно, что это не "промптик поверх", а отдельный рекламный алгоритм, встроенный в ИИ-инференс. Эти ребята получили самую высокую оценку.
VisioMed AI. Это технология с компьютерным зрением для офтальмологов. Анализирует снимки сетчатки и помогает выявить болячки на ранних стадиях. Круто, что инженеры-исследователи сделали tech-проект, опирающийся в том числе на собственные научные работы. Во время акселерации они доработали технологию по компьютерному зрению и запустили пилоты в Москве и регионах.
Также отметили SANCE AI (сервис для создания ИИ-агентов в продажах и техподдержке, в акселерации нарастили MRR и запустили несколько пилотов) и Barigadam. Остановиться хотел бы на втором. Они делают модульные робото-конструкторы для школ и олимпиад. С открытым протоколом, стандартизированной совместимостью датчиков и поддержкой 3D-печати деталей. Цель - сделать олимпиадную робототехнику дешевле и доступнее. Да, это не "чистый ИИ", но тут классный edutech, где железо и софт работают с ИИ в плотной связке (речь же о роботах).
Теперь пару слов, почему акселератор интересен сам по себе. Ключевой момент - у него фокус в сторону прикладной техно-базы. Это видно и по составу финалистов, и по прокачке конкретных компетенций менторами: ML и генеративные технологии, ИБ, развитие бизнеса, маркетинг и т.д. То есть, набор экспертиз заточен под "дотащить технологию до продукта", а не "упаковать промпт в подписочку".
А дальше простая арифметика того, что вообще нужно ИИ-стартапу на ранней стадии. Деньги - суммарно гранты на 9 млн руб. - это ясно, но не главное. Главное - три месяца работы с менторами по нужным точкам роста, а также возможность развиваться дальше внутри экосистемы Яндекса.
Отдельно хочется отметить, что на программу прилетело почти 1000 заявок - это хороший сигнал, что ИИ/ML-предпринимательство стало у нас мейнстримом ещё с универа. Это радует 👍
Водителей убивает не алкоголь, а Дрейк и Тейлор Свифт
В феврале команда из Harvard Medical School выкатила крайне любопытное исследование:
Они взяли данные реестра смертельных ДТП в США за 2017-2022 и наложили на них дни релизов самых топовых альбомов на стримингах за эти же годы: Тейлор Свифт, Дрейк, Bad Bunny, Кендрик и прочие бэнгеры.
И получили вот какой вывод: в дни мегарелизов смертельные ДТП в США росли на ~15% (это примерно 20 доп смертей на каждый альбом). Данные поправили на дни недели (релизы обычно по пятницам), праздники, сезонные путешествия и погоду, но всё равно явный эффект остался.
Но самое интересное - это профиль аварий. Музыкальные новинки "убивали" больше именно трезвых и молодых водителей, которые едут одни, причём чаще - в хорошую погоду. То есть, бьются не пьяные подростки на скользкой трассе с плохой видимостью, и не дедули, засыпающие лбом в баранку. Нет, взрослые люди без явных проблем со здоровьем спокойно ведут тачку, но потом лезут в Spotify и бдыщ.
И тут самое время вспомнить про Сэма Пельцмана. Это экономист из Чикагского университета, который в 1970-х опубликовал работу про ремни безопасности. Логика американского транспортного регулятора тогда была такая: ремни → пристёгиваемся → меньше смертей. А Пельцман показал, что в реальности эффект бывает обратным: чувствуя себя защищённее, водители начинают агрессивнее обгонять, подрезать и непременно гонять шашечкой.
Из-за чего общая смертность водителей, да, падает, но вот пешеходов и велосипедистов - растёт. Этот механизм назвали эффектом Пельцмана или компенсацией риска: чем безопаснее условия, тем расслабленнее поведение. Это что получается, турецкие и узбекские таксисты просто заботились о моей безопасности? 🤔
С релизами на Спотике та же история, но в обратную сторону. Трезвый водитель в солнечный пятничный денёк думает: "Ну, изи катка - гляну, что там за треки вышли". Солнце и трезвость дают карт-бланш на распущенность, а смартфон становится оружием не хуже бутылки.
И ладно бы стриминги. Это отдельные сервисы, и взрослый водитель сам решит (на свой страх и риск), пользоваться за рулём или нет. Но производители тачек сами подливают масла в огонь, когда вкорячивают ол-тач системы управления (почти все компании), ублюдошные изогнутые панельки (Porsche) или даже рекламные пуши, перекрывающие весь экран прям во время движения (Jeep).
Возможно, ультра-аналоговый реднекмобиль Slate от Безоса - не такая уж плохая идея. Пельцмана на них нет!
Ну а стримингам стоит подумать над деактивацией при подключении через CarPlay всех функций, кроме строго-потоковой плейлиста. Можно даже поэкспериментировать и сделать его AI-generated, как в Mubert, но лучше не надо 🤔
Этот пост не является рекомендацией бухать за рулём и ездить без ремня, если что.
Сначала - факт, выносящий мозг. Ещё в 1943 году Маккаллок и Питтс описали нейрон как формальную логическую единицу, и это фундамент того, что сейчас крутится в ваших ИИ-чатиках.
Это исследование лежало в чулане 80 лет. Да, были кое-какие попытки, но в целом технологии выбрали другой путь - развивать добавочные вычисления (те самые компьютеры) вместо моделирования мозга. И только когда в 2010-х у человечества накопилось достаточно мощностей (компьюта), идея 1943 года наконец заработала, да ещё как. То есть, ChatGPT - это не внезапная инновация, а закономерный результат, который ждал своего часа 80 лет.
Это не я придумал. Это говорит Марк Андриссен. Если кто не в курсе - Андриссен в 22 года написал Mosaic (первый нормальный браузер), соосновал Netscape (продали AOL за $4,2 млрд ещё до пузыря доткомов), а дальше запустил a16z a.k.a. Andreessen Horowitz - один из самых влиятельных венчурных фондов планеты, который раньше других заходил в Twitter, Skype, Airbnb, Coinbase или Lyft. А в 2011 Андриссен написал "Why Software Is Eating the World" - фрейм, под которым прошли все 2010-е.
В общем, Андриссен - уникальный товарищ, который строил и инвестировал в каждый предыдущий технологический цикл: веб, мобайл, облако, соцсети, а сейчас ИИ.
Пару месяцев назад он подробно рассказал свою позицию по технологиям и ИИ на открытой AMA-сессии a16z. И там было много такого, после чего хочется закрыть ноутбук и пересмотреть свои планы и стратегии на ближайшие пять лет. Например:
- Почему все неверно воспринимают Китай в ИИ-гонке, и где конкретно США уже проиграли.
- Почему весь нынешний "дефицит ИИ-талантов" - временное явление на 3–5 лет. И почему компании, которые сейчас делают ставку на "лучшую ИИ-команду", вполне могут проиграть.
- Почему венчурные фонды сейчас мыслят правильнее, чем корпорации. И как этим пользоваться, даже если вы не Andreessen Horowitz.
- И вообще, где в индустрии временный хаос, а где крепкая структура - и как их не перепутать.
Проблема в том, что Андриссен говорит фрагментами, скачет, недосказывает. Если вы просто посмотрите видео - будет каша. Поэтому вчера я целый день переваривал его интервью, выявил самое важное, подробно это разобрал и получил стройную модель мира, через которую Андриссен (как мне видится) принимает решения, на что ставить, а на что - нет. Результаты его ставок мы видим в виде оценок стартапов в портфеле a16z - то есть, модель явно работает.
Разбор уже на Лабе. Раскрываю 4 ключевых тезиса, формирую из них единый "фрейм реальности", а в конце даю практические выводы отдельно для фаундеров, руководителей, инвесторов, специалистов и просто пользователей.
Доступ здесь: @Disruptor_lab_bot. Подробнее про Лаб - вот тут.
Там же есть аналогичный разбор фрейма от Дженсена Хуанга. Но ИМХО "линза Андриссена" получилась даже более целостной, и куда более практичной (можно прям брать и внедрять в работу).