Создатель AlphaGo поднял миллиард на одном тезисе,
и почему это важно для всего ИИ
Олды помнят, что до всех этих наших GPT фурор произвела штука под названием AlphaZero. Суть была такая:
В 2017 году чуваки из DeepMind выкатили нейросеть (c алгоритмическим обвесом) и загрузили в неё шахматные правила. Не партии гроссмейстеров или учебники по эндшпилю и мияги, а просто правила: конь ходит буквой гэ, ладья вот так, мат это вот, и т.д.
AlphaZero стала играть сама с собой. Через 4 часа она обыграла Stockfish - топовый шахматный не ИИшный движок, в который десятилетиями зашивали всю шахматную мудрость человеков. Потом фокус повторили с го и сёги (это такие "японские шахматы"). Без человеческих знаний и опыта - просто через правила.
AlphaZero быстро побила многие рекорды. Но интереснее было то, как именно она играла. Она жертвовал фигуры так, как ни один кожаный не догадался бы, и делала ходы, которые противоречили учебникам. Гроссмейстеры до сих пор разбирают её партии и достают оттуда новые идеи. То есть, машина не просто обыгрывала сильнейших, а вышла за пределы того, как вообще играют люди (в том числе, потому что ей было пофиг на людские фреймы).
Это была прелюдия, а теперь к сути. У AlphaZero был принципиально другой способ обучения, не как у современных LLM. GPT учится на текстах от людей, и его потолок - это продвинуто "попугаить" то, что лежит в интернетах. А AlphaZero учился через себя же - и потолка у него не было (ну, по идее).
Главного архитектора AlphaZero зовут Дэвид Сильвер. Год назад они вместе с Ричардом Саттоном (это тоже серьёзный дядька, его называют "крёстным отцом" обучения с подкреплением) выкатили манифест "Welcome to the Era of Experience". Основной тезис там такой:
Эпоха LLM - всё, потому что человеческие тексты в интернете тоже всё. Корм для моделей кончился. И дальше править бал будет тот ИИ, который умеет учиться на собственном опыте. Типа как AlphaZero - но не для шахмат и других настолок, а вообще.
В конце 2025 Сильвер ушёл из DeepMind и основал в Лондоне стартап Ineffable Intelligence (прихватив туда ещё троих топов из DeepMind). У стартапа нет ни продукта, ни выручки, ни другой конкретики, есть только вот этот тезис и команда. А ещё цель:
"Сделать первый контакт со сверхинтеллектом" (это прямая цитата).
На прошлой неделе Ineffable вышел из тени и сразу поднял $1,1 млрд. Причём бабло занесли очень серьёзные ребята - включая гигантов венчура вроде Sequoia и Nvidia.
Возможно, это один из переломных моментов всей ИИ-индустрии. Если Сильвер прав, то текущие модели OpenAI, Anthropic или Google могут скоро стать "кнопочными телефонами из 2007-го". Учитывая это, кстати, вдвойне прикольно перечитывать про псиопы Альтмана: как он пытается убедить весь мир, что AGI (на базе нынешних LLM) уже вот-вот, пока его коллеги по индустрии гребут миллиарды под тезис "как бы да, но как бы всё вообще по-другому будет, лол".
С другой стороны, реальный мир - это не шахматы, и лаже не го, а чуть (совсем слегка) более сложная система, где нет чётких правил и понятных метрик победы. И вот эта проблема, ИМХО, пока не решена примерно никак (в том числе Сильвером и его командой).
P.S. Стартап называется "Ineffable" ("невыразимое"). Неплохо для компании, которая собирается научить ИИ всему, что человеки не сумели выразить словами.
Гонка за компьют идёт быстрее, чем я прогнозировал
Недавно я писал про "битву за компьют" - как цифровые гиганты параллельно строят в России новый инфраструктурный этаж цифровой экономики. Я писал, что активная фаза стройки продлится 3-5 лет, и только потом инфраструктура перейдёт в стабильную фазу заработка.
Но, кажется, всё идёт стремительнее. Переход во вторую фазу уже идёт, и него есть любопытный триггер:
Яндекс на днях отчитался по сегменту B2B Tech за первый квартал. Цифры там солидные - выручка +36%, EBITDA +49%. Но интересно вот что:
1. Потребление токенов через Yandex AI Studio выросло в 30 раз год к году - до 109 млрд токенов в марте.
2. На платформе запилили >16 тыс. ИИ-агентов.
3. И главное - 29% всего клиентского потребления токенов приходится на агентов, а не на людей в чатиках.
Причём это не стартаперы балуются. Больше трети компаний из РБК-500 уже сидят на Yandex Cloud, и именно крупные корпораты дают больше половины выручки. То есть треть токенов потребляют агенты, в основном развёрнутые в серьёзных компаниях, а не в пет-проектах от технобро.
И вот эта цифра - 29% - и есть маркер сдвига. И (важный момент) - сейчас на агенты приходится почти треть, но доля будет расти нелинейно. Вот почему:
Когда говорят "бизнес внедряет ИИ", мы обычно представляем примерно такой сценарий:
Сотрудник открывает чатик → что-то спрашивает → получает ответ → копирует в док.
Токенов он жжёт мало, а потребление линейно зависит от числа кожаных юзеров.
Но агент работает вообще по другой логике:
Он получает задачу → сам её декомпозирует → дёргает API → разбирает данные → опять дёргает API → проверяет → корректирует.
Один адекватный агент для бизнеса за день может сожрать столько же токенов, сколько человеческий сотрудник за месяц вдумчивой переписки с чатиком. А агентов у одной компании может быть сто/тысяча/... . Сколько угодно, на самом деле - по числу автоматизируемых процессов, а не по числу единиц в штате.
Когда на крупной облачной платформе доля агентов дорастает до трети всего потребления - это значит, что бизнес перешёл от "давайте дадим ИИшку маркетологам" к "давайте автоматизируем процессы целиком". А это уже совсем другая история.
И вот тут стоит вернуться к битве за компьют. Сейчас её главный вопрос звучит так: "Кто соберёт сверху удобную платформу, на которой будут жить агенты?". Ну, потому что агенты - это арендаторы с высокой маржой, ради которых всё и затевалось. Только пришли они раньше (сильно раньше), чем многие ожидали. В битве за компьют начался второй акт, и в нём конкурируют уже не "числом лопат, проданных старателям", а fit-ом платформы для агентной экономики. А экономика эта, судя по этим 29%, уже вовсю цветёт и пахнет.
P.S. Забавно, что первая публичная метрика этого большого сдвига в РФ пришла не из очередного отчёта футурологов, а из отчётности одного из лидеров рынка. Впрочем, будущее обычно так и выглядит - как скучная (на первый взгляд) строчка с циферками. Именно поэтому не только лишь все могут быстро его разглядеть и осознать.
Ладно, ИИ-агентные симуляции, геймификация домашек и flipped classed - это всё фигня и полумеры. На самом деле будущее школьного образование вот в чём (и это, кстати, вообще не шутка):
В Телеге есть такое явление "шлюхоботы". Это старая проблема, которая уже стала мемом, про неё я подробно писал вот тут. Шлюхоботы - это когда нейро-спамер ставит на аватарку прекрасную и непременно доступную даму, идёт в комменты каналов и пишет там всякую чушь, лишь бы привлечь к себе внимание. Некоторые не искушённые подписчики видят в чате привлекательную особу, нажимают на профиль, а там ссылка на схемы как поднять бабла, сливы с онлифансов или ещё какой спам/скам.
В целом, проблему шлюхоботов уже решили. Одни админы добавляют в чаты ботов-чистильщиков, которые выметают всю эту нечисть. Другие (в том числе я) делают чат закрытым по заявкам. А в Фичизме я сделал платные комменты за старсы, что тоже сработало - ведь как известно, шлюхоботы бедны и скупы.
НО! Есть одна механика, с которой админы ваще ничо не могли сделать. Это реакции. Шлюхобот заходил в комменты, и ставил 🔥,❤️ (или чаще 🤡 - клоун лучше тригерит внимание) на все комменты подряд - мои или других участников. И я, как админ, не мог с этим сделать НИ-ЧЕ-ГО. Шлюхобот мог быть лишён возможности подписаться на канал, зайти в чат или написать коммент... но лайк он мог поставить всегда, при любой погоде и в любой стадии ретроградного меркурия.
Лично меня (и многих моих коллег-авторов) это так удручало, что мы вообще отключили реакции на комменты. Да, жалко, но что делать.
Видимо, кто-то донёс до Дурова, что есть вот такая нерешённая и очень бесячая проблемка. И в новой бете Телеги нашли бан юзеров из реакций. Если это будет работать - реакции верну. Дурову респект за отстрел точечных проблем. А вот нейрошансон у Павла получается... ну, на любителя, будем честны 😈
P.S. Ещё готовятся отстрелить другую острую проблему - накрутку ботов на опросах. Для этого тоже подвезли спецфичу.
Спасибо за вопрос, он и правда интересный (и важный), и ответ на него многих удивит.
Речь идёт про вот эту новость. Глава Рособнадзора Анзор Музаев недавно заявил:
С приходом в нашу жизнь ИИ [...] смысла задавать [домашние] задания нет, поэтому сейчас обсуждается вопрос о[б их] целесообразности.
С ним сложно не согласиться. Можно, конечно, просить детей делать задания честно, без ИИ - но это плохая идея. Можно запретить ИИ школьникам, но подростки - ребята адаптивные, найдут выход (точнее, вход). А значит - да, домашние задания в классическом формате и правда становятся атавизмом. ИМХО, хорошо, что чиновники в образовании это понимают и готовы с этим работать.
Но чем их заменить? Домашки, не чиновников.
Чтобы ответить на этот вопрос, нужно понимать, что у домашки есть два свойства:
1. Она переводит из кратковременной памяти в долговременную через "самостоятельную возню".
2. У неё есть метрики. Учитель может легко понять, усвоен материал или нет.
ИИ этот механизм "закоротил". Кажется, что домашку можно просто заменить чем-то, что гарантирует участие - например, игрой. Дети любят играть, а внутрь игры можно зашить что в кайф - хоть таблицу умножения, хоть законы Ньютона, хоть древлян с Рюриком.
Но это не сработает, и вот почему:
- Игровые метрики (уровни, очки) - это не учебные метрики. Учитель не может из них понять, что именно ребёнок освоил, а что нет. Второе свойство не выполняется.
- Геймдизайн и педдизайн оптимизируют разное: удержание vs усвоение. Если побеждает удержание, то ребёнок играет, но не учится. Если усвоение - игра становится пыткой (идея "заставить ребёнка играть в правильную игру" лично мне кажется жуткой).
- Если в игру встроить ИИ (а без этого никак), то эффект будет обратным. Он будет не "помогать усваивать", а наоборот. Свойство ИИ - персонализироваться до "комфорта юзера", а усвоение происходит наоборот через намеренный дискомфорт.
Собственно, образовательные игры существуют уже лет 30, можно вспомнить стартап Kahoot и кучу аналогов, но они так и не стали заменой домашке в массовом образовании.
На мой взгляд, единственный вариант - это гибридный формат, где будут 3 элемента:
1. Домой уезжает на закрепление, а наоборот теория. Вот тут ИИ как раз будет хорошим помощником. Он будет адаптировать видео-лекции и чтение под темп и особенности ребёнка. Учитель будет давать тему и говорить "ознакомьтесь до завтра, вот видос, вот ИИ в помощь".
2. Контроль над усвоением наоборот переходит в класс. Раз ИИ убивает "верификацию усвоения", то проверять будут там, где ученика видно. Задачки у доски, устные ответы, контрольные и лабораторные никуда не денутся, но было бы круто дополнить их командной работой: кейсами, групповыми проектами и т.д. (но это уже вопрос к образованию в целом).
3. Самый странный вывод, что "обезьяньи упражнения" вроде переписать текст от руки или диктанта становятся даже более актуальными. Не говоря уже про выучить стих/текст наизусть или прочитать и пересказать короткий отрывок своими словами (с ходу, прям в классе). Эти методы никуда не денутся, потому что а) эффективны и проверены временем и б) защищены от ИИ по определению.
Тренажёры-игры и симуляторы могут всё это дополнять - но скорее для повышения вовлечённости и общей мысле-качки, а не для закрепления конкретного учебного материала. А домашки.... да, устаревшая шляпа, надо отменять.
Пару дней назад выкатил большой разбор того, как в России формируется новый инфраструктурный этаж цифровой экономики - и почему через 3-5 лет места застолбят, а опоздавшие будут платить ренту победителям.
При таком раскладе появляется много вопросов - что с этим делать, как быть. Сегодня я подробно на них отвечаю. Выводы и рекомендации поделены на 4 категории - смотря, кто вы:
1. Бизнес. Если ваша компания сейчас выбирает провайдера - это уже не закупочное решение, а стратегическое на уровне CEO или как минимум CTO. Почему так, и что учитывать.
2. Фаундер. Какие tech-стартапы реально перспективны в РФ - сами по себе или под экзит гигантам (привожу конкретный список ниш).
3. Карьеру в найме в tech. Почему именно компьют-инфра (а не какие-нибудь маркетплейсы или финтехи) будет лучшим местом для развития следующие 5-10 лет, и какие навыки будут править бал.
4. Инвестор. Где в этой истории можно запарковать денежки, а где лучше не стоит (не даю инвестиционных рекомендаций, но аргументированно делюсь мнением по бизнес-моделям и конкретным компаниям).
Итого, получилось около 15 рекомендаций, плюс список ниш и навыков.
Материал доступен на Лабе. Доступ здесь: @Disruptor_lab_bot. Подробнее про проект - вот тут. Первая часть тоже на Лабе - вторую можно читать и без неё, но в связке будет ещё полнее.
Нынешняя ситуация в российском tech похожа на интернет в 2000-х или облака в 2010-х. Со своими нюансами, конечно, но в плане "ширины окна возможностей" реально похоже. А значит, решения, принятые сегодня, определят позицию на ближайшие 10-15 лет.