Стартап Nebius Аркадия Воложа опять растёт. Почему? И вообще, что именно он делает?
Вчера оценка Nebius почти пробила $30 млрд, а личное состояние Воложа превысило $4 млрд. Скачок случился на фоне размещения облигаций и большого долгосрочного контракта с экстремистской Meta. А ранее Nebius заключил стратегическое партнёрство с Nvidia и получал инвестиции от других глобальных бигтехов.
Но почему новое детище Воложа так хайпит? И что конкретно делает этот Nebius? Чтобы нормально разобраться, нам нужно чуть погрузиться в инфраструктуру для ИИ.
Итак, ИИ - это не просто чатботик, LLM и чип. Это ещё дофига всего:
1. Не просто чипы, а много-много чипов, собранные в огромные дата-центры (их ещё называют AI-factories).
2. Сети InfiniBand. ИИшка работает не на одном чипе, и даже не на десяти. А на тысячах и десятках тысяч GPU. Причём одновременно. Следовательно, они должны быть связаны очень-очень быстрой сетью. Эта сеть называется InfiniBand.
3. Инференс. У LLM есть обучение (training), а есть момент, когда уже обученная модель работает на результат, генерит что-то, выдаёт ответ и т.д. Это и есть инференс (inference). Миллионы пользователей делают миллиарды запросов. Если ИИшки будут обрабатывать всё это в лоб, то будет дорого и не эффективно. Поэтому в ход идут inference-системы. Они объединяют много похожих запросов в один (= batching), работают с промежуточными результатами из кэша, распределяют запросы между моделями (простые - в дешёвую модель, посложнее - в дорогую) и делают ещё много разных оптимизаций.
4. Управление вычислениями (Kubernetes, Slurm). Это "мозги" всей системы. Штуки, которые решают, кому, когда и сколько GPU/памяти выдать. Это такой "диспетчер датацентра".
5. И ещё куча всего, что я тут задолбаюсь перечислять. Но что тоже важно, чтобы этот наш эйай стабильно и уверенно генерил нам слопы с танцующими толстыми котиками.
Так вот, Nebius собирают ВСЁ ЭТО в один готовый продукт в формате "вся инфра под ключ + облако + UX". Но есть важный момент. Всё это (пункты 1-5) может быть и у других облачных провайдеров (AWS / Google / Azure, ...), но все они - универсалы. А Nebius заточен именно под ИИ-нагрузки. У него AI-native архитектура - а значит, он лучше делает inference (за инференс у Nebius отвечает собственная система Token Factory, быстрее даёт доступ к GPU (это дефицитный ресурс), эффективнее их загружает и т.д.
Клиенты у Nebius разные:
- Лабы, которые делают свою модель. Им нужно много GPU, быстрые сети, хранение и инструменты для обучения.
- Компании, уже обучившие модель и желающие быстро выкатить на ней продукт. Таким нужен хороший inference и что-то ещё. Например инфраструктура для ИИ-агентов (для этого Nebius купил агентский стартап Tavily).
- Гиганты вроде той же компании Цука, у которых вся инфра есть, но вдруг нужно будет резко-резко масштабироваться и добавить мощностей... Тогда Nebius их быстро подгонит и выступит в роли "гиперскейлера".
А для Nvidia компании вроде Nebius важны, потому что дают "более рыночный" (в смысле, менее зависимый от геополитики и всяких чип-санкций) и хорошо масштабируемый источник спроса на их GPU.
Всё это Волож и команда пересобрали из зарубежных активов Яндекса - дата-центров в Финляндии, инженеров, собственного ИИ-стека и разных побочных продуктов вроде Toloka. Toloka - это сервис, где раньше Яндекс краудсорсил разные задачки, а сейчас там ищут разметчиков данных для ИИ.
Как к персоналии к Воложу можно относиться по-разному, но предприниматель и визионер он очень крутой. Есть разные (в том числе оригинальные) версии, почему его Nebius так легко получает миллиарды от западного бигтеха. Но ИМХО настоящая причина в том, что это просто отличный технологический проект, который полезен и нужен Хуангу, Цукербергу и прочим большим техно-дядям здесь и сейчас, и станет ещё более нужен в будущем.
Дизраптор
👍
150
❤
54
🔥
9
🤔
2
💯
2
🙊
2
⚡
1