Вышел хороший пост от чела из DeepMind про то, как попасть в frontier lab сегодня. Автор сейчас lead for Gemini pretraining в GDM, а до этого дропнулся с PhD и пошел в стартап Sisu, где быстро стал Head of ML.
Суть поста коротко: если хочешь попасть в топовую AI-лабу, надо прокачивать mathematical maturity, жутко потеть во время универа (причем задрачивать без использования LLM), уметь очень хорошо кодить, и делать работу на “краях” LLM-стека – снизу kernels / inference / systems / quantization, сверху agents / rigorous evals / agentic loops. Не просто “поиграться с агентами”, а делать технически строгие эксперименты и показывать вклад, который реально нужен frontier labs.
В целом всё по делу, но мне кажется, что автор упускает несколько важных вещей.
Не весь интересный frontier-level research вне топ-лаб ограничивается разработкой кернелов, low-level оптимизациями LLM и написанием агентских врапперов.
И чтобы заниматься frontier research, не обязательно идти только в большие лабы типа OpenAI, Anthropic, Meta Superintelligence Labs или GDM.
Frontier-level research можно делать и в стартапах на более ранних стадиях. И часто там у вас будет в разы больше ownership, а рост по карьере и по скиллам будет намного быстрее.
Иронично, что сам автор как раз так и сделал: дропнулся с PhD, пошел в стартап, быстро стал Head of ML – и уже после этого попал в Google, причем сразу на Staff-level позицию.
В стартапах есть куча фундаментально интересных задач, где не нужны $100M+ бюджеты. Есть задачи, для которых достаточно “двузначных миллионов”, сильной команды и правильного технического фокуса.
А в бигтехе, если ты не Director+, ты часто просто взаимозаменяемый винтик, которому дают потрогать маленькую фичу в огромной системе. Ownership минимальный, scope ограничен, выбиться на следующий уровень очень и очень трудно. Большинство людей до Staff+ никогда в жизни так и не дорастают.
Да, стартапов, где реально сильная команда и где можно делать фундаментальные вещи, не так много. Но именно в такие стартапы можно попасть на восходящей траектории карьерного роста — когда у тебя еще нет крутого track record, который нужен, чтобы хотя бы пройти скрининг в топовую большую лабу, но видно как ты резко ускоряешься. (Именно такой принцип я и применяю, когда отбираю более молодых кандидатов к себе в стартап)
И там намного больше пространства для роста. Никто не будет искусственно ограничивать тебя в scope. Всё зависит от тебя: насколько ты готов ебашить, брать ответственность и тащить сложные куски.
Кстати, раз уж заговорили про стартапы: мы в GenPeach AI всегда рады пообщаться с выдающимися кандидатами на позицию AI Research Scientist. Это как раз роль про работу над foundation models - не “AI wrappers”, а pre-train и post-train своих large-scale моделей, O(PB) данные, SOTA ресерч по кастомным архитектурам и методам контроля генерации.
Хорошая альтернатива OpenClaw, которая работает из коробки. Под капотом — саб-агенты, поддержка 1000+ MCP-серверов и работа в групповых чатах.
Через Mira можно автоматизировать кучу всего:
– Ремайндеры и автономные задачи;
– Трейдинг и мониторинг рынков;
– Кастомных AI-ботов;
– Генерацию и автопостинг контента;
– Связки с Gmail, Calendar, Notion, GitHub и другим стеком.
Она заметно сильнее чем Gemini 3.1 Pro, но цены за токены выросли в 3 раза, с $0.5/$3 до $1.5/$9 за миллион токенов. 3.1 Pro, для сравнения, стоит $2/$12 за миллион токенов для контекстов меньше 200к. Насколько реально выросла стоимость за задачу по сравнению с прошлой Flash мы узнаем только с тестами.
Самое главное — Google серьёзно отнёсся к проблемам в агентности и особенно прокачал модель в этом. Как пример показали как Gemini 3.5 Flash написала за 12 часов небольшую ОС, которая может запустить Doom. Pro модель существует, её обещают завезти в следующем месяце, страшно какие там заломят цены.
В одном из своих интервью осенью (кстати, очень рекомендую к просмотру) Адрей Карпатый говорил, что у него сформировалось FOMO, пока он был на вольных хлебах. Поэтому он, возможно, хотел бы вернуться назад в какую-нибудь frontier лабу в ближайшее время.
LLM уже пишут код, чинят баги, генерируют тесты, документацию и помогают запускать продукты в разы быстрее, чем это делали классические команды разработки. И это уже не "будущее когда-нибудь", а суровая реальность, которая меняет рынок прямо сейчас.
И те, кто научится вайбкодить сейчас, будут увереннее конкурировать на рынке и зарабатывать больше тех, кто по-прежнему хардокодит всё вручную (ну, по крайней мере, пока нас всех окончательно не заменят ИИ-агенты).
Стартовать с нуля поможет канал Вайб-кодинг. Там ребята круглосуточно мониторят более 320 российских и зарубежных источников и публикуют только главное: релизы, тулзы, гайды, курсы и практические кейсы.
Подписывайтесь, в комьюнити уже 45 тысяч: @vibecoding_tg
За два месяца модель заметно прокачали по бенчам, используя ту же базу K2.5. Количество синтетических тасков на которых тренировали модель увеличили в 25 раз. Это первая модель Cursor, натренированная в датацентрах SpaceXAI, они уже совместно тренируют заметно большую модель, используя в 10 раз больше компьюта. Скорее всего от результатов этой модели и будет зависить приобретёт ли SpaceX Cursor или нет.
С выходом новой модели удвоили стоимость fast mode, который включен по дефолту, теперь он стоит $3/$15 за миллион токенов, что равно стоимости Sonnet. Цена обычного режима не изменилась — $0.5/$2.5.
За последнее время сервера с GPU становится всё сложнее и сложнее арендовать, например прямо сейчас я не смог найти публичного провайдера, у которого можно арендовать даже 8xH100 (ну на васте есть еще пара машин), не говоря уже про кластер побольше. Да и даже одну единственную видеокарту стало сложно ухватить. A100 сейчас стоит дороже чем два года назад, видеокарта, на минуточку, уже почти шесть лет на рынке. На более новые видюхи цена тоже выросла в 1.5-2 раза.
Улучшения ситуации в ближайшее время не предвидится. Неоклауды не видят смысла сдавать GPU в аренду публично или на короткий срок, если всё и так купит антропик. А как вы решаете проблемы с компьютом?