tl;dr: RL environments engineer, $50-150/hour, part-time/full-time, remote
У нас тут новые клиенты — нам кажется, идеальные, а вот вы скажите, что думаете!
Смотрите сами:
💫 $16M инвестиций от Andreessen Horowitz и SignalFire;
😍 работают с Anthropic и другими топовыми лабами;
🌼 female-led! Одна фаундерка — ранняя сотрудница Anthropic, вторая — ещё более ранняя из DatologyAI, стартапа про data curation;
🗓 удалёнка с почасовой оплатой и возможностью парттайма;
✨ ищут не одного человека, а сразу несколько — можно наконец и самому податься, и друга посоветовать!
Ну, а главное, как обычно, продукт. Агентные системы типа Codex или Claude Code — во многом подвиг пост-трейн команд. Они запихивают чатового агента в сложный скаффолд, и вдалбливают в него все особенности работы в этой среде, пока он сопротивляется — ревард-хакает, галлюцинирует и в целом делает всё, чтобы от него отстали ☹️
Preference Model делают RL-окружения, где агенты учатся всяким сложным штукам, а потом начинают работать в реальных скаффолдах лучше и сопротивляться поменьше 👾
И хотят больше новых сред от экспертов — поэтому ищут RL Environments Engineer'ов: людей, которые разбираются в чём-то сложном и ML-related.
Вакансия похожа на сэндвич, который вы собираете сами. Для начала выберите главный ингредиент.
Вам понадобится что-нибудь из списка ниже (не всё сразу!):
🥦 публикации по теме;
или инженерный опыт в чём-нибудь из следующего:
🍖 внутренности трансформеров;
🐟 CUDA или Pallas kernel-разработка;
🦐 ML-архитектуры и генеративные модели (тут все от KAN до диффузионок);
🥚 geometric/topological DL, optimal transport;
🧀 mechanistic interpretability;
🥑 ML в науке и численные методы (от биоинформатики до fluid dynamics);
Дальше — основа:
🍞 опыт разработки на Python + Docker;
🍅 хорошее понимание, что умеют и не умеют нынешние LLM;
🍞 английский C1+.
Заправьте форматом работы на ваш вкус: от 3 месяцев до бесконечности и от 20 часов в неделю до фуллтайма 🥫
Платят $50-150/час в зависимости от опыта и специализации. Полная удалёнка, нужно только пересекаться с PST-таймзоной хотя бы часа на 4. Если понравитесь команде, есть возможность перейти в штат и обсудить переезд в SF.
Пишите Феде @owlkov 🍴
👎
92
❤
67
🌭
40
👍
15
🔥
7
😁
6
🤷♀
3