Любую 3D-модель теперь можно превратить в интерактивный учебник 🤯
Atlas3D позволяет загрузить 3D-модель и изучать ее с помощью ИИ. Можно кликнуть на любую деталь, узнать, как она работает, а затем даже пройти мини-квиз. Внутри уже есть пара моделек по медицине, инженерии и науке.
Переходим от учёбы к реальной работе — Авито запустил годовой буткемп для DS!
Целый год работы над реальными продуктами и технологиями: рекомендации, ранжирование объявлений, AI-ассистенты! Идеально, чтобы прокачаться до мидла.
Вас ждет:
🟢 Два трека на выбор: классический ML / NLP и LLM;
🟢 Наставники и комьюнити для поддержки на весь год;
🟢 Для лучших участников - возможность присоединиться к команде Авито по итогам стажировки;
🟢 В конце буткемпа техническое интервью на базе матрицы компетенций Авито, чтобы подтвердить уровень middle DS.
🟢 Удалённая или очная работа в одном из 5 офисов Авито.
Дедлайн подачи заявки — 9 июля.
Переходим по ссылке, регистрируемся и прокачиваем скиллы 😎
Fable называют скамом от Амодеи — модель просто отказывается работать!
Так, пользователи жалуются, что модель не выполняет обычные рутинные запросы по кодингу, перенаправляя всё на Opus 4.8 из-за усиленных фильтров кибербезопасности.
Более того, по данным BridgeBench, качество дебага в модели рухнуло с 86 до 26 баллов после перезапуска и этих доп фильтров, а рефакторинг — с 74 до 38.
«Я плачу за токены, которые не создают ценности», — глава Palantir недоволен моделями и ИИ-компаниями.
Алекс Карп считает, что в индустрии «что-то пошло совсем не так»: бигтех платит за токены огромные деньги, кормит их своими данными и при этом не владеют ни моделями, ни вычислениями, ни инфраструктурой. Он назвал всю эту схему «налогом на богатство» — и компании сложившейся расстановкой сил крайне недовольны.
💵 GFusion: как мы обучали диффузионную LLM в GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.
Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.
Почему это интересно?
Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.
В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.
Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.
Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.
Цикл обучения включал:
🔘адаптацию AR-модели к диффузионной генерации;
🔘постепенное увеличение размера блока;
🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM;
🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации.
Результаты:
🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B.
🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%.
🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации.
🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM.
🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
➡️Подробности — в статье на Habr.
➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B
➡️GitVerse
Маководы, вам: забираем Techtool Lite — ваш личный диагностический центр для яблока 👍
Компания Micromat, которая уже больше 30 лет занимается диагностикой маков и их ремонтом, выпустила бесплатную утилиту для быстрой проверки здоровья вашего компьютера. Она смотрит SSD, оперативную память, батарею, чистит системные кэши и многое другое. Есть даже мониторинг локальной сети.