Термин родился из комбинации слов «бенчмарк» и «максинг». Он подразумевает чрезмерный упор на достижение высоких показателей ради самих показателей и завирусился в начале августа сразу после релиза gpt-oss и GPT-5 от OpenAI.
Новые модели оценивают с помощью бенчмарков — тестов на навыки нейросетей. Например, как хорошо они генерируют код или насколько чётко следуют просьбам пользователя. В интересах разработчиков обогнать конкурентов по бенчмаркам, поэтому они могут искусственно «бенчмаксить» результаты тестов. Для этого модель оптимизируют для успешного прохождения бенчмарков, однако это не приносит пользы потребителю — почти как зазубрить ЕГЭ на 100 баллов и при этом остаться без понимания предмета.
⭐️ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке
Подписывайтесь 👉 @techno_yandex