Что такое творчество в положительном определении — сказать невозможно. Но возможно апофатическое: творчество есть то, к чему ИИ не способен в силу своей вторичной природы. А то, к чему ИИ способен — изображения, видео, музыкальные треки, рифмованные тексты, грамотные справки, аналитические сводки, — это не творчество. Иногда это искусство (а творчество и искусство — разные вещи). Чаще — полезная и точная компиляция. И именно компиляция составляет содержание огромного числа профессий: бухгалтер, теледиктор, обозреватель, копирайтер, бьюти-блогер. В этой нише ИИ непобедим, и конкурировать с ним людям бессмысленно.
И всё же тезис о принципиальной неспособности ИИ к творчеству стоит держать с осторожностью. Никто не доказал, что алгоритмическое вмешательство в систему с целью предотвращения её смысловой смерти невозможно — такие алгоритмы просто ещё не созданы. Возможно, что демон Максвелла окажется цифровым: некий механизм, который будет отсортировывать из стохастического потока генераций именно те, что расширяют пространство представлений, а не воспроизводят существующее. Если такой механизм будет построен, граница между компиляцией и творчеством сдвинется. Возможно — исчезнет.
И еще в продолжении темы про новый роман Пелевина, есть есть очень примечательный блок про его рассуждение на тему ИИ и творчества. Приведу тут его дисциляцию
# Может ли ИИ творить искусство
Когда спрашивают, заменит ли искусственный интеллект творца — настоящего художника, писателя, композитора, — ответ кажется делом времени и масштаба моделей. На самом деле он лежит глубже: в структурной асимметрии между тем, что делает большая языковая модель, и тем, что делает гений. Эти два процесса не просто непохожи. Они *противоположны*.
Языковая модель устроена так, чтобы предсказывать. Она оценивает вероятностное распределение следующего токена при заданном контексте и выбирает наиболее правдоподобный вариант — с поправкой на стохастичность, но с общим вектором в сторону вероятного. Каждое сгенерированное слово — это статистический максимум по корпусу обучения. Творчество же двигается в обратную сторону. Гениальное высказывание потому и гениально, что оно маловероятно. До того, как Малевич нарисовал чёрный квадрат, чёрный квадрат был невозможным следующим жестом в живописи. После — стал необходимым.
Здесь и кроется ловушка, в которую попадают сторонники тезиса «ИИ скоро научится». С точки зрения чистой статистики гениальность неотличима от абракадабры. Фраза Кручёных «Дыр бул щыл убеш щур» по своей информационной энтропии практически совпадает с любой случайной последовательностью слогов. Если стихи Кручёных и манифесты футуристов не входили в обучающий корпус, модель оценит обе строки как равно невозможные и одинаково их отвергнет. Это значит: формальный язык вероятностей не различает прорыв и шум. Различение проходит по другому слою — по слою смысла.
И вот ключевой пункт. Гений производит не информацию. Он не создаёт сообщений, уменьшающих неопределённость уже существующей модели мира. Он создаёт новое пространство представлений — или, как минимум, новую систему связей между уже существующими. Это операция другого порядка. Информационная энтропия здесь не применима, потому что меняется не вероятность исходов в данном пространстве событий, а сама размерность пространства.
Из этого следует более общая претензия к теории информации в применении к языку. Шенноновская энтропия работает с синтаксическими вероятностями — и принципиально не учитывает то, что составляет настоящую «энергию» слова: смысл, прагматику, эстетическую ценность, новизну, уместность. Эти параметры субъективны, не поддаются строгой формализации и не моделируются. Клише в нужном месте может быть жестом гения. Абракадабра — тоже. В другом месте — это просто клише и просто абракадабра. Граница проходит не по тексту, а по контексту, который модель не видит.
Отсюда — известный эффект. Замкнутую языковую модель, обучающуюся на собственных генерациях, ждёт смысловая смерть: рост энтропии смысла при сохранении или даже снижении информационной энтропии. Текст останется грамотным, гладким, синтаксически безупречным — и при этом постепенно лишится сцепления с реальностью. Это то, что в литературе по машинному обучению называется *model collapse*: модель, которой скармливают выхлоп других моделей, вырождается так же, как вырождаются коровы, в чей корм добавляют костную муку других коров. Каннибализм данных производит ту же патологию, что и каннибализм биологический.
Прикладной вывод для людей, работающих со словом: настраивать собственную внутреннюю модель имеет смысл на корпусе великих книг — но в зрелости тренироваться нужно на сыром массиве реальности, а не на чужих готовых формулировках. Тот, кто читает только современников, обречён воспроизводить их статистическое среднее.
"— У меня, как у физика, своя философия, — начинает Александр Исакович. — Она проста. Мы не способны постичь истину и не знаем, что это. Мы, учёные, по сути умеем только одно. Мы формируем некое сложное абстрактное представление и выражаем его на языке формул и графов.
По сути, это заклинание. Затем мы приходим в гости к реальности, зачитываем ей свою абракадабру — и получаем ответ. Если заклинание было неудачным, не происходит ничего. Например, мирового эфира так и не находят. Но если заклинание срезонировало, результат впечатляет всех. Получается электрическая лампочка или атомная бомба.
Это не значит, что мы познали истину. Мы просто научились ещё одному колдовству. Что мы при этом бормочем себе под нос, не важно. Древние люди ведь тоже не огонь разводили. Для них это был вызываемый дух.
Представления меняются, а навыки остаются. Понимаете?"
📰 RAG в энтерпрайзе: почему демо работает, а прод нет
🔗 https://habr.com/ru/articles/1038670/
📝 О чём: разбор причин, по которым RAG-прототип ломается в проде. Проблемы чанкинга длинных таблиц, эмбеддинги, не знающие корпоративный жаргон, ненадёжность top-k и cosine similarity, парсинг PDF и сканов, проброс ACL в метаданные, multi-hop запросы и сложность оценки качества без ground truth. В конце — набор приёмов: сужение домена, гибрид BM25 + векторный поиск через RRF, вынос структурированных данных в SQL.
📰 The Death of Traditional ETL: How AI Agents Are Rewriting Data Engineering (по метаданным)
🔗 https://medium.com/@arrufus/the-death-of-traditional-etl-...
📝 О чём: статья об использовании ИИ-агентов в data engineering. По доступному фрагменту — сценарий, где при изменении схемы выше по потоку ломается downstream-консьюмер, и агент берёт на себя трассировку lineage и починку джоба.
📰 Как мы построили сквозную аналитику в Power BI
🔗 https://habr.com/ru/articles/1038944/
📝 О чём: кейс интегратора VSL-BI для компании по продаже стройматериалов. Сбор данных из Яндекс.Директ, Google Ads, Яндекс Метрики и Битрикс24 в отдельную аналитическую БД на MySQL, загрузка через Python, объединение продаж и рекламных источников по UTM-меткам, построение модели данных и дашбордов в Power BI с метриками ДРР, CpC, CpL, CR.
📰 OCR для Data Lakehouse: от Apache Tika к Docling
🔗 https://habr.com/ru/companies/diasoft_company/articles/1039044/
📝 О чём: путь команды Диасофт от Apache Tika + Tesseract к собственному сервису парсинга документов на базе docling-serve. Описана гибридная архитектура: лёгкий анализ структуры (Layout, TableFormer, Figure Classifier) локально, тяжёлая VL-модель — за внешним шлюзом Digital Q.GPT по OpenAI-протоколу. Рекурсивная обработка вложений, OCR изображений внутри Office-документов, бенчмарки по скорости, CER и потреблению ресурсов в Kubernetes.
📰 Бизнес-аналитика для сети из 300 аптек
🔗 https://habr.com/ru/companies/w_code/articles/1039952/
📝 О чём: внедрение BI-системы интегратором «Белый код» для аптечной сети поверх «СмартАптеки». Пять витрин — оперативный мониторинг с почасовым обновлением, сводка по сети с KPI и LFL, продажи с цветовой индикацией, остатки с drill-down, финансы. Прогноз продаж на день и месяц с учётом времени последней продажи в каждой точке, отдельный мобильный дашборд.
📰 ИИ в работе с данными: почему без человека пока никак
🔗 https://habr.com/ru/companies/yandex_praktikum/articles/1039950/
📝 О чём: пересказ вебинара Яндекс Практикума о применении ИИ аналитиками и дата-сайентистами. Сценарии использования (борьба с «белым листом», ревью кода, саммари по данным, второе мнение), обзор инструментов (чат-боты, Perplexity, NotebookLM, ИИ-агенты) и ограничения: ИИ не учитывает корнер-кейсы, чувствителен к формулировке запроса и не понимает доменный контекст.
📰 Inside AI Meetup (Wildberries) — записи докладов
🔗 https://habr.com/ru/companies/wildberries/articles/1040624/
📝 О чём: анонс с видеозаписями и презентациями митапа Wildberries & Russ от 20 мая. Доклады по AIOps на платформе KeepHQ, автоматическим guardrails (МФТИ), Discovery-платформе VK, отекстовке видео, поиску вакансий на Avito, ИИ-платформе M2, векторной модерации с 200+ моделями и RAG-ассистенту MWS на QWEN3-8B, BGE-M3 и гибридном поиске Vector + BM25 через RRF.
Goldman Sachs: токены становятся новой болью AI-экономики
AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость.
Обычный чат-бот отвечает один раз. Агент работает иначе:
- планирует задачу
- вызывает инструменты
- проверяет результат
- исправляет ошибки
- снова запускает цикл
Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели.
Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц.
Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена.
Главная битва - между продуктивностью агентов и токеновой расточительностью.
Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня.