Лучшее за неделю

Русский промпт в поле переменной

Работа с AI-промптами похожа на поход в супермаркет: ты приходишь за вкусом детства — тем самым, «как у бабушки», — а получаешь продукт, рассчитанный на массовый сегмент

Cгенерировано ИИ по заданию автора

Проблема не в том, что AI тебя не слушает. Проблема в том, что не каждый запрос переводится в математическую модель.

Особенно ясно это видно в русском языке. Русский промпт приносит с собой не только объект описания, но и многозначность: способность соединять высокое с низким, космическое с коммунальным, частное с историческим.

Машина обрабатывает этот запрос, усредняет и достраивает. И в этот момент возникает не просто изображение, а культурный сбой.

AI как беседа с зеркалом

Cгенерировано ИИ по заданию автора

Здесь полезен образ из «Соляриса». Океан у Лема и Тарковского не разговаривает с человеком в человеческой логике. Он возвращает человеку его собственную память — пусть и в искаженной форме.

Генеративный AI работает похожим образом. Он отвечает не смыслом, а преломлением: вытаскивает из запроса то, что человек сам не до конца осознает, и возвращает массовую версию понятия.

Именно поэтому ошибка важна. В ней становится видимой граница между личным и массовым. Там, где модель не может напрямую перевести смысл, появляется промежуточный образ: не совсем русский, не совсем глобальный, не совсем правильный — но показательный.

Такой сбой, часто называемый галлюцинацией модели, можно исправлять как дефект. А можно исследовать как симптом данных.

Валерия Титова, нейрохудожница, формулирует это через работу с состояниями: «Модель плохо понимает не слова, а состояния, где нет объекта. Но для меня в этом всегда особый шарм, поскольку я работаю с чувствами, воспоминаниями и другими эфемерными конструкциями. Я бы не назвала это соавторством, как сейчас модно, скорее это игра с латентным пространством».

Промпт как ключ к архиву

Cгенерировано ИИ по заданию автора

Глобальная культура работы с AI часто описывает промпт как способ управлять результатом: нужно точнее задать стиль, композицию, свет, объектив камеры и угол съемки.

Но иногда слова и даже референсы не дают машине ясной визуальной инструкции. Вместе с языком приходится переносить контекст самой жизни — опыт, память и среду, в которой этот образ когда-то имел смысл.

Как уточняет Титова: «Почти невозможно корректно сгенерировать понятия, где важна не картинка, а ощущение: пустота после праздника, тоска, авось и весь этот набор. Но на самом деле так куда интереснее, я думаю дело не в непознаваемой русскости, а в датасетах, которые заточены под конкретные вещи и еще и в западной культуре. Датасеты в российских нейронках обучены абсолютно на том же, иногда их чуть дообучают на культурном коде, но это капля в море».

Русскость как маркер для разметки

Cгенерировано ИИ по заданию автора

Многие модели увереннее справляются с глобальными визуальными клише — футуристическим городом, кинематографичным светом, минималистичным интерьером, киберпанк-улицей, — чем с локальными культурными состояниями.

Декоративная «русскость» — это поверхностная сборка из узнаваемых элементов. Но именно она интересна как симптом: модель показывает, какие визуальные клише уже закреплены в данных, глобальном воображении и массовом представлении о культуре.

Титова проводит здесь точную границу: «Русский культурный код заканчивается там, где образ перестаёт быть опытом и становится сувениром. Берёза, купол, снег, орнамент или советский ковёр сами по себе не проблема. Проблема начинается, когда они стоят в кадре как доказательство «русскости», но между ними нет внутренней связи. Понимаете, это не набор маркеров, а отношения между домом, бедностью, красотой, верой, бытом, трудом, стыдом и нежностью».

Соловьев предлагает другую, но важную для текста оптику: не отменять маркер, а смотреть на его функцию. «Если художник вырос и живет в России, то русский контекст сам собой органично вплетется в его взгляд на мир, в его работы. Локальная проблематика, локальные эмоции, локальный визуальный паттерн — все это притянет уникальные образы и русскость обозначится органично».

Инфраструктура понимания

В 2025 году RusCode предложил бенчмарк для проверки text-to-image моделей на 1250 русскоязычных промптах и 19 категориях русского визуального культурного кода.

В техническом отчете Kandinsky 5.0 представлен Kandinsky RCC dataset: 229 504 видеосцены и 768 555 изображений, сфокусированных на признаках русского культурного кода — вере, языке, исторической памяти, природе, архитектуре, персоналиях и других слоях.

MERA Multi переносит эту логику в мультимодальную оценку: это бенчмарк для русскоязычных моделей, которые работают не только с текстом, но и с изображениями, аудио и видео. В нем 18 задач, созданных с учетом русской языковой и культурной специфики.

Как уточняет Вадим Соловьев, вопрос уже не только в способности нейросети визуализировать русское: «В актуальных моделях я лично не сталкивался с серьезными проблемами визуализации русского культурного кода. Русское, советское, постсоветское — все это нейронки сейчас в целом понимают и рисуют... Сложнее побороть особый «почерк» каждой отдельной генеративной модели».

Но, возможно, когда AI научится полностью считывать культурный контекст, мы снова начнем скучать по несовершенству — по ошибкам, которые давали нам возможность посмотреть на себя со стороны.