Свяжитесь с моим агентом

Артур Самигуллин Фото: Сергей Козловский

Давайте начнем с базы, потому что понятие агента для большинства людей пока довольно размыто. Что вы под словом «агент» понимаете?

Если по-простому, агент — это система, которая может не просто сгенерировать ответ, а самостоятельно решить задачу. Для этого агент может понять цель, выбрать инструменты, спланировать действия и проверить себя по ходу решения.

То есть агент нужен в сложных многосоставных задачах?

Да, именно. Индустрия любит всё упрощать, но граница здесь довольно понятная. Если речь о чем-то вроде перевода денег маме, то нам не нужен агент, гораздо удобнее нажать на две кнопки. А вот там, где возникает сложный сценарий с множеством шагов, агент уже уместен.

Хороший пример — планирование путешествия. Ты не просто выбираешь билет из Москвы в Петербург. Ты думаешь: хочу зимой улететь из Москвы туда, где есть море, но рядом должен быть город, чтобы не только на пляже лежать. Дальше начинается поиск вариантов, подбор дат по цене, поиск отеля по набору критериев, попытка уложить всё это в бюджет. Ты можешь посмотреть Таиланд, понять, что он не подходит, и вернуться к ОАЭ. Вот в таких задачах, где есть рассуждение, возвраты, много критериев и много действий, агенты действительно будут полезны.

Что агенты уже сейчас умеют делать хорошо?

Я бы разделил агентов на два типа — кстати, применительно к обычным сотрудникам логика этого разделения тоже работает. Первый — workflow-агенты. Это, по сути, агенты внутри заданного процесса. У них понятный алгоритм, понятные правила, от которых нельзя отклоняться. Они сегодня уже активно используются в бизнесе.

Как секретарь.

Именно. Второй тип — более автономные агенты. Это уже ближе к тому, как работает, например, живой разработчик. Ты задаешь ему цель, даешь контекст и ограничения, а дальше он сам, используя знания, инструменты, данные компании и интернета, пытается прийти к результату. Он не прошит жестким сценарием. Но если говорить честно, сегодня агенты живут в довольно узких и хорошо обвязанных сценариях: разобрать входящие сообщения, подготовить черновики писем, суммаризировать встречи, поискать по корпоративным знаниям, маршрутизировать тикеты, заполнить CRM по итогам разговора. Там, где есть четкий процесс и цена ошибки не катастрофическая, они уже очень полезны. По сути, прямо сейчас агенты хороши как операционный слой рядом с человеком. А вот как самостоятельных менеджеров «без поводка» рынок их, мне кажется, пока сильно переоценил.

В будущем их все-таки отпустят с поводка?

Там, где есть понятный, формализованный способ оценить качество результата, работа очень сильно автоматизируется. Человек останется в контуре, но уйдет от ручной операционки. Будет формулировать задачу, а в конце принимать результат.

В Yandex AI Studio есть конструктор агентов. Он на кого рассчитан? Может ли простой человек без специальных знаний собрать себе на коленке помощника?

Платформа в первую очередь рассчитана на тех, кто понимает логику софта. На айтишников. Причем айтишник — не обязательно программист, агентов на платформе можно создавать без навыков кодинга. Но человек должен уметь мыслить такими сущностями, как «источник данных», «триггер», «роли доступа», «ошибка» и так далее. Продвинутые пользователи уже к нам заходят, особенно в сценариях вроде «собери мне ассистента, который анализирует данные», «разбери почту», «ответь на сообщения в мессенджере в таком-то виде», «заполни CRM по итогам звонка». Но это пока точно не массовый потребительский продукт в духе «нажал кнопку — получил сотрудника».

Но вы к этому стремитесь?

К упрощению стремимся, но до известных пределов. Я не верю, что массовая аудитория придет в конструкторы. Массовой аудитории нужны готовые помощники, зашитые в привычные продукты, — например, мы встраиваем так Алису Про в сервисы «Яндекс 360». Если ваша рабочая жизнь проходит в таблицах, значит, логично, чтобы помощник жил прямо в таблице, а не в отдельном приложении. Можно, конечно, загрузить Excel-файл в ChatGPT и попросить его проанализировать, но гораздо естественнее, когда заходишь в сам Excel или Google Sheets и работаешь там. В интерфейс Google Sheets нейросеть Gemini уже встроена.Буквально это я и имею в виду. Поэтому Google постепенно отжимает долю у OpenAI — у них больше привычных точек входа.

То есть ваша борьба идет не столько за конечного пользователя, сколько за бизнесы и продукты, которые встроят ваши решения к себе?

Да. Yandex AI Studio находится не в слое массового потребительского рынка. Мы находимся в слое бизнеса, приложений, стартапов.

Вы сами сегодня какими агентами пользуетесь?

У меня довольно прикладной набор. Я часто пользуюсь Claude, ChatGPT, Алисой AI. Например, у меня есть задача, которую я решаю ежедневно: анализ конкурентов, рыночная сводка, сбор информации из телеграм-каналов, из интернета. Это один пример.

Второй — совсем недавний. Мы буквально вчера собирали для наших сейлзов агента, который при входящей заявке идет в веб, в наши внутренние источники, в партнерские данные и заполняет карточку CRM. Чтобы человек, который идет на встречу с компанией, уже заранее понимал, в каком сегменте она работает, что говорила про ИИ, какие у нее могут быть потребности. И приходил на разговор не с нуля, а с готовой фактурой.

А если это не ваши сейлзы? В Yandex AI Studio можно прийти со стороны и попросить собрать такое решение?

У нас есть партнерская сеть, которая помогает клиентам с прикладными сценариями. Параллельно мы идем в сторону сильного упрощения: в этом году точно придем к тому, чтобы человек мог просто описать задачу, которую хочет решить, а дальше Yandex AI Studio из своих кубиков собирала ему готовое решение. Потом это решение можно править, анализировать качество и развивать.

В моменте мы либо выделяем технических экспертов «Яндекса», которые помогают клиенту собрать свое решение из нашей платформы, либо привлекаем партнеров.

Агенты, которые собираются из вашего конструктора, совместимы с разными нейросетями? Или только с Алисой?

Нам как платформе нужно стремиться к модельной нейтральности. Мир уже мультимодельный и таким, скорее всего, останется. У одной модели лучше код, у другой — цена, у третьей — скорость, у четвертой — условно, более приятная вайбовость ответа.

Но при этом полная переносимость — это скорее мечта, чем реальность. У моделей разные контекстные окна, разная работа с инструментами, разные политики безопасности, разные привычки следования инструкциям. Один и тот же промпт не будет одинаково работать везде.

Поэтому переносимость должна быть не в смысле «всё работает идентично», а в смысле «ядро приложения переносится, а тонкая настройка дорабатывается». Вот к этому мы стремимся. Например, Yandex AI Studio поддерживает OpenAI-совместимые протоколы: можно достаточно легко переезжать с нас на модели OpenAI и наоборот. Дальше уже начинается вопрос качества, а он зависит не только от модели.

Как вы собираетесь конкурировать с глобальными игроками, раз уж мы о них так много говорим? «Яндекс» — крупная компания, но вычислительные мощности OpenAI, Anthropic или Google улетели в космос, и этот разрыв, кажется, невозможно преодолеть…

На одной только модели конкурировать с ними — это точно плохая стратегия. Поэтому у нас ставка на платформу и интеграцию в доступные на рынке сервисы. Платформа — это доступ к разным моделям, включая наши. Это инструменты для агентных сценариев, поиск, распознавание, синтез речи, enterprise-интеграции, безопасность и всё остальное.

Побеждает не тот, у кого красивее демоответ, а тот, кто лучше встроен в работу клиента. Именно в этом, как мне кажется, и начинается наше конкурентное преимущество. Вот очень простой пример: приходит к нам компания и говорит, что хочет «корпоративный ChatGPT». Звучит понятно. Но что стоит за этим на практике?

Сначала надо написать интеграции — к вики, к трекерам, к внутренним системам. Потом надо разобраться с данными: в любой корпоративной базе куча беспорядка, противоречий и мусора. Потом — обеспечить актуализацию: если в документе что-то изменилось, система должна это быстро увидеть и обновить. Потом — построить поиск. Потом — разделить роли и доступы в системе, чтобы сотрудник получал ту информацию, к которой имеет доступ. Потом — система качества, мониторинга, контроля.

Я сейчас перечислил шесть шагов, с каждым из которых можно застрять на месяцы. И в них вообще ни разу не прозвучало слово LLM. Вот в этом и есть пропасть между красивой демкой и продакшен-системой, которой можно пользоваться внутри компании.

Вы какое-то время работали в Т-Банке, сейчас — в «Яндексе», но между этими двумя корпорациями успели сделать свой стартап и продать его. Это сейчас единственно возможный сценарий? Есть ли возможность продолжать развивать собственное дело или с определенного момента надо искать покупателя? Грубо говоря, вы пошли по второму пути, потому что он вам органичнее или потому что никакого выбора не существует?

Будет личный ответ и бизнесовый. Личный таков: пока я был в этой стартап-движухе, понял про себя, что у меня есть потребность делать что-то большое, значимое для рынка, решать действительно крупную задачу. В стартапе делаешь маленькую вещь, пытаешься довести ее до очень хорошего состояния, и это интересно. Но рядом всегда условный «Яндекс» или Google, который на рынок влияет, меняет его. И мне в какой-то момент стало важно быть ближе к этой большой задаче.

По поводу того, что делать, чтобы тебя не съели. На мой взгляд, место на новом рынке ИИ-приложений имеют три стратегии. Стать system of record (система, в которой хранится официальная, актуальная и достоверная версия данных. — Прим. ред.), а не просто интерфейсом — это самая защищенная позиция.

Поясните.

Это место, где живут критичные данные: права доступа, история операций, комплаенс, аудит, финальные статусы. Потому что ИИ может сгенерировать интерфейс и помощника, но заменить доверенную трансакционную систему не так легко. Если ты «источник истины» — поверх тебя будут строиться агенты. Но это ближе к существующим решениям ERP, бухгалтерии, CRM и так далее.

Вторая стратегия — уходить в вертикаль. Горизонтальный SaaS (Software as a Service, «программное обеспечение как услуга». — Прим. ред.) сейчас под ударом, потому что типовые сценарии работы нейросети собирают все лучше и лучше. А вертикальный SaaS защищен сильнее, у него внутри есть сложная доменная логика, отраслевые интеграции, регуляторика, специфичные данные, длинный путь внедрения. Хороший пример — правотех, у которых есть уникальные данные по судебной практике. Либо можно привести в пример HarveyAI.

Наконец, третья стратегия — владеть уникальными данными. Например, уникальной историей действий. По такому пути сейчас идет Higgsfield: они делают не еще одну модель для генерации контента, а весь стек создания контента, потому что иначе они не получат самые важные данные в этом домене. Это их защищает от Google и OpenAI и позволяет решать задачу на порядок лучше.

Скоро агенты станут настолько продвинутыми, что люди переложат на них всю работу, прилягут на диван, наберут лишний вес, разучатся думать и окончательно деградируют. В какой мере вы с этим утверждением согласны?

Я не верю в сценарий, где люди вообще всё переложат на агентов. Но вполне верю, что у огромного числа людей атрофируется навык решать рутину вручную. И это уже происходит.

Простой пример — навигация. Люди не перестали думать из-за GPS, но сильно разучились держать карту в голове. С агентами будет примерно так же: меньше ручной операционки, меньше терпения к повторяемой работе, меньше навыка собирать что-то с нуля без помощника.

Но риски я вижу не в какой-то абстрактной деградации человечества, а в более приземленных вещах. Первое — потеря субъектности, когда человек уже не понимает, что делает система. Второе — рост цены ошибки из-за автоматизации. И третье — новая асимметрия, когда небольшое количество компаний контролирует огромное число цифровых помощников и агентов.

В частности, «Яндекс».

В частности, наверное, да.

Это плохо?

Это не плохо, это специфика рынка, с которой обществу придется работать. Признак того, что технология из игрушки, демоверсии превращается в индустрию.

Потеря субъектности решается просто: не надо строить магический черный ящик вместо человека, надо строить системы, где у человека остается право остановить, проверить и вмешаться. Рост цены ошибки — тоже не аргумент против агентов. Это аргумент за ограничения, аудит и поэтапное внедрение. Что касается концентрации власти в руках нескольких игроков — ситуация не новая: ее будут размывать опенсорс, локальные модели, конкуренция платформ и желание крупных компаний не зависеть от одного поставщика.

Так что вопрос не в том, не слишком ли опасны агенты. Нужно просто построить нормальный слой управления поверх них.

Свяжитесь с моим агентом

Подписывайтесь на наши соцсети:

Читайте также

Фейк под микроскопом: на что смотреть, чтобы распознать подделку, созданную искусственным интеллектом?

Пространство диалога: как искусственный интеллект меняет музеи

Новая норма: искусственный интеллект на работе и дома