Сегодня фокус внимания широкой публики и части инвесторов сосредоточен на LLM, не привело ли это к тому, что другие разделы данной технологии останутся недоинвестированными?
Да, действительно, внимание комьюнити в основном сфокусировано на прогрессе в LLM (large language model — большая языковая модель, алгоритм, лежащий в основе генеративного разговорного ИИ) сегменте. Почти каждую неделю появляются новости и статьи, где авторы тестируют и сравнивают производительность новых версий GPT, iLlama, Claude, Gemini. На самом деле специалистов интересует не только LLM, а скорее более широкий спектр ИИ, к примеру GenAI, который помимо текста способен генерировать изображения и видео. Такие технологии помогают в решении рутинных задач, обучении, создании идей для бизнеса и других проектов. С помощью GenAI процесс поиска и консолидации информации стал намного быстрее.
Хотя в последние годы основное внимание инвесторов сосредоточено на генеративном ИИ (GenAI), другие направления, такие как причинно-следственный ИИ (Causal AI) и ИИ для робототехники (AI for Robotics), также продолжают активно развиваться и привлекать значительные инвестиции.
В том, что касается вашей компетенции, какие технологии в области ИИ вы бы назвали наиболее перспективными на данный момент?
Мой персональный опыт связан с использованием компьютерного зрения в таких направлениях, как определение и классификация объектов, распознание биометрических параметров. Эти треки связаны с автономным транспортом, безопасностью, контролем доступа, маркетингом и ритейлом, умными городами. Самое широкое распространение технологии компьютерного зрения получили в Китае — их развивают такие компании, как Hikvision, SenseTime. В других странах потенциал пока не раскрыт, и перед исследователями здесь открыты самые широкие возможности. Ожидается, что мировой рынок ИИ в сфере компьютерного зрения вырастет с 23,42 млрд долл. в 2025 году до 63,48 млрд долл. в 2030 году, то есть почти втрое! Компьютерное зрение перспективнее всего в качестве одного из главных решений, которое дополняется другими ИИ-технологиями. Это автономный транспорт, Edge AI (периферийный искусственный интеллект) — модели для работы на устройствах с ограниченными ресурсами, компьютерное зрение в здравоохранении, причинно-следственный ИИ (Casual AI), робототехника. Все эти направления способны привнести значительные позитивные изменения в нашу повседневную жизнь.

Что может стать следующей «большой историей», которая существенно поменяет ситуацию в экономике и социальной сфере?
Главными героями такой истории могут стать персонализированные ИИ-агенты. Это цифровые помощники, способные адаптироваться под индивидуального пользователя, самостоятельно обучаться в процессе взаимодействия и действовать автономно в рамках поставленных задач. В отличие от нынешних голосовых ассистентов, такие агенты могут выступать полноценными помощниками пользователя в цифровом пространстве: бронировать услуги, вести переговоры, составлять отчеты, помогать в программировании и даже управлять финансовыми делами. Например, Devin от компании Cognition — ИИ-агент, выступающий инженером-программистом, который умеет генерировать код программы, исправлять баги, управлять репозиториями.
Еще одной стратегической областью для развития ИИ является медицина, особенно по двум направлениям. Первое — диагностика: системы Aidoc, Zebra Medical Vision и Qure.ai используют ИИ для анализа рентгеновских снимков, томографии и МРТ, сокращая время постановки диагноза и повышая его точность.
Второе направление — фармакология и биология: модели по типу AlphaFold от DeepMind и разработки Isomorphic Labs открыли путь к детальному предсказанию структуры белков и моделированию взаимодействий разных лекарств. В перспективе это может существенно ускорить и удешевить разработку новых препаратов.
Аналитики называют беспилотный транспорт одним из ключевых драйверов развития ИИ. Что происходит в этом секторе? Нет ли ощущения некоторого застоя? Новых проектов автономного транспорта не появляется, как и новостей на тему в целом.
Здесь стоит согласиться: индустрия достигла некого плато. Роботизированный транспорт по-прежнему демонстрирует успешные результаты. К примеру, Waymo уже запустила коммерческое роботакси в Финиксе и Сан-Франциско. Tesla продолжает развивать Full Self Driving — полностью автономный режим вождения автомобиля. Однако на качественно новый уровень беспилотный транспорт пока так и не вышел. Полагаю, что основная причина застоя не столько в самом AI, сколько в недостаточно развитой инфраструктуре, слабом регулировании отрасли и отсутствии массового тестирования. Поясню на конкретном примере: ИИ научился справляться с типичными ситуациями, но в реальной жизни слишком много непредсказуемых моментов: на дорогу неожиданно выскакивает ребенок, случается авария, начинаются дорожные работы, перед транспортным средством внезапно появляется яма, лужа или непонятный дорожный знак. Все эти нюансы нужно «зашить» в алгоритмы машины, научить ее правильно на них реагировать.
Для безаварийного движения беспилотного транспорта также нужна совершенная инфраструктура: дороги с идеальной разметкой, легко читаемые дорожные знаки, постоянная устойчивая связь с интернетом и спутниками. Здесь не обойтись и без полноценного тестирования на миллионах километров трасс в самых разных условиях — в снег, дождь, при слабой видимости, при плохом качестве дорожного полотна. Это займет немало времени и средств.
Еще одно немаловажное препятствие связано с юридической стороной дела и ответственностью: кто получит срок и сядет в тюрьму в случае аварии с летальным исходом? Производитель, владелец, программист?
Насколько сейчас, с вашей точки зрения, перспективен рынок БПЛА в гражданском секторе? Возможно ли, что популярность этой технологии в проектах двойного назначения придаст динамику рынку в целом?
Рынок БПЛА (дронов) в гражданском секторе растет, особенно в сельском хозяйстве. К примеру, успешно реализуется проект DJI Agras T40 для распыления удобрений. Беспилотники, например Skydio, также находят отличное применение в инспекции инфраструктуры — линий электропередачи и мостов. В логистике реализуются проекты Amazon Prime Air и Zipline (в Африке и США).
Проекты двойного назначения действительно стимулируют разработку и удешевление технологий, как это было, например, с дронами Bayraktar или FPV-дронами, которые успешно модифицируют под гражданские нужды. Для решения большинства задач БПЛА все еще нуждаются в операторе. Большие перспективы в этой сфере связаны с комбинированием БПЛА и персонализированных агентов ИИ, чтобы дроны могли выполнять свои задачи полностью автономно, без участия человека.
Если говорить об «умном» видеонаблюдении, что происходит в этой сфере? Насколько активно развивается эта технология, есть ли новые стоящие внимания проекты или кейсы?
Здесь я бы выделил развитие прикладных направлений умного видеонаблюдения, направленных на совершенствование самой технологии и рост производительности. Первое — это централизация и масштабирование видеонаблюдения. Министерство цифрового развития России планирует запустить в 2025 году сервис интеллектуальной обработки видеопотоков с использованием ИИ, включая компьютерное зрение. Проект объединит видеоданные с региональных и городских систем в единую платформу, что позволит оперативно реагировать на чрезвычайные ситуации и обеспечивать безопасность.
Второе направление — периферийный искусственный интеллект (Edge AI). Это оптимизация компьютерного зрения для запуска на самих камерах видеонаблюдения либо на edge-серверах в непосредственной близости к камерам видеонаблюдения. Технология позволяет уменьшить нагрузку на сеть при передаче видеопотоков для обработки компьютерным зрением, а также ускорить получение и передачу метаинформации от компьютерного зрения в облако.
Из интересных кейсов можно назвать сотрудничество компаний IREX.ai и Visium Technologies для внедрения своей платформы в городе Мирафлорес (Перу), что стало первой полноценной инициативой умного города в стране. Синергия включала внедрение концепции «Этичного многослойного интеллекта» (ELITM), объединяющего возможности ИИ от IREX с технологией TruContext от Visium для повышения уровня общественной безопасности, включая мероприятия по поиску пропавших детей.
В промышленности большинство крупных предприятий уже внедрили проекты на основе компьютерного зрения. Есть ли понимание, куда эта технология в сфере промышленности будет развиваться дальше?
В промышленном производстве очень важно снижение затрат, рост качества производства, повышение безопасности сотрудников. Наиболее перспективным направлением становится объединение компьютерного зрения с промышленной робототехникой и ИИ-системами управления.
Это означает переход от «слепых» роботов к роботам, «видящим» и принимающим решения на основе ИИ. Они способны самостоятельно ориентироваться в пространстве, подстраиваясь под меняющуюся обстановку, могут выполнять сложные действия с объектами разной формы, цвета и положения — например, сортировать нестандартные детали или упаковку. В рамках предиктивного обслуживания такие помощники с компьютерным зрением могут отслеживать износ оборудования или утечки, предсказывая поломки до их наступления.
Бизнес-значение такого подхода в гибкости настроек производства: он позволяет снижать зависимость от жесткой конвейерной логики, уменьшает затраты на перенастройку линий при смене продукта, ускоряет выход новых продуктов на рынок за счет быстрой адаптации оборудования, а главное — дает возможность вести производство круглосуточно и автономно, без постоянного присутствия человека.
Большинство технологий, связанных с ИИ, достаточно дороги: GPU, сервера, кастомные разработки, дообучение нейросетей. Когда эти решения могут добраться до малого и среднего бизнеса и нужно ли это вообще?
На мой взгляд, ИИ уже внедряются в малый и средний бизнес — и, что важно, в удобной и доступной форме. Благодаря облачным платформам, таким как Amazon Bedrock и Microsoft Copilot Studio, даже небольшие компании уже сегодня могут использовать ИИ без крупных инвестиций в инфраструктуру. Появились компактные модели вроде LLaMA 3 и Mistral, которые можно запускать локально, а SaaS-продукты — от Notion и Grammarly до QuickBooks — уже стали частью повседневной работы. Все это дает жизнь массе практических кейсов: кафе используют ИИ для анализа отзывов и генерации меню, маркетологи — для создания контента и тестирования лендингов, а интернет-магазины — для автогенерации описаний товаров и ведения чатов с клиентами.
Даже в таких сферах, как логистика, HR и юриспруденция, появляются профильные, узкие, но мощные инструменты, которые автоматизируют рутинные процессы и экономят время. Главное — не просто внедрить ИИ ради галочки, а найти конкретную бизнес-задачу, которую он может решить лучше, быстрее или дешевле, чем человек.
Что нового и интересного происходит в теоретической науке, связанной с ИИ, появляются ли какие-то новые концепции, подходы, типы алгоритмов?
Теоретическая наука в области ИИ развивается так быстро и интересно, что заслуживает отдельного большого разговора. Я бы выделил несколько направлений, которые лично мне кажутся самыми перспективными. Во-первых, архитектуры с внутренними мировыми моделями и планированием — так называемые World Models & Planning-Centric Architectures. Это системы, которые не просто предсказывают следующее слово или изображение, а формируют внутри себя структурированное представление мира и используют его для осмысленного планирования дальнейших действий. Это еще больше приближает ИИ к человеческому мышлению: сначала понять — потом действовать. Удачные примеры таких подходов — проекты Voyager (самообучающийся агент в Minecraft), GFlowNets. Эти модели — основа будущих автономных ИИ-агентов с памятью, адаптацией и способностью самостоятельно ставить себе цели.
Второе важное направление — Causal AI, или причинный ИИ. Сегодня большинство нейросетей просто фиксируют корреляции, но не могут ответить на вопрос: «Что произойдет, если мы что-то изменим?» Причинно-следственное мышление критически важно для таких областей, как медицина, логистика и экономика. Здесь ведутся серьезные теоретические разработки, во многом опирающиеся на работы Джудеи Перла (Judea Pearl) и Элиаса Барейнбойма (Elias Bareinboim). Они закладывают фундамент для более устойчивого и объяснимого ИИ, способного обобщать информацию за пределами обучающих данных.
И, наконец, третий тренд — это разреженные и модульные архитектуры. Вместо того чтобы запускать огромную модель целиком, ИИ теперь может выбирать и активировать только те блоки, которые реально нужны под конкретную задачу. Это делает процесс не только более экономичным, но и более управляемым и прозрачным. Наглядные примеры — Pathways от Google, Sparse LLaMA, Mixture-of-Experts, Liquid Neural Networks. Такие архитектуры могут стать основой более гибкого, «умного» по своей структуре ИИ.