Интуиция робота, или Как научить машину прогнозировать будущее
Команда Cognitive Technologies десять лет назад замахнулась на разработку искусственного разума по человеческому образу и подобию, чтобы создать беспилотный автомобиль. Причем задача была сделать не «как хороший водитель», а лучше самого хорошего водителя, то есть вполне божественного масштаба.
Понимание того, как решить подобную задачу, приходило по мере того, как в команду, изначально состоявшую из математиков и программистов классической школы, вливались нейропсихологи, биологи, физики, нейронщики. В результате с 2014 года мы уже не представляли своей работы без нейронных сетей глубокого обучения, а в 2017 году произошел глобальный прорыв, и в рамках открытия метода Cognitive Low Level Data Fusion стало возможно объединить в единый нейронный организм все разрозненные датчики и системы. И мы поняли: да, мы сделаем ИИ лучше, точнее и безопаснее, чем человек — водитель экспертного уровня.
В этот момент мы вспомнили про Канта и, согласно его представлениям о теории познания, сгруппировали все процессы в две программные команды: «Логика» и «Интуиция». И последняя начала доминировать в системах искусственного разума.
Если разбирать процесс принятия решений, то он намного сложнее видимой конструкции логических построений. В жизни мы часто пользуемся термином «интуиция», подразумевая под этим особенные способности человека. Люди пытаются узреть в этом нечто мистическое, привнесенное извне, но на самом деле это результат работы нейронных систем человеческого организма, основанный на предыдущем опыте, воображении, эмпатии и тому подобном. Ну, а значит, это можно смоделировать.
Изменение угла поворота колеса или бокового зеркала автомобиля говорит о вероятном начале перестроения и дает возможность предоставить системе новые варианты моделирования дорожной сцены
Для робота в транспортном потоке это очень важно. Действительно, опытный водитель интуитивно понимает, что блондинка в соседнем «мерсе», включив правый поворотник, будет перестраиваться налево. Или собирает волю в кулак, сообразив, что сосед слева сейчас рванет в его ряд, не включив поворотник, потому что мама в детстве ему объяснила, что поворотниками пользуются только трусы.
На самом деле вам не Господь об этом на ушко шепнул. Это ваше периферийное зрение заметило изменение угла поворота его бокового зеркала и послало сигнал в мозг, где накапливался соответствующий опыт анализа этого события.
Наша команда Cognitive Pilot год назад открыла проект по созданию искусственной транспортной интуиции — C-Pilot Artificial Intuition. И в начале этого года мы представили мировому сообществу (и это стало одним из хитов CES 2018) первые результаты нашей работы: мы научили программу распознавать не только автомобили в потоке, но и мелкие детали машин, и небольшие объекты, возникающие на дороге, а также изменение угла их отображения. Это дает возможность предсказывать дорожную ситуацию на несколько секунд вперед. Например, определенное изменение угла поворота колеса или бокового зеркала автомобиля говорит о вероятном начале перестроения и дает возможность предоставить системе новые варианты моделирования дорожной сцены.
Такие инновации воспринимаются как чудо, но на самом деле тут нет никакого волшебства, просто серьезная оптимизация нейронных сетей глубокого обучения.
Человек делает огромное количество вещей автоматически, интуитивно, не выстраивая причинно-следственных связей. Мы каждую минуту принимаем сотни решений, не задумываясь над этим, на подсознательных импульсах. А логический аппарат с цепочкой выверенных рассуждений включаем в тот момент, когда нам «надо сесть и подумать» или подучиться, — и это не более 10–15% нашего времени. Таким образом, интуитивное понимание — главный процесс в человеческих системах, и он должен занимать главенствующую позицию и в системах ИИ.
Система берет пространство и отсекает из него все лишнее, постепенно приближаясь к точному подобию искомого объекта. Никакой последовательной логики
В Средние века философия рассматривала знание как благодать, исходящую от Бога, который обнаруживал себя в творении и в откровении. И поэтому схоласты разрабатывали концепцию дедуктивного способа получения знания. Примерно так же и программисты старой школы все свои системы выстраивали на логическом аппарате, где из A следует B и так далее. А Иммануил Кант фактически стал предтечей нейронщиков новой волны XXI века, поставив вопрос о предпосылках знания, то есть о сфере трансцендентального, и отрицая возможность познания мира логическим путем.
Cognitive DNN (нейронные сети глубокого обучения) — это системы, которые мы строим в принципиально новой вычислительной парадигме. Как это работает? Система берет пространство и отсекает из него все лишнее, постепенно приближаясь к точному подобию искомого объекта. Никакой последовательной логики. Если хотите, это натаскивание системы на новый опыт, на формирование «искусственного чутья».
Лев Толстой так описывал создание художником своего шедевра в «Анне Карениной»: «...Он часто слышал это слово "техника" и решительно не понимал, что такое под этим разумели. Он знал, что под этим словом разумели механическую способность писать и рисовать, совершенно независимую от содержания. Часто он замечал, как и в настоящей похвале, что "технику" противополагали внутреннему достоинству, как будто можно было написать хорошо то, что было дурно. Он знал, что надо было много внимания и осторожности для того, чтобы, снимая покров, не повредить самого произведения, и для того, чтобы снять все покровы; но искусства писать, техники тут никакой не было. Если бы малому ребенку или его кухарке также открылось то, что он видел, то и она сумела бы вылущить то, что она видит. А самый опытный и искусный живописец-техник одною механическою способностью не мог бы написать ничего, если бы ему не открылись прежде границы содержания...»
Ольга Ускова — один из спикеров панельной сессии по искусственной интуиции, которая пройдет на форуме «Открытые инновации».