«Яндекс» научил систему распознавания речи отвечать людям

Компания «Яндекс» усовершенствовала систему распознавания речи Yandex SpeechKit, научив ее включаться по голосовой команде, понимать смысл слов, а также отвечать пользователю. Новые технологии представили в четверг, 30 октября, на технологической конференции Yet another Conference в Москве

«Сегодня мы дополнили SpeechKit тремя новыми технологиями, которые делают общение человека с компьютером более полноценным», — сообщается в блоге «Яндекса».

Голосовое включение планируется использовать в любых приложениях, применяющих технологию SpeechKit (всего их около 500). Командой включения может стать любая фраза. «Все зависит от фантазии разработчика», — говорят в компании. Авторы системы утверждают, что для включения не понадобится использовать кнопки.

Также систему научили распознавать в речи смысловые объекты. Например, SpeechKit понимает, что во фразе «Набери Владимира» речь идет о человека, а во фразе «Поехали во Владимир» — о городе. Также система знает синонимы и не спутает «Набери номер Ивана Ивановича» и «Позвони Ивану Ивановичу».

Также в SpeechKit появилась технология синтеза речи, которая позволяет компьютеру проговаривать текст вслух. «Акустическая модель принимает на вход последовательность фонем и выдает на выходе соответствующий им звук, — объяснили в "Яндексе". — Это позволяет добиться более плавных интонаций, гибко управлять скоростью речи и даже придавать ей те или иные эмоции». В блоге «Яндекса» опубликована 16-секундная аудиозапись, в которой технология синтеза речи представляет саму себя.

Первым приложением с новыми технологиями стала «Яндекс.Диктовка», пока что доступная в Яндекс.Store (позже приложение добавят в App Store и Google Play). Программа предназначена для набора текста голосом. Чтобы ее включить нужно произнести команду «Яндекс, записывай». Для управления существует несколько команд: «Удали последнее слово», «Начни с новой строки», «Выдели весь текст», «Добавь веселый смайлик», а также «Прочитай все». Готовый текст при помощи голоса можно сохранить как заметку, а также отправить письмом или по смс. В «Яндексе» подчеркнули, что это тестовое приложение.