Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LXXIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 17 января 2019 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Епифанов В.Н. РАСПОЗНАВАНИЕ РЕЧИ В АВТОМОБИЛЬНОЙ СРЕДЕ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LXXIII междунар. студ. науч.-практ. конф. № 1(72). URL: https://sibac.info/archive/technic/1(72).pdf (дата обращения: 29.03.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

РАСПОЗНАВАНИЕ РЕЧИ В АВТОМОБИЛЬНОЙ СРЕДЕ

Епифанов Владимир Николаевич

магистрант кафедры управления в технических системах СПб ГУАП,

РФ, г. Санкт-Петербург

Статистика показывает, что молодые водители во время вождения используют мобильные устройства без аксессуаров (наушники, блютуз гарнитура). Это в свою очередь влияет на их восприятие дорожного движения.

Наличие вычислительной мощности компьютера и сетевого подключения в автомобилях и мобильных устройств привело к использованию доступных приложений и сервисов для пользователей. Одним из возможных способов работы с мобильным устройством во время движения является использование функции распознавания речи.

Автомобильная среда является одной из самых сложных сред для распознавания речи. В таких случаях важно уменьшить визуальное и физическое взаимодействие водителя из - за потенциальных помех, таких как пассажиры автомобиля и их разговор, фоновая музыка или подобные фоновые шумы (ветер, звук стеклоочистителей и т.д.). По этим и аналогичным причинам производители автомобилей и оборудования инвестируют в улучшение и оптимизацию приложений для распознавания речи, адаптированных к конкретной среде автомобиля. Учитывая вышесказанное, установлены высококачественные микрофоны в автомобиле, а также технология, позволяющая снизить уровень шума. Применения улучшаются, используя акустическую окружающую среду, которая специфически для окружающей среды автомобиля.

Речь является одной из естественных возможностей взаимодействия человека с машиной. Возможности распознавания речи все больше развиваются и используются в автомобильной промышленности. Вышесказанное неудивительно, учитывая, что конкурентоспособность на рынке современных автомобилей во многом зависит от их технических особенностей и инноваций.

Таким образом, развитие распознавания речи в автомобильной промышленности основывается на следующих областях:

  • голосовые указания;
  • использование навигационных систем
  • взаимодействие бортовой системы автомобиля (включение радио, вкл/выкл кондиционера и т.д.).

Умные устройства становятся все более популярными с развитием сегмента оборудования, а также новых функций, которые являются результатом использования все большего числа датчиков. Одним из важных применений смартфонов является возможность распознавания речи и обработки этой информации/команд.

Разработка приложений для современных смартфонов имеет большой потенциал. В связи со спецификой отдельных мобильных операционных систем разрабатываются разнообразные приложения, позволяющие в той или иной степени реализовать хотя бы часть функций распознавания речи. Целью этих решений является разработка программного решения, которое сможет использовать человеческую речь.

Транснациональные компании, такие как Apple и Google, признали важность таких приложений и одними из первых предложили комплексные решения. Применение Siri в данном случае являлось фундаментальным подходом к поставленной задаче. Она была предложена для большого количества пользователей по всему миру [1].

Возможности применения распознавания речи с помощью мобильных терминальных устройств могут быть разнообразными, при этом наиболее важные варианты использования приведены на рисунке 1. Указанные варианты использования могут быть выполнены в любом из двух режимов, независимо от того, работает ли распознавание речи непосредственно на терминальном устройстве или выполняется на сервере [2].

 

Рисунок 1. Наиболее распространенные случаи использования приложения распознавания речи в автомобиле

 

Рисунок 1 дает представление о возможных сценариях использования смартфонов в автомобиле при помощи речи. Учитывая вышесказанное, можно выделить следующие важнейшие характеристики и возможности использования смартфонов:

  • голосовой поиск - поиск информации, хранящейся на мобильном устройстве;
  • голосовой вызов;
  • интернет поиск необходимой информации с помощью голосовых команд в браузере мобильного устройства;
  • преобразование голоса в текст;
  • воспроизведение голоса - возможность прослушать полученное в текстовом формате сообщение, при этом сообщение автоматически воспроизводится с помощью голоса
  • поиск сообщений – возможность использования голоса при поиске информации в определенных сообщений (SMS-сообщений, напоминаний, календаря, сообщений электронной почты);
  • календарь / напоминания - добавление / удаление / редактирование заметок и обязательств, связанных с календарем мобильного устройства, с помощью голоса
  • прослушивание прогноза погоды;
  • доступ к мультимедиа – устройство, которое обеспечивает воспроизведение мультимедийных данных (видео-файлы, музыкальные файлы, фотогалерея и т. д.) [3].

Современные системы голосового управления успешно справляются с разговорным языком, различными диалектами, альтернативными формулировками, индивидуальными особенностями произношения и быстротой речи. Для повышения качества распознавания команд используется фильтр шумов, отсекающий ненужные звуки [4].

 

Список литературы:

  1. Материал с сайта «INC». Раздел «Who's Smartest: Alexa, Siri, and or Google Now?» [Электронный ресурс]. URL: https://www.inc.com/kevin-j-ryan/internet-trends-7-most-accurate-word-recognition-platforms.html (дата обращения: 7.10.2018).
  2. Материал с сайта «Globalme». Раздел «Speech Recognition Technology Overview» [Электронный ресурс]. URL: https://www.globalme.net/blog/the-present-future-of-speech-recognition (дата обращения: 30.10.2018).
  3. Материал с сайта «Globalme». Раздел «Speech Recognition Technology Overview» [Электронный ресурс]. URL: https://www.globalme.net/blog/the-present-future-of-speech-recognition (дата обращения: 30.10.2018).
  4. Материал с сайта «Systemsauto». Раздел «Система голосового управления» [Электронный ресурс]. URL: http://systemsauto.ru/another/voice-control-system.html (дата обращения: 17.12.2018).
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.