Статья опубликована в рамках: Научного журнала «Студенческий» № 39(83)
Рубрика журнала: Технические науки
Секция: Технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7
УПРАВЛЕНИЯ РОБОТОМ С ПОМОЩЬЮ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ
Обучение с подкреплением – это метод автономного обучения интеллектуальных роботов. Обучение с подкреплением должно рассматривать обучение как процесс проб и ошибок оценки и самокоррекции. Этот процесс подобен человеческим пробам и ошибкам. Когда люди не знают, как работать лучше, во многих случаях они выбирают метод операции для достижения наилучшего эффекта путем оценки своего и меняют поведение, если хотят улучшить результат.
В настоящее время на международном уровне предложено несколько различных теорий и методов обучения поведению интеллектуальных роботов. Например, предложены Брукс, обучение с подкреплением и эволюционные алгоритмы, основанные на поведенческой робототехнике. Чтобы понять процесс моделирования метода обучения с подкреплением, чтобы интеллектуальные роботы могли производить автономное поведение, мы должны сначала понять концепции и принципы метода обучения с подкреплением.
Во всем мире технология робототехники привлекла большое внимание со всех стран с точки зрения содействия развитию интеллектуального производственного оборудования, развития ресурсов и будущей индустрии робототехники. В этой тенденции производительность роботов постоянно улучшается и постоянно развивается в направлении интеллектуализации, стандартизации и сетевого взаимодействия. Технология управления роботом, как основное направление исследований, очень популярна для проектирования новых систем. Систему управления роботом можно разделить на открытый тип и закрытый тип. С момента рождения роботов большинство систем управления были закрытого типа. Однако с усложнением поставленных задач ограничения замкнутой системы становятся все более очевидными, поэтому проектирование и разработка открытой системы управления является актуальной тенденцией.
Глубокое обучение с подкреплением является новой точкой исследования в области искусственного интеллекта. Оно сочетает в себе способность восприятия углубленного обучения со способностью принятия решений обучения подкреплению в общей форме и может реализовать прямой контроль от исходного ввода до вывода через сквозное обучение. С тех пор, как оно было предложено, во многих задачах, требующих восприятия многомерных исходных данных и контроля принятия решений, и метод углубленного обучения подкреплению сделал существенные прорывы. Описаны три основных вида методов глубокого обучения с подкреплением, в том числе глубокое обучение с подкреплением на основе ценностной функции на основе градиента стратегии и на основе поиска и наблюдения. Также обобщены некоторые пограничные направления исследований в области глубокого обучения с подкреплением, в том числе иерархическое глубокое обучение, многозадачное миграционное глубокое обучение и мультиагентное глубокое обучение. В конце концов, успешное применение и будущая тенденция развития глубокого обучения с подкреплением в нескольких областях суммируются.
В последние годы применение роботов становится все более и более обширным. Однако реальная среда динамична и полна неопределенности. Для того, чтобы использование роботов стало повсеместным, роботы должны обладать высоким интеллектом. Основная работа и инновации включают детальный анализ текущего состояния исследований технологии управления мобильными роботами в мире. В результате исследования мобильных роботов предложена стратегия управления мобильным роботом, основанная на обучении с подкреплением, которая объединяет алгоритм обучения Q с нейронной сетью BP. Используют метод искусственного потенциального поля для определения значения функции усиления, а затем реализуют предотвращение препятствий мобильных роботов в неопределенной среде и в конечном итоге контролируют мобильных роботов для достижения целей. Разработан интерфейс удаленного мониторинга мобильного робота. Через дистанционный контроль роботов, мы можем контролировать движение мобильных роботов в окружающей среде в реальном масштабе времени, для избегания столкновения. Подробно анализируется состояние исследований технологии визуальной навигации для мобильных роботов. Для получения информации в более широком поле зрения и ее слияния с информацией, полученной датчиками расстояния, для управления действиями робота применяется динамический прибор наблюдения с качкой и качанием. Через карту сбора изображений собранные изображения обрабатываются, и, наконец, осуществляется сопоставление изображений. Visual C++ в основном используется для реализации различных алгоритмов обработки изображений.
Исследования роботических систем и координации мульти-роботов превратились в динамичное и перспективное направление исследований в области робототехники. Большое теоретическое и практическое значение имеет изучение основных теорий архитектуры мультироботных систем и координации и взаимодействия мультироботных систем. Наконец, проводится моделирование и эксперименты, а также анализируются результаты экспериментов. Итоги показывают, что результаты исследований позволяют эффективно осуществлять поиск и отслеживание объектов таргетинга в неизвестных средах мобильных роботов.
Список литературы:
- [Электронный ресурс]. – Режим доступа: https://habr.com/ru/post/437020/ (дата обращения 18.10.2019)
- [Электронный ресурс]. – Режим доступа: http://www.rroij.com/open-access/android-based-humanrobot-interaction-system-for-localisation.php?aid=86967 (дата обращения 20.10.2019)
Оставить комментарий