Статья опубликована в рамках: Научного журнала «Студенческий» № 39(83)

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7

Библиографическое описание:

Пазухина А.П., Дроздова В.В. УПРАВЛЕНИЯ РОБОТОМ С ПОМОЩЬЮ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ // Студенческий: электрон. научн. журн. 2019. № 39(83). URL: https://sibac.info/journal/student/83/160220 (дата обращения: 04.08.2025).

УПРАВЛЕНИЯ РОБОТОМ С ПОМОЩЬЮ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ

Пазухина Анастасия Павловна

студент, кафедра «Защита информации», Институт комплексной безопасности и специального приборостроения, Российский Технологический Университет,

РФ, г. Москва

Дроздова Владлена Владимировна

РФ, г. Москва

Обучение с подкреплением – это метод автономного обучения интеллектуальных роботов. Обучение с подкреплением должно рассматривать обучение как процесс проб и ошибок оценки и самокоррекции. Этот процесс подобен человеческим пробам и ошибкам. Когда люди не знают, как работать лучше, во многих случаях они выбирают метод операции для достижения наилучшего эффекта путем оценки своего и меняют поведение, если хотят улучшить результат.

В настоящее время на международном уровне предложено несколько различных теорий и методов обучения поведению интеллектуальных роботов. Например, предложены Брукс, обучение с подкреплением и эволюционные алгоритмы, основанные на поведенческой робототехнике. Чтобы понять процесс моделирования метода обучения с подкреплением, чтобы интеллектуальные роботы могли производить автономное поведение, мы должны сначала понять концепции и принципы метода обучения с подкреплением.

Во всем мире технология робототехники привлекла большое внимание со всех стран с точки зрения содействия развитию интеллектуального производственного оборудования, развития ресурсов и будущей индустрии робототехники. В этой тенденции производительность роботов постоянно улучшается и постоянно развивается в направлении интеллектуализации, стандартизации и сетевого взаимодействия. Технология управления роботом, как основное направление исследований, очень популярна для проектирования новых систем. Систему управления роботом можно разделить на открытый тип и закрытый тип. С момента рождения роботов большинство систем управления были закрытого типа. Однако с усложнением поставленных задач ограничения замкнутой системы становятся все более очевидными, поэтому проектирование и разработка открытой системы управления является актуальной тенденцией.

Глубокое обучение с подкреплением является новой точкой исследования в области искусственного интеллекта. Оно сочетает в себе способность восприятия углубленного обучения со способностью принятия решений обучения подкреплению в общей форме и может реализовать прямой контроль от исходного ввода до вывода через сквозное обучение. С тех пор, как оно было предложено, во многих задачах, требующих восприятия многомерных исходных данных и контроля принятия решений, и метод углубленного обучения подкреплению сделал существенные прорывы. Описаны три основных вида методов глубокого обучения с подкреплением, в том числе глубокое обучение с подкреплением на основе ценностной функции на основе градиента стратегии и на основе поиска и наблюдения. Также обобщены некоторые пограничные направления исследований в области глубокого обучения с подкреплением, в том числе иерархическое глубокое обучение, многозадачное миграционное глубокое обучение и мультиагентное глубокое обучение. В конце концов, успешное применение и будущая тенденция развития глубокого обучения с подкреплением в нескольких областях суммируются.

В последние годы применение роботов становится все более и более обширным. Однако реальная среда динамична и полна неопределенности. Для того, чтобы использование роботов стало повсеместным, роботы должны обладать высоким интеллектом. Основная работа и инновации включают детальный анализ текущего состояния исследований технологии управления мобильными роботами в мире. В результате исследования мобильных роботов предложена стратегия управления мобильным роботом, основанная на обучении с подкреплением, которая объединяет алгоритм обучения Q с нейронной сетью BP. Используют метод искусственного потенциального поля для определения значения функции усиления, а затем реализуют предотвращение препятствий мобильных роботов в неопределенной среде и в конечном итоге контролируют мобильных роботов для достижения целей. Разработан интерфейс удаленного мониторинга мобильного робота. Через дистанционный контроль роботов, мы можем контролировать движение мобильных роботов в окружающей среде в реальном масштабе времени, для избегания столкновения. Подробно анализируется состояние исследований технологии визуальной навигации для мобильных роботов. Для получения информации в более широком поле зрения и ее слияния с информацией, полученной датчиками расстояния, для управления действиями робота применяется динамический прибор наблюдения с качкой и качанием. Через карту сбора изображений собранные изображения обрабатываются, и, наконец, осуществляется сопоставление изображений. Visual C++ в основном используется для реализации различных алгоритмов обработки изображений.

Исследования роботических систем и координации мульти-роботов превратились в динамичное и перспективное направление исследований в области робототехники. Большое теоретическое и практическое значение имеет изучение основных теорий архитектуры мультироботных систем и координации и взаимодействия мультироботных систем. Наконец, проводится моделирование и эксперименты, а также анализируются результаты экспериментов. Итоги показывают, что результаты исследований позволяют эффективно осуществлять поиск и отслеживание объектов таргетинга в неизвестных средах мобильных роботов.

Список литературы:

[Электронный ресурс]. – Режим доступа: https://habr.com/ru/post/437020/ (дата обращения 18.10.2019)
[Электронный ресурс]. – Режим доступа: http://www.rroij.com/open-access/android-based-humanrobot-interaction-system-for-localisation.php?aid=86967 (дата обращения 20.10.2019)

УПРАВЛЕНИЯ РОБОТОМ С ПОМОЩЬЮ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ

Оставить комментарий