Статья опубликована в рамках: XII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ЭКОНОМИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 08 октября 2013 г.)
Наука: Экономика
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
отправлен участнику
ЗАДАЧА ОПТИМАЛЬНОГО ИМПУЛЬСНОГО УПРАВЛЕНИЯ В МОДЕЛИ ФИРМЫ С ОБУЧЕНИЕМ РАБОТНИКОВ НОВОЙ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ
Адушинова Наталья Александровна
студент 5 курса, кафедра методов оптимизации ФГБОУ ВПО «ИГУ», Институт математики, экономики и информатики, г. Иркутск
E-mail: actualis@bk.ru
Самсонюк Ольга Николаевна,
научный руководитель. канд. ф.-м. наук, доцент, ФГБОУ ВПО «ИГУ», Институт математики, экономики и информатики, г. Иркутск
Работа выполнена при частичной финансовой поддержке ФЦП «Научные и научно-педагогические кадры инновационной России», соглашение 8211 от 06.08.2012.
1. Введение
В статье рассматривается частный вариант модели фирмы, выпуск продукции которой зависит от уровня освоения её работниками новой производственной технологии. Предполагается, что обучение работников происходит как вследствие их контакта с уже обученными, так и при целенаправленных действиях со стороны руководства фирмы, допускающих обучение с высокой интенсивностью в течение кратких промежутков времени (например, краткосрочные курсы повышения квалификации). Последнее приводит к быстрому, почти скачкообразному, увеличению количества работников, владеющих инновациями. В статье исследуется упрощенный вариант модели, в котором объемы основного капитала и трудовых ресурсов не меняются на рассматриваемом промежутке времени, и, как следствие, доход фирмы зависит только от степени освоения инновационной производственной технологии. Однако предположения, допускающие скачкообразные изменения количества обученных работников, приводят к появлению в этой модели задачи оптимального управления с разрывными траекториями (задачи оптимального импульсного управления) и использованию неклассических методов исследования [1].
2. Описание модели
Пусть фирма производит некоторый товар, выпуск которого по традиционной технологии описывается производственной функцией где
— объем основного капитала,
— объем трудовых ресурсов. Известно, что использование производственных инноваций может дать прирост выпуска на величину
в случае, когда все работники фирмы знакомы с нововведениями и могут их применять. Обозначим через
— объем трудовых ресурсов, способных использовать новую технологию. Тогда производственная функция фирмы имеет вид
Таким образом, выпуск фирмы складывается из выпуска по традиционному способу и дополнительного выпуска, полученного вследствие применения частью работников улучшенного способа производства. Предположим, что на рассматриваемом промежутке времени величины
и
не изменяются, и доход фирмы описывается функцией
где
— цена единицы продукции,
Уровень освоения работниками фирмы новой технологии
может возрастать при общении работников между собой, а также в результате их обучения со стороны руководства фирмы. Кроме того, часть работников, владеющих новой технологией, утрачивает навыки в результате забывания. Предполагается, что темп забывания постоянен и равен
Уравнение динамики
имеет следующий вид
(1)
(2)
где задает текущие усилия руководства фирмы, направленные на обучение сотрудников, а
— объем трудовых ресурсов, знакомых с новой технологией в начальный момент времени. Прокомментируем динамическую систему (1), (2). В уравнении (1) первое слагаемое означает, что прирост числа обученных работников в момент времени
пропорционален текущему уровню
в совокупности с усилиями руководства и, кроме того, пропорционален множителю
Смысл множителя
состоит в том, что обучение в первую очередь охватывает наиболее заинтересованных, расположенных к нему работников, и, следовательно, чем больше человек уже освоило данную технологию, тем сложнее обучить остальных. Второе слагаемое в (1) характеризует снижение уровня
в результате забывания или утраты навыков.
Все параметры в (1), (2) неотрицательны и имеют следующий смысл: характеризует эффективность внутреннего взаимодействия сотрудников,
— эффективность обучения при применении единицы усилий со стороны руководства,
— темп забывания,
— уровень освоивших новую технологию, при котором происходит наиболее эффективное обучение работников.
Рассмотрим уравнение (1) при отсутствии внешнего обучения, т. е. при Запишем (1) в следующем виде
Здесь задает функцию роста трудовых ресурсов, владеющих новой технологией. График
при значениях параметров
приведен на Рис.1, где
,
,
. Охарактеризуем функцию
на промежутках
и
Рисунок 1. График функции f(x) при a = 10, m = 30, b = 0,1
· При начальном небольшом количестве работников, владеющих новой технологией, т. е. скорость освоения новой технологии возрастает, что объясняется интересом к ней наиболее активных и любознательных работников. Таким образом,
отражает уровень, соответствующий максимальной скорости обучаемости работников. Функция
на промежутке
возрастает и является вогнутой.
· При скорость обучения путем взаимодействия работников друг с другом (внутреннее обучение) снижается, поскольку теперь в этот процесс вовлекаются менее заинтересованные слои трудового коллектива. При этом с каждым дополнительным работником, освоившим технологию, происходит большее замедление скорости внутреннего обучения. Здесь, функция
убывает и является вогнутой.
· При в обучение вовлекаются еще более инертные слои. Функция
убывает и является выпуклой. Скорость обучения не высока, и каждому дополнительному обученному работнику соответствует меньшее ее снижение.
· При скорость внутреннего обучения отрицательна. Величина
характеризует объем трудовых ресурсов, не проявляющих самостоятельного интереса к инновациям или не способных к самообучению.
На Рис. 2 и 3 приведены результаты качественного исследования уравнения (1) при и набросок семейства интегральных кривых. Для любого начального условия
интегральные кривые при
стремятся к уровню насыщения
Рисунок 2. Фазовый портрет
Рисунок 3. Семейство интегральных кривых
Введение внешнего обучения в уравнение (1) позволяет увеличить уровень насыщения и, тем самым, добиться того, чтобы новой технологией овладело большее число работников, что приведет к увеличению выпуска продукции и дохода. Суммарный доход фирмы описывается интегралом где
— текущие затраты фирмы, направленные на обучение работников,
— горизонт планирования.
Рассмотрим задачу выбора такой стратегии обучения , при которой суммарный доход фирмы будет наибольшим, т. е.
(3)
Задача (1)—(3) является задачей оптимального управления, в которой — траектория, а
— управление. Особенность этой задачи состоит в том, что управление
входит в правую часть уравнения динамики (1) линейно и не является ограниченным сверху. Это означает, что хотя суммарные расходы, затрачиваемые руководством фирмы на обучение персонала, ограничены, но их интенсивность может быть сколь угодно большой в течение краткого промежутка времени, т. е. допускается в некотором смысле «агрессивное» обучение, приводящее к почти скачкообразным изменениям уровня освоения новой технологией. Указанная особенность приводит к тому, что в классе кусочно-непрерывных управлений данная задача не имеет решения.
Будем рассматривать задачу (1)—(3) в расширенной постановке, учитывающей возможность «агрессивного» обучения и скачки уровня Соответствующая задача оптимального управления с разрывными траекториями описывается следующими соотношениями [1]:
(4)
(5)
(6)
(7)
(8)
Управлением в задаче (4)-(8) является набор , в котором кусочно-непрерывная функция
описывает усилия руководства фирмы, направленные на обычное обучение,
— множество моментов времени
, в которых проводится обучение с высокой интенсивностью,
— интенсивность обучения в момент
Ограничение на управление задается соотношениями (8). Предполагается, что
где
задает ограничение по суммарным расходам на обучение работников. Кусочно-непрерывные функции
и
— траектории. На промежутках, не включающих точки множества
, они удовлетворяют системе дифференциальных уравнений (5), а в точках множества
— условию скачка (6). Заметим, что функция
появляется при переходе от интегрального функционала к терминальному, а именно, в задаче (1)—(3)
где
(9)
и после расширения задачи (1)-(3) до задачи с разрывными траекториями и отбрасывания слагаемого получаем критерий качества (4). Цель управления в задаче (4)—(8) состоит в нахождении такой стратегии обучения работников
, при которой функционал качества (4) принимает наибольшее значение.
Назовем допустимым процессом задачи (4)-(8) набор , состоящий из кусочно-непрерывных траекторий
и управления
, удовлетворяющих соотношениям (5)-(8). Назовем
оптимальным процессом задачи (4)-(8), если для всех допустимых процессов
выполняется неравенство
Сделаем два замечания [1].
Замечание 1. Допустимое управление по сути является неотрицательной мерой Лебега-Стилтьеса и может быть записано в следующем виде
где: — дельта-функция Дирака, сосредоточенная в точке
Такие управления принято называть импульсными, а задачу вида (4)—(8) — задачей оптимального импульсного управления.
Замечание 2. Для любого допустимого процесса найдется последовательность
состоящая из троек функций
удовлетворяющих (1), (2) и (9), такая, что функции
сходятся к
в точках непрерывности, а
в смысле сходимости мер. Таким образом, любая траектория задачи (4)—-(8) может быть приближена последовательностью траекторий задачи (1)—(3).
Исследуем задачу (4)—(8) при помощи необходимых условий оптимальности в форме принципа максимума для задач оптимального импульсного управления [1].
3. Необходимые условия оптимальности в задаче (4)—(8) и их анализ
Обозначим через , где
исследуемый на оптимальность процесс задачи (4)—(8). Будем считать, что величина
достаточно большая и на исследуемом процессе выполняется неравенство
Выпишем условия принципа максимума [1], для простоты опуская черту у исследуемого процесса.
Функция Понтрягина:
(10)
Соотношения для сопряженной переменной:
(11)
(12)
(13)
Условия максимума:
(14)
Условия оптимальности точек скачка:
(15)
При записи соотношений (10)—(15) учли, что сопряженная переменная по тождественно равна
.
Прокомментируем условия принципа максимума.
1. Сопряженная функция является кусочно-непрерывной функцией. На участках, не содержащих точки множества
, она удовлетворяет дифференциальному уравнению (11), а в точках
— условию скачка (12) . В конечный момент времени выполняется условие трансверсальности (13).
2. Условие максимума управления (14) означает, что если ,
— оптимальный процесс,
— соответствующая
сопряженная функция, то справедливо следующее:
· в моменты времени в которых
выполняется равенство
· в моменты времени когда проводится обучение высокой интенсивности («агрессивное» обучение), выполняются равенства
· в остальные моменты выполняется неравенство
3. Условие оптимальности моментов времени, в которых осуществляется обучение высокой интенсивности, задается соотношениями (15).
Анализ условия принципа максимума приводит к следующим выводам:
1. Пусть выполняется условие:
, (16)
где и
— решение следующей системы дифференциальных уравнений
Тогда дополнительное обучение работников со стороны руководства фирмы не эффективно, т.е.
2. Пусть условие (16) не выполнено. Тогда существует магистральный участок , на котором
, где
и
— решения уравнений
(17)
При этом реализуется один из следующих случаев:
2.1. Пусть . Тогда
,
Здесь – характеристическая функция отрезка
, а моменты выхода на магистраль
и схода с нее
определяются из следующих условий:
· момент :
· момент :
Таким образом, при из-за высокого начального уровня освоения новой технологии агрессивное обучение не эффективно. На начальном промежутке времени
руководству фирму не выгодно прилагать усилия к обучению работников, однако, после снижении уровня
до магистрального
в момент
проводится обычное обучение с интенсивностью
позволяющее поддерживать количество работников, владеющих новой технологией, на магистральном уровне.
2.2. Пусть . Тогда
где момент схода с магистрального участка определяется как в 2.1. В этом случае в начальный момент времени эффективно проведение обучения высокой интенсивности, оно приводит к скачку функции
в момент
с начального уровня
до магистрального
Далее проводится обычное обучение, нацеленное на сохранение магистрального уровня освоения новой технологии. После момента
затраты на обучение перестают окупаться.
2.3. В случае, когда горизонт планирования мал и магистральный участок может отсутствовать и управление будет чисто импульсным. При этом в начальный момент времени проводится обучение высокой интенсивности, поднимающее
с начального уровня
до
где
удовлетворяет условиям
В этом случае принципу максимума будет удовлетворять управление со следующими компонентами:
Проиллюстрируем полученные выводы на числовом примере. Зададим значения параметров
Вычислим магистральные значения уровней освоения новой технологии и усилий по обучению со стороны руководства фирмы из уравнений (17). Имеем
Поскольку то в начальный момент времени проводится «агрессивное» обучение, приводящее к скачкообразному увеличению уровня
до магистрального. При этом
Обычное обучение задается функцией
На Рис. 4 и 5 приведены графики управления и соответствующей траектории, удовлетворяющих принципу максимума. Можно показать, что для полученного процесса выполняются достаточные условия оптимальности из работы [2], и, следовательно, он является оптимальным.
Рисунок 4. Оптимальное управление
Рисунок 5. Оптимальная траектория
Таким образом, в содержательных случаях решение задачи носит магистральный характер и имеет участок особого управления, на котором поддерживается на постоянном уровне
. Если
, то в начальный момент времени эффективно обучение с высокой интенсивностью, что приводит к скачкообразному возрастанию уровня
до магистрального значения. Если
, то имеется начальный участок выхода на магистраль, на котором обучение не ведется.
Список литературы:
1.Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: ФИЗМАТЛИТ, 2003.
2.Dykhta V.A., Samsonyuk O.N. Some applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems // European Journal of Control. — 2011. — Vol. 17. — Pp. 55—69.
отправлен участнику
Оставить комментарий