Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Оптимальная политика замены оборудования






Проблема своевременной замены устаревшего оборудования новым — одна из насущных проблем любой сферы производственной деятельности. В самом деле, с течением времени оборудование изнашивается и физически, и " морально", а потому на каком-то этапе его эксплуатация становится менее выгодной, нежели приобретение и использование нового оборудования. В связи с этим и возникает задача определения наиболее подходящего момента замены. В качестве критерия оптимальности при замене оборудования в промышленности обычно принимают минимум ожидаемых затрат или максимум ожидаемой прибыли за некоторый период времени.

Мы рассмотрим задачу в упрощенной постановке. Пусть в начале планового периода из N лет имеется некоторое оборудование возраста t. Ежегодно производится продукция стоимостью r(t). При этом оборудование требует эксплуатационных затрат u(t) и имеет остаточную стоимость s(t). Все перечисленные характеристики зависят от возраста t оборудования. В любой год оборудование можно сохранить или продать по остаточной стоимости и купить новое по цене р (сюда же входят затраты на установку и запуск в эксплуатацию).

Требуется разработать оптимальную политику замены оборудования исходя из условия максимизации ожидаемой прибыли за период времени длительностью N лет.

В соответствии с общей концепцией динамического программирования начнем процесс оптимизации с конца планового периода, т. е. рассмотрим сначала последний год периода. При этом годы будем нумеровать от конца периода к его началу: п = 1, 2,..., N.

Итак, пусть п = 1. Будем считать, что к началу последнего года у нас имеется оборудование возраста t. По нашему усмотрению может быть принято одно из следующих решений: сохранить оборудование или продать его и купить новое.

Если оборудование сохранить, то за последний год прибыль составит

Если же оборудование продать по остаточной стоимости и купить новое, то прибыль к концу последнего года выразится суммой

 

где r(0) — стоимость продукции, произведенной новым оборудованием (" нулевого" возраста) за год; и(0) — расходы, связанные с эксплуатацией нового оборудования в течение года.

Поскольку планируется деятельность в последнем году планового периода, то в соответствии с концепцией динамического программирования мы должны действовать так, чтобы последний год сам по себе принес максимальную выгоду. Но результаты деятельности в данном случае характеризуются выражениями (0.6) и (0.7). Заменять оборудование будет выгодно лишь в случае, если , т.е. когда доход от нового оборудования больше (!), чем от старого.

Обозначим через fn(t) максимально возможную прибыль за последние п лет планового периода при условии, что в начале периода имеется оборудование возраста t и мы придерживаемся оптимальной политики. В соответствии с этим максимальную прибыль за последний год обозначим через f1(t). Ясно, что f1(t) равняется наибольшему из выражений (0.6) и (0.7), что символически запишется так:

 

 

Пусть теперь п = 2, т. е. рассматривается период, состоящий из двух последних лет. Если к началу этого периода имеется оборудование возраста t и принято решение его сохранить, то к концу первого года будет получена прибыль. За год оборудование постареет и к началу последнего года будет иметь возраст t + 1 лет. Если в отношении этого оборудования на последнем году придерживаться оптимальной политики, то дополнительно будет получена прибыль f1(t + 1), а общая прибыль за два года составит

 

(0.8)

 

Если же в начале второго года будет принято решение оборудование заменить, то затраты, связанные с продажей и приобретением оборудования, составят s(t) - р, а прибыль от нового оборудования за первый год будет равна r(0) - и(0). К концу года новое оборудование постареет и будет иметь возраст 1 год, поэтому оптимальная политика в последнем году принесет прибыль f1(1).

Общая же прибыль за два года составит

 

(0.9)

 

Оптимальной в последние два года будет политика, обеспечивающая за этот период максимальную прибыль, которая равна наибольшему из выражений (0.8) и (0.9). Записать это можно так:

 

 

Рассуждая аналогично, можно получить выражения для f3(t) и т. д. Общие функциональные уравнения Беллмана име­ют вид:

 

 

Эти рекуррентные соотношения позволяют реализовать концепцию динамического программирования и развернуть процесс формирования оптимальной политики замен с конца планируемого периода. Процесс станет понятным, когда мы разберем числовой пример, приведенный ниже.

Пример 10.4. Разработать оптимальную политику относительно оборудования возраста не старше 10 лет при следующих условиях: 1) стоимость r(t) продукции, произведенной с использованием оборудования за год, и расходы u(t), связанные с эксплуатацией оборудования, задаются табл. 10.15: 2) ликвидационная стоимость оборудования не зависит от его возраста и равна 4; 3) цена единицы нового оборудования ее временем не меняется и равна 13.

 

Решение. Прежде всего запишем функциональные уравнения для числовых данных нашего примера (s(t) = 4, р = 13, r(0) = 27, u(0) = 15):

 


 

А теперь, пользуясь этими формулами, будем последовательно вычислять значения максимальной прибыли fn(t) при различных п и t и записывать их в специальную таблицу табл. 10.16). Первую строку таблицы будем заполнять, придавая параметру t в формулах (10.17) значения 0, 1,..., 10 и пользуясь данными табл. 10.15.


 

 

Пусть t =0, тогда выражение (10.17) примет вид


 


Так как 12 > 3, то оптимальная политика, соответствующая f1(0), есть политика сохранения оборудования. Полученное значение максимальной прибыли (12) вписываем первым элементом первой строки табл. 10.16.

 


Пусть теперь t = 1. Из формулы (10.17) получаем

 

И снова заключаем, что оптимальной политикой, отвечаю­щей f1(l), является политика сохранения оборудования. Значение максимальной прибыли (11) вписываем вторым элементом первой строки табл. 10.16.


Действуя аналогично и далее, при t = 7 находим

 

 

что по-прежнему соответствует политике сохранения оборудования. Но при t = 8 имеем

 

 


Здесь уже 2 < 3, а это означает, что оптимальной будет политика замены оборудования.

Из табл. 10.15 видно, что r(t) - u(t) с ростом t убывает поэтому, если при t = 8 r(8) - u(8) = 21 -19= =2 < 3, npи t > 8 и подавно r(t) — u(t) < 3. Так что при t > 8 оптимальной будет политика замены оборудования.

Чтобы в табл. 10.16 различать, в результате какой политики получается то или иное значение максимальной прибыли разграничим жирной чертой элементы таблицы, соответствующие различным политикам. В результате в первой строке окажутся отделенными жирной чертой все элементы, начиная с f1(8) = 3. Аналогичное разделение элементов будем производить и во всех других строках таблицы.

Вторую строку табл. 10.16 заполняем на основе формулы


полученной из равенства (10.18) для двухлетнего периода (п = 2). При этом учтено, что f1(l)= 11 (см. первую строку табл. 10.16).

Придавая в равенстве (10.19) параметру t значения 0, 1,..., последовательно находим f2(0) = 23, f2(1) = 21,... При этом значения r(t) и u(t) берем, как и ранее, из табл. 10.15, а значения f1(t+l) — из первой строки табл. 10.16.

При t = 4 получаем

 

 

Здесь обе политики обеспечивают одинаковую прибыль в 14 ед. Выбрать целесообразнее все же политику сохранения, гак как имеющееся оборудование нам хорошо известно, и мы к нему привыкли. При t = 5 имеем

 

 

откуда видим, что f2(5)=14 обеспечивается при политике замены.

Поскольку r(t)u(t) и f1(t + 1) с ростом t убывают, что видно из табл. 10.15 и 10.16 (это и понятно: чем старее оборудование, тем меньший доход оно дает), то при t > 5 оптимальной будет политика замен и f2(t) = 14.

Третья строка табл. 10.16, отвечающая трехлетнему периоду (п = 3), заполняется на основе формулы

 

 

При этом значения f2(t+1) следует брать из второй строки табл. 10.16.

Продолжая вычисления описанным способом, мы постепенно заполним всю табл. 10.16. Данные этой таблицы можно использовать для решения ряда задач.

Предположим, например, что в начале десятилетнего периода имеется оборудование четырехлетнего возраста и требуется выработать оптимальную политику в отношении этого оборудования.

В табл. 10.16 на пересечении строки f10(t) и столбца t = 4 читаем значение максимальной прибыли, равное 82 ден. ед. Найдем теперь оптимальную политику, обеспечивающую эту прибыль. Замечаем, что значение f10(4) = 82 записано слева от жирной линии, в " области политик сохранения". Это означает, что для достижения в плановом периоде из 10 лет максимальной прибыли в 82 ден. ед. надо в первом году оборудование сохранить.

В течение первого года оборудование постареет на один год, так что к концу года мы придем с оборудованием возраста 4+1 = 5 лет. Теперь нам надо действовать оптимально в оставшемся периоде из 9 лет с оборудованием возраста 5 лет. На пересечении строки f9(t) и столбца t = 5 читаем значение 74 оказавшееся справа от жирной линии, т. е. в " области политки замен". Заменив оборудование и проработав на нем очередной год, мы за 8 лет до конца планового периода будем иметь оборудование возраста 1 год. Теперь при наличии оборудования возраста 1 год нужно действовать оптимально в оставшиеся 8 лет. Продолжая рассуждать таким же образом, последовательно находим f8(1) = 71, f7(2) = 60, f6(3) == 50, f5(4)=41 в " области политик сохранения", что означает, что в третьем, четвертом, пятом и шестом годах имеющееся оборудование надо сохранять. Действуя оптимально и дальше, мы обнаруживаем, что f4(5) = 33 находится в " области политик замен". Следовательно, на седьмом году оборудование придется заменить новым. Далее находим fз(1) = 30, f2(2) = 19 и f1(3) = 9, расположенные в " области политик сохранения". Значит, на восьмом, девятом и десятом годах планового периода оборудование заменяться не будет.

Рассмотренный процесс формирования оптимальной поли­тики можно изобразить символически следующим образом:

 


Анализируя рассмотренное решение, замечаем, что вместо поиска оптимальной политики сразу для всего десятилетнего периода мы предпочли находить серию взаимосвязанных оптимальных решений для отрезков времени меньшей длины (1 год), т.е. вместо решения одной сложной задачи находили оптимальные решения нескольких более простых взаимосвязанных задач аналогичного содержания. В этом и проявляется суть метода динамического программирования.

Табл. 10.16 составлена для десятилетнего периода времени. Однако ход

рассуждений не изменится, если потребуется составить политику для планового периода меньшей продолжительности.

Пусть, например, в начале семилетнего периода имеется оборудование пятилетнего возраста и необходимо сформулировать политику в отношении этого оборудования. Рассуждая, как и выше, последовательно находим:

 


Таким образом, максимальная прибыль f7(5) = 57 ден. ед. и достигается за счет политики, состоящей в том, что в первом году оборудование заменяется, затем в течение трех лет оно эксплуатируется, после чего (на пятом году) вновь заменяется и в оставшиеся два года планового периода сохраняется.

Известно, что поэтапное планирование многошагового процесса должно осуществляться так, чтобы при планировании политики для каждого этапа учитывалась не выгода, получаемая только на данном этапе, а общая выгода, получаемая по окончании всего процесса, и именно относительно общей выгоды производится оптимальное планирование. Эта особенность динамического программирования может быть наглядно проиллюстрирована в условиях только что рассмотренного примера. Итак, на первом году мы заменили оборудование и, как видно из табл. 10.16, получили по прошествии года прибыль, равную 57 - 54 = 3 ден. ед., хотя могли сохранить оборудование и получить прибыль в 6 ден. ед. (f1(5) = 6). Оказалось, что с точки зрения всего семилетнего периода, а не одного первого года, следует пойти на " жертву" в первый год, сознательно уменьшив прибыль.

В заключение этого примера проанализируем такую политику: не заменяя оборудования в первом году, получить прибыль в 6 ден.ед. (это лучше, чем 3 ден. ед.!), а впоследствии (начиная со второго года) придерживаться оптимальной политики. Несостоятельность такого подхода обнаруживается сразу. Из табл. 10.16 видно, что f6(6) = 48 ден. ед., и, таким образом, суммарная ожидаемая прибыль составит 6 + 48 = 54 ден. ед., что меньше 57 ден. ед., которые можно обеспечить, следуя с самого начала оптимальной политике замен (10.21).

 

Предлагаем убедиться в оптимальности политики


которой мы воспользуемся для иллюстрации одной из характерных особенностей метода динамического программирования.

Сопоставляя оптимальные политики (10.20) и (10.22), замечаем следующее: несмотря на то что в начале рассматриваемых периодов имелось оборудование разного возраста (четырехлетнее и двухлетнее) и в отношении его проводились разные политики, начиная с восьмого года политика в обоих случаях стала одинаковой. А произошло это потому, что к началу восьмого года возраст оборудования в обоих случаях оказался одинаковым (равным одному году). Этим подтверждается важная особенность метода динамического программирования, состоящая в том, что прошлое оптимизируемого процесса не имеет значения при определении будущей политики. Иначе говоря, решение, принимаемое на данном этапе, не зависит от того, каким образом оптимизируемый процесс достиг теперешнего состояния. Оптимальная политика выбирается лишь с учетом факторов, характеризующих процесс в данный момент.

 

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.012 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал