Методы штрафных функций

Автор работы: Пользователь скрыл имя, 05 Февраля 2013 в 13:43, контрольная работа

Описание работы

В области нелинейного программирования методы штрафных функций представлены в различных вариантах, которые, однако, имеют одну общую черту: во всех этих методах осуществляется преобразование задачи нелинейного программирования при наличии ограничений либо в одну (эквивалентную исходной) задачу без ограничений, либо в эквивалентную последовательность задач без ограничений.

Содержание работы

Введение
I. Метод штрафных функций
Описание метода штрафных функций
Сходимость метода
II. Применение метода штрафных функций
Список использованных источников

Файлы: 1 файл

Методы штрафных функций.doc

— 386.50 Кб (Скачать файл)

МИНОБРНАУКИ РОССИИ

 

Федеральное государственное бюджетное  образовательное учреждение высшего  профессионального образования

 

"РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ  ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ" 

(РГГУ)

 

ИНСТИТУТ ЭКОНОМИКИ, УПРАВЛЕНИЯ И  ПРАВА

ФАКУЛЬТЕТ УПРАВЛЕНИЯ

 

 

 

 

 

 

 

 

 

 

 

Сергеев Станислав Владимирович

Методы штрафных функций

Контрольная работа по дисциплине Математические модели в управлении студента

1-го курса обучения (заочной дистанционной) формы  обучения

 

 

 

 

 

 

 

 

 

 

Руководитель

Гришина Наталья 

Васильевна

 

 

 

 

 

СОДЕРЖАНИЕ

 

Введение

I. Метод штрафных функций

  1. Описание метода штрафных функций
  2. Сходимость метода

II. Применение метода штрафных функций

Список использованных источников

 

Введение

 

В области нелинейного  программирования методы штрафных функций  представлены в различных вариантах, которые, однако, имеют одну общую черту: во всех этих методах осуществляется преобразование задачи нелинейного программирования при наличии ограничений либо в одну (эквивалентную исходной) задачу без ограничений, либо в эквивалентную последовательность задач без ограничений.

Методы штрафных функций  можно разделить на два класса: 1) параметрические методы и 2) непараметрические  методы.

Параметрические методы характеризуются  наличием одного или нескольких надлежащим образом подобранных параметров, входящих в структуру штрафной функции (которая строится с помощью функций-ограничений) в качестве весовых коэффициентов. К числу типичных параметрических методов относится метод последовательной безусловной минимизации (МПБМ), предложенный Фиакко и Мак-Кормиком, а также метод Зангвилла. С другой стороны, в непараметрических методах, таких как "метод центров" Гуарда и предложенный Фиакко и Мак-Кормиком непараметрический МПБМ, целевая функция рассматривается как функция, задающая дополнительное искусственное ограничение, постепенно "уплотняемое" по мере получения информации в ходе решения задачи.

Параметрические методы распадаются на три категории:

  1. методы внутренней точки;
  2. методы внешней точки;
  3. комбинированные методы.

При использовании методов  внутренней точки уровень целевой функции удерживается в отдалении от границ допустимой области с помощью штрафных функций. Метод внешней точки и метод Фиакко и Мак-Кормика, наоборот, генерируют последовательность точек, которые выходят за пределы допустимой области.

В комбинированных методах (использование которых особенно необходимо в случае, когда ограничение имеют вид равенств) в ходе минимизации одни из ограничивающих условий удовлетворяются , а другие не удовлетворяются; однако все условия в пределах заданного допуска оказываются удовлетворенными при достижении исходного решения.

 

 

I. Метод штрафных функций

 

    1. Описание метода штрафных функций

 

Метод штрафных функций является одним  из наиболее простых и широко применяемых методов решения задач минимизации. Основная идея метода заключается в сведении исходной задачи

 

J(u)->inf; uÎU (1)

 

к последовательности задач минимизации

 

Fk(u)->inf; uÎ U0, k=0,1,…, (2)

 

где Fk(u) - некоторая вспомогательная функция, а множество U0 содержит U.При этом функция Fk(u) подбирается так, чтобы она с ростом номера k мало отличалась от исходной функции J(u) на множестве U и быстро возрастала на множестве U0\U.Можно ожидать, что быстрый рост функции Fk(u) вне U приведет к тому, что при больших k нижняя грань этой функции на U0 будет достигаться в точках, близких ко множеству U, и решение задачи (2) будет приближаться к решению задачи (1). Кроме того, как увидим ниже, и меняться достаточно широкий произвол в выборе функций Fk(u) и множества U0 для задач (2), и можно надеяться на то , что задачи (2) удастся составить более простыми по сравнению с задачей (1) и допускающими применение несложных методов минимизации. Определение 1: Последовательность функций {Рk(u), k=0,1,..}, определенных и не отрицательных на множестве U0, содержащем множество U, называют штрафом или штрафной функцией множества U на множестве U0, если

 

 

Из этого определения видно, что при больших номерах k за нарушение условия u U приходится "платить" большой штраф, в то время как приu

U штрафная функция представляет собой бесконечно малую величину при k-> . Для любого множества U Еn можно указать сколько угодно различных штрафных функций. Например, если {Аk} – какая-либо положительная последовательность, Аk , то можно взять

 

Рk(u)= Аkr(u,U), u En U0, k=0,1,…

 

(здесь U предполагается замкнутым) или

 

 

здесь r(u,U)= |u-v| - расстояние от точки до множества U, а - какая либо точка из U. Другие примеры штрафных функций будут приведены ниже. Допустим, что некоторое множество U , содержащее U,а также штрафная функция {Р (u)} множества U на U0 уже выбраны . Предполагая, что функция J(u) определена на U0, введем функции

 

(u)=J(u)+P (u), u U0, k=0,1,... (3)

 

и рассмотрим последовательность задач (2) с функциями (3). Будем считать, что = (u)>- , k=0,1,… может и не достигаться. Поэтому будем считать, что при каждом k=0,1,… с помощью какого-либо метода минимизации найдена точка uk, определяемая условиями:

 

uk U0, (uk) (6),

 

где - некоторая заданная последовательность, , k=0,1,…, (если uk удовлетворяет условиям (5), то в (6) допускается возможность =0). Отметим, что, вообще говоря, uk U. Метод штрафных функций описан. Подчеркнем, что дальнейшее изложение не зависит от того, каким конкретным методом будет найдена точка uk из (6). Поэтому мы здесь можем ограничиться предположением, что имеется достаточно эффективный метод определения такой точки.

 

    1. Сходимость метода

 

Перейдем к исследованию сходимости метода штрафных функций. Т.к. при u U0\U, то можно ожидать, что для широкого класса задача (1) последовательность {uk}, определяемая условиями (6), будет приближаться ко множеству U и будут справедливы равенства:

 

  )=0

 

Мы здесь ограничимся  рассмотрением задачи (1) для случая, когда множество U имеет вид

 

U= , (7)

 

 

Где U0- заданное множество из Еn (например, U0=En), функции J(u),gi(u) (i=1,…s),определены на U0 . В качестве штрафной функции множества (7) возьмем

 

Pk(u)=AkP(u),

P(u)= , u U0 , (8)

 

Где Аk>0 (K=0,1,…), , a p 1 – фиксированное число.

Очевидно, если функции gi(u) r раз непрерывно дифференцируемы на множестве U0, то при любом p>r функция (8) также будет rраз непрерывно дифференцируема на U0. Если в (8) p=1 , то из непрерывности gi(u) (i=1,…,s) следует непрерывность Pk(u) на U0 , но гладкости Pk(u) в этом случае ожидать не приходится. Полезно также заметить, что если U0 – выпуклое множество функции gi(u) при i=1,…,m выпуклы на U0 ,gi(u)=<ai,u> - bi – линейные функции при i=m+1,..,s, то функция (8) выпукла на U0.

Если для краткости ввести обозначения

 

max{gi(u);0} i=1,…,m,

g (u)= (9)

|gi(u)|, i=m+1,…,s.

 

то функцию (8) можно записать в виде

 

Pk(u)=AkP(u), P(u)= , u U0.

 

Функцию P(u) мы иногда также будем называть штрафной функцией множества (7), подразумевая при этом, что после умножения на Ak>0, , она превратится в штрафную функцию в смысле определения 1.

Величины Аk из (8) будем называть штрафными коэффициентами.

Заметим, что существуют и другие штрафные функции множества (7). Например, вместо (8) можно взять

 

Pk(u)= i, u U0, k=0,1,…,

 

где pi , Aki>0, (i=1,…,s); здесь каждое ограничение из (7) имеет свой штрафной коэффициент. Весьма широкий класс штрафных функций множества (7) дает следующая конструкция:

 

Pk(u)= i, u U0, k=0,1,…,

 

Где - произвольная функция, определенная при g 0 такая, что при g>0, i=1,…,s. При необходимости можно выбрать функции так, чтобы штрафная функция Pk(u) обладала различными полезными свойствами, такими, как, например, непрерывность, гладкость, выпуклость, простота вычисления значения функции и нужных производных и т. п. Возможны и другие конструкции штрафных функций множества (7). Приведем еще два конкретных примера штрафной функции

штрафной функция  программирование нелинейный

Pk(u)=(1+ )A -1, pi ,

Pk(u)=A ( ),

где Ak>0, (k=0,1,…), .

 

 

Теорема 1.

Пусть функции J(u), gi(u) (I=1,…,s), определены на множестве U0 , а последовательность {uk} определена условиями (3), (6), (8). Тогда

 

J(uk) Фk(uk)= Фk*(uk) J*. (10)

 

Если, кроме того , J**= ,то

 

P(uk)= =О(А ), k=0,1,…, (11)

gi(uk) 0, i=1,…,m; gi(uk)=0, i=m+1,…,s. (12)

 

Доказательство. Так как P(u) ,то из (3), (6), (8) имеем

 

J(uk) J(uk)+Ak P (uk)= (uk) (u) =J(uk)+Ak P (uk) , "u U0, k=0,1,...

 

Отсюда, переходя к нижней грани по u U и учитывая, что P(u)=0, uÎU,получим

 

J(uk) (uk) J* , k=0,1,... (13)

 

При k из (13) вытекает (10)

Пусть теперь J**>- .Так как J* J**,то J*>- .С учетом (13) имеем

 

0 P (uk)= (uk)- J(uk) J* -J** k=0,1,... ,или

0 P (uk)=(J* -J** k=0,1,...

 

Оценка (11) доказана. Из нее следует, что P (uk)=0 или g (uk)=0 (i=1,…,s). Вспоминая определение (9) для g (uk), отсюда получим соотношения (12). В общем случае неравенства в (10) могут быть строгими.

Теорема 2.

Пусть U0- замкнутое множество из Еn, функции J(u), g1(u),…,gm(u),|gm+1(u),…,|gs(u)| полунепрерывны снизу на U0, J**= . Пусть последовательность {uk} , определяемая условиями (3), (6), (8), имеет хотя бы одну предельную точку. Тогда все предельные точки принадлежат множеству точек минимума задачи (1), (7). Если, кроме того, множество

 

U = , (14)

 

Ограничено хотя бы при  одном значении , то

 

Фk(uk) Фk*= J(uk)=J*, (uk,U*)=0 (15)

 

Доказательство.

При сделанных предположениях для последовательности {uk} соотношения (10)-(12) сохраняют силу. Пусть v*–какая-либо предельная точка последовательности {uk} , пусть {uk } v* . Заметим, что v* в силу замкнутости U0. Тогда с учетом полунепрерывности снизу указанных в условии теоремы функций из соотношений(12) получим

 

gi(v*) gi(uk ) gi(uk) , i=1,…,m

|gi(v*)| |gi(uk )|= |gi(uk)|=0, i=m+1,…,s

 

Следовательно, v* .Тогда с учетом (10) имеем

 

J* J(v*) J(uk ) J(uk) , т.е. J(uk )=J(v*) =J* или u*

 

Наконец, пусть множество (14) ограничено при некоторых  .Из соотношений(12) следует, что {uk} для всех k k0.Это означает что {uk}имеет хотя бы одну предельную точку. Тогда, как было выше показано все предельные точки {uk} принадлежат . Следовательно, (uk,U*)=0.Из тех же рассуждений и неравенств (10)вытекают остальные равенства(15). Теорема 2 доказана.

Для сходимости метода штрафной функции важное значение имеет способ задания множества U: ограничения, задающие множество U , и штрафные функции этого множества должны быть как-то согласованы с минимизируемой функцией J(u).

Определение 2. Скажем, что задача (1), (7) имеет согласованную постановку на множестве U0, если для любой последовательности {uk} U0, для которой g (uk)=0 , i=1,…,s, (16) имеет место соотношение

Информация о работе Методы штрафных функций