Консультационный центр MATLAB: Control System Toolbox Е.В.Никульчев

II Всероссийская конференция пользователей MATLAB, 25-26 мая 2004 года >>

Семинары

Обучение

Лицензирование

Разработка

Форум

Регистрация

Matlab

Toolboxes

Simulink

Blocksets

Femlab

3rd-Party Products

Полезное

Вход

Раздел "Проектирование систем управления\Control System Toolbox"

Е.В.Никульчев. Пособие "Control System Toolbox"
Синтез оптимального управления с полной обратной связью

В оглавление книги \ К следующему разделу \ К предыдущему разделу

Краткие сведения из теории

Пусть поведение модели объекта управления описывается обыкновенным дифференциальным уравнением

x(t) = f (t, x(t), u(t)), (1)

где х - вектор состояния системы, х Î Rⁿ, Rⁿ – n-мерное евклидово пространство; u - вектор управления, и u Î U Ì Rⁿ, U - некоторое заданное множество допустимых значений управления, t Î T = [t₀, t₁] – интервал времени функционирования системы, моменты начала процесса t₀ и окончания процесса t₁ заданы, f (t, x, u): Т ´ Rⁿ ´ U ® Rⁿ.

Задан функционал качества управления

(2)

где f⁰(t, x, u), F(x) - заданные непрерывно дифференцируемые функции. Предполагается, что при управлении используется информация о текущем времени и векторе состояния х.

Применяемое в каждый момент времени t Î Т управление имеет вид управления c полной связью по всем переменным вектора состояния (рис. 1).

Рис.6.1. Схема управления с полной обратной связью по вектору состояния.

Требуется найти такую функцию u*(t, x) Î U_n, что

. (3)

Функция u*(t, x) Î U_n называется оптимальным управлением с полной обратной cвязью. Для любого начального состояния x₀ из множества Rⁿ она порождает соответствующую оптимальную пару, т.е. оптимальную траекторию х*(^.) и оптимальное программное управление u*(^.).

Достаточным условием минимума функционала (2) является уравнение Беллмана для непрерывных детерминированных систем.

Если существуют функция f (t, x) Î C^1,1, удовлетворяющая уравнению Беллмана с граничным условием:

(4)

и управление u*(t, x) Î U_n, удовлетворяющее условию

то u*(t, x) является оптимальным управлением с полной обратной связью. При этом минимальное значение функционала (2)

Пусть система, описывающая поведение модели объекта управления, является линейной

(t) = A(t) x(t) + B(t) u(t), (5)
y(t) = C(t) x(t) +D(t) u(t)

Пусть функционал качества управления квадратичный:

(6)

гяе S(t), L - неотрицательно определенные симметрические матрицы размера (n´ n), a Q(t) - положительно определенная симметрическая матрица (q ´ q).

Далее используем известные правила и обозначения :

Уравнение Беллмана для данной задачи имеет вид

(7)

Отсюда

Найдем максимум в последнем выражении по управлению с использованием необходимых условий экстремума и правила 1-3. Дифференцируя выражение в фигурных скобках по u и приравнивая результат нулю, получаем структуру оптимального управления:

(8)

Решение уравнения (7) ищется в виде

, (9)

где K₂(t) - неизвестная симметрическая матрица (n ´ n).

Подставляя (9) в уравнение (7), приравнивая нулю квдратичные формы, получаем:

(10)

Решая уравнение Риккати (10), можно получить явный вид оптимального управления (8) с полной обратной связью

. (11)

Минимальная величина функционала вычисляется по формуле

Рассмотрим дискретный случай

x(k+1) = A(k) x(k) + B(k) u(k), (12)
y(k) = C(k) x(k) + D(k) u(k)
k = 0, 1, …, N –1,

с начальным условием

x(0) = x₀, (13)

и функционалом качества

(14)

где Q(k), L – неотрицательно определенные симметрические матрицы размера (n ´ n), R(k) - положительно определенная симметрическая матрица (q ´ q).

Требуется найти управление u*(k, x) с полной обратной связью, минимизирующее функционал (14).

Уравнение Беллмана принимают вид

(15)

Функция Беллмана B(k, x) ищется в форме

B(k, x) = x^TP(k)x , (16)

где P(k) – где неизвестная неотрицательно определенная симметрическая матрица размера (n ´ n).

Получаем, что в задаче (13)–(14) оптимальное управление определяется соотношением

u*(k, x) = – K(k) х,
k = 0, 1, ..., N–1,

где K(k) - матрица коэффициентов усиления регулятора размера (q ´ n)

K(k) = [R(k) + B^TP(k+1)B(k)]^–1B^T(k)P(k+1)A(k), k=0, l, ..., N-l,

а матрица P(k) размера (n ´ n) удовлетворяет уравнению

P(k) = Q(k) + K^T(k)R(k)K(k) + [A(k) - B(k)K(k)]^T P(k+l) [A(k) - B(k)K(k)],
k = N – l, ..., l, 0,
P(N) = L .

Минимальная величина функционала определяется но формуле

min J = .

Для каждого начального состояния x₀ оптимальный линейный регулятор порождает оптимальное программное управление u*(x, k) и оптимальную траекторию х*(k). Структурная схема этой системы изображена на рис 2.

Рис. 6.2. Схема регулирования.

Описание функций

Для синтеза оптимального регуляторов линейных стационарных систем в Control System Toolbox имеются функции решений уравнений Беллмана (табл. 1).

Таблица 1. Функции Control System Toolbox

Синтаксис	Описание
[K P e] = lqr(A, B, Q, S)	Синтез непрерывного регулятора
[K P e] = lqr(A, B, Q, S, N)	Синтез непрерывного регулятора
[K P e] = dlqr(A, B, Q, R)	Синтез дискретного регулятора
[K P e] = dlqr(A, B, Q, R, N)	Синтез дискретного регулятора
[K P e] = lqrd(A, B, Q, R, Ts)	Синтез дискретного регулятора
[K P e] = lqrd(A, B, Q, R, N, Ts)	Синтез дискретного регулятора

Функция lqr вычисляет матрицу коэффициентов регулирования K cо среднеквадратичным функционалом качества без терминального члена:

при этом вычисляются матрица P, являющаяся решением уравнения Риккати и собственные значения e матрицы (A – BK).

Функция dlqr вычисляет матрицу коэффициентов регулирования по всем переменным состояния K для дискретной системы cо среднеквадратичным функционалом качества без терминального члена:

Функция lqrd предназначена для синтеза оптимального дискретного регулятора непрерывной системы cо среднеквадратичным функционалом качества:

В качестве параметра в функцию передается шаг дискретизации Ts, возвращаются значения матрицы K дискретного управления, матрица P, являющаяся решением уравнения Риккати и собственные значения e матрицы системы управления, полученный в результате дискретизации .

При использованию всех команд синтеза оптимального линейного регулятора по всем переменным состояния на исходные данные накладываются следующие ограничения:

система, определяемая матрицами (A, B) должна быть стабилизируема;
должны выполняться неравенства S> 0, Q – NR^–1N^T>0,
пара матриц (Q – NR^–1N^T, A – BR^–1B^T) не должна иметь наблюдаемые моды с собственными значениями на действительной оси.