Типовые задачи — Теория управления

$\global\def\at#1#2{\left. #1 \right\rvert_{#2}}$ $\global\def\abs#1{\left\lvert #1 \right\rvert}$ $\global\def\norm#1{\left\lVert #1 \right\rVert}$ $\global\def\dp#1#2{#1 \cdot #2\,}$ $\global\def\vp#1#2{#1 \times #2\,}$ $\global\def\dv#1#2{\frac{d #1}{d #2}}$ $\global\def\pd#1#2{\frac{\partial #1}{\partial #2}}$ $\global\def\pdv2#1#2{\frac{\partial^2 #1}{\partial #2^2}}$ $\global\def\ppdv#1#2#3{\frac{\partial^2 #1}{\partial #2 \partial #3}}$ $\global\def\paren#1{\left( #1 \right)}$ $\global\def\mbox#1{\text{#1}}$ $\global\def\div{\text{div}\,}$ $\global\def\dsum{\displaystyle\sum\,}$ $\global\def\grad{\text{grad}\,}$ $\global\def\rot{\text{rot}\,}$ $\global\def\bydef#1{\overset{\mathrm{def}}{#1}}$ $\global\def\vb#1{\textbf{#1}}$ $\global\def\rddots{\cdot^{\displaystyle \cdot^{\displaystyle \cdot}}}$ $\global\def\op#1{\mathrm{#1}\,}$ $\global\def\diag{\mathrm{diag}\,}$ $\global\def\rank{\mathrm{rank}\,}$ $\global\def\Sp{\,\mathrm{Sp}\,}$ $\global\def\proj{\mathrm{proj}}$ $\global\def\grad{\,\mathrm{grad}\,}$ $\global\def\const{\text{const}\,}$ $\global\def\res{\text{res}\,}$ $\global\def\Res{\text{Res}\,}$ $\global\def\Lin{\,\text{Lin}\,}$ $\global\def\Re{\text{Re}\,}$ $\global\def\Im{\text{Im}\,}$ $\global\def\ch{\text{ch}\,}$ $\global\def\sh{\text{sh}\,}$ $\global\def\tg{\mathrm{tg}\,}$ $\global\def\argtg{\text{argtg}\,}$
  1. Найти индуцированную норму матрицы $A = \begin{bmatrix} 1 & 2 \\ 0 & 1 \end{bmatrix}.$
    Будем считать, что под индуцированной нормой понимается спектральная норма: \[ \norm{A}_2 = \sqrt{\max_k \lambda_k(A^* A)}. \] Тогда \[ A^* A = \begin{bmatrix} 1 & 0 \\ 2 & 1 \end{bmatrix} \cdot \begin{bmatrix} 1 & 2 \\ 0 & 1 \end{bmatrix} = \begin{bmatrix} 1 & 2 \\ 2 & 5 \end{bmatrix}. \] Ищем собственные числа: \[ \begin{aligned} \det (A^* A - \lambda E) &= \begin{vmatrix} 1 - \lambda & 2 \\ 2 & 5 - \lambda \end{vmatrix} \\ &= (1 - \lambda) \cdot (5 - \lambda) - 4 \\ &= 5 - 5 \lambda - \lambda + \lambda^2 - 4 \\ &= \lambda^2 - 6 \lambda + 1. \end{aligned} \] Найдём дискриминант: \[ D = 36 - 4 = 32 = 16 \cdot 2, \] поэтому \[ \lambda_{1,2} = \frac{6 \pm 4\sqrt{2}}{2} = 3 \pm 2\sqrt{2}. \] Итак, спектральная норма матрицы равна \[ \norm{A}_2 = \sqrt{3 + 2 \sqrt{2}} = \sqrt{\paren{1 + \sqrt{2}}^2} = 1 + \sqrt{2}. \]
  2. Выпишите общий вид грамиана управляемости для системы \[ x(k+1) = P x(k) + Q u(k) + f(k), \quad \text{\textbf{где}} \quad P = \left[\begin{matrix} -2 & -1 \\ 1 & -2 \end{matrix}\right]. \]
    Проверим систему на асимптотическую устойчивость: \[ \begin{aligned} \det (P - \lambda E) &= \begin{vmatrix} -2 - \lambda & -1 \\ 1 & -2 - \lambda \end{vmatrix} \\ &= (2 + \lambda)^2 + 1 \\ &= \lambda^2 + 4 \lambda + 5. \end{aligned} \] Найдём дискриминант: \[ D = 16 - 20 = -4, \] поэтому \[ \lambda_{1,2} = \frac{-4 \pm 2i}{2} = -2 \pm i. \] Видно, что собственные числа не лежат внутри единичного круга: \[ \abs{\lambda_{1,2}} = \sqrt{4 + 1} = \sqrt{5} \gt 1, \] поэтому грамиан управляемости не существует.
  3. Сформулируйте 4 основных теоремы для полной наблюдаемости системы $\dot{x} = P(t) x + f(t)$.
    1. (Критерий полной наблюдаемости). Система \[ \begin{aligned} \dot{x} &= P(t) x + f(t), \\ y &= R(t) x + \varphi(t), \end{aligned} \] полностью наблюдаема тогда и только тогда, когда столбцы матрицы \[ H(t) := R(t) Y(t), \quad \text{где} \; Y(t) \; \text{— матрицант,} \] линейно независимы на $[0;T]$.
    2. Столбцы матрицы $H(t)$ линейно независимы на $[0;T]$ тогда и только тогда, когда существуют моменты времени \[ 0 \leqslant t_1 \lt t_2 \lt \dots \lt t_m \leqslant T, \quad m \leqslant n, \] для которых \[ \rank \paren{ \begin{matrix} H(t_1) \\ \vdots \\ H(t_m) \end{matrix} } = n. \]
    3. (Принцип двойственности). Система \[ \begin{aligned} \dot{x} &= P(t) x + f(t), \\ y &= R(t) x + \varphi(t), \end{aligned} \] полностью наблюдаема тогда и только тогда, когда двойственная система \[ \dot{z} = -P^*(t) z + R^*(t) u \] полностью управляема.
    4. (Достаточное условие полной наблюдаемости). Для полной наблюдаемости системы \[ \begin{aligned} \dot{x} &= P(t) x + f(t), \\ y &= R(t) x + \varphi(t). \end{aligned} \] достаточно, чтобы существовал такой момент времени $\tau \in [0; T]$, что \[ \rank S(\tau) = n, \] где \[ \left\{ \begin{aligned} S_0(t) &= R^*(t) \\ S_1(t) &= \dot{S}_0(t) + P^*(t) S_0(t) \\ &\dots \\ S_{n-1}(t) &= \dot{S}_{n-2}(t) + P^*(t) S_{n-2}(t) \end{aligned} \right. \quad \text{и} \quad S(t) := \left[ S_0(t), \dots, S_{n-1}(t) \right]. \]
  4. Запишите общее решение разностной системы в форме Коши.
    Рассмотрим линейную однородную разностную систему: \[ x(k+1) = P(k) x(k). \] Для неё общее решение в форме Коши: \[ x(k, k_0, x_0) = Y(k, k_0) x_0 = \prod_{j=k_0}^{k-1} P(j) x_0, \] где $Y(k, k_0)$ — матрицант.
  5. Постройте область достижимости: \[ A = \left[ \begin{matrix} a_1 & 0 \\ 0 & a_2 \end{matrix} \right], \quad a_1 \lt a_2, \quad Y(T) = E. \]
    Область достижимости представляет собой эллипс \[ \frac{1}{a_1} x^2 + \frac{1}{a_2} y^2 \leqslant \mu, \] вытянутый в сторону оси $Ox$.
    Рассматриваем полностью управляемую однородную систему \[ \dot{x} = P(t) x + Q(t) u, \quad f(t) \equiv 0, \] причём интенсивность управления ограничена: \[ \int\limits_0^T u^*(t) u(t) dt \leqslant \mu, \quad \mu \gt 0. \] Задача состоит в построении множества точек $\mathcal{A}$, в которые можно попасть из начала координат за время $T$, используя управление ограниченной интенсивности.

    Фундаментальная матрица $Y(t)$ не является матрицантом, поэтому сформулируем вспомогательную задачу:

    Построить область управляемости — множество точек, из которых можно попасть в начало координат за промежуток времени $[T; 0]$, используя управление ограниченной интенсивности: \[ \int\limits_T^0 u^*(t) u(t) dt \leqslant \mu, \quad \mu \gt 0. \]

    Нетрудно видеть, что фундаментальная матрица $Y(t)$ в этом случае будет матрицантом.

    Пусть $x_0 \in \mathcal{A}$. Система полностью управляема, поэтому можно построить программное управление для точек $(x_0, \vb{0})$ в виде \[ u(t) = B^*(t) C. \]

    Если $V(t) \not\equiv 0$, то значение функционала станет больше, следовательно, мы не учтём некоторые точки из области управляемости.

    Так как $x_1 = \vb{0}$, то \[ \eta = \cancel{Y^{-1}(0) \underbrace{x_1}_{=0}} - x_0 - \cancel{ \int\limits_T^0 Y^{-1}(\tau) \underbrace{f(\tau)}_{\equiv 0} d\tau } = - x_0. \] Из теоремы о полной управляемости линейной системы следует невырожденность матрицы $A$, поэтому $C = A^{-1} \eta$, а управление запишется в виде \[ u(t) = B^*(t) C = B^*(t) A^{-1} \eta = - B^*(t) A^{-1} x_0. \] Подставим его в уравнение интенсивности: \[ \begin{aligned} \int\limits_T^0 u^*(\tau) u(\tau) d\tau &= \int\limits_T^0 x_0^* (A^{-1})^* \overbrace{B(\tau) B^*(\tau)}^{=A} A^{-1} x_0 d\tau \\ &= x_0^* (A^{-1})^* A A^{-1} x_0 \\ &= x_0^* (A^{-1})^* x_0 \\ &= x_0^* (A^*)^{-1} x_0 \\ &= x_0^* A^{-1} x_0 \leqslant \mu. \end{aligned} \] В нашем случае \[ A^{-1} = \left[ \begin{matrix} \frac{1}{a_1} & 0 \\ 0 & \frac{1}{a_2} \end{matrix} \right], \] поэтому уравнение области управляемости принимает вид \[ \frac{1}{a_1} x^2 + \frac{1}{a_2} y^2 \leqslant \mu, \quad \text{где} \quad x_0 = \left[ \begin{matrix} x \\ y \end{matrix} \right] \]

  6. Оцените сверху и снизу функционал в задаче оптимальной стабилизации при произвольном допустимом управлении.
    Рассмотрим задачу оптимальной стабилизации: \[ \begin{aligned} \dot x &= P(t) x + Q(t) u, \\ u &= M(t) x, \end{aligned} \] где $P(t), Q(t), M(t)$ — вещественные ограниченные непрерывные матрицы. Требуется минимизировать функционал \[ J(x_0, u) = \int\limits_0^\infty f(t,x,u) dt, \] где $x_0$ — некоторый начальный вектор, а \[ f(t,x,u) := x^* A(t) x + x^* B(t) u + u^* B^*(t) x + u^* C(t) u. \] На допустимом управлении и соответствующем ему решении системы функционал сходится, так как матрицы ограничены, а система экспоненциально устойчива (по определению допустимого решения).

    В связи с этим можно оценить функционал для произвольного допустимого управления $u$: \[ J(x_0, u_0) \leqslant J(x_0, u) \lt +\infty. \]

  7. Что такое допустимое управление в задаче оптимальной стабилизации? Постройте множество допустимых управлений и обоснуйте его существование.
    Рассмотрим линейную нестационарную систему в отклонениях \[ \dot x = P(t) x + Q(t) u. \]
    Управление $u = M(t) x$ называют допустимым, если замкнутая система \[ \dot x = \paren{P(t) + Q(t) M(t)} x \] экспоненциально устойчива.
  8. Сформулируйте условие наблюдаемости конкретной пары точек $(x_0, x_1)$ для разностной системы \[ x(k+1) = P(k) x(k) + Q(k) u(k) + f(k). \]
  9. Сколько уравнений нужно решить, чтобы показать полную управляемость разностной устойчивой системы \[ x(k+1) = P x(k) + Q u(k) + f(k)? \]
  10. Какой факт из теории дифференциальных уравнений используется для доказательства принципа двойственности?
    Если $Y(t)$ — фундаментальная матрица системы \[ \dot x = P(t) x, \] то \[ \dot Y(t) \equiv P(t) Y(t). \]
  11. Сформулируйте достаточное условие стабилизации системы \[ \dot x = P(t) x + Q(t) u. \]
    Если система полностью управляема, то для неё можно построить стабилизирующее управление.