Вопросы — Современные разделы теории управления

Показывать
$\global\def\at#1#2{\left. #1 \right\rvert_{#2}}$ $\global\def\abs#1{\left\lvert #1 \right\rvert}$ $\global\def\norm#1{\left\lVert #1 \right\rVert}$ $\global\def\dp#1#2{#1 \cdot #2\,}$ $\global\def\vp#1#2{#1 \times #2\,}$ $\global\def\dv#1#2{\frac{d #1}{d #2}}$ $\global\def\pd#1#2{\frac{\partial #1}{\partial #2}}$ $\global\def\pdv2#1#2{\frac{\partial^2 #1}{\partial #2^2}}$ $\global\def\ppdv#1#2#3{\frac{\partial^2 #1}{\partial #2 \partial #3}}$ $\global\def\paren#1{\left( #1 \right)}$ $\global\def\mbox#1{\text{#1}}$ $\global\def\div{\text{div}\,}$ $\global\def\dsum{\displaystyle\sum\,}$ $\global\def\grad{\text{grad}\,}$ $\global\def\rot{\text{rot}\,}$ $\global\def\bydef#1{\overset{\mathrm{def}}{#1}}$ $\global\def\vb#1{\textbf{#1}}$ $\global\def\rddots{\cdot^{\displaystyle \cdot^{\displaystyle \cdot}}}$ $\global\def\op#1{\mathrm{#1}\,}$ $\global\def\diag{\mathrm{diag}\,}$ $\global\def\rank{\mathrm{rank}\,}$ $\global\def\Sp{\,\mathrm{Sp}\,}$ $\global\def\proj{\mathrm{proj}}$ $\global\def\grad{\,\mathrm{grad}\,}$ $\global\def\const{\text{const}\,}$ $\global\def\res{\text{res}\,}$ $\global\def\Res{\text{Res}\,}$ $\global\def\Lin{\,\text{Lin}\,}$ $\global\def\Re{\text{Re}\,}$ $\global\def\Im{\text{Im}\,}$ $\global\def\ch{\text{ch}\,}$ $\global\def\sh{\text{sh}\,}$ $\global\def\tg{\mathrm{tg}\,}$ $\global\def\argtg{\text{argtg}\,}$
  1. Построение программного управления. Лемма о допустимых управлениях
    Рассмотрим систему \[ \left\{ \begin{aligned} \dot x(t) &= A(t) x(t) + B(t) u(t) + \xi(t), \\ y(t) &= C(t) x(t) + \eta(t), \end{aligned} \right. \] где
    • $t \in [0, T]$, где $T > 0$;
    • $x(t) \in \mathbb{R}^n, \; u(t) \in \mathbb{R}^m, \; y(t) \in \mathbb{R}^r$;
    • $A(t) \in \mathbb{R}^{n \times n}, \; B(t) \in \mathbb{R}^{n \times m}, \; C(t) \in \mathbb{R}^{r \times n}$
    • $\xi(t) \in \mathbb{R}^n, \; \eta(t) \in \mathbb{R}^r$.
    Вектор $x(t)$ назыывают вектором состояния, $u(t)$ — управлением, $y(t)$ — наблюдением, а $\xi(t)$ и $\eta(t)$ — внешними воздействиями.

    Будем считать, что $A(t), B(t)$ и $C(t)$ непрерывны.

    Функцию $u(t) \in U$ называют допустимым управлением, если она
    1. задана на $[0, T]$;
    2. кусочно-непрерывна.
    Если потребуется, можно ещё сказать, что интенсивность функции $u(t)$ должна быть ограничена на $[0, T]$: \[ \chi[u] = \int\limits_0^T u^T(\tau) u(\tau) d \tau \lt \infty. \]

    Рассмотрим линейную систему ОДУ: \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t). \] Пусть $Y(t)$ — фундаментальная матрица соответствующей однородной системы, нормированная в нуле: $Y(0) = E$. Тогда можно записать общее решение неоднородной системы в форме Коши: \[ x(t, 0, x^0) = Y(t) \left( x^0 + \int\limits_0^t Y^{-1}(\tau) \left[ B(\tau) u(\tau) + \xi(\tau) \right] d\tau \right). \]

    Требуется найти допустимое управление $u(t)$, переводящее систему \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t), \] из состояния $x(0) = x^0$ в состояние $x(T) = x^1$.
    Допустимое управление $u(t)$ называется программным, если оно переводит систему \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t) \] из состояния $x(0) = x^0$ в состояние $x(T) = x^1$.
    Рассмотрим общее решение исходной системы в форме Коши: \[ x(t, 0, x^0) = Y(t) \left( x^0 + \int\limits_0^t Y^{-1}(\tau) \left[ B(\tau) u(\tau) + \xi(\tau) \right] d\tau \right). \] Если $u(t)$ — программное, то \[ x(T, 0, x^0) = x^1, \] то есть поиск программного решения сводится к поиску решения, удовлетворяющего этому равенству.

    Найдём из него, что \[ x^1 = Y(T) \paren{ x^0 + \int\limits_0^T Y^{-1}(\tau) B(\tau) u(\tau) d\tau + \int\limits_0^T Y^{-1}(\tau) \xi(\tau) d\tau }. \] Обозначим $Q(t) := Y^{-1}(t) B(t)$ и домножим уравнение слева на $Y^{-1}(T)$: \[ \begin{gathered} Y^{-1}(T) x^1 = x^0 + \int\limits_0^T \underbrace{Y^{-1}(\tau) B(\tau)}_{= Q(\tau)} u(\tau) d\tau + \int\limits_0^T Y^{-1}(\tau) \xi(\tau) d\tau, \\ \implies \int\limits_0^T Q(\tau) u(\tau) d\tau = Y^{-1}(T) x^1 - x^0 - \int\limits_0^T Y^{-1}(\tau) \xi(\tau) d\tau. \end{gathered} \] Правая часть — некоторая константа, которую можно обозначить как $\eta$, тогда \[ \int\limits_0^T Q(\tau) u(\tau) d\tau = \eta, \] то есть если $u(t)$ удовлетворяет этому интегральному уравнению, то оно программное.

    (о допустимых управлениях)
    Если допустимое управление $u(t)$ линейной системы \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t) \] на $[0, T]$ существует, то оно представимо в виде \[ u(t) = Q^T(t) C + V(t), \qquad Q(t) := Y^{-1}(t) B(t), \] где
    • $Y(t)$ — нормированная в нуле фундаментальная матрица соответствующей однородной системы;
    • $C \in \mathbb{R}^n$ — постоянный вектор, подлежащий определению;
    • $V(t)$ — $m$-мерная векторная функция, удовлетворяющая условию ортогональности: \[ \int\limits_0^T Q(\tau) V(\tau) d\tau = 0. \]
    Подставим представление \[ u(t) = Q^T(t) C + V(t) \] в уравнение ортогональности, докажем совместность системы от противного (предположив, что $\rank \Gamma(T) \lt \rank (\Gamma(T), \eta)$), воспользовавшись теоремой Фредгольма: система $A x = b$ несовместна тогда и только тогда, когда существует ненулевой вектор $\gamma$ такой, что $\gamma^T A = 0$, но $\gamma^T b \neq 0$.
    Пусть существует допустимое управление $u(t)$. Тогда утверждение леммы справедливо, если \[ V(t) = u(t) - Q^T(t) C \] и \[ \int\limits_0^T Q(\tau) \left[ u(\tau) - Q^T(\tau) C \right] d\tau = 0. \] Перепишем это равенство в виде \[ \int\limits_0^T Q(\tau) u(\tau) d\tau = \int\limits_{0}^{T} Q(\tau) Q^T(\tau) C d\tau = \left( \int\limits_{0}^{T} Q(\tau) Q^T(\tau) d\tau \right) C \] и рассмотрим его как СЛАУ относительно неизвестного вектора $C$: \[ \Gamma(T) C = \eta, \] где \[ \Gamma(T) := \int\limits_0^T Q(\tau) Q^T(\tau) d\tau, \quad \eta := \int\limits_0^T Q(\tau) u(\tau) d\tau. \]
    Матрицу \[ \Gamma(T) = \int\limits_0^T Q(\tau) Q^T(\tau) d\tau \] называют матрицей Грама (грамианом) управляемости.

    Из теоремы Кронекера-Капелли известно, что система $Ax = b$ совместна тогда и только тогда, когда $\rank A = \rank (A, b)$.

    Предположим, что система несовместна, то есть $\rank \Gamma(T) \lt \rank (\Gamma(T), \eta)$. Тогда по теореме Фредгольма найдётся вектор $\gamma \neq 0$, ортогональный всем столбцам матрицы $\Gamma(T)$, но не ортогональный вектору $\eta$, то есть \[ \gamma^T \Gamma(T) = 0, \quad \gamma^T \eta \neq 0. \] Отсюда следует, что \[ \begin{aligned} 0 &= \gamma^T \Gamma(T) \\ &= \gamma^T \Gamma(T) \gamma \\ &= \gamma^T \int\limits_0^T Q(\tau) Q^T(\tau) d\tau \cdot \gamma \\ &= \int\limits_0^T \gamma^T Q(\tau) Q^T(\tau) \gamma d\tau \\ &= \int\limits_0^T \norm{\gamma^T Q(\tau)}^2 d\tau = 0, \end{aligned} \] то есть $\gamma^T Q(t) \equiv 0$ на $[0, T]$. Но тогда \[ \gamma^T \eta = \gamma^T \int\limits_0^T Q(\tau) u(\tau) d\tau = \int\limits_0^T \underbrace{\gamma^T Q(\tau)}_{\equiv 0} u(\tau) d\tau = 0, \] что противоречит выбору $\gamma$. Значит, $\rank \Gamma(T) = \rank (\Gamma(T), \eta)$, то есть система совместна.

    Решая эту систему, находим вектор $C$, при котором разность $u(t) - Q^T(t) C$ удовлетворяет условию \[ \int\limits_0^T Q(\tau) \left[ u(\tau) - Q^T(\tau) C \right] d\tau = 0. \] Введя обозначение $V(t) := u(t) - Q^T(t) C$, получаем, что \[ u(t) = Q^T(t) C + V(t). \]

    В случае поиска программного управления $u(t)$, переводящего систему из $x(0) = x^0$ в $x(T) = x^1$, известен коэффициент \[ \eta = \int\limits_0^T Q(\tau) u(\tau) d\tau \bydef= Y^{-1}(T) x^1 - x^0 - \int\limits_0^T Y^{-1}(\tau) \xi(\tau) d\tau. \]
  2. Первый критерий полной управляемости: теорема о полноте ранга матрицы Грама управляемости
    Рассмотрим систему \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t) \] на отрезке $[0, T]$.
    Пара точек $(x^0, x^1)$ называется управляемой на $[0, T]$, если существует программное управление $u(t)$, переводящее систему из $(0, x^0)$ в $(T, x^1)$.
    (об управляемости пары точек)
    Пара точек $(x^0, x^1)$ управляема на $[0, T]$ тогда и только тогда, когда \[ \rank \Gamma(T) = \rank (\Gamma(T), \eta), \] где
    • ${\displaystyle \Gamma(T) = \int\limits_0^T Q(\tau) Q^T(\tau) d\tau}$,
    • ${\displaystyle Q(t) = Y^{-1}(t) B(t)}$.
    • ${\displaystyle \eta = Y^{-1}(T) x^1 - x^0 - \int\limits_{0}^{T} Y^{-1}(\tau) \xi(\tau) d\tau}$.
    Так как пара точек управляема, существует программное управление, тогда по лемме о допустимых управлениях $\rank \Gamma(T) = \rank (\Gamma(T), \eta)$.
    Так как $\rank \Gamma(T) = \rank (\Gamma(T), \eta)$, то можно решить систему $\Gamma(T) C = \eta$ (она совместна), найти решение $\overline C$ и построить программное управление $u(t) = Q^T(t) \overline C + V(t)$, где $\overline C$ и $V(t)$ удовлетворяют условию леммы о допустимых управлениях, следовательно, пара точек управляема.
    Пусть пара $(x^0, x^1)$ — управляема, то есть существует программное управление $u(t)$. Из леммы о допустимых управлениях следует, что оно представимо в виде \[ u(t) = Q^T(t) C + V(t), \quad \text{причём} \quad \int\limits_0^T Q(\tau) V(\tau) d\tau = 0, \] и удовлетворяет уравнению \[ \int\limits_0^T Q(\tau) u(\tau) d\tau = \eta, \] следовательно, $C$ является решением СЛАУ \[ \Gamma(T) C = \eta, \] то есть эта СЛАУ совместна, поэтому по теореме Кронекера-Капелли \[ \rank \Gamma(T) = \rank (\Gamma(T), \eta). \]
    Пусть $\rank \Gamma(T) = \rank (\Gamma(T), \eta)$, тогда по теореме Кронекера-Капелли СЛАУ \[ \Gamma(T) C = \eta \] совместна, следовательно, существует $\overline{C}$ — решение этой СЛАУ. Тогда по лемме о допустимых управлений управление \[ u(t) = Q^T(t) \overline{C} + V(t), \quad \text{причём} \quad \int\limits_0^T Q(\tau) V(\tau) d\tau = 0, \] удовлетворяет уравнению \[ \int\limits_0^T Q(\tau) u(\tau) d\tau = \eta, \] то есть является программным для пары точек $(x^0, x^1)$. Отсюда по определению следует, что пара точек $(x^0, x^1)$ является управляемой.
    Система называется полностью управляемой на $[0, T]$, если любая пара точек $(x^0, x^1)$ управляема.
    (первый критерий полной управляемости)
    Система \[ \dot x(t) = A(t) x(t) + B(t) u(t) + f(t) \] полностью управляема на $[0; T]$ тогда и только тогда, когда \[ \rank \Gamma(T) = n, \quad (\text{или} \; \det \Gamma(T) \neq 0), \] где
    • ${\displaystyle \Gamma(T) = \int\limits_0^T Q(\tau) Q^T(\tau) d\tau}$;
    • ${\displaystyle Q(t) = Y^{-1}(t) B(t)}$.
    Если система полностью управляма, то система $\Gamma(T) C = \eta$ должна быть разрешима при любом $\eta = \eta(x^0, x^1)$, а это возможно тогда и только тогда, когда $\Gamma(T)$ невырождена.
    Если $\Gamma(T)$ невырождена, то для любой пары точек $(x^0, x^1)$ можно найти $\overline C$, решив СЛАУ $\Gamma(T) C = \eta = \eta(x^0, x^1)$, то есть построить программное управление вида $u = Q^T(t) C + V(t)$, а это и означает полная управляемость системы.
    Пусть система полностью управляема, тогда $\eta = \eta(x^0, x^1)$ может принимать любые значения в силу произвольности пары $(x^0, x^1)$, следовательно, система \[ \Gamma(t) C = \eta \] совместна для любого $\eta$. Отсюда следует невырожденность матрицы $\Gamma(T)$, то есть $\det \Gamma(T) \neq 0$.
    Пусть $\det \Gamma(T) \neq 0$, тогда для любого вектора $\eta = \eta(x^0, x^1)$ можно найти решение $\overline C$ СЛАУ \[ \Gamma(T) C = \eta, \] следовательно, для любой пары точек $(x^0, x^1)$ можно построить программное управление \[ u(t) = Q^T(t) \overline C + V(t), \] поэтому система является полностью управляемой на $[0, T]$.
  3. Второй критерий полной управляемости: теорема о линейной независимости на отрезке $[0, T]$ строк грамиана управления
    Рассмотрим систему \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t) \] на отрезке $[0, T]$.
    (второй критерий полной управляемости)
    Система является полностью управляемой тогда и только тогда, когда строки матрицы $Q(t) = Y^{-1}(t) B(t)$ (столбцы матрицы $Q^T(t)$) являются линейно независимыми на $[0, T]$.
    Везде пользуемся определением грамиана: \[ \Gamma(T) \bydef= \int\limits_{0}^{T} Q(\tau) Q^T(\tau) d\tau. \]
    Доказываем от противного: предполагаем, что система полностью управляема, но строки матрицы $Q(t)$ линейно зависимы. Строим квадратичную форму $C^T \Gamma(T) C$, пользуемся определением грамиана и приходим к тому, что $C^T \Gamma(T) C$. Так как $C \neq 0$, получаем, что $\Gamma(T) C = 0$, то есть $\det \Gamma(T) = 0$, а это противоречит первому критерию полной управляемости.
    Доказываем от противного: предполагаем, что строки матрицы $Q(t)$ линейно независимы, но система не является полностью управляемой. Тогда из первого критерия полной управляемости следует, что $\det \Gamma(T) = 0$, то есть существует $C \neq 0$ такой, что $\Gamma(T) C = 0$. Домножаем справа на $C^T$, пользуемся определением грамиана и получаем, что $C^T Q(t) \equiv 0$, а это противоречит линейной независимости строк $Q(t)$.
    От противного. Пусть система полностью управляема, но строки матрицы $Q(t)$ линейно зависимы на $[0, T]$. Это значит, что существует вектор $C \neq 0$ такой, что \[ C^T Q(t) \equiv 0, \quad t \in [0, T]. \] Рассмотрим квадратичную форму \[ \begin{aligned} C^T \Gamma(T) C &= C^T \left[ \int\limits_{0}^{T} Q(\tau) Q^T(\tau) d\tau \right] C = \\ &= \int\limits_{0}^{T} C^T Q(\tau) Q^T(\tau) C d\tau = \\ &= \int\limits_{0}^{T} \norm{C^T Q(\tau)}^2 d\tau = 0, \end{aligned} \] то есть $C^T \Gamma(T) C = 0$. В силу того, что $C \neq 0$, имеем $\Gamma(T) C = 0$, откуда следует, что $\det \Gamma(T) = 0$, то есть грамиан является вырожденным. Из первого критерия полной управляемости известно, что система является полностью управляемой тогда и только тогда, когда грамиан невырожден, следовательно, получили противоречие.
    От противного. Пусть строки матрицы $Q(t)$ линейно независимы на $[0, T]$, но система не является полностью управляемой, то есть (по первому критерию полной управляемости) $\det \Gamma(T) = 0$. Отсюда следует, что существует ненулевой вектор $C \neq 0$ такой, что \[ \Gamma(T) C = 0. \] Тогда \[ \begin{aligned} 0 &= \Gamma(T) C = \\ &= C^T \Gamma(T) C = \\ &= C^T \left[ \int\limits_{0}^{T} Q(\tau) Q^T(\tau) d\tau \right] C = \\ &= \int\limits_{0}^{T} C^T Q(\tau) Q^T(\tau) C d\tau = \\ &= \int\limits_{0}^{T} \norm{C^T Q(\tau)}^2 = 0. \end{aligned} \] Следовательно, для некоторого ненулевого $C$ выполняется тождество \[ C^T Q(t) \equiv 0, \qquad t \in [0, T], \] что противоречит предположению о линейной независимости строк матрицы $Q(t)$ на $[0, T]$.
  4. Третий критерий полной управляемости: теорема о существовании конечного числа точек на $[0, T]$ таких, что матрица, составленная из значений грамиана в данных точках, имеет полный ранг
    Рассмотрим систему \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t) \] на отрезке $[0, T]$.
    (третий критерий полной управляемости)
    Система полностью управляема тогда и только тогда, когда существует $k > 0$ и точки \[ 0 \leqslant t_1 \leqslant t_2 \leqslant \dots \leqslant t_k \leqslant T, \] такие, что \[ \rank \left[ Q(t_1), Q(t_2), \dots, Q(t_k) \right] = n. \]
    Доказываем от противного: пусть система полностью управляема, но для любых точек ранг блочной матрицы меньше $n$. Каждому набору точек соответствует ненулевой вектор $C \neq 0$ такой, что \[ C^T Q(t_i) = 0, \qquad i = \overline{1, k}. \] Чтобы показать, что найдётся вектор, обращающий $C^T Q(t)$ в тождественный ноль на $[0, T]$, делаем следующее. Рассматриваем какой-то набор из $k$ рациональных точек, ему соответствует $C_k \neq 0$. Докидываем ещё одну точку, получаем новый $C_{k+1}$. Сделаем так, чтобы все эти $C_k$ были единичными (это всегда можно сделать нормировкой), тогда они лежат на единичной гиперсфере.

    Теперь устремляем $k \to \infty$. Получаем последовательность векторов $\left\{ C_N \right\}$. Так как эта последовательность определена на компакте, то из неё можно выделить сходящуюся подпоследовательность, которая сойдётся к некоторому $C \neq 0$. Теперь ссылаемся на то, что множество рациональных чисел плотно на отрезке, и на непрерывность $Q(t)$, и получаем, что найдётся $C \neq 0$, при котором \[ C^T Q(t) \equiv 0, \quad t \in [0, T]. \] Это значит, что строки $Q(t)$ линейно зависимы на $[0, T]$, а это противоречит предположению о полной управляемости системы (конкретно второму критерию полной управляемости).

    Так как для какого-то набора точек ранг блочной матрицы равен $n$, то линейная комбинация строк обращается в ноль тогда и только тогда, когда $C = 0$. Значит, конкретно в этих точках \[ C^T Q(t_i) = 0, \qquad i = \overline{1, k} \] только для $C = 0$, а отсюда следует, что $C^T Q(t) \not\equiv 0$ на $[0, T]$. Значит, строки матрицы $Q(t)$ линейно независимы на $[0, T]$, поэтому из второго критерия полной управляемости следует полная управляемость системы.
    От противного. Пусть система полностью управляема, но для любого $k \gt 0$ и любых \[ 0 \leqslant t_1 \leqslant t_2 \leqslant \dots \leqslant t_k \leqslant T \] справедливо неравенство \[ \rank \left[ Q(t_1), Q(t_2), \dots, Q(t_k) \right] \lt n. \] Следовательно, найдётся $C \neq 0$ такой, что \[ C^T \left[ Q(t_1), Q(t_2), \dots, Q(t_k) \right] = 0. \] Выбор $C \neq 0$ зависит от конкретных точек $t_1, \dots, t_k$.

    Пусть $r_1, \dots, r_k$ — некоторые рациональные числа из отрезка $[0, T]$. Для них найдётся $C_k \neq 0$ такой, что \[ C_k^T Q(r_i) = 0, \quad i = \overline{1, k}. \] Пусть $\norm{C_k} = 1$, то есть $C_k$ лежит на единичной гиперсфере $S_1(\mathbb{R}^n)$. Этого всегда можно добиться нормировкой.

    Рассмотрим теперь набор рациональных чисел $r_1, \dots, r_k, r_{k+1}$. Для него найдётся $C_{k+1} \neq 0$ такой, что \[ C_{k+1}^T Q(r_i) = 0, \quad i = \overline{1, k+1}. \] Теперь, последовательно добавляя новые рациональные точки к существующему набору, получим последовательность ненулевых векторов $C_1, C_2, \dots, C_k, \dots$. Все эти векторы лежат на единичной гиперсфере конечномерного пространства $\mathbb{R}^n$, которая является компактом. Значит, из этой последовательности $\left\{ C_{N} \right\}$ можно выделить сходящуюся подпоследовательность $\left\{ C_{N_l} \right\} \to C$, причём $\norm{C} = 1$, то есть $C \neq 0$.

    Теперь, пользуясь плотностью рациональных чисел на отрезке и непрерывностью $Q(t)$, заключаем, что существует $C \neq 0$ такой, что \[ C^T Q(t) \equiv 0, \qquad t \in [0, T]. \] Следовательно, строки матрицы $Q(t)$ линейно зависимы на $[0, T]$, а это противоречит предположению о полной управляемости системы (конкретно второму критерию полной управляемости).

    Пусть \[ \rank \left[ Q(t_1), Q(t_2), \dots, Q(t_k) \right] = n. \] Отсюда следует, что \[ C^T \left[ Q(t_1), Q(t_2), \dots, Q(t_k) \right] = 0 \] тогда и только тогда, когда $C = 0$. Тогда \[ C^T Q(t_i) = 0, \qquad i = \overline{1, k}. \] Отсюда следует, что $C^T Q(t) \not\equiv 0$ на $[0, T]$, то есть строки матрицы $Q(t)$ являются линейно независимыми на $[0, T]$. Пользуясь вторым критерием полной управляемости, заключаем, что система является полностью управляемой.
  5. Достаточный признак полной управляемости
    Рассмотрим систему \[ \dot x(t) = A(t) x(t) + B(t) u(t) + \xi(t) \] на отрезке $[0, T]$.

    Рассмотрим последовательность матриц: \[ \begin{aligned} L_1(t) &= B(t), \\ L_2(t) &= \frac{d }{d t} L_1(t) - A(t) L_1(t), \\ &\vdots \\ L_{k+1}(t) &= \frac{d }{d t} L_k(t) - A(t) L_k(t). \end{aligned} \]

    (достаточный признак полной управляемости)
    Если существует $l \geqslant 1$ и $\tau \in [0, T]$ такие, что \[ \rank \left[ L_1(\tau), L_2(\tau), \dots, L_l(\tau) \right] = n, \] то система полностью управляема.
    Доказываем от противного: предполагаем, что ранг блочной матрицы равен $n$, но система не является полностью управляемой. Из второго критерия полной управляемости следует, что строки матрицы $Q(t)$ являются линейно зависимыми на $[0, T]$, то есть найдётся $C \neq 0$, при котором \[ C^T Q(t) \equiv 0. \] Подставляем сюда формулу $Q(t) = Y^{-1}(t) B(t)$, дифференцируем $l$ раз, для нахождения производной от $Y^{-1}(t)$ дифференцируем $Y^{-1}(t) Y(t) = E$ и пользуемся тем, что $Y(t)$ — фундаментальная матрица однородной системы, то есть $\frac{d }{d t} Y(t) = A(t) Y(t)$. После всех шагов дифференцирования имеем: \[ C^T Y^{-1}(t) L_i(t) \equiv 0, \quad i = \overline{1, l}. \] Замечаем, что $\gamma^T = C^T Y^{-1}(t)$ ненулевой, и получаем, что нашёлся ненулевой вектор, который тождественно зануляет нашу блочную матрицу — противоречие.
    От противного. Пусть выполнены условия теоремы, но система не является полностью управляемой. Из второго критерия полной управляемости следует, что строки матрицы $Q(t)$ являются линейно зависимыми на $[0, T]$, то есть найдётся $C \neq 0$ такой, что \[ C^T Q(t) \equiv 0, \qquad t \in [0, T]. \] По определению $Q(t) = Y^{-1}(t) B(t)$, тогда \[ \begin{aligned} C^T Q(t) = C^T Y^{-1}(t) B(t) &\equiv 0, \\ \implies C^T Y^{-1}(t) L_1(t) &\equiv 0, & t &\in [0, T]. \end{aligned} \] Продифференцируем по $t$: \[ \tag{1} C^T \frac{d }{d t} Y^{-1}(t) L_1(t) + C^T Y^{-1}(t) \frac{d }{d t} L_1(t) \equiv 0 \] Теперь воспользуемся тем, что $Y^{-1}(t) Y(t) = E$: \[ \begin{aligned} \frac{d }{d t} \left( Y^{-1}(t) Y(t) \right) &= \frac{d }{d t} Y^{-1}(t) Y(t) + Y^{-1}(t) \frac{d }{d t} Y(t) = \\ &= \frac{d }{d t} Y^{-1}(t) Y(t) + Y^{-1}(t) A(t) Y(t) = 0, \end{aligned} \] так как матрица $Y(t)$ является фундаментальной матрицей однородной системы $\dot x(t) = A(t) x(t)$.

    Домножим теперь обе части неравенства справа на $Y^{-1}(t)$, получаем: \[ \frac{d }{d t} Y^{-1}(t) + Y^{-1}(t) A(t) = 0, \implies \frac{d }{d t} Y^{-1}(t) = - Y^{-1}(t) A(t). \]

    Подставляем в $(1)$: \[ \begin{aligned} C^T \frac{d }{d t} Y^{-1}(t) L_1(t) + C^T Y^{-1}(t) \frac{d }{d t} L_1(t) &= - C^T Y^{-1}(t) A(t) L_1(t) + C^T Y^{-1}(t) \frac{d }{d t} L_1(t) = \\ &= C^T Y^{-1}(t) \left[ \frac{d }{d t} L_1(t) - A(t) L_1(t) \right] = \\ &= C^T Y^{-1}(t) L_2(t) \equiv 0, & t &\in [0, T]. \end{aligned} \]

    Повторяя этот процесс $l$ раз, получаем \[ C^T Y^{-1}(t) L_i(t) \equiv 0, \quad t \in [0, T], \quad i = \overline{1, l}. \] Заметим теперь, что $\gamma^T := C^T Y^{-1}(t) \neq 0$. Значит, \[ \gamma^T \left[ L_1(\tau), L_2(\tau), \dots, L_l(\tau) \right] \equiv 0, \qquad t \in [0, T], \] откуда следует, что \[ \rank \left[ L_1(\tau), L_2(\tau), \dots, L_l(\tau) \right] \lt n, \] то есть получили противоречие.

  6. Понятие наблюдаемости. Необходимое и достаточное условие полной наблюдаемости
    Рассмотрим систему \[ \left\{ \begin{aligned} \dot x(t) &= A(t) x(t) + B(t) u(t), \\ y(t) &= C(t) x(t) \end{aligned} \right. \] на отрезке $[0, T]$.
    Система называется полностью наблюдаемой на отрезке $[0, T]$, если из того, что \[ u(t) \equiv 0, \qquad t \in [0, T] \] и \[ y(t) \equiv 0, \qquad t \in [0, T], \] следует, что \[ x(t) \equiv 0, \qquad t \in [0, T]. \]
    Система называется полностью наблюдаемой на отрезке $[0, T]$, если из того, что \[ u_1(t) \equiv u_2(t) \quad \text{и} \quad y_1(t) \equiv y_2(t), \quad t \in [0, T] \] следует, что \[ x_1(t) \equiv x_2(t), \quad t \in [0, T]. \]
    Определения выше эквивалентны.
    Рассмотрим две системы с $u_1, y_1, x_1$ и $u_2, y_2, x_2$. Вычтем из первой вторую, предположим, что \[ u_1(t) - u_2(t) \equiv 0, \qquad y_1(t) - y_2(t) \equiv 0. \] Из того, что $C(t) \not\equiv 0$, получаем, что $x_1(t) - x_2(t) \equiv 0$.

    Если обозначим разности, получим первое определение. Если перенесём вторые слагаемые вправо, получим второе определение.

    Рассмотрим две системы: \[ \left\{ \begin{aligned} \dot x_1(t) &= A(t) x_1(t) + B(t) u_1(t), \\ y_1(t) &= C(t) x_1(t) \end{aligned} \right. \] и \[ \left\{ \begin{aligned} \dot x_2(t) &= A(t) x_2(t) + B(t) u_2(t), \\ y_2(t) &= C(t) x_2(t). \end{aligned} \right. \] Вычтем из первой вторую: \[ \left\{ \begin{aligned} \frac{d }{d t} \left( x_1(t) - x_2(t)\right) &= A(t) \left(x_1(t) - x_2(t) \right) + B(t) \left( u_1(t) - u_2(t) \right), \\ y_1(t) - y_2(t) &= C(t) \left( x_1(t) - x_2(t) \right). \end{aligned} \right. \] Заметим, что если $u_1(t) - u_2(t) \equiv 0$ и $y_1(t) - y_2(t) \equiv 0$, то \[ \left\{ \begin{aligned} \frac{d }{d t} \left( x_1(t) - x_2(t)\right) &= A(t) \left(x_1(t) - x_2(t) \right), \\ 0 &= C(t) \left( x_1(t) - x_2(t) \right). \end{aligned} \right. \] Так как $C(t) \not\equiv 0$, получаем, что $x_1(t) - x_2(t) \equiv 0$.
    1. Первое определение получаем, если положим \[ \begin{aligned} u(t) &= u_1(t) - u_2(t) \equiv 0, \\ y(t) &= y_1(t) - y_2(t) \equiv 0, \\ x(t) &= x_1(t) - x_2(t) \equiv 0. \end{aligned} \]
    2. Второе определение получаем, если перепишем тождества: \[ \begin{aligned} u_1(t) - u_2(t) \equiv 0 \implies & u_1(t) \equiv u_2(t), \\ y_1(t) - y_2(t) \equiv 0 \implies & y_1(t) \equiv y_2(t), \\ x_1(t) - x_2(t) \equiv 0 \implies & x_1(t) \equiv x_2(t). \end{aligned} \]
    По доступным наблюдениям $y(t)$ определить $x(t)$ на отрезке $[0, T]$.
    Пусть $x(0) = x^0$, тогда рассмотрим общее решение в форме Коши: \[ \begin{aligned} x(t) &= Y(t) \paren{ x^0 + \int\limits_0^t Y^{-1}(\tau) B(\tau) u(\tau) d\tau } = \\ &= Y(t) \paren{ x^0 + \int\limits_0^t Q(\tau) u(\tau) d\tau }. \end{aligned} \] Подставим это выражение в уравнение наблюдателя: \[ \begin{aligned} y(t) &= C(t) Y(t) \paren{ x^0 + \int\limits_0^t Q(\tau) u(\tau) d\tau } = \\ &= C(t) Y(t) x^0 + C(t) Y(t) \int\limits_0^t Q(\tau) u(\tau) d\tau. \end{aligned} \] Пусть $P(t) := C(t) Y(t)$, тогда \[ \begin{aligned} y(t) &= P(t) x^0 + P(t) \int\limits_0^t Q(\tau) u(\tau) d\tau = \\ &= P(t) x^0 + \varphi(t), \end{aligned} \] где \[ \varphi(t) = P(t) \int\limits_0^t Q(\tau) u(\tau) d\tau. \]
    Матрицу \[ O(T) = \int\limits_{0}^{T} P^T(\tau) P(\tau) d\tau \] называют грамианом наблюдаемости.
    $\dim P(t) = r \times n$, а $\dim O(T) = n \times n$.
    Система наблюдаема тогда и только тогда, когда \[ \rank O(T) = n. \]
    Доказываем от противного: предполагаем, что система полностью наблюдаема, но $\rank O(T) \lt n$. Отсюда следует, что существует $z \neq 0$ такой, что $O(T) z = 0$.

    Теперь рассматриваем $z^T O(T) z$, получаем, что $P(t) z \equiv 0$ на $[0, T]$.

    Окончательно рассматриваем два начальных условия: $x^1 = 0$ и $x^2 = z$, строим наблюдения. Первые слагаемые у них обнулятся, они будут равны друг другу, и тут фиксируем противоречие с полной наблюдаемостью, т.к. управления и наблюдения совпадают, а решения нет.

    Доказываем от противного: предполагаем, что $\rank O(T) = n$, но система не является полностью наблюдаемой. По определению это значит, что существуют начальные условия $x^1 \neq x^2$ такие, что наблюдения и управления совпадут. Строим для каждого начального условия наблюдатель, их разница тождественно равна нулю, поэтому $P(t) (x^1 - x^2) = P(t) z \equiv 0$ на $[0, T]$.

    Рассматриваем теперь квадратичную форму $z^T O(T) z$, подставляем определение грамиана наблюдаемости, получаем, что эта форма равна нулю при ненулевом $z$ — получаем противоречие с тем, что $\rank O(T) = n$.

    От противного. Пусть система полностью наблюдаема, но $\rank O(T) \lt n$. Следовательно, существует $z \neq 0$ такой, что \[ O(T) z = 0. \] Тогда \[ \begin{aligned} 0 &= O(T) z = \\ &= z^T O(T) z = \\ &= z^T \left[ \int\limits_{0}^{T} P^T(\tau) P(\tau) d\tau \right] z = \\ &= \int\limits_{0}^{T} z^T P^T(\tau) P(\tau) z d\tau = \\ &= \int\limits_{0}^{T} \norm{P(\tau) z}^2 d\tau = 0. \end{aligned} \] Следовательно, \[ P(t) z \equiv 0, \quad t \in [0, T]. \] Рассмотрим теперь два начальных условия: $x^1 = 0$ и $x^2 = z$. Им соответствуют наблюдения \[ y_1(t) = P(t) x^1 + \varphi_1(t) \quad \text{и} \quad y_2(t) = P(t) x^2 + \varphi_2(t). \] Заметим, что $P(t) x^1 \equiv 0$, так как $x^1 = 0$, и $P(t) x^2 = P(t) z \equiv 0$.

    Также заметим, что $\varphi_1(t) \equiv \varphi_2(t) \equiv \varphi(t)$, так как это слагаемое не зависит от начальных условий.

    Получаем, что $y_1(t) \equiv y_2(t)$ и $u_1(t) \equiv u_2(t)$, но $x_1(t) \not\equiv x_2(t)$, что противоречит предположению о полной наблюдаемости системы.

    От противного. Пусть $\rank O(T) = n$, но система не является полностью наблюдаемой. Значит, существуют $x^1 \neq x^2$ такие, что $y_1(t) \equiv y_2(t)$ и $u_1(t) \equiv u_2(t)$, но $x_1(t) \not\equiv x_2(t)$.

    Наблюдения, соответствующие этим начальным условиям: \[ y_1(t) = P(t) x^1 + \varphi(t), \quad y_2(t) = P(t) x^2 + \varphi(t), \] причём \[ y_1(t) - y_2(t) = P(t) (x^1 - x^2) \equiv 0, \quad t \in [0, T]. \] Обозначим $z = x^1 - x^2 \neq 0$. Тогда \[ P(t) z \equiv 0, \quad t \in [0, T]. \]

    Рассмотрим теперь квадратичную форму: \[ \begin{aligned} z^T O(T) z &= z^T \left[ \int\limits_{0}^{T} P^T(\tau) P(\tau) d\tau \right] z = \\ &= \int\limits_{0}^{T} z^T P^T(\tau) P(\tau) z d\tau = \\ &= \int\limits_{0}^{T} \norm{P(\tau) z}^2 d\tau = 0. \end{aligned} \] Это противоречит предположению о том, что $\rank O(T) = n$.

  7. Двойственность. Теорема о полной наблюдаемости и полной управляемости двойственных систем
    Рассмотрим наблюдаемую систему \[ \left\{ \begin{aligned} \dot x(t) &= A(t) x(t) + B(t) u(t), \\ y(t) &= C(t) x(t) \end{aligned} \right. \] на отрезке $[0, T]$.
    Система \[ \left\{ \begin{aligned} \dot{\widetilde x}(t) &= A_1(t) \widetilde x(t) + B_1(t) \widetilde u(t), \\ \widetilde y(t) &= C_1(t) \widetilde x(t), \end{aligned} \right. \] где \[ A_1(t) = -A^T(t), \quad B_1(t) = C^T(t), \quad C_1(t) = B^T(t), \] называется двойственной системой.

    Размерности:

    • $\widetilde x \in \mathbb{R}^n$;
    • $\widetilde u \in \mathbb{R}^r$;
    • $\widetilde y \in \mathbb{R}^m$.

    Пусть $Y(t)$ — фундаментальная матрица системы $\dot x(t) = A x(t)$. Требуется найти фундаментальную матрицу системы $\dot{\widetilde x(t)} = -A^T \widetilde x(t)$.
    Рассмотрим \[ Y^{-1}(t) Y(t) = E. \] Продифференцируем: \[ \begin{aligned} 0 &= \frac{d }{d t} Y^{-1}(t) Y(t) + Y^{-1}(t) \frac{d }{d t} Y(t) = \\ &= \frac{d }{d t} Y^{-1}(t) Y(t) + Y^{-1}(t) A(t) Y(t). \end{aligned} \] Отсюда следует, что \[ \frac{d }{d t} Y^{-1}(t) = - Y^{-1}(t) A(t). \] Транспонируем: \[ {\left( \frac{d }{d t} Y^{-1}(t) \right)}^T = - A^T(t) {\left( Y^{-1}(t) \right)}^T. \] Заметим, что \[ {\left( \frac{d }{d t} Y^{-1}(t) \right)}^T = \frac{d }{d t} {\left( Y^{-1}(t) \right)}^T. \] Следовательно, \[ \frac{d }{d t} {\left( Y^{-1}(t) \right)}^T = - A^T(t) {\left( Y^{-1}(t) \right)}^T. \] Значит, матрица ${\left( Y^{-1}(t) \right)}^T$ является фундаментальной для системы $\dot{\widetilde x(t)} = -A^T \widetilde x(t)$.

    Введём обозначение: \[ \widetilde Y(t) = {\left( Y^{-1}(t) \right)}^T. \]

    Система полностью управляема на $[0, T]$ тогда и только тогда, когда двойственная ей система полностью наблюдаема на $[0, T]$.

    Рассмотрим грамиан управляемости: \[ \begin{aligned} \Gamma(T) &\bydef= \int\limits_{0}^{T} Q(t) Q^T(t) dt = \\ &= \int\limits_{0}^{T} Y^{-1}(t) B(t) B^T(t) {\left( Y^{-1}(t) \right)}^T dt = \\ &= \int\limits_{0}^{T} {\left(\widetilde Y(t)\right)}^T C_1^T(t) C_1(t) \widetilde Y(t) dt = \\ &= \int\limits_{0}^{T} \widetilde P^T(t) \widetilde P(t) dt \bydef= \\ &\bydef= \widetilde O(T). \end{aligned} \] Следовательно, грамиан управляемости исходной системы совпадает с грамианом наблюдаемости двойственной системы, поэтому из полной управляемости исходной системы следует полная наблюдаемость двойственной (например, из первого критерия полной управляемости и необходимого и достаточного условия полной наблюдаемости).

    Проверим в обратную сторону: \[ \begin{aligned} O(T) &\bydef= \int\limits_{0}^{T} P^T(t) P(t) dt = \\ &= \int\limits_{0}^{T} Y^T(t) C^T(t) C(t) Y(t) dt = \\ &= \int\limits_{0}^{T} \widetilde Y^{-1}(t) B(t) B^T(t) {\left( \widetilde Y^{-1}(t) \right)}^T dt = \\ &= \int\limits_{0}^{T} \widetilde Q(t) \widetilde Q^T(t) dt \bydef= \\ &\bydef= \widetilde \Gamma(T). \end{aligned} \]

    Если система полностью наблюдаема на отрезке $[0, T]$, то она является полностью наблюдаемой на $[0, T_1]$ при любом $T_1 \geqslant T$.
    Система полностью наблюдаема тогда и только тогда, когда столбцы матрицы $P$ линейно независимы на $[0, T]$.
    Если система полностью наблюдаема на $[0, T]$, то двойственная ей полностью управляема на $[0, T]$. Из второго критерия полной управляемости следует, что строки матрицы $\widetilde Q(t)$ являются линейно независимыми на $[0, T]$.

    Распишем $\widetilde Q(t)$: \[ \begin{aligned} \widetilde Q(t) &= \widetilde Y^{-1}(t) B_1(t) = \\ &= Y^T(t) C^T(t) = \\ &= {\left[ C(t) Y(t) \right]}^T \bydef= \\ &\bydef= P^T(t). \end{aligned} \] Строки матрицы $Q(t)$ линейно независимы на $[0, T]$, следовательно, и строки матрицы $P^T(t)$ будут линейно независимыми на $[0, T]$, что эквивалентно тому, что столбцы матрицы $P(t)$ являются линейно независимыми на $[0, T]$.

  8. Стационарные системы. Критерий Калмана полной управляемости
    Рассмотрим наблюдаемую стационарную систему \[ \left\{ \begin{aligned} \dot x(t) &= A x(t) + B u(t), \\ y(t) &= C x(t) \end{aligned} \right. \] на отрезке $[0, T]$.

    Фундаментальная матрица однородной системы $\dot x(t) = A x(t)$ имеет вид \[ Y(t) = e^{A t} = \sum_{k = 0}^{\infty} \frac{t^k}{k!} A^k. \] Обратная ей: \[ Y^{-1}(t) = e^{-A t}. \]

    Рассмотрим блочную матрицу, которую называют матрицей Калмана: \[ K = \left[ B, AB, \dots, A^{n-1} B \right]. \]

    (критерий Калмана полной управляемости.)
    Стационарная система полностью управляема тогда и только тогда, когда $\rank K = n$.
    От противного. Пусть стационарная система полностью управляема, но $\rank K \lt n$. Значит, существует $C \neq 0$ такой, что $C^T K = 0$, то есть \[ C^T B = 0, \quad C^T AB = 0, \quad \dots, \quad C^T A^{n-1} B = 0. \] Рассмотрим матрицу $A$ и её характеристический многочлен \[ c(\lambda) = \lambda^n + \alpha_1 \lambda^{n-1} + \dots + \alpha_n = 0. \] По теореме Гамильтона-Кэли $c(A) = 0$, то есть \[ A^n + \alpha_1 A^{n-1} + \dots + \alpha_n E_{n \times n} = 0 \] или \[ A^n = -\alpha_1 A^{n-1} - \dots - \alpha_n E_{n \times n}. \] Домножем это равенство справа на $B$, а слева — на $C^T$: \[ C^T A^n B = -\alpha_1 C^T A^{n-1} B - \dots - \alpha_n C^T B = 0. \] Отсюда следует, что \[ C^T A^k B = 0, \quad k \geqslant 0. \]

    Рассмотрим теперь \[ \begin{aligned} C^T Q(t) &= C^T Y^{-1}(t) B = \\ &= C^T e^{-A t} B = \\ &= C^T \left[ \sum_{k=0}^{\infty} \frac{{(-t)}^k}{k!} A^k \right] B = \\ &= \sum_{k=0}^{\infty} \frac{{(-t)}^k}{k!} C^T A^k B \equiv 0, \quad t \in [0, T]. \end{aligned} \] Следовательно, строки матрицы $Q(t)$ являются линейно зависимыми на $[0, T]$, что противоречит предположению о полной управляемости стационарной системы (по второму критерию полной управляемости).

    От противного: пусть $\rank K = n$, но стационарная система не является полностью управляемой. Тогда существует $C \neq 0$ такой, что $C^T Q(t) \equiv 0$ на $[0, T]$. Следовательно, \[ C^T Q(t) = \sum_{k=0}^{\infty} \frac{{(-t)}^k}{k!} C^T A^k B \equiv 0, \quad t \in [0, T]. \] Отсюда следует, что \[ C^T A^k B = 0, \quad k \geqslant 0. \] Но в таком случае $C^T K = 0$, то есть строки матрицы $K$ являются линейно зависимыми, что противоречит предположению о том, что $\rank K = n$.
  9. Первое разбиение управляемой системы
  10. Второе разбиение управляемой системы
  11. Каноническое разбиение управляемой системы
  12. Критерий Хаутуса полной управляемости стационарных систем
  13. Критерий Калмана и критерий Хаутуса полной наблюдаемости
  14. Программное управление в разностных системах. Критерий полной управляемости
  15. Задача наблюдения в разностных системах. Критерий полной наблюдаемости
  16. Оценка матричной экспоненты
  17. Оценка решения линейной системы
  18. Преобразование Лапласа. Основные свойства
  19. Определение передаточной функции (матрицы). Свойства передаточной функции
  20. Физический смысл передаточной функции. Частотная характеристика
  21. Статическая обратная связь. Управляемость и наблюдаемость замкнутой системы
  22. Стабилизация системы со скалярным управлением. Случай управления системы с матрицей Фробениуса
  23. Стабилизация полностью управляемой системы со скалярным управлением
  24. Стабилизация не полностью управляемой системы со скалярным управлением
  25. Первая каноническая форма Зубова
  26. Вторая каноническая форма Зубова
  27. Критерий Найквиста
  28. Стабилизация по выходу. Пример полностью управляемой и полностью наблюдаемой системы, не стабилизируемой по выходу. Наблюдатель Люенбергера
  29. Динамическая стабилизация по выходу полностью управляемой и полностью наблюдаемой системы
  30. Свойства Кронекерова (прямого) произведения матриц
  31. Теорема о собственных значениях составных матриц
  32. Теорема о разрешимости матричных уравнений вида $AX + XB = C$
  33. Теорема о разрешимости матричных уравнений вида $A^T X + XA = C$ для гурвицевой матрицы $A$
  34. Лемма о разрешимости матричного неравенства вида $A^T X + XA \leqslant C^T C$ для наблюдаемой пары $(A, C)$
  35. Стабилизация полностью наблюдаемой системы в терминах матричного уравнения Лурье—Риккати
  36. Теорема Ляпунова об устойчивости нулевого решения
  37. Теорема Ляпунова об асимптотической устойчивости нулевого решения
  38. Пример асимптотической устойчивости нулевого решения при неотрицательной производной функции Ляпунова в силу системы (физический маятник с трением)
  39. Теорема Барбашина—Красовского об асимптотической устойчивости
  40. Теорема о неустойчивости
  41. Исследование устойчивости по линейному приближению