АДУС — 06 — Вопросы

Показывать
$\global\def\at#1#2{\left. #1 \right\rvert_{#2}}$ $\global\def\abs#1{\left\lvert #1 \right\rvert}$ $\global\def\norm#1{\left\lVert #1 \right\rVert}$ $\global\def\bvec#1{\mathbf{#1}}$ $\global\def\floor#1{\left\lfloor #1 \right\rfloor}$ $\global\def\limto#1{\underset{#1}{\longrightarrow}}$ $\global\def\prob#1{\mathbb{P} \left\{ #1 \right\}}$ $\global\def\mean#1{\mathbb{E} \left[ #1 \right]}$ $\global\def\disp#1{D \left[ #1 \right]}$ $\global\def\dp#1#2{#1 \cdot #2\,}$ $\global\def\vp#1#2{#1 \times #2\,}$ $\global\def\dv#1#2{\frac{d #1}{d #2}}$ $\global\def\rdv#1#2{\frac{d' #1}{d #2}}$ $\global\def\pd#1#2{\frac{\partial #1}{\partial #2}}$ $\global\def\pdv2#1#2{\frac{\partial^2 #1}{\partial #2^2}}$ $\global\def\pdvk#1#2#3{\frac{\partial^#1 #2}{\partial #3^#1}}$ $\global\def\ppdv#1#2#3{\frac{\partial^2 #1}{\partial #2 \partial #3}}$ $\global\def\pois#1{\left\{ #1 \right\}}$ $\global\def\paren#1{\left( #1 \right)}$ $\global\def\bydef#1{\overset{\mathrm{def}}{#1}}$ $\global\def\mbox#1{\text{#1}}$ $\global\def\div{\text{div}\,}$ $\global\def\dsum{\displaystyle\sum\,}$ $\global\def\grad{\text{grad}\,}$ $\global\def\rot{\text{rot}\,}$ $\global\def\vb#1{\textbf{#1}}$ $\global\def\op#1{\mathrm{#1}\,}$ $\global\def\Im{\text{Im}\,}$ $\global\def\Res{\text{Res}\,}$ $\global\def\Re{\text{Re}\,}$ $\global\def\argtg{\text{argtg}\,}$ $\global\def\ch{\text{ch}\,}$ $\global\def\const{\text{const}\,}$ $\global\def\degree{\text{degree}\,}$ $\global\def\proj{\operatorname{proj}}$ $\global\def\rank{\operatorname{rank}}$ $\global\def\res{\text{res}\,}$ $\global\def\sh{\text{sh}\,}$ $\global\def\sign{\operatorname{sign}}$ $\global\def\tg{\operatorname{tg}}$ $\global\def\am{\operatorname{am}}$ $\global\def\sn{\operatorname{sn}}$ $\global\def\cn{\operatorname{cn}}$ $\global\def\dn{\operatorname{dn}}$
  1. Классификация связей
    Рассмотрим произвольную систему $n$ материальных точек $M_i$ с обобщёнными координатами $q_1, \dots, q_r$.
    Если материальная система не свободна, то её обобщённые координаты $q_1, \dots, q_r$, так же как и обобщённые скорости $\dot q_1, \dots, \dot q_r$, подчиняются ограничительным условиям, которые называют связями.
    Связи, выражаемые аналитические уравнениями вида \[ \begin{aligned} \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) &= 0 \\ \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) &\leqslant 0 \\ \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) &\geqslant 0, \end{aligned} \] называют кинематическими.
    Если время не входит явно в уравнения связей, то такие связи называют стационарными, в противном случае — нестационарными.
    Кинематические связи, уравнения которых не содержат обобщённых скоростей или путём интегрирования могут быть к такому виду приведены, называют голономными, в противном случае — неголономными.
    Связи, заданные неравенствами \[ \begin{aligned} \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) &\leqslant 0 \\ \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) &\geqslant 0, \end{aligned} \] называют освобождающими (неудерживающими, односторонними).

    Связи, заданные равенствами \[ \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) = 0, \] называют неосвобождающими (удерживающими, двусторонними).
  2. Определение: истинное перемещение, виртуальное перемещение
    Рассмотрим бесконечно малые перемещения точек системы, совместимые со связями, наложенными на эту систему.
    Перемещения точек системы, осуществляемые за данный бесконечно малый промежуток времени точками несвободной системы в их действительном движении под действием приложенных сил, называют истинными (действительными).
    $d\bvec{r}(t), dx, dy, dz, dt$.
    Если связи нестационарны, то бесконечно малые перемещения точек системы можно представить себе разложенными на два слагаемых:
    1. совместимые со связями бесконечно малые перемещения, которые имели бы место, если бы связи на мгновение перестали изменяться;
    2. перемещения, обусловленные изменением самих связей.
    Бесконечно малые перемещения точек системы, совместимые со связями, зафиксированными в данный момент времени, называют виртуальными.
    $\delta \bvec{r}(t), \delta x, \delta y, \delta z$.
  3. При каких условиях истинные перемещения совпадают с виртуальными?
    Истинные перемещения совпадают с виртуальными, если связи стационарны.

    Рассмотрим несвободную систему с удерживающей связью \[ f(x,y,z,t) = 0. \] По определению виртуального перемещения, оно должно удовлетворять этой связи, то есть \[ f(x + \delta x, y + \delta y, z + \delta z, t) = 0. \] Рассмотрим разложение функции $f(x + \delta x, y + \delta y, z + \delta z, t)$ в ряд в окрестности точки $0$: \[ f(x, y, z, t) + \pd{f}{x}\delta x + \pd{f}{y} \delta y + \pd{f}{z} \delta z + \cdots = 0. \] Отбрасывая члены высшего порядка малости (в силу того, что $\delta x, \delta y, \delta z$ — бесконечно малые перемещения) и учитывая, что $f(x,y,z,t) = 0$ для любых $x,y,z,t$, получаем, что \[ \pd{f}{x}\delta x + \pd{f}{y} \delta y + \pd{f}{z} \delta z = 0. \]

    Рассмотрим теперь истинное перемещение. Для него так же \[ f(x + dx, y + dy, z + dz, t + dt) = 0. \] Разложение в ряд в окрестности точки 0: \[ f(x, y, z, t) + \pd{f}{x} dx + \pd{f}{y} dy + \pd{f}{z} dz + \pd{f}{t} dt + \cdots = 0. \] Пользуясь аналогичными рассуждениями, приходим к равенству \[ \pd{f}{x} dx + \pd{f}{y} dy + \pd{f}{z} dz + \pd{f}{t} dt = 0. \] Нетрудно видеть, что если связь стационарная, то ${\displaystyle \pd{f}{t} = 0}$, а предыдущее уравнение принимает вид \[ \pd{f}{x} dx + \pd{f}{y} dy + \pd{f}{z} dz = 0. \]

    Из равенства \[ \pd{f}{x} \delta x + \pd{f}{y} \delta y + \pd{f}{z} \delta z = 0 \] следует, что только две вариации могут быть независимыми.
    Данное утверждение верно и для системы из $n$ материальных точек; в этом случае разложение в ряд примет вид \[ \pd{f}{t} dt + \sum_{i=1}^n \paren{ \pd{f}{x_i} dx_i + \pd{f}{y_i} dy_i + \pd{f}{z_i} dz_i } = 0. \]
  4. Определение: реакции связей
    Ограничивая свободу движения системы, связи действуют на точки системы посредством сил, называемых реакциями связей.
    Силы, приложенные к точкам несвободной системы, называют активными, а реакции связей — реактивными силами.
  5. Определение: идеальная связь
    Рассмотрим систему из $N$ материальных точек, подчинённую $m$ связям. Обозначим равнодействующую всех реактивных сил, действующих на $j$-ую точку, как $\bvec{R}_j$.
    Идеальными связями называют такие связи, сумма элементарных работ реакций которых на любом виртуальном перемещении системы равна нулю: \[ \sum_{j=1}^N \bvec{R}_j \cdot \delta \bvec{r}_j = 0. \]
  6. Общее уравнение механики
    Рассмотрим несвободную систему из $N$ материальных точек массами $m_j$. Составим уравнения движения системы: \[ m_j \dv{\bvec{v}_j}{t} = \bvec{F}_j + \bvec{R}_j, \] где
    • $\bvec{F}_j$ — равнодействующая активных сил, приложенных к $j$-ой точке;
    • $\bvec{R}_j$ — равнодействующая реактивных сил, приложенных к $j$-ой точке.
    Рассмотрим равенство \[ \sum_{j=1}^N \paren{ m_j \dv{\bvec{v}_j}{t} - \bvec{F}_j - \bvec{R}_j } \delta \bvec{r}_j = 0. \] Если связи идеальны, то по определению их виртуальные работы равны нулю: \[ \sum_{j=1}^N \bvec{R}_j \cdot \delta \bvec{r}_j = 0. \] Учитывая этот факт, приходим к общему уравнению механики: \[ \sum_{j=1}^N \paren{ m_j \dv{\bvec{v_j}}{t} - \bvec{F}_j } \delta \bvec{r}_j = 0, \] которое также называют уравнением Даламбера-Лагранжа в декартовых координатах.
  7. Принцип возможных перемещений
    Необходимое и достаточное условие равновесия системы, подчинённой стационарным неосвобождающим идеальным связям, заключается в равенстве нулю суммы элементарных работ активных сил на любом возможном перемещении системы из рассматриваемого положения равновесия, т.е. \[ \sum_{j=1}^N \bvec{F}_j \cdot \delta \bvec{r}_j = 0. \]
    Предположим, что несвободная система, подчинённая стационарным неосвобождающим идеальным связям, находится в состоянии равновесия. Тогда каждая её точка $M_j$ находится в состоянии равновесия, и равнодействующая сил $\bvec{F}_j$ и $\bvec{R}_j$, приложенных к точке $M_j$, должна быть равна нулю. Равна нулю будет и работа этой равнодействующей, так что \[ \sum_{j=1}^N \paren{ \bvec{F}_j + \bvec{R}_j } \delta \bvec{r}_j = 0, \] или \[ \sum_{j=1}^N \bvec{F}_j \cdot \delta \bvec{r}_j + \sum_{j=1}^N \bvec{R}_j \cdot \delta \bvec{r}_j = 0, \] но вторая сумма равна нулю в силу идеальности связей, и, следовательно, \[ \sum_{j=1}^N \bvec{F}_j \cdot \delta \bvec{r}_j = 0. \]
    Если выполнено условие \[ \sum_{j=1}^N \bvec{F}_j \cdot \delta \bvec{r}_j = 0, \] то общее уравнение механики \[ \sum_{j=1}^N \paren{ m_j \dv{\bvec{v_j}}{t} - \bvec{F}_j } \delta \bvec{r}_j = 0 \] примет вид \[ \sum_{j=1}^N \dv{\bvec{v_j}}{t} \cdot \delta \bvec{r}_j = 0, \] откуда (в силу произвольности перемещения $\delta \bvec{r}_j$) следует, что \[ \dv{\bvec{v_j}}{t} = 0 \qquad \forall j = \overline{1,N}, \] то есть равнодействующая активных и реактивных сил, приложенных к каждой точке, равна нулю.
  8. Уравнения Лагранжа I рода и реакции идеальных связей
    Рассмотрим систему $N$ точек. Введём обозначения:
    • $m_{3j-2} = m_{3j-1} = m_{3j}$ — масса $j$-ой точки;
    • $x_{3j-2}, x_{3j-1}, x_{3j}$ — координаты $j$-ой точки;
    • $X_{3j-2}, X_{3j-1}, X_{3j}$ — проекции равнодействующей активных связей $\bvec{F}_j$, действующих на $j$-ую точку;
    • $R_{3j-2}, R_{3j-1}, R_{3j}$ — проекции равнодействующей реактивных связей $\bvec{R}_j$, действующих на $j$-ую точку.
    • $x = (x_1, \dots, x_{3N})$.
    В общем виде несвободная система подчиняется как голономным \[ f_j(x,t) = 0, \qquad j = \overline{1,k}, \] так и неголономным связям: \[ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \dot{x}_{\nu} + a_\rho(t) = 0, \qquad \rho = \overline{1, r} \] что вкупе со вторым законом Ньютона \[ m_\nu \ddot{x}_\nu = X_\nu + R_\nu, \qquad \nu = \overline{1,3N} \] даёт $3N + k + r$ уравнений относительно $6N$ неизвестных $x_\nu, R_\nu$.

    Если связи идеальны, то общее уравнение механики для данной системы запишется в виде \[ \sum_{\nu=1}^{3N} \paren{ m_\nu \ddot{x}_\nu - X_\nu } \delta x_\nu = 0. \] Связи удерживающие, поэтому они накладывают на вариации следующие ограничения: \[ \sum_{\nu=1}^{3N} \pd{f_i}{x_\nu} \delta x_\nu = 0, \qquad i = \overline{1,k}. \] Умножим обе части уравнений неголономных связей на $dt$: \[ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \frac{d x_\nu}{\cancel{dt}} \cancel{dt} + a_\rho(t) dt = 0, \qquad \rho = \overline{1, r}. \] Перейдём к изохронному варьированию: $\delta t = 0$, поэтому ограничения, накладываемые неголономными связями на вариации, примут следующий вид: \[ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \delta x_\nu = 0, \qquad \rho = \overline{1, r}. \] Итак, имеем $k+r$ ограничений на вариации, следовательно, среди $3N$ вариаций $k+r$ будут зависимыми.

    Введём в рассмотрение множители Лагранжа: $\lambda_1(t), \dots, \lambda_k(t)$ для голономных связей и $\mu_1(t), \dots, \mu_r(t)$ — для неголономных. Домножим уравнения связей на соответствующие множители и вычтем из общего уравнения механики: \[ \sum_{\mu=1}^{3N} \paren{ m_\nu \ddot{x}_\nu - X_\nu - \sum_{i=1}^k \lambda_i \pd{f_i}{x_\nu} - \sum_{\rho=1}^r \mu_\rho a_{\rho \nu} } \delta x_\nu = 0. \] Выберем $\lambda_i$ и $\mu_\rho$ так, чтобы какие-либо $r+k$ скобок обнулились. Считая оставшиеся $3N - r-k$ вариаций независимыми, воспользуемся тем фактом, что сумма произведений некоторых выражений на произвольные величины равна нулю только в том случае, когда все эти выражения по отдельности обращаются в ноль. Таким образом, оставшиеся $3N - r-k$ выражений также равны нулю.

    Итак, имеем $3N+r+k$ уравнений \[ \left\{ \begin{aligned} m_\nu \ddot{x}_\nu - X_\nu - \sum_{i=1}^k \lambda_i \pd{f_i}{x_\nu} - \sum_{\rho=1}^r \mu_\rho a_{\rho \nu} &= 0, & \nu = \overline{1,3N}, \\ f_j(x,t) &= 0, & j = \overline{1,k}, \\ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \dot{x}_{\nu} + a_\rho(t) &= 0, & \rho = \overline{1, r}. \end{aligned} \right. \] относительно $3N+r+k$ неизвестных $x_\nu, \lambda_i, \mu_\rho$.

    Эти уравнения называют уравнениями Лагранжа I рода.

    Заметим, что из второго закона Ньютона следует, что \[ m_\nu \ddot{x}_\nu - X_\nu - R_\nu = 0, \qquad \nu = \overline{1,3N}, \] поэтому реакции идеальных связей (вернее, их проекции) можно найти из уравнений \[ R_\nu = \sum_{i=1}^k \lambda_i \pd{f_i}{x_\nu} + \sum_{\rho=1}^r \mu_\rho a_{\rho \nu}. \]

  9. Определение: лагранжевы координаты
    Рассмотрим несвободную систему $N$ точек. Будем считать, что она подчинена только голономным связям: \[ f_i(x,t) = 0, \qquad i = \overline{1,m}, \] причём
    • $x \in M \subset \mathbb{R}^{3N}$;
    • $f_i \in C^2 \paren{M \times [t_1, t_2]}$.
    Также будем считать, что связи линейно независимы, то есть \[ \rank \paren{\pd{f_i}{x_k}} = m, \qquad x \in M. \] Тогда из $3N$ вариаций зависимыми будут $m$.
    Число $s = 3N - m$ называют числом степеней свободы.
    Если присутствуют неголономные связи или $m$ голономных связей линейно зависимы, то $s$, вообще говоря, не равно $3N - m$.
    Рассмотрим $s$ координат $q = (q_1, \dots, q_s) \in D \subset \mathbb{R}^s$.
    Если координаты $q = (q_1, \dots, q_s) \in D$ удовлетворяют условиям
    1. $x(q,t) \in M$;
    2. $f_i(x(q,t),t) = 0$, где $i = \overline{1,m}$,
    причём $t \in (t_1, t_2)$, то их называют обобщёнными (лагранжевыми) координатами.
  10. Теорема о неявных функциях (без док-ва)
    Если функции \[ F_i(x_1, \dots, x_n, y_1, \dots, y_m), \quad i = \overline{1,m} \] непрерывно дифференцируемы в некоторой окрестности точки \[ (x^0, y^0) = (x_1^0, \dots, x_n^0, y_1^0, \dots, y_m^0) \] и \[ \begin{gathered} F_i(x_1^0, \dots, x_n^0, y_1^0, \dots, y_m^0) = 0, \quad i = \overline{1,m}, \\ \at { \pd{ \paren{F_1, \dots, F_m} }{ \paren{y_1, \dots, y_m} } } { \paren{x^0, y^0} } \neq 0, \end{gathered} \] то существуют окрестности $U_x \subset \mathbb{R}^n$ и $U_y \subset \mathbb{R}^m$ точек $x^0$ и $y^0$ такие, что система уравнений \[ F_i(x_1, \dots, x_n, y_1, \dots, y_m) = 0, \quad i = \overline{1,m} \] однозначно разрешима в окрестности $U_x \times U_y$ точки $(x^0, y^0)$ относительно переменных $y_1, \dots, y_m$.
  11. Доказать, что обобщённые координаты можно выразить через декартовы
    Рассмотрим систему $N$ точек, стеснённую только голономными связями \[ f_i(x, t) = 0, \qquad i = \overline{1,m}. \] Связи считаем линейно независимыми, то есть \[ \rank \paren{ \pd{f_i}{x_k} } = m. \] В этом случае число степеней свободы данной системы равно $s = 3N - m$.
    Если $(q,t) \in D \times (t_1, t_2)$, то \[ \rank \paren{ \pd{x_\nu}{q_i} } = s \neq 0. \]
    Пусть \[ \rank \paren{ \pd{x_\nu}{q_i} } = k \leqslant s. \] Тогда количество зависимых координат равно $3N - k$. Так как система стеснена только $m$ связями, то количество зависимых координат не может превышать $m$, то есть \[ 3N - k \leqslant m, \implies k \geqslant 3N - m \bydef= s, \] откуда следует, что $k = s$.
    Итак, в области $D \times (t_1, t_2)$ \[ \rank \paren{ \pd{x_\nu}{q_i} } = s \neq 0, \] поэтому (по теореме о неявных функциях) обобщённые координаты разрешимы относительно декартовых, то есть \[ q_k = q_k(x,t), \qquad k = \overline{1,s}. \]
  12. Связь вариаций декартовых и обобщённых координат. Вариации лагранжевых координат
    Рассмотрим несвободную систему $N$ точек, подчинённую идеальным голономным удерживающим связям. Обозначим за $\bvec{r}_j = \bvec{r}_j(q,t)$ радиус-вектор $j$-ой точки системы. Тогда \[ \left\{ \begin{aligned} \bvec{v}_j &= \dv{\bvec{r}_j(q,t)}{t} = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i + \pd{\bvec{r}_j}{t}, & j=\overline{1,N}, \\ \dot{x}_\nu &= \dv{x_\nu(q,t)}{t} = \sum_{i=1}^s \pd{x_\nu}{q_i} \dot{q}_i + \pd{x_\nu}{t}, & \nu=\overline{1,3N}, \end{aligned} \right. \] или, переходя к (изохронным) вариациям, \[ \left\{ \begin{aligned} \delta \bvec{r}_j &= \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i + \pd{\bvec{r}_j}{t} \delta t = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i, & j=\overline{1,N}, \\ \delta x_\nu &= \sum_{i=1}^s \pd{x_\nu}{q_i} \delta q_i + \pd{x_\nu}{t} \delta t = \sum_{i=1}^s \pd{x_\nu}{q_i} \delta q_i, & \nu=\overline{1,3N}, \end{aligned} \right. \]
  13. Общее уравнение механики в обобщённых координатах
    Рассмотрим общее уравнение механики в декартовых координатах для системы $N$ точек, подчинённой идеальным связям: \[ \sum_{j=1}^N \paren{ m_j \dv{\bvec{v}_j}{t} - \bvec{F}_j } \delta \bvec{r}_j = 0. \] Так как \[ \delta \bvec{r}_j = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i, \qquad j=\overline{1,N}, \] то \[ \sum_{j=1}^N \paren{ m_j \dv{\bvec{v}_j}{t} - \bvec{F}_j } \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i = 0. \]
    Справедливо тождество Лагранжа: \[ \dv{\bvec{v}_j}{t} \pd{\bvec{r}_j}{q_i} = \dv{}{t} \paren{ \bvec{v}_j \pd{\bvec{r}_j}{q_i} } - \bvec{v}_j \dv{}{t} \pd{\bvec{r}_j}{q_i}. \]
    Действительно, \[ \dv{}{t} \paren{ \bvec{v}_j \pd{\bvec{r}_j}{q_i} } = \dv{\bvec{v}_j}{t} \pd{\bvec{r}_j}{q_i} + \bvec{v}_j \dv{}{t} \pd{\bvec{r}_j}{q_i}. \]
    Взяв от уравнений \[ \bvec{v}_j = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i + \pd{\bvec{r}_j}{t}, \qquad j=\overline{1,N}, \] частную производную по $\dot{q}_i$, получим, что \[ \pd{\bvec{r}_j}{q_i} = \pd{\bvec{v}_j}{\dot{q}_i}. \]
    Справедливо равенство: \[ \dv{}{t} \pd{\bvec{r}_j}{q_i} = \pd{\bvec{v}_j}{q_i}. \]
    Так как \[ \bvec{v}_j = \dot{\bvec{r}}_j = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i + \pd{\bvec{r}_j}{t}, \] то \[ \pd{\bvec{v}_j}{q_i} = \pd{\dot{\bvec{r}}_j}{q_k} = \sum_{i=1}^s \ppdv{\bvec{r}_j}{q_k}{q_i} \dot{q}_i + \ppdv{\bvec{r}_j}{q_k}{t}, \] но \[ \dv{}{t} \paren{ \pd{\bvec{r}_j}{q_k} } = \sum_{i=1}^s \ppdv{\bvec{r}_j}{q_k}{q_i} \dot{q}_i + \ppdv{\bvec{r}_j}{q_k}{t}, \] откуда следует справедливость равенства \[ \dv{}{t} \pd{\bvec{r}_j}{q_i} = \pd{\bvec{v}_j}{q_i}. \]
    Итак, домножим тождество Лагранжа \[ \dv{\bvec{v}_j}{t} \pd{\bvec{r}_j}{q_i} = \dv{}{t} \paren{ \bvec{v}_j \pd{\bvec{r}_j}{q_i} } - \bvec{v}_j \dv{}{t} \pd{\bvec{r}_j}{q_i} \] на $m_j$ и просуммируем полученные равенства: \[ \sum_{j=1}^N m_j \dv{\bvec{v}_j}{t} \pd{\bvec{r}_j}{q_i} = \sum_{j=1}^N m_j \dv{}{t} \paren{ \bvec{v}_j \pd{\bvec{r}_j}{q_i} } - \sum_{j=1}^N m_j \bvec{v}_j \dv{}{t} \pd{\bvec{r}_j}{q_i}. \] Введём в рассмотрение уравнение кинетической энергии: \[ T = \frac{1}{2} \sum_{j=1}^N m_j \dp{\bvec{v}_j}{\bvec{v}_j}. \] Используя его, перепишем уравнение в следующем виде: \[ \sum_{j=1}^N m_j \dv{\bvec{v}_j}{t} \pd{\bvec{r}_j}{q_i} = \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i}. \]
    Действительно, рассмотрим следующие частные производные: \[ \begin{aligned} \pd{T}{\dot{q}_i} &= \frac{1}{2} \sum_{j=1}^N m_j \pd{}{\dot{q}_i} \paren{ \dp{\bvec{v}_j}{\bvec{v}_j} } = \\ &= \sum_{j=1}^N m_j \paren{ \dp{\bvec{v}_j}{\pd{\bvec{v}_j}{\dot{q}_i}} } = \\ &= \sum_{j=1}^N m_j \paren{ \dp{\bvec{v}_j}{\pd{\bvec{r}_j}{q_i}} }. \end{aligned} \] Аналогично \[ \begin{aligned} \pd{T}{q_i} &= \frac{1}{2} \sum_{j=1}^N m_j \pd{}{q_i} \paren{ \dp{\bvec{v}_j}{\bvec{v}_j} } = \\ &= \sum_{j=1}^N m_j \paren{ \dp{\bvec{v}_j}{\pd{\bvec{v}_j}{q_i}} } = \\ &= \sum_{j=1}^N m_j \paren{ \dp{\bvec{v}_j}{ \dv{}{t} \pd{\bvec{r}_j}{q_i} } }. \end{aligned} \]
    Также рассмотрим обобщённую силу \[ Q_i = \sum_{j=1}^N \bvec{F}_j \pd{\bvec{r}_j}{q_i}. \]
    Если активные силы консервативны, то \[ Q_i = -\pd{\Pi}{q_i}, \] где $\Pi$ — потенциальная энергия системы.
    Раскрыв скобки в уравнении \[ \sum_{j=1}^N \paren{ m_j \pd{\bvec{v}_j}{t} - \bvec{F}_j } \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i = 0, \] придём к уравнению \[ \sum_{j=1}^N \paren{ \sum_{i=1}^s m_j \pd{\bvec{v}_j}{t} \pd{\bvec{r}_j}{q_i} - \sum_{i=1}^s \bvec{F}_j \pd{\bvec{r}_j}{q_i} } \delta q_i = 0, \] которое можно записать в виде \[ \sum_{i=1}^s \paren{ \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i} - Q_i } \delta q_i = 0. \] В этом виде оно известно как общее уравнение механики в обобщённых координатах.
  14. Уравнения Лагранжа II рода
    Рассмотрим голономную механическую систему с идеальными связями и $s$ степенями свободы, зададим обобщённые координаты $q = (q_1, \dots, q_s)$.

    В силу независимости вариаций обобщённых координат из общего уравнения механики \[ \sum_{i=1}^s \paren{ \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i} - Q_i } \delta q_i = 0 \] следует, что \[ \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i} = Q_i, \qquad i=\overline{1,s}. \]

    Эти уравнения называют уравнениями Лагранжа II рода.
    Если активные силы консервативны, то \[ Q_i = -\pd{\Pi}{q_i}. \] Введя функцию Лагранжа \[ L = T - \Pi, \] уравнения Лагранжа II рода примут вид \[ \dv{}{t} \pd{L}{\dot{q}_i} - \pd{L}{q_i} = 0, \qquad i=\overline{1,s}. \]
  15. В чём преимущество уравнений Лагранжа II рода перед уравнениями I рода?
    1. Они не зависят от точек системы — только от степени свободы, следовательно, размерность у них меньше.
    2. В них не входят заранее не известные реакции идеальных связей.
  16. Инвариантность уравнений Лагранжа II рода
    Говорят, что уравнения Лагранжа II рода инвариантны относительно какого-то класса преобразований, если каждое преобразование этого класса не изменяет кинетическую энергию $T$ и обобщённые силы $Q_i$.
    Рассмотрим движение материальной точки в центральном поле сил. Пусть $m$ — масса точки, а $x_1, x_2, x_3$ — её координаты, тогда \[ \begin{aligned} T &= \frac{1}{2} m v^2 = \frac{1}{2} m \paren{ \dot{x}_1^2 + \dot{x}_2^2 + \dot{x}_3^2 }, \\ \Pi &= - \frac{\mu}{r} = \frac{-\mu}{\sqrt{x_1^2 + x_2^2 + x_3^2}}. \end{aligned} \] Видно, что уравнения Лагранжа II рода инвариантны относительно поворота системы координат в силу инвариантности длины векторов.
  17. Разрешимость уравнений Лагранжа II рода относительно старших производных
    Рассмотрим кинетическую энергию механической системы в декартовых координатах: \[ T = \frac{1}{2} \sum_{j=1}^N m_j \bvec{v}_j^2. \] Так как \[ \bvec{v}_j = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i + \pd{\bvec{r}_j}{t}, \] то \[ \begin{aligned} T &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i + \pd{\bvec{r}_j}{t} } \paren{ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i + \pd{\bvec{r}_j}{t} } \\ &= T_2 + T_1 + T_0, \end{aligned} \] где \[ \begin{aligned} T_2 &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i }^2 \\ T_1 &= \sum_{p=1}^s \paren{ \sum_{j=1}^N m_j \pd{\bvec{r}_j}{q_p} \pd{\bvec{r}_j}{t} } \dot{q}_p, \\ T_0 &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \pd{\bvec{r}_j}{t} }^2. \end{aligned} \] Если ввести обозначения \[ \begin{aligned} a_{ik} = a_{ki} &= \sum_{j=1}^N m_j \pd{\bvec{r}_j}{q_i} \pd{\bvec{r}_j}{q_k}, \\ a_p &= \sum_{j=1}^N m_j \pd{\bvec{r}_j}{q_p} \pd{\bvec{r}_j}{t}, \end{aligned} \] то уравнения можно представить в виде \[ \begin{aligned} T_2 &= \frac{1}{2} \sum_{i,k=1}^s a_{ik} \dot{q}_i \dot{q}_k, \\ T_1 &= \sum_{p=1}^s a_p \dot{q}_p, \\ T_0 &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \pd{\bvec{r}_j}{t} }^2. \end{aligned} \] Значит, уравнения Лагранжа \[ \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i} = Q_i, \qquad i=\overline{1,s} \] можно представить в виде \[ \sum_{k=1}^s a_{ik} \ddot{q}_k = B_i, \qquad i=\overline{1,s}, \] где $B_i$ не зависят от обобщённых ускорений $\ddot{q}_1, \dots, \ddot{q}_s$. Значит, для доказательства разрешимости уравнений Лагранжа II рода относительно обобщённых ускорений достаточно доказать, что \[ \det A \neq 0, \quad A = (a_{ik})_{i,k=1}^s. \] При $u = (u_1, \dots, u_s)$ рассмотрим квадратичную форму \[ T_2(u) = \frac{1}{2} \sum_{i,k=1}^s a_{ik} u_i u_k. \] Применим к ней критерий Сильвестра — для положительной определённости этой формы необходимо и достаточно, чтобы все главные миноры были строго положительны, то есть, в частности, \[ \det A \gt 0. \] Значит, доказав положительную определённость этой формы, мы докажем, что $\det A \neq 0$. Так как \[ T_2(u) = \frac{1}{2} \sum_{j=1}^N m_j \paren{ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} u_i }^2, \] то $T_2(u) \geqslant 0$ для всех $u$. Докажем, что $T_2(u) = 0 \iff u = 0$. Рассуждаем от противного: пусть $\exists u \neq 0$, для которого $T_2(u) = 0$. Тогда \[ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} u_i = 0, \qquad j = \overline{1,N}, \] или \[ \sum_{i=1}^s \pd{x_{3j-2}}{q_i} = \sum_{i=1}^s \pd{x_{3j-1}}{q_i} = \sum_{i=1}^s \pd{x_{3j}}{q_i} = 0, \] откуда следует линейная зависимость столбцов якобиана $\dfrac{D(x)}{D(q)}$, то есть $\rank \dfrac{D(x)}{D(q)} \lt s$, но известно, что $\rank \dfrac{D(x)}{D(q)} = s$ — получили противоречие.
  18. Определение: обобщённые импульсы
    Рассмотрим голономную механическую систему с идеальными связями. Пусть активные силы консервативны, то есть $L = T - \Pi$ и \[ \dv{}{t} \pd{L}{\dot{q}_i} - \pd{L}{q_i} = 0, \qquad i=\overline{1,s}. \]
    Величины \[ p_i = \pd{L}{\dot{q}_i}, \qquad i = \overline{1,s} \] называют обобщёнными импульсами.
  19. Вывод канонических уравнений
    Рассмотрим голономную механическую систему с идеальными связями. Пусть активные силы консервативны, то есть $L = T - \Pi$ и \[ \dv{}{t} \pd{L}{\dot{q}_i} - \pd{L}{q_i} = 0, \qquad i=\overline{1,s}. \] Потенциальная энергия не зависит от обобщённых скоростей, поэтому \[ \ppdv{L}{\dot{q}_i}{\dot{q}_k} = \ppdv{T}{\dot{q}_i}{\dot{q}_k}, \qquad i,k=\overline{1,s}. \] Так как \[ \det \left. \paren{ \ppdv{T}{\dot{q}_i}{\dot{q}_k} } \right|_{i,k=1}^s \neq 0, \] то уравнения импульсов \[ p_i = \pd{L}{\dot{q}_i}, \qquad i = \overline{1,s} \] разрешимы относительно обобщённых скоростей, то есть \[ \dot{q}_i = \dot{q}_i(q, p, t), \qquad i = \overline{1,s}. \]
    Функцию \[ H(q,p,t) = \sum_{k=1}^s p_k \dot{q}_k(q,p,t) - L(q, \dot{q}(q,p,t), t) \] называют функцией Гамильтона (гамильтонианом).
    Нетрудно видеть, что справедливы соотношения: \[ \begin{aligned} \pd{H}{p_i} &= \dot{q}_i + \sum_{k=1}^s \paren{ p_k \pd{\dot{q}_k}{p_i} - \pd{L}{\dot{q}_k} \pd{\dot{q}_k}{p_i} } = \dot{q}_i, \\ \pd{H}{q_i} &= \sum_{k=1}^s \paren{ p_k \pd{\dot{q}_k}{q_i} - \pd{L}{\dot{q}_k} \pd{\dot{q}_k}{q_i} } - \pd{L}{q_i} = -\pd{L}{q_i}, \\ \pd{H}{t} &= \sum_{k=1}^s \paren{ p_k \pd{\dot{q}_k}{t} - \pd{L}{\dot{q}_k} \pd{\dot{q}_k}{t} } - \pd{L}{t} = -\pd{L}{t}. \end{aligned} \] Учитывая, что \[ \dv{}{t} p_i = \pd{L}{q_i} = - \pd{H}{q_i}, \] можно записать уравнения, называемые каноническими уравнениями: \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}. \end{aligned} \right. \]
    Переменные $(q,p)$ называют каноническими.
  20. Определение: первый интеграл динамической системы
    Функцию $f(x)$ называют первым интегралом системы, если её производная в силу этой системы равна нулю: \[ \dv{f}{t} = 0. \] Другими словами, вдоль решений системы \[ f(x) = C = \const. \]
  21. Канонические уравнения: интеграл механической энергии
    Рассмотрим гамильтониан \[ H(q,p,t) = \sum_{k=1}^s p_k \dot{q}_k(q,p,t) - L(q, \dot{q}(q,p,t), t) \] и канонические уравнения \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}. \end{aligned} \right. \] Также рассмотрим полную производную гамильтониана: \[ \begin{aligned} \dv{H}{t} &= \pd{H}{t} + \sum_{i=1}^s \paren{ \pd{H}{q_i} \dot{q}_i + \pd{H}{p_i} \dot{p}_i } = \\ &= \pd{H}{t} + \sum_{i=1}^s \underbrace{\paren{ \pd{H}{q_i} \pd{H}{p_i} - \pd{H}{p_i} \pd{H}{q_i} }}_{=0} \\ \implies \dv{H}{t} &= \pd{H}{t}. \end{aligned} \] Значит, если гамильтониан не зависит явно от времени $t$ (то есть $H = H(q,p)$), то \[ \pd{H}{t} = 0, \implies \dv{H}{t} = 0, \implies H = h = \const. \] Нетрудно проверить, что $H(q,p) = h$ является первым интегралом канонической системы.

    Механический смысл первого интеграла $H(q,p) = h$: по определению \[ H(q,p,t) = \sum_{k=1}^s p_k \dot{q}_k(q,p,t) - L(q, \dot{q}(q,p,t), t). \] Если $H = H(q,p)$, то \[ \begin{aligned} H(q,p) &= \sum_{k=1}^s p_k \dot{q}_k(q,p) - L(q, \dot{q}(q,p)) = \\ &= \sum_{k=1}^s \pd{L}{\dot{q}_k} \dot{q}_k(q,p) - L(q, \dot{q}(q,p)). \end{aligned} \] Так как \[ L = T - \Pi = T_2 + T_1 + T_0 - \Pi, \] где \[ \begin{aligned} T_2 &= \frac{1}{2} \sum_{i,k=1}^s a_{ik} \dot{q}_i \dot{q}_k, \\ T_1 &= \sum_{p=1}^s a_p \dot{q}_p, \\ T_0 &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \pd{\bvec{r}_j}{t} }^2, \end{aligned} \] то \[ \sum_{k=1}^s \pd{L}{\dot{q}_k} \dot{q}_k = 2T_2 + T_1. \]

    Так как \[ \pd{T_0}{\dot{q}_i} = 0, \qquad \pd{\Pi}{\dot{q}_i} = 0, \] то \[ \sum_{k=1}^s \pd{L}{\dot{q}_k} \dot{q}_k = \sum_{k=1}^s \pd{T_2}{\dot{q}_k} \dot{q}_k + \sum_{k=1}^s \pd{T_1}{\dot{q}_k} \dot{q}_k. \] Очевидно, что \[ \pd{T_1}{\dot{q}_k} \dot{q}_k = a_k \dot{q}_k, \implies \sum_{k=1}^s \pd{T_1}{\dot{q}_k} \dot{q}_k = T_1. \] Остаётся разобраться с первым слагаемым \[ \sum_{k=1}^s \pd{T_2}{\dot{q}_k} \dot{q}_k. \] Прежде всего, заметим, что \[ \pd{T_2}{\dot{q}_k} \dot{q}_k = 2 a_{kk} \dot{q}_k^2 + \sum_{j = 1, j \neq k}^s a_{kj} \dot{q}_j \dot{q}_k, \] причём слагаемого с коэффициентом $a_{kk}$ в других частных производных не будет, а слагаемое с коэффициентом $a_{kj}$ встретится в частной производной \[ \pd{T_2}{\dot{q}_j} \dot{q}_j. \] Отсюда можно сделать вывод, что \[ \sum_{k=1}^s \pd{T_2}{\dot{q}_k} \dot{q}_k = 2 T_2. \] Окончательно получаем, что \[ \sum_{k=1}^s \pd{L}{\dot{q}_k} \dot{q}_k = 2T_2 + T_1. \]
    Функция \[ H = T_2 - T_0 + \Pi = h \] называется функцией Гамильтона в форме Якоби-Остроградского.
    Если $\bvec{r}_j = \bvec{r}_j(q)$ (то есть радиус-векторы точек не зависят явно от времени), то $T_0 = 0$, и, следовательно, \[ H = T + \Pi = h = \const. \]
  22. Определение: функция Гамильтона в форме Якоби-Остроградского
    Функция \[ H = T_2 - T_0 + \Pi = h, \] где \[ \begin{aligned} T_2 &= \frac{1}{2} \sum_{i,k=1}^s a_{ik} \dot{q}_i \dot{q}_k, \\ T_0 &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \pd{\bvec{r}_j}{t} }^2, \end{aligned} \] называется функцией Гамильтона в форме Якоби-Остроградского.
  23. Циклические координаты
    Рассмотрим обобщённые координаты $q = (q_1, \dots, q_s)$.
    Обобщённые координаты координат $q_1, \dots, q_\sigma$ (где $\sigma \lt s$), от которых функция Лагранжа $L = L(q, p, t)$ явно не зависит, называют циклическими. Остальные координаты называют позиционными.
    Из канонических уравнений известно, что \[ -\dot{p}_i = \pd{H}{q_i} \bydef= -\pd{L}{q_i} = 0, \qquad i = \overline{1,\sigma}, \] поэтому \[ \dot{p}_i = 0, \implies p_i = C_i = \const, \] то есть циклические импульсы являются первыми интегралами канонической системы.
    Каждая циклическая координата снижает порядок системы на 2.
    Так как $L$ не зависит от циклической координаты $q_\sigma$, то от неё не зависит и гамильтониан $H$ (по построению). Выходит, что в канонической системе уже не участвует координата $q_\sigma$, то есть её порядок понижен на 1.

    Теперь заметим, что, подставив $p_i = C_i = \const$, в гамильтониан, мы также избавим каноническую систему от переменной импульса $p_i$, то есть снова понизим её размерность на 1.

    Используя тот факт, что обобщённые скорости можно выразить через $q$ и $p$, можно записать, что \[ \dot{q}_i = \dot{q}_i( q_{\sigma+1}, \dots, q_s, C_1, \dots, C_\sigma, p_{\sigma+1}, \dots, p_s, t ), \qquad i = \overline{1,\sigma}. \] Такие скорости называют циклическими.
    Циклические скорости не зависят от циклических координат по построению: от них не зависит лагранжиан $L$.
  24. Полный интеграл и характеристики уравнений в частных производных первого порядка
    Рассмотрим голономную систему с идеальными связями в потенциальном поле сил.
    Свести систему дифференциальных уравнений к одному ДУЧП. В этом случае полный интеграл ДУЧП позволит найти общее решение исходной системы.
    Рассмотрим ДУЧП 1 порядка относительно функции $z = z(x)$: \[ \left\{ \begin{aligned} F(x,z,p) &= 0, \\ p_j &= \pd{z}{x_j}, & j = \overline{1,n}, \end{aligned} \right. \] где $x \in D \subset \mathbb{R}^n, p \in \mathbb{R}^n$.
    Любая функция $z = z(x)$, обращающая уравнение $F(x,z,p) = 0$ в тождество, называется частным интегралом этого уравнения.
    Полным интегралом называется любое $n$-параметрическое семейство функций $z = z(x, a)$ (где $a \in A \subset \mathbb{R}^n)$, для которого выполнены условия:
    • функции $z, {\displaystyle \pd{z}{x_j}}$ непрерывно дифференцируемы на множестве $D \times A$;
    • из уравнений \[ p_j = \pd{z}{x_j}, \qquad j = \overline{1,n} \] исключением параметров $a$ получается уравнение $F(x,z,p) = 0$.
    Частные случаи:
    1. $F(x,p) = 0$ — не зависит от $z$. Тогда \[ z = z(x, a_1, \dots, a_{n-1}) + a_n \] — полный интеграл.
    2. $F(x_{k+1}, \dots, x_n, p_1, \dots, p_n) = 0$ — не зависит от $z$ и от $x_1, \dots, x_k$. Тогда \[ z = \sum_{j=1}^k a_j x_j + \zeta(x_{k+1}, \dots, x_n). \]
      Учитывая \[ p_j = \pd{z}{x_j} = a_j, \qquad j = \overline{1,k}, \] функцию $F(x_{k+1}, \dots, x_n, p_1, \dots, p_n)$ можно представить в виде \[ F = F\paren{ x_{k+1}, \dots, x_n, a_1, \dots, a_k, \pd{\zeta}{x_{k+1}} \dots \pd{\zeta}{x_n} } = 0. \] Так как $F$ не зависит от $\zeta$, то из первого пункта следует, что \[ \zeta = \zeta(x_{k+1}, \dots, x_n, a_1, \dots, a_k, a_{k+1}, \dots, a_{n-1}) + a_n \] является полным интегралом, откуда следует, что \[ z = \sum_{j=1}^k a_j x_j + \zeta(x_{k+1}, \dots, x_n) \] является полным интегралом уравнения $F(x_{k+1}, \dots, x_n, p_1, \dots, p_n) = 0$.
    Если $F = F(x,p)$, то \[ \frac{d x_1}{P_1} = \frac{d x_2}{P_2} = \cdots = \frac{d x_n}{P_n} = -\frac{d p_1}{X_1} = \cdots = -\frac{d p_n}{X_n}, \] где \[ P_j = {\displaystyle \pd{F}{p_j}}, \qquad X_j = {\displaystyle \pd{F}{x_j}}, \] является уравнением характеристик для ДУЧП $F(x,p) = 0$.
    См. вывод.
  25. Уравнение Гамильтона-Якоби, главная функция Гамильтона
    Рассмотрим канонические уравнения \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}. \end{aligned} \right. \] Их можно записать в виде \[ \frac{d q_1}{\partial H / \partial p_1} = \frac{d q_2}{\partial H / \partial p_2} = \cdots = \frac{d q_n}{\partial H / \partial p_n} = -\frac{d p_1}{\partial H / \partial q_1} = \cdots = -\frac{d p_n}{\partial H / \partial q_n} = \frac{dt}{1}. \] Эти уравнения могут рассматриваться как уравнения характеристик для ДУЧП 1-го порядка \[ \pd{S}{t} + H\paren{q_1, \dots, q_n, \pd{S}{q_1}, \dots, \pd{S}{q_n}, t} = 0, \] которое называют уравнением Гамильтона-Якоби.

    Так как левая часть уравнения Гамильтона-Якоби не зависит от $S$, то полный интеграл этого ДУЧП представим в виде функции \[ S = S(t, q_1, \dots, q_n, a_1, \dots, a_n) + a_{n+1}, \] которую называют главной функцией Гамильтона.

  26. Метод Якоби
    (Якоби).
    Если $D \subset \mathbb{R}^{2n+1}$ — область, а $S(t,q,a) \in C^2(D)$ — полный интеграл вида \[ S = S(t, q_1, \dots, q_n, a_1, \dots, a_n) + a_{n+1} \] уравнения \[ \pd{S}{t} + H\paren{q_1, \dots, q_n, \pd{S}{q_1}, \dots, \pd{S}{q_n}, t} = 0, \] удовлетворяющий условию \[ \det \paren{ \ppdv{S}{q_i}{a_k} } \neq 0, \qquad (t,q,a) \in D, \] то существует область $D' \subset D \times \mathbb{R}^n$ такая, что равенства \[ \left\{ \begin{aligned} \pd{S}{q_i} &= p_i, \\ \pd{S}{a_i} &= b_i, & i = \overline{1,n} \end{aligned} \right. \] представляют собой $2n$ независимых интегралов канонических уравнений \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}, \end{aligned} \right. \] где $a,b$ — произвольные постоянные.
    Если для некоторого $(t_0, q_0, a_0) \in D$ выполнено \[ \left\{ \begin{aligned} \pd{S}{q_{0i}} &= p_{0i}, \\ \pd{S}{a_{0i}} &= b_{0i}, & i = \overline{1,n}, \end{aligned} \right. \] то из условия \[ \det \paren{ \ppdv{S}{q_i}{a_k} } \neq 0 \] по теореме о неявных функциях следует, что в некоторой окрестности точки $(t_0, q_0, a_0, b_0)$ равенства \[ \left\{ \begin{aligned} \pd{S}{q_i} &= p_i, \\ \pd{S}{a_i} &= b_i, & i = \overline{1,n} \end{aligned} \right. \] однозначно определяют дважды непрерывно дифференицруемые функции $p = p(t,a,b)$ и $q = q(t,a,b)$. Остаётся показать, что эти функции удовлетворяют каноническим уравнениям.

    Подставим полученную функцию $q$ во вторую группу уравнений и продифференцируем их по $t$: \[ \ppdv{S}{t}{a_i} + \sum_{k=1}^n \ppdv{S}{q_k}{a_i} \dv{q_k}{t} = 0, \qquad i = \overline{1,n}. \] С другой стороны, подставляя полный интеграл \[ S = S(t, q_1, \dots, q_n, a_1, \dots, a_n) + a_{n+1} \] в уравнение Гамильтона-Якоби и дифференцируя полученное тождество по $a_i$, приходим к равенствам: \[ \ppdv{S}{t}{a_i} + \sum_{k=1}^n \pd{H}{(\partial S /\partial q_k)} \ppdv{S}{q_k}{a_i} = 0, \qquad i = \overline{1,n}. \] Вычитая из полученных равенств предыдущие и учитывая равенства \[ \left\{ \begin{aligned} \pd{S}{q_i} &= p_i, \\ \pd{S}{a_i} &= b_i, & i = \overline{1,n}, \end{aligned} \right. \] получаем, что \[ \sum_{k=1}^n \ppdv{S}{q_k}{a_i} \paren{ \dv{q_k}{t} - \pd{H}{p_k} } = 0, \qquad i = \overline{1,n}. \] Так как \[ \det \paren{ \ppdv{S}{q_i}{a_k} } \neq 0, \qquad (t,q,a) \in D, \] то \[ \dot{q}_i = \pd{H}{p_i}, \qquad i = \overline{1,n}. \] Аналогичным образом, подставляя полученную функцию $q$ в равенства \[ p_i = \pd{S}{q_i}, \qquad i = \overline{1,n} \] и дифференцируя полученные тождества по $t$, а также подставляя полный интеграл $S$ в уравнение Гамильтона-Якоби и дифференцируя его по $q_i$, получаем вторую группу канонических уравнений.

  27. Решение задачи о движении точки относительно планеты методом Якоби
  28. Определение: скобки Пуассона
    Рассмотрим две функции $f(q,p,t)$ и $g(q,p,t)$.
    Выражение \[ \pois{f, g} = \sum_{i=1}^n \paren{ \pd{f}{q_i} \pd{g}{p_i} - \pd{g}{q_i} \pd{f}{p_i} } \] называют скобками Пуассона.
  29. Свойства скобок Пуассона
    1. $\pois{f,g} = -\pois{g,f}$; $\pois{f,f} = 0$.
    2. Если $C = \const$, то $\pois{f,C} = \pois{C,f} = 0$.
    3. $\pois{f_1 + f_2, g} = \pois{f_1, g} + \pois{f_2, g}$.
      $\pois{f_1 \cdot f_2, g} = f_1 \pois{f_2, g} + f_2 \pois{f_1, g}$.
    4. ${\displaystyle \pd{}{t} \pois{f,g} = \pois{\pd{f}{t}, g} + \pois{f, \pd{g}{t}} }$.
    5. ${\displaystyle \pois{f, q_k} = -\pd{f}{p_k}; \quad \pois{f, p_k} = \phantom{-}\pd{f}{q_k} }$.
    6. ${\displaystyle \pois{q_i, q_k} = 0; \quad \pois{p_i, p_k} = 0; \quad \pois{q_i, p_k} = \delta_{ik}. }$
    7. Тождество Пуассона: \[ \pois{f, \pois{g, h}} + \pois{g, \pois{h, f}} + \pois{h, \pois{f, g}} \equiv 0. \]
  30. Теорема Пуассона
    Рассмотрим канонические уравнения: \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}. \end{aligned} \right. \] Также рассмотрим функцию $f = f(q,p,t)$; её производная в силу системы равна \[ \begin{aligned} \dv{f}{t}(q,p,t) &= \pd{f}{t} + \sum_{i=1}^n \left[ \pd{f}{q_i} \dot{q}_i + \pd{f}{p_i} \dot{p_i} \right] = \\ &= \pd{f}{t} + \sum_{i=1}^n \left[ \pd{f}{q_i} \pd{H}{p_i} - \pd{f}{p_i} \pd{H}{q_i} \right], \\ \implies \dv{f}{t}(q,p,t) &= \pd{f}{t} + \pois{f, H}. \end{aligned} \] Если $f(q,p,t)$ — первый интеграл канонической системы, то её производная в силу системы равна нулю, то есть \[ \pd{f}{t} + \pois{f, H} = 0. \]
    (Пуассона).
    Если $\varphi(q,p,t)$ и $\psi(q,p,t)$ — первые интегралы канонической системы, то \[ f = \pois{\varphi, \psi} \] также является первым интегралом этой системы.
    Так как $\varphi$ и $\psi$ — первые интегралы, то \[ \begin{aligned} \pd{\varphi}{t} + \pois{\varphi, H} &= 0, \\ \pd{\psi}{t} + \pois{\psi, H} &= 0. \end{aligned} \] Рассмотрим тождество Пуассона: \[ \pois{H, \pois{\varphi, \psi}} + \pois{\varphi, \pois{\psi, H}} + \pois{\psi, \pois{H, \varphi}} \equiv 0. \] Подставив \[ \pois{\psi, H} = -\pd{\psi}{t}, \qquad \pois{\varphi, H} = -\pd{\varphi}{t}, \] получим, что \[ \begin{aligned} &\phantom{=} \pois{H, \pois{\varphi, \psi}} + \pois{\varphi, -\pd{\psi}{t}} + \pois{\psi, \pd{\varphi}{t}} = \\ &= \pois{\pois{\varphi, \psi}, H} + \pois{\varphi, \pd{\psi}{t}} + \pois{\pd{\varphi}{t}, \psi} = \\ &= \pois{\pois{\varphi, \psi}, H} + \pd{}{t} \pois{\varphi, \psi} \equiv 0. \end{aligned} \] Отсюда следует, что $f \bydef= \pois{\varphi, \psi}$ также является первым интегралом канонической системы.
  31. Скобки Пуассона: построение интеграла в стационарном случае
    Рассмотрим стационарный случай: $H = H(q,p)$. В этом случае $H = \const$ — первый интеграл канонической системы \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}. \end{aligned} \right. \] Пусть $\varphi(q,p,t)$ также является первым интегралом системы, тогда по теореме Пуассона $f = \pois{\varphi, H} = \const$ — тоже первый интеграл. Но \[ \pd{\varphi}{t} + \pois{\varphi, H} = 0, \implies f \bydef= \pois{\varphi, H} = -\pd{\varphi}{t} = \const, \] то есть ${\displaystyle -\pd{\varphi}{t} = \const}$ также является первым интегралом этой системы, то есть \[ \pdv2{\varphi}{t} + \pois{\pd{\varphi}{t}, H} = 0, \] но по теореме Пуассона ${\displaystyle \pois{\pd{\varphi}{t}, H} = \const}$ также является первым интегралом, поэтому ${\displaystyle \pdv2{\varphi}{t} = \const}$ — тоже первый интеграл.
    Если система стационарна ($H = H(q,p)$) и известен первый интеграл $\varphi(q,p,t)$, причём $\varphi \in C^{k}_t$, то \[ \pdvk{m}{f}{t} = \const, \qquad m = \overline{1,k} \] являются либо первыми интегралами, либо константами.
  32. Вариации канонических переменных
    Рассмотрим систему $N$ точек, подчинённую идеальным голономным удерживающим связям. Пусть $\bvec{r}_j$ и $\bvec{r}_j'$ — два бесконечно близких кинематических движения.
    Величину \[ \delta \bvec{v}_j = \bvec{v}_j' - \bvec{v}_j = \dv{}{t} \bvec{r}_j' - \dv{}{t} \bvec{r}_j \] называют вариацией скорости $j$-ой точки системы.
    Рассмотрим проекции точек на оси координат: $(x_1, \dots, x_{3N})$. Тогда вариацию скорости можно записать в виде \[ \delta \dot{x}_\nu = \dot{x}_\nu' - \dot{x}_\nu. \] Учитывая, что вариация координаты имеет вид \[ \delta x_\nu = x_\nu' - x_\nu, \] получаем, что \[ \dv{}{t} \delta x_\nu = \dot{x}_\nu' - \dot{x}_\nu \bydef= \delta \dot{x}_\nu. \] Отсюда следует важный факт: операторы варьирования и дифференцирования перестановочны.

    Рассмотрим теперь обобщённые координаты $q = (q_1, \dots, q_s)$: \[ \begin{aligned} x_\nu &= x_\nu(q_1, \dots, q_s, t), & \nu &= \overline{1,3N}, \\ \bvec{r}_j &= \bvec{r}_j(q_1, \dots, q_s, t), & j &= \overline{1,N}. \end{aligned} \] Тогда \[ \begin{aligned} \dot{x}_\nu &= \dv{}{t} x_\nu(q,t) = \pd{x_\nu}{t} + \sum_{i=1}^s \pd{x_\nu}{q_i} \dot{q}_i, \\ \bvec{v}_j &= \dv{}{t} \bvec{r}_j(q,t) = \pd{\bvec{r}_j}{t} + \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i. \end{aligned} \] Рассмотрим вариацию скорости: \[ \delta \bvec{v}_j = \sum_{i=1}^s \ppdv{\bvec{r}_j}{q_i}{t} \delta q_i + \sum_{i,k=1}^s \ppdv{\bvec{r}_j}{q_i}{q_k} \dot{q}_k \delta q_i + \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta \dot{q}_i. \] Продифференцируем равенство \[ \delta \bvec{r}_j = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i \] по $t$: \[ \begin{aligned} \dv{}{t} \delta \bvec{r}_j &= \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dv{}{t} \delta q_i + \sum_{i=1}^s \paren{ \sum_{k=1}^s \ppdv{\bvec{r}_j}{q_k}{q_i} \dot{q}_k + \ppdv{\bvec{r}_j}{t}{q_i} } \delta q_i = \\ &= \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dv{}{t} \delta q_i + \sum_{i,k=1}^s \ppdv{\bvec{r}_j}{q_k}{q_i} \dot{q}_k \delta q_i + \sum_{i=1}^s \ppdv{\bvec{r}_j}{t}{q_i} \delta q_i. \end{aligned} \] Вычтем полученное равенство из уравнения вариации скорости: \[ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \paren{ \delta \dot{q}_i - \dv{}{t} \delta q_i } = 0. \] Так как \[ \rank \paren{ \pd{x_\nu}{q_i} } = s, \] то равенство возможно только при \[ \delta \dot{q}_i = \dv{}{t} \delta q_i. \]

    Величины $\delta q_i$ независимы, поэтому из полученного равенства следует, что $\delta \dot{q}_i$ не являются независимыми от $\delta q_i$ как функции времени. С другой стороны, в любой фиксированный момент времени $t = \tilde t$ вариации $\delta \dot{q}_i$ и $\delta q_i$ можно рассматривать как независимые величины.
    В канонических координатах \[ p_i = \pd{L(q,p,t)}{\dot{q}_i}, \] поэтому вариация обобщённых импульсов запишется в виде \[ \delta p_i = \sum_{k=1}^s \left[ \ppdv{L}{q_k}{\dot{q}_i} \delta q_k + \ppdv{L}{\dot{q}_k}{\dot{q}_i} \delta \dot{q}_k \right]. \]
  33. Основной дифференциальный принцип механики
    Рассмотрим общее уравнение механики в случае потенциального поля сил: \[ \paren{ \dv{}{t} \pd{L}{\dot{q}} - \pd{L}{q} } \delta q = 0. \] Рассмотрим уравнение \[ \dv{}{t} \paren{ \pd{L}{\dot{q}} \delta q } = \paren{ \dv{}{t} \pd{L}{\dot{q}} } \delta q + \pd{L}{\dot{q}} \delta \dot{q}. \] Так как \[ \pd{L}{\dot{q}} \bydef= p, \] а из общего уравнения механики следует (в силу произвольности вариации $\delta q$), что \[ \dv{}{t} \pd{L}{\dot{q}} = \pd{L}{q}, \] то \[ \begin{aligned} \dv{}{t} \paren{ p \delta q } &= \pd{L}{q} \delta q + \pd{L}{\dot{q}} \delta \dot{q} = \\ &= \delta L. \end{aligned} \]
    Уравнение \[ \dv{}{t} \paren{p \delta q} = \delta L \] называют основным дифференциальным принципом механики.
  34. Вывод канонических уравнений из основного дифференциального принципа
    Рассмотрим гамильтониан \[ H \bydef= p \dot{q} - L, \implies L = p \dot{q} - H. \] Тогда \[ \delta L = \dot{q} \delta p + p \delta \dot{q} - \pd{H}{q} \delta q - \pd{H}{p} \delta p. \] Подставим это выражение в основной дифференциальный принцип: \[ \begin{aligned} \delta L &= \dv{}{t} \paren{p \delta q} = \dot{p} \delta q + \cancel{p \delta \dot{q}} = \\ &= \dot{q} \delta p + \cancel{p \delta \dot{q}} - \pd{H}{q} \delta q - \pd{H}{p} \delta p. \end{aligned} \] Перенося все слагаемые в левую часть, получаем, что \[ \paren{ \pd{H}{q} + \dot{p} } \delta q + \paren{ \pd{H}{p} - \dot{q} } \delta p = 0, \] откуда, в силу независимости вариаций $\delta q$ и $\delta p$, выводятся канонические уравнения: \[ \left\{ \begin{aligned} \dot{q} &= \phantom{-}\pd{H}{p}, \\ \dot{p} &= -\pd{H}{q}. \end{aligned} \right. \]
  35. Определение: функционал действия
    Величину \[ W = \int\limits_{t_1}^{t_2} L(q'(t), \dot{q}'(t), t) dt, \] где
    • $L$ — функция Лагранжа механической системы;
    • $q'(t) = \paren{ q_1'(t), \dots, q_s'(t) }$ — любое кинематически возможное движение;
    называют действием (по Гамильтону).
  36. Определение: изохронная вариация функционала действия
    Бесконечно малую величину \[ \delta \int\limits_{t_1}^{t_2} L dt = \int\limits_{t_1}^{t_2} L(q', \dot{q}', t) dt - \int\limits_{t_1}^{t_2} L(q, \dot{q}, t) dt, \] рассматриваемую как функционал от $q'(t)$, называют изохронной вариацией функционала действия.
    В силу перестановочности операторов варьирования и дифференцирования \[ \delta \int\limits_{t_1}^{t_2} L dt = \int\limits_{t_1}^{t_2} \delta L dt, \] причём равенство понимается как равенство с точностью до бесконечно малых высшего порядка.

    Используя основной дифференциальный принцип \[ \dv{}{t} \paren{p \delta q} = \delta L, \] получаем, что \[ \delta \int\limits_{t_1}^{t_2} L dt = \left.\paren{ p \delta q }\right|_{t_1}^{t_2}. \]

  37. Определение: полная вариация координат, скоростей и функций
    Бесконечно малые величины \[ \begin{gathered} \Delta q = q'(t + \Delta t) - q(t), \\ \Delta \dot{q} = \dot{q}'(t + \Delta t) - \dot{q}(t) \end{gathered} \] при
    • $\Delta t \to 0$;
    • $q' \to q$;
    • $\dot{q}' \to \dot{q}$
    называют полными вариациями координат и скоростей.
    Полная вариация $\Delta \Phi$ функции $\Phi(q, \dot{q}, t)$ определяется как \[ \Delta \Phi(q, \dot{q}, t) = \Phi(q'(t + \Delta t), \dot{q}'(t + \Delta t), t + \Delta t) - \Phi(q, \dot{q}, t). \]
  38. Вывод формул, связывающих полную и изохронную вариации координат, скоростей и функций
    Рассмотрим полную вариацию \[ \begin{aligned} \Delta q &= q'(t + \Delta t) - q(t) = \\ &= q'(t + \Delta t) - q(t + \Delta t) + q(t + \Delta t) - q(t) = \\ &= \left.\delta q\right|_{t + \Delta t} + \dot{q}(t) \Delta t. \end{aligned} \] В силу перестановочности операторов варьирования и дифференцирования \[ \begin{aligned} \left. \delta q \right|_{t + \Delta t} &= \left. \delta q \right|_t + \Delta t \at{\dv{}{t} \delta q}{t} = \\ &= \left. \delta q \right|_t + \Delta t \left. \delta \dot{q} \right|_t. \end{aligned} \] Подставляя это выражение в исходное уравнение и отбрасывая член второго порядка малости (при $\delta \dot{q}$), получаем искомую формулу: \[ \Delta q = \delta q + \dot{q} \Delta t. \] Аналогично получаем, что \[ \Delta \dot{q} = \delta \dot{q} + \ddot{q} \Delta t. \] Наконец, используя формулы \[ \begin{aligned} \Delta \Phi &= \pd{\Phi}{q} \Delta q + \pd{\Phi}{\dot{q}} \Delta \dot{q} + \pd{\Phi}{t} \Delta t, \\ \delta \Phi &= \pd{\Phi}{q} \delta q + \pd{\Phi}{\dot{q}} \delta \dot{q}, \end{aligned} \] приходим к равенству: \[ \Delta \Phi = \delta \Phi + \dot{\Phi} \Delta t. \]
  39. Определение: полная вариация функционала действия
    Бесконечно малую величину \[ \Delta \int\limits_{t_1}^{t_2} L dt = \int\limits_{t_1 + \Delta t_1}^{t_2 + \Delta t_2} L(q', \dot{q}', t) dt - \int\limits_{t_1}^{t_2} L(q, \dot{q}, t) dt \] при
    • $\Delta t_1, \Delta t_2 \to 0$;
    • $q' \to q$;
    • $\dot{q}' \to \dot{q}$
    называют полной вариацией функционала действия.
  40. Вывод формулы, связывающей полную и изохронную вариации функционала действия
    Введём обозначения \[ L_i = L(q(t_i), \dot{q}(t_i), t_i), \qquad i = 1,2 \] и учитывая, что \[ \Delta t_1, \Delta t_2 \to 0, \quad q' \to q, \quad \dot{q}' \to \dot{q}, \] последовательно получаем \[ \begin{aligned} \Delta \int\limits_{t_1}^{t_2} L dt &= \int\limits_{t_1 + \Delta t_1}^{t_2 + \Delta t_2} L(q', \dot{q}', t) dt - \int\limits_{t_1}^{t_2} L(q, \dot{q}, t) dt = \\ &= \int\limits_{t_1 + \Delta t_1}^{t_1} L(q', \dot{q}', t) dt + \int\limits_{t_1}^{t_2} L(q', \dot{q}', t) dt + \\ &\phantom{=} + \int\limits_{t_2}^{t_2 + \Delta t_2} L(q', \dot{q}', t) dt - \int\limits_{t_1}^{t_2} L(q, \dot{q}, t) dt = \\ &= \int\limits_{t_1}^{t_2} \left[ L(q', \dot{q}', t) - L(q, \dot{q}, t) \right] dt -\\ &\phantom{=}- \int\limits_{t_1}^{t_1 + \Delta t_1} L(q', \dot{q}', t) dt + \int\limits_{t_2}^{t_2 + \Delta t_2} L(q', \dot{q}', t) dt. \end{aligned} \] Пусть $G(q', \dot{q}', t)$ — первообразная функции $L(q', \dot{q}', t)$. Тогда, учитывая, что $\Delta t_1 \to 0$, и пользуясь определением производной, получаем, что \[ \begin{aligned} \int\limits_{t_1}^{t_1 + \Delta t_1} L(q', \dot{q}', t) dt &= \left. G(q', \dot{q}', t) \right|_{t_1}^{t_1 + \Delta t_1} = \\ &= G'( q'(t_1), \dot{q}'(t_1), t_1 ) \Delta t_1 = \\ &= L( q'(t_1), \dot{q}'(t_1), t_1 ) \Delta t_1. \end{aligned} \] Аналогично \[ \int\limits_{t_2}^{t_2 + \Delta t_2} L(q', \dot{q}', t) dt = L( q'(t_2), \dot{q}'(t_2), t_2 ) \Delta t_2, \] поэтому \[ \begin{aligned} \Delta \int\limits_{t_1}^{t_2} L dt &= \int\limits_{t_1}^{t_2} \delta L dt - L(q'(t_1), \dot{q}'(t_1), t_1) \Delta t_1 + L(q'(t_2), \dot{q}'(t_2), t_2) \Delta t_2 = \\ &= \int\limits_{t_1}^{t_2} \delta L dt - L_1 \Delta t_1 + L_2 \Delta t_2. \end{aligned} \] Используя равенство \[ \delta \int\limits_{t_1}^{t_2} L dt = \left.\paren{ p \delta q }\right|_{t_1}^{t_2}, \] можно записать, что \[ \Delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \delta q + L \Delta t } \right|_{t_1}^{t_2}. \] Учитывая, что \[ \Delta q = \delta q + \dot{q} \Delta t, \] а также определение гамильтониана \[ H \bydef= p \dot{q} - L, \] окончательно получаем, что \[ \Delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \Delta q - H \Delta t } \right|_{t_1}^{t_2}. \]
  41. Принцип Гамильтона-Остроградского
    Пусть $q = (q_1, \dots, q_s)$ — лагранжевы координаты голономной механической системы, имеющей $s$ степеней свободы и находящейся под действием только потенциальных сил.

    Если $(t_1, t_2)$ — произвольный промежуток, причём \[ \left. \delta q_i \right|_{t_1} = \left. \delta q_i \right|_{t_2} = 0, \quad i = \overline{1,s}, \] то равенство \[ \delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \delta q } \right|_{t_1}^{t_2} \] примет вид \[ \delta \int\limits_{t_1}^{t_2} L dt = 0. \]

    (принцип Гамильтона-Остроградского).
    Пусть все действующие на механическую систему активные силы потенциальны, а её движения стеснены только голономными идеальными удерживающими связями. Тогда истинные движения этой системы, удовлетворяющие условиям \[ \delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \delta q } \right|_{t_1}^{t_2}, \] принадлежат тому подмножеству множества всех кинематически возможных её движений, для которых выполнено равенство \[ \delta \int\limits_{t_1}^{t_2} L dt = 0. \]
    Другими словами: действие на истинном движении имеет стационарное значение по Гамильтону.
  42. Вывод уравнений Лагранжа II рода из принципа Гамильтона-Остроградского
    Так как операторы варьирования и дифференцирования перестановочны и \[ \begin{aligned} \delta L &= \pd{L}{q} \delta q + \pd{L}{\dot{q}} \delta \dot{q} = \\ &= \dv{}{t} \paren{ \pd{L}{\dot{q}} \delta q } - \paren{ \dv{}{t} \pd{L}{\dot{q}} - \pd{L}{q} } \delta q, \end{aligned} \] то \[ \delta W = \delta \int\limits_{t_1}^{t_2} L dt = \int\limits_{t_1}^{t_2} \paren{ \pd{L}{q} - \dv{}{t} \pd{L}{\dot{q}} } \delta q dt + \left. \paren{ \pd{L}{\dot{q}} \delta q } \right|_{t_1}^{t_2}. \] Так как \[ \left. \delta q_i \right|_{t_1} = \left. \delta q_i \right|_{t_2} = 0, \quad i = \overline{1,s}, \] в силу принципа Гамильтона-Остроградского получаем, что \[ \int\limits_{t_1}^{t_2} \left[ \paren{ \dv{}{t} \pd{L}{\dot{q}} - \pd{L}{q} } \delta q \right] dt = 0, \] откуда следует, что \[ \paren{ \dv{}{t} \pd{L}{\dot{q}} - \pd{L}{q} } \delta q = 0. \]
    Доказать от противного (см. Бабаджанянц, стр. 183).
    В силу независимости вариаций $\delta q$ следуют уравнения Лагранжа II рода: \[ \dv{}{t} \pd{L}{\dot{q}} - \pd{L}{q} = 0. \]
  43. Действие — решение уравнений Гамильтона-Якоби
    Пусть $q$ — решение уравнений движения рассматриваемой системы. Введём в рассмотрение величину \[ W = \int\limits_{t_1}^{t_2} L(q, \dot q, t) dt, \] совпадающую с функционалом действия при $q' = q$. С другой стороны, полагая, что решение $q$ однозначно определяется начальным $q^1 = q(t_1)$ и конечным $q^2 = q(t_2)$ положениями, можно рассматривать величину $W$ как функцию $W(q^1, q^2, t_1, t_2)$ параметров $q^1, q^2, t_1, t_2$.
    Функцию $W = W(q^1, q^2, t_1, t_2)$ называют функцией действия.

    Будем предполагать, что функция действия $W(q^1, q^2, t_1, t_2)$ определена в некоторой области $D_W \subset \mathbb{R}^{2s+2}$.

    Из определения функции действия (то есть в силу того, что движение истинное) следует, что \[ \Delta t = dt, \quad \Delta q = dq, \quad \Delta W = dW, \] поэтому уравнение \[ \Delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \Delta q - H \Delta t } \right|_{t_1}^{t_2} \] примет вид \[ \begin{aligned} dW &= \left. \paren{ p dq - H dt } \right|_{t_1}^{t_2}, \\ \implies W &= \left. \paren{ p q - H t } \right|_{t_1}^{t_2}. \end{aligned} \] Тогда \[ \left\{ \begin{aligned} \pd{W}{q_2} &= p^2 = \left. p \right|_{t_2}, \\ \pd{W}{t_2} &= -H(q^2, p^2, t_2). \end{aligned} \right. \] Подставляя первое уравнение во второе, получаем \[ \pd{W}{t_2} + H\paren{q^2, \pd{W}{q_2}, t_2} = 0 \] то есть функция действия $W = W(q^1, q^2, t_1, t_2)$ задаёт $s+1$-параметрическое семейство решений уравнений Гамильтона-Якоби по переменным $q^2, t_2$ при таких значениях параметров $q^1, t_1$, что $(q^1, q^2, t_1, t_2) \in D_W$.
  44. Принцип Эйлера-Лагранжа
    Рассмотрим голономную механическую систему с идеальными связями, имеющую $s$ степеней свободы и находящуюся под действием только потенциальных сил. Также пусть лагранжевы координаты связаны c декартовыми координатами стационарными соотношениями и пусть ${\displaystyle \pd{H}{t} = 0}$. В этом случае гамильтониан является первым интегралом уравнений движения, то есть \[ H = T + \Pi = h, \] где $h$ принимает конкретное значение для каждого конкретного движения системы. Отсюда также следует, что \[ L = T - \Pi = 2T - h. \]

    Среди кинематически возможных вариаций выделим только те, которые соответствуют выполнению равенства \[ T + \Pi = h, \] из которого следует, что \[ \Delta h = \pd{h}{\dot{q}} \Delta \dot q + \pd{h}{q} \Delta q = 0. \] Считаем вариации $\Delta q$ независимыми, а $\Delta t$ выберем так, чтобы выполнялось предыдущее уравнение.

    Кинетическая энергия \[ T(q, \dot q, t) = h - \Pi(q, t) \] зависит от того, в какой точке находится объект. Соответственно, скорость объекта также зависит от пути — значит, выбирая разные траектории, объект на перемещение затратит, вообще говоря, разное время. Именно поэтому следует рассматривать полную вариацию.

    Из формул \[ \begin{aligned} \Delta q &= \delta q + \dot q \Delta t, \\ \Delta \dot q &= \delta \dot q + \ddot q \Delta t \end{aligned} \] следует \[ \begin{aligned} \dv{}{t} \Delta q &= \dv{}{t} \delta q + \ddot q \Delta t + \dot q \dv{}{t} \Delta t = \\ &= \Delta \dot q + \dot q \dv{}{t} \Delta t, \\ \implies \Delta \dot q &= \dv{}{t} \Delta q - \dot q \dv{}{t} \Delta t. \end{aligned} \] Тогда \[ \begin{aligned} \Delta h &= \pd{h}{\dot{q}} \Delta \dot q + \pd{h}{q} \Delta q = \\ &= \pd{h}{\dot{q}} \dv{}{t} \Delta q - \pd{h}{\dot{q}} \dot q \dv{}{t} \Delta t + \pd{h}{q} \Delta q = 0, \end{aligned} \] откуда следует равенство \[ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q = \pd{h}{\dot{q}} \dot q \dv{}{t} \Delta t. \]

    В рассматриваемом случае \[ \pd{\Pi}{\dot{q}} = 0, \quad T = T_2, \] причём $T_2$ — квадратичная форма по $\dot{q}_i$, поэтому \[ \pd{h}{\dot{q}} \dot{q} = \pd{\paren{T + \Pi}}{\dot{q}} \dot{q} = \pd{T_2}{\dot{q}} \dot{q} = 2T_2 = 2T. \]

    Подставляя полученное уравнение в формулу \[ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q = \pd{h}{\dot{q}} \dot q \dv{}{t} \Delta t, \] приходим к \[ \dv{}{t} \Delta t = \frac{1}{2T} \paren{ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q }. \] Интегрируя это равенство от $t_1$ до $t$, получаем \[ \Delta t = \Delta t_1 + \int\limits_{t_1}^t \frac{1}{2T} \paren{ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q } dt, \] где

    • $\Delta q_i$ — независимые вариации координат,
    • $\Delta t_1$ — независимая точечная вариация (значение $\Delta t$ в точке $t = t_1$).
    Учитывая, что $\Delta t_1 = 0$, получаем, что \[ \Delta t_2 = \int\limits_{t_1}^{t_2} \frac{1}{2T} \paren{ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q } dt. \]

    Обратимся теперь к формуле для полной вариации функционала действия: \[ \Delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \Delta q - H \Delta t } \right|_{t_1}^{t_2}. \] Учитывая условия \[ \Delta t_1 = 0, \quad \left. \Delta q \right|_{t_1, t_2} = 0, \] получаем, что \[ \Delta \int\limits_{t_1}^{t_2} L dt = -h \Delta t_2. \] Кроме того, из формулы \[ L = 2T - h \] следует, что \[ \Delta \int\limits_{t_1}^{t_2} L dt = \Delta \int\limits_{t_1}^{t_2} 2T dt - h \Delta t_2, \] поэтому \[ \Delta \int\limits_{t_1}^{t_2} 2T dt = 0, \] то есть полная вариация действия по Лагранжу равна нулю.

    (принцип Эйлера-Лагранжа).
    Пусть все действующие на механическую систему активные силы потенциальны, её движение стеснено только голономными идеальными удерживающими связями, лагранжевы координаты системы связаны с декартовыми координатами стационарными соотношениями, а гамильтониан не зависит от времени явно. Тогда истинные движениия этой системы, удовлетворяющие условию \[ \Delta t_1 = 0, \quad \left. \Delta q \right|_{t_1, t_2} = 0, \] принадлежат тому подмножеству множества всех кинематически возможных её движений, для которых выполнено равенство \[ \Delta \int\limits_{t_1}^{t_2} 2T dt = 0 \] с учётом того, что \[ \Delta t_2 = \int\limits_{t_1}^{t_2} \frac{1}{2T} \paren{ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q } dt, \]
    Иначе говоря, принцип Эйлера-Лагранжа означает, что среди всех кинематически возможных движений данной системы, удовлетворяющих условиям \[ \Delta t_1 = 0, \quad \left. \Delta q \right|_{t_1, t_2} = 0, \] истинное движение таково, что для него полная вариация действия по Лагранжу равна нулю.
  45. Контактные преобразования

    Удачый выбор обобщённых координат может существенно облегчить исследования уравнений движения, которые при любом выборе координат \[ q_i' = q_i'(q_1, \dots, q_k, t), \qquad q_i' \in C^2, \quad \overline{1,s} \] можно записать в форме Лагранжа II-го рода или в каноническом виде.

    Преобразование \[ q_i' = q_i'(q_1, \dots, q_s, t), \qquad q_i' \in C^2, \quad \overline{1,s} \] называется точечным.

    Если одновременно с заменой координат перейти к новым обобщённым импульсам по формулам \[ \begin{aligned} q_i' &= q_i'(q_1, \dots, q_s, p_1, \dots, p_s, t), \\ p_i' &= p_i'(q_1, \dots, q_s, p_1, \dots, p_s, t), \end{aligned} \] то в общем случае уравнения движения не сохраняют канонического вида. Однако при определённых условиях это преобразование к новым переменным позволяет вместо уравнений \[ \begin{aligned} \dot q = \phantom{-} \pd{H}{p}, \\ \dot p = - \pd{H}{q} \end{aligned} \] с произвольной функцией $H(q, p, t)$ получить канонические уравнения относительно новых переменных с новой функцией Гамильтона $H'(q', p', t)$.

    Формулы \[ \begin{aligned} q_i' &= q_i'(q_1, \dots, q_s, p_1, \dots, p_s, t), \\ p_i' &= p_i'(q_1, \dots, q_s, p_1, \dots, p_s, t) \end{aligned} \] определяют каноническое преобразование, если любая каноническая система уравнений переводится в каноническую.
    Рассмотрим канонические уравнения \[ \left\{ \begin{aligned} \dot{q}_i &= \phantom{-}\pd{H}{p_i}, \\ \dot{p}_i &= -\pd{H}{q_i}. \end{aligned} \right. \] Введём функции $Q = (Q_1, \dots, Q_n)$ и $P = (P_1, \dots, P_n)$: \[ \left\{ \begin{aligned} Q_i &= Q_i(q,p,t), \\ P_i &= P_i(q,p,t). \end{aligned} \right. \]
    Если существует функция $H'$ такая, что выполняются соотношения \[ \left\{ \begin{aligned} \dot{Q}_i &= \phantom{-}\pd{H'}{P_i}, \\ \dot{P}_i &= -\pd{H'}{Q_i}, \end{aligned} \right. \] то формулы \[ \left\{ \begin{aligned} Q_i &= Q_i(q,p,t), \\ P_i &= P_i(q,p,t) \end{aligned} \right. \] определяют каноническое преобразование.
    Говорят, что каноническое преобразование \[ \left\{ \begin{aligned} Q_i &= Q_i(q,p,t), \\ P_i &= P_i(q,p,t) \end{aligned} \right. \] является контактным, если выполняется одно из следующих условий:
    1. $p \delta q + Q \delta P = \delta S(q,P,t)$, или \[ \left\{ \begin{aligned} p_i &= \pd{S}{q_i}, \\ Q_i &= \pd{S}{P_i}, \end{aligned} \right. \]
    2. $p \delta q - P \delta Q = \delta S(q,Q,t)$, или \[ \left\{ \begin{aligned} p_i &= \pd{S}{q_i}, \\ P_i &= -\pd{S}{Q_i}, \end{aligned} \right. \]
    3. $q \delta p - Q \delta P = \delta S(p,P,t)$, или \[ \left\{ \begin{aligned} q_i &= \pd{S}{p_i}, \\ Q_i &= -\pd{S}{P_i}, \end{aligned} \right. \]
    4. $q \delta p + P \delta Q = \delta S(p,Q,t)$, или \[ \left\{ \begin{aligned} q_i &= \pd{S}{p_i}, \\ P_i &= \pd{S}{Q_i}. \end{aligned} \right. \]
    Функция $S$ называется производящей (преобразующей).
    1. Любое контактное преобразование является каноническим.
    2. Гамильтониан $H'$ преобразованной системы связан с $H$ исходной системы следующим соотношением: \[ H' = H + \pd{S}{t}. \]
    Рассмотрим, например, \[ p \delta q + Q \delta P = \delta S(q,P,t). \] Продифференцируем по $t$: \[ \dv{}{t} \paren{ p \delta q} + \dot Q \delta P + Q \dv{}{t} \delta P = \dv{}{t} \delta S(q, P, t). \] Пользуясь тем, что операции варьирования и дифференцирования перестановочны: \[ \dv{}{t} \delta P = \delta \dot P, \] а также тем, что \[ \dv{}{t} (p \delta q) = \delta L, \quad H = p \dot q - L \implies \dv{}{t} (p \delta q) = \delta \paren{ -H + p \dot q }, \] получаем, что \[ \delta L + \dot Q \delta P + Q \delta \dot P = \delta \dot s(q, P, t) = \delta \paren{ \pd{S}{q} \dot q + \pd{S}{P} \dot P + \pd{S}{t} } \]

    Заметим, что уравнение \[ p \delta q + Q \delta P = \delta S(q,P,t) \] равносильно системе \[ \left\{ \begin{aligned} p_i &= \pd{S}{q_i}, \\ Q_i &= \pd{S}{P_i}, \end{aligned} \right. \] откуда следует, что \[ \begin{aligned} \delta L + \dot Q \delta P + Q \delta \dot P &= \delta \paren{ p \dot q + Q \dot P + \pd{S}{t} }, \implies \\ \implies \delta \paren{ L - p \dot q - \pd{S}{t} } &= \dot P \delta Q + \cancel{Q \delta \dot P} - \dot Q \delta P - \cancel{Q \delta \dot P}, \implies \\ \implies \delta \paren{ L - p \dot q - \pd{S}{t} } &= \dot P \delta Q - \dot Q \delta P. \end{aligned} \] Воспользуемся тем, что \[ \dot P \delta Q = \dv{}{t} \paren{ P \delta Q } - P \delta \dot Q, \] тогда \[ \delta \paren{ L - p \dot q - \pd{S}{t} + \dot P Q } = \dv{}{t} \paren{ P \delta Q }. \] Используя определение гамильтониана, это равенство можно записать в виде \[ \delta \paren{ - H - \pd{S}{t} + \dot P Q } = \dv{}{t} \paren{ P \delta Q }. \] Рассмотрим теперь основной дифференциальный принцип в новых координатах: \[ \dv{}{t} \paren{ P \delta Q } = \delta L', \] причём $L'$ можно выразить через гамильтониан в новых координатах: \[ H' = P \dot Q - L' \implies L' = P \dot Q - H', \] откуда следует, что \[ \dv{}{t} \paren{ P \delta Q } = \delta \paren{ P \dot Q - H' }. \] Но \[ \delta \paren{ - H - \pd{S}{t} + \dot P Q } = \dv{}{t} \paren{ P \delta Q }, \] откуда следует, что \[ H' = H + \pd{S}{t}. \]

  46. Контактные преобразования и уравнения Гамильтона-Якоби

    Попробуем найти такую производящую функцию $S(q, p', t)$, чтобы контактное преобразование переводило исходные переменные $q, p$ в постоянные величины \[ p_i' = \alpha_i = \const, \qquad q_i' = \beta_i = \const. \] Такая функция должна удовлетворять равенствам \[ p_i = \pd{S}{q_i} = p_i(q, p', t), \qquad q_i' = \pd{S}{\alpha_i} = \beta_i. \] Кроме того, новые переменные должны удовлетворять каноническим уравнениям с гамильтонианом \[ H' = H + \pd{S}{t}. \] В этом случае \[ \begin{aligned} \dot q_i' &= 0 = \pd{H'}{p'}, \\ \dot p_i' &= 0 = \pd{H'}{q'}, & i = \overline{1,s}. \end{aligned} \] Следовательно, новая функция Гамильтона $H'(q', p', t)$ не зависит от новых переменных $q', p'$. Тогда должно выполняться равенство \[ H\paren{ q, \pd{S}{q}, t } + \pd{S}{t} = f(t), \] которое называют уравнением Гамильтона-Якоби. Правая часть представляет собой произвольную функцию времени $f(t)$.

    Вместо этого уравнения можно рассмотреть другое уравнение в частных производных, которому должна удовлетворять производящая функция $\tilde S(q, \alpha, t)$: \[ H\paren{ q, \pd{\tilde S}{q}, t } + \pd{\tilde S}{t} = 0, \] где \[ \tilde S = S - \int\limits_{t_0}^{t} f(\tau) d\tau. \]

    Таким образом, для решения поставленной задачи нужно найти полное решение (полный интеграл) уравнения Гамильтона-Якоби, которое будет зависеть от $s$ постоянных $\alpha$ и аддитивной постоянной $\alpha_0$ в виде \[ \tilde S = \psi(q, \alpha, t) + \alpha_0. \] Тогда задача интегрирования канонических уравнений заменяется нахождением решения уравнения Гамильтона-Якоби. Если функция $\tilde S$ получена, она порождает контактное преобразование \[ p_i = \pd{\psi}{q_i}, \qquad \beta_i = \pd{\psi}{\alpha_i}. \] Разрешая последние уравнения относительно $q$, получим явное решение исходных уравнений движения: \[ q_i = q_i(t, \alpha, \beta), \qquad p_i = p_i(t, \alpha, \beta). \]

    Если рассматривать движение механической системы со стационарными связями, то функция Гамильтона не зависит явно от времени. Тогда можно искать решение $\u{S}$ уравнения Гамильтона-Якоби вида \[ H\paren{ q, \pd{\u{S}}{q} } = h. \] После этого получим \[ S(q, \alpha, t) = -h t + \u{S}(q, \alpha), \] где $h = \alpha_1$.

  47. Геометрия масс. Моменты инерции. Тензор инерции. Эллипсоид инерции
    Пусть $x,y,z$ — декартовы координаты произвольной точки твёрдого тела. Пусть плотность тела $\rho = \rho(x,y,z)$ — непрерывная функция координат в области $V$, занимаемой телом.
    Величину \[ \iiint\limits_V \rho(x,y,z) x^i y^j z^k dx dy dz, \qquad i,j,k \in [0; +\infty) \] называют моментом порядка $\alpha = i + j + k$. Обозначение: $\sum m x^i y^j z^k$.
    Введём в рассмотрение шесть величин: \[ \begin{aligned} J_{yz} &= \sum m yz, & J_{zx} &= \sum m zx, & J_{xy} &= \sum m xy, \\ J_{xx} &= \sum m (y^2 + z^2), & J_{yy} &= \sum m (x^2 + z^2), & J_{zz} &= \sum m (x^2 + y^2). \end{aligned} \]
    $J_{yz}, J_{zx}, J_{xy}$ — центробежные моменты, $J_{xx}, J_{yy}, J_{zz}$ — осевые моменты.

    Момент инерции материальной точки относительно оси $l$ — величина $mh^2$, где $m$ — масса точки, $h$ — расстояние до оси $l$.

    Пусть $\rho(x,y,z)$ — плотность тела — непрерывная функция координат в области $V$, а $h(x,y,z)$ — расстояние точки $(x,y,z)$ до оси $l$.

    Величину \[ \iiint\limits_V \rho(x,y,z) h^2(x,y,z) dx dy dz \] называют моментом инерции твёрдого тела относительно оси $l$. Обозначение: $\sum m h^2$.
    Пусть $J_l$ — момент инерции относительно оси $l$, а $M$ — масса твёрдого тела. Тогда величину $\rho_l$ такую, что \[ J_l = M \rho_l^2, \] называют радиусом инерции твёрдого тела относительно оси $l$.
    Средством вычисления $J_l$ является следующая
    Пусть ось $l$ проходит через точку $O$, а $\alpha, \beta, \gamma$ — её направляющие косинусы в системе координат $Oxyz$. Тогда \[ J_l = J_{xx} \alpha^2 + J_{yy} \beta^2 + J_{zz} \gamma^2 - 2 J_{yz} \beta \gamma - 2 J_{zx} \gamma \alpha - 2 J_{xy} \alpha \beta. \]

    Пусть система координат $Oxyz$ фиксирована. Рассмотрим пучок прямых $l$, проходящих через точку $O$. Относительно каждой из осей $l$ этого пучка данное тело имеет свой момент инерции $J_l$. Наглядную картину распределения моментов инерции $J_l$ твёрдого тела (в зависимости от выбора оси $l$) даёт эллипсоид инерции.

    Пусть $\bvec{e} = (\alpha, \beta, \gamma)$ — единичный вектор, направленный вдоль $l$. Взяв на $l$ произвольную точку $M(x,y,z)$ и обозначая $OM = R$, получаем \[ x = R \alpha, \quad y = R \beta, \quad z = R \gamma. \] Тогда из формулы \[ J_l = J_{xx} \alpha^2 + J_{yy} \beta^2 + J_{zz} \gamma^2 - 2 J_{yz} \beta \gamma - 2 J_{zx} \gamma \alpha - 2 J_{xy} \alpha \beta \] получаем \[ k^2 = J_{xx} x^2 + J_{yy} y^2 + J_{zz} z^2 - 2 J_{yz} y z - 2 J_{zx} z x - 2 J_{xy} x y, \] где $k^2 = J_l R^2$. Данная формула задаёт поверхность второго порядка. Будем считать, что $k = \const$, поэтому \[ R = \frac{k}{\sqrt{J_l}}. \] Так как $J_l$ существенно больше нуля, то $R \lt \infty$ и, следовательно, задаёт эллипсоид (единственная поверхность 2 порядка, не имеющая бесконечно удалённых точек). Этот эллипсоид и называется эллипсоидом инерции. Центр эллипсоида находится в точке $O$, а $k$ определяет масштаб. Итак, с точностью до выбора масштаба $k$ каждой точке $O$ тела соответствует свой эллипсоид инерции. Главные оси эллипсоида инерции называют главными осями инерции тела для точки $O$. Если точка $O$ совпадает с центром масс, то построенный для неё эллипсоид инерции называют центральным, а его главные оси — главными центральными осями инерции.

    Положим \[ J_{xy} = J_{yx}, \quad J_{yz} = J_{zy}, \quad J_{zx} = J_{xz} \] (это следует из определения произведений инерции) и рассмотрим матрицу квадратичной формы \[ (J) = \begin{pmatrix} J_{xx} & -J_{xy} & -J_{xz} \\ -J_{yx} & J_{yy} & -J_{yz} \\ -J_{zx} & -J_{zy} & J_{zz} \end{pmatrix} \]

    Матрица $(J)$ называется тензором инерции.
    Если оси $Oxyz$ направить вдоль главных осей эллипсоида инерции для точки $O$, то тензор инерции становится диагональной матрицей, а уравнение эллипсоида инерции имеет каноническую форму \[ J_{xx} x^2 + J_{yy} y^2 + J_{zz} z^2 = k^2. \]
  48. Движение твёрдого тела около неподвижной точки. Динамические и кинематические уравнения Эйлера

    Пусть $\bvec{K}_O$ — вектор кинетического момента твёрдого тела относительно неподвижной точки $O$. Тогда \[ \begin{aligned} \bvec{K}_O &= \sum \bvec{r}_i \times m_i \bvec{v}_i = \\ &= \sum \bvec{r}_i \times m_i \paren{ \bvec{\omega} \times \bvec{r}_i } = \\ &= \bvec{\omega} \sum m_i r_i^2 - \sum m_i \bvec{r}_i (\dp{\bvec{r}_i}{\bvec{\omega}}), \end{aligned} \] где $\bvec{r}_i, \bvec{v}_i$ — радиус-вектор относительно точки $O$ и скорость произвольной точки тела; $\bvec{\omega}$ — угловая скорость твёрдого тела.

    Здесь $\sum$ — условное обозначение.

    Пусть $O\xi\eta\zeta$ — неподвижная система координат, а $Oxyz$ — СК, жёстко связанная с твёрдым телом.

    Пусть $p,q,r$ — координаты вектора $\bvec{\omega}$ в подвижной СК $Oxyz$, а $K_x, K_y, K_z$ — координаты $\bvec{K}_O$ в той же СК $Oxyz$. Тогда, проектируя формулу \[ \bvec{K}_O = \bvec{\omega} \sum m_i r_i^2 - \sum m_i \bvec{r}_i (\dp{\bvec{r}_i}{\bvec{\omega}}) \] на оси $x, y, z$, получим \[ \begin{aligned} K_x &= p \sum m_i (y_i^2 + z_i^2) - q \sum m_i x_i y_i - r \sum m_i x_i z_i, \\ K_y &= q \sum m_i (x_i^2 + z_i^2) - p \sum m_i y_i x_i - r \sum m_i y_i z_i, \\ K_z &= r \sum m_i (x_i^2 + y_i^2) - p \sum m_i z_i x_i - q \sum m_i z_i y_i, \end{aligned} \] то есть \[ \begin{aligned} K_x &= J_{xx} p - J_{xy} q - J_{xz} r, \\ K_y &= -J_{yx} p + J_{yy} q - J_{zz} r, \\ K_z &= -J_{zx} p - J_{zy} q + J_{zz} r, \end{aligned} \] или, иначе, \[ \bvec{K}_O = (J) \bvec{\omega}. \]

    Если за подвижные оси взять главные оси инерции для точки $O$, то тензор инерции становится диагональным, и координаты $\bvec{K}_O$: \[ K_x = J_{xx}p, \quad K_y = J_{yy} q, \quad K_z = J_{zz} r. \]

    Выразим кинетическую энергию твёрдого тела как функцию компонент вектора $\bvec{\omega}$: \[ \begin{aligned} 2T &= \sum m_i \dp{\bvec{v}_i}{\bvec{v}_i} = \\ &= \sum m_i \bvec{v}_i \paren{ \bvec{\omega} \times \bvec{r}_i } = \\ &= \sum \bvec{\omega} \paren{ \bvec{r}_i \times m_i \bvec{v}_i } = \\ &= \bvec{\omega} \sum \paren{ \bvec{r}_i \times m_i \bvec{v}_i } = \\ &= \bvec{\omega} \bvec{K}_O. \end{aligned} \] Здесь:

    • $\bvec{K}_O$ — вектор кинетического момента твёрдого тела относительно неподвижной точки $O$;
    • $\bvec{\omega}$ — угловая скорость твёрдого тела.

    В подвижной СК \[ \bvec{\omega} = (p,q,r), \quad \bvec{K}_O = (K_x, K_y, K_z), \] поэтому \[ 2T = J_{xx} p^2 + J_{yy} q^2 + J_{zz} r^2 - 2 J_{yz} qr - 2 J_{zx} rp - 2 J_{xy} qp. \]

    Если за подвижные оси взяты главные оси инерции тела для точки $O$, то это уравнение принимает вид \[ 2T = J_{xx} p^2 + J_{yy} q^2 + J_{zz} r^2. \]


    В неподвижной СК $O\xi\eta\zeta$ запишем теорему об изменении кинетического момента: \[ \dv{\bvec{K}_O}{t} = \bvec{M}_O, \] где $\bvec{M}_O$ — главный момент всех внешних сил относительно неподвижной точки $O$.

    Относительная производная — производная в подвижной системе отсчёта.

    Справедлива формула: \[ \dv{\bvec{P}}{t} = \rdv{\bvec{P}}{t} + \vp{\bvec{\omega}}{\bvec{P}}, \] где $\bvec{P}$ — произвольный вектор.

    Используя эту формулу, получаем \[ \dv{\bvec{K}_O}{t} = \rdv{\bvec{K_O}}{t} + \vp{\bvec{\omega}}{\bvec{K_O}} = \bvec{M}_O. \] Спроецируем эту формулу на оси подвижной СК $Oxyz$, направленные по главным осям инерции твёрдого тела в точке $O$: \[ \begin{aligned} \dv{K_x}{t} + q K_z - r K_y &= M_x, \\ \dv{K_y}{t} + r K_x - p K_z &= M_y, \\ \dv{K_z}{t} + p K_y - q K_x &= M_z. \end{aligned} \] Учитывая выражения \[ K_x = J_{xx}p, \quad K_y = J_{yy} q, \quad K_z = J_{zz} r \] и вводя обозначения \[ J_{xx} = A, \quad J_{yy} = B, \quad J_{zz} = C, \] получаем уравнения, которые называют динамическими уравнениями Эйлера: \[ \begin{aligned} A \dot p + (C - B) qr = M_x, \\ B \dot q + (A - C) pr = M_y, \\ C \dot r + (B - A) pq = M_z. \end{aligned} \]

    Чтобы полностью описать движение твёрдого тела с неподвижной точкой, к динамическим уравнениям Эйлера необходимо добавить кинематические уравнения Эйлера, связывающие проекции $(p,q,r)$ угловой скорости твёрдого тела $\bvec{\omega}$ в СК $Oxyz$ и углы Эйлера: \[ \left\{ \begin{aligned} p &= \dot\psi \sin\theta \sin\varphi + \dot\theta \cos\varphi, \\ q &= \dot\psi \sin\theta \cos\varphi - \dot\theta \sin\varphi, \\ r &= \dot\psi \cos\theta + \dot\varphi, \end{aligned} \right. \]
    где:
    • $O\xi\eta\zeta$ — неподвижная СК;
    • $Oxyz$ — подвижная СК;
    • $ON$ — линия узлов, образуемая пересечением плоскостей $O\xi\eta$ и $Oxy$;
    • $\psi$ — угол прецессии — угол между $O\xi$ и $ON$;
    • $\theta$ — угол нутации — угол между $O\zeta$ и $Oz$;
    • $\varphi$ — угол чистого вращения — угол между $Ox$ и $ON$.
    Скорости $\dot\psi, \dot\varphi, \dot\theta$ направлены по осям $O\xi, Oz, ON$, соответственно.
  49. Задача вращательного движения тела в однородном поле тяжести. Уравнения движения и интегралы. Случаи Эйлера, Лагранжа, Ковалевской
    Рассмотрим движение твёрдого тела с неподвижной точкой под действием только силы тяжести $\bvec{P}$. Введём в рассмотрение две СК с началом в точке $O$: неподвижную $O\xi\eta\zeta$, связанную с Землёй, и подвижную $Oxyz$, которая совпадает с главными осями инерции тела для точки $O$. Ось $O\zeta$ направлена вертикально вверх. Обозначим орт этой оси за $\bvec{e}$, а его направляющие косинусы в СК $Oxyz$ — за $(\gamma_1, \gamma_2, \gamma_3)$. Так как направление $O\zeta$ неподвижно относительно Земли, то \[ \dv{\bvec{e}}{t} = 0, \] или \[ \tag{1} \dv{\bvec{e}}{t} = \rdv{\bvec{e}}{t} + \vp{\bvec{\omega}}{\bvec{e}} = 0. \] Проецируя это уравнение на подвижные оси $Oxyz$, получаем уравнения Пуассона: \[ \tag{2} \begin{aligned} \dot\gamma_1 &= r \gamma_2 - q \gamma_3, \\ \dot\gamma_2 &= p \gamma_3 - r \gamma_1, \\ \dot\gamma_3 &= q \gamma_1 - p \gamma_2. \end{aligned} \] Единственная внешняя сила, действующая на ТТ — сила тяжести: \[ \bvec{P} = -P \bvec{e}. \] Главный момент этой силы относительно точки $O$ равен \[ \bvec{M}_O(\bvec{P}) = \vp{\bvec{r}_C}{\bvec{P}} = P \vp{\bvec{e}}{\bvec{r}_C} = P \begin{vmatrix} \bvec{i} & \bvec{j} & \bvec{k} \\ \gamma_1 & \gamma_2 & \gamma_3 \\ x_C & y_C & z_C \end{vmatrix}, \] где $\bvec{r}_C = \paren{ x_C, y_C, z_C }$ — радиус-вектор центра тяжести ТТ относительно $O$ в СК $Oxyz$.

    С учётом этого, динамические уравнения Эйлера примут вид \[ \tag{3} \begin{aligned} A\dot p + (C - B) qr &= P(\gamma_2 z_C - \gamma_3 y_C), \\ B\dot q + (A - C) rp &= P(\gamma_3 x_C - \gamma_1 z_C), \\ C\dot r + (B - A) pq &= P(\gamma_1 y_C - \gamma_2 x_C). \end{aligned} \] Из (2) и (3) получаем систему из 6 нелинейных ОДУ 1-го порядка относительно 6 неизвестных функций времени $\gamma_1, \gamma_2, \gamma_3, p, q, r$.

    Если $\gamma_1, \gamma_2, \gamma_3, p, q, r$ найдены как функции времени, то для полного решения задачи (т.е. для определения эйлеровых углов как функций времени) необходимо из любого из кинематических уравнений Эйлера \[ \left\{ \begin{aligned} p &= \dot\psi \sin\theta \sin\varphi + \dot\theta \cos\varphi, \\ q &= \dot\psi \sin\theta \cos\varphi - \dot\theta \sin\varphi, \\ r &= \dot\psi \cos\theta + \dot\varphi, \end{aligned} \right. \] найти $\psi(t)$ одной квадратурой: например, исключим из первых двух уравнений $\dot\theta$, тогда \[ p \sin \varphi + q \cos \varphi = \dot \psi \sin \theta, \] откуда \[ \dot \psi = \frac{p \sin\varphi + q \cos\varphi}{\sin\theta}, \] а $\theta(t)$ и $\varphi(t)$ определяются непосредственно через $\gamma_1(t), \gamma_2(t), \gamma_3(t)$, так как \[ \begin{aligned} \gamma_1 &= \sin \theta \sin \varphi, \\ \gamma_2 &= \sin \theta \cos \varphi, \\ \gamma_3 &= \cos \theta. \end{aligned} \]

    Установлено, что для полного решения системы (2)-(3) достаточно знать 4 независимых интеграла вместо 6.

    Можно указать следующие первые интегралы:

    1. Геометрический. Так как $\bvec{e} = (\gamma_1, \gamma_2, \gamma_3)$ в СК $Oxyz$ и $\abs{\bvec{e}} = 1$, то \[ \tag{4} \gamma_1^2 + \gamma_2^2 + \gamma_3^2 = 1. \]
    2. Интеграл площадей. Применим теорему об изменении кинетического момента относительно оси $O\xi$: \[ M_{O\xi}(\bvec{P}) = 0, \] так как \[ O\xi \parallel \bvec{P} \implies \dv{K_\xi}{t} = M_{O\xi} = 0 \implies K_\xi = \const. \] Так как \[ K_\xi = \dp{\bvec{K}_O}{\bvec{e}} = \paren{ A p \bvec{i}, B q \bvec{j}, C r \bvec{k} } \cdot \paren{ \gamma_1 \bvec{i}, \gamma_2 \bvec{j}, \gamma_3 \bvec{k} } = A p \gamma_1 + B q \gamma_2 + C r \gamma_3, \] то \[ \tag{5} A p \gamma_1 + B q \gamma_2 + C r \gamma_3 = \const. \]
      Расписать закон сохранения площадей.
    3. Интеграл энергии. По теореме об изменении кинетической энергии \[ dT = - P d\xi_C, \] где $\xi_C$ — координата центра тяжести ТТ в $O\xi\eta\zeta$.

      Интегрируя это равенство, получаем, что \[ T = -P \xi_C + \const. \] Так как \[ 2T = J_{xx} p^2 + J_{yy} q^2 + J_{zz} r^2 = A p^2 + B q^2 + C r^2, \] а \[ \xi_C = \dp{\bvec{r}_C}{\bvec{e}} = x_C \gamma_1 + y_C \gamma_2 + z_C \gamma_3, \] то \[ \tag{6} \frac{1}{2} \paren{ A p^2 + B q^2 + C r^2 } = -P \paren{ x_C \gamma_1 + y_C \gamma_2 + z_C \gamma_3 } + \const; \] это равенство и называют интегралом энергии.

    Остаётся найти ещё один интеграл, независимый от (4)-(6). Сделать это удалось только для трёх частных предположений относительно движущегося тела и условий его движения:

    1. Случай Эйлера: центр тяжести является неподвижной точкой \[ x_C = 0, \; y_C = 0, \; z_C = 0, \qquad A \neq B \neq C. \]
    2. Случай Лагранжа: моменты инерции относительно главных осей удовлетворяют условиям \[ A = B \neq C, \] а центр тяжести находится на оси симметрии эллипсоида инерции: \[ x_C = 0, \quad y_C = 0. \]
    3. Случай Ковалевской: центр тяжести расположен в экваториальной плоскости эллипсоида инерации \[ z_C = 0, \] а моменты инерции относительно главных осей удовлетворяют условиям \[ A = B = 2C. \]
    Интеграл \[ \tag{7} u = \int\limits_{0}^{x} \frac{dx}{\sqrt{(1-x^2)(1 - k^2 x^2)}} \] называют эллиптическим интегралом Якоби 1-го рода.
    После замены $x = \sin \varphi$ он принимает вид \[ u = \int\limits_{0}^{\varphi} \frac{d\varphi}{\sqrt{ 1 - k^2 \sin^2 \varphi }} = F(\varphi, k). \]
    Интеграл \[ \tag{8} u = \int\limits_{0}^{\varphi} \frac{d\varphi}{\sqrt{ 1 - k^2 \sin^2 \varphi }} = F(\varphi, k) \] называют эллиптическим интегралом Лежандра 1-го рода.
    Обратную функцию $\varphi(u)$ называют амплитудой: \[ \varphi = \am u = \am F(\varphi, k). \]
    Эллиптическими функциями назывюатся тригонометрические функции от $\am u$: \[ \tag{10} \left\{ \begin{aligned} \sin \varphi &= \sin \am u = \sn u, \\ \cos \varphi &= \cos \am u = \cn u, \\ \sqrt{ 1 - k^2 \sin^2\varphi } &= \Delta \varphi = \Delta \am u = \dn u. \end{aligned} \right. \] Функцию $\dn u$ называют дельтой амплитуды.
    Нетрудно проверить, что справедливо равенство \[ \tag{11} \sn^2 u + \cn^2 u = 1. \] Если $k = 0$, то $\sn u = \sin u$ и $\cn u = \cos u$, так как в этом случае $\varphi = u$. Отсюда следует, что при $k = 0$ \[ \sn 0 = 0, \qquad \cn 0 = 1, \qquad \dn 0 = 1. \]
    Эллиптические функции являются периодическими с действительным периодом $4l$, где \[ l = \int\limits_{0}^{\pi / 2} \frac{d\varphi}{\sqrt{ 1 - k^2 \sin^2 \varphi }}. \]
  50. Постановка задач оптимального управления: критерии качества и ограничения
    Рассмотрим систему ОДУ \[ \dot x = f(x(t), u(t)), \] где \[ x \in \R^n, \qquad u \in \R^m, \qquad t \in [t_\text{н}, t_\text{к}]. \] Рассмотрим классификацию критериев качества:
    1. Задача Лагранжа: \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t)) dt. \]
    2. Задача Майера: \[ J_0 = \varphi_0(t_\text{н}, x(t_\text{н}), t_\text{к}, x(t_\text{к})). \]
    3. Задача Больца: \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t)) dt. + \varphi_0(t_\text{н}, x(t_\text{н}), t_\text{к}, x(t_\text{к})), \] причём первое слагаемое называют интегральной частью, а второе — терминальной частью.

    Рассмотрим классификацию ограничений:

    1. Ограничения на траекторию
      1. Задача с фиксированными концами: \[ x(t_\text{н}) = x^\text{н}, \qquad x(t_\text{к}) = x^\text{к}. \]
      2. Задача со свободным левым/правым концом: \[ x(t_\text{н}) = x^\text{н} \quad \text{или} \quad x(t_\text{к}) = x^\text{к}. \]
      3. Задача с подвижными концами: \[ x(t_\text{н}) = G(t_\text{н}), \qquad x(t_\text{к}) = G(t_\text{к}). \]
      4. Изопериметрическая задача: \[ \left\{ \begin{aligned} J_j &= \int\limits_{t_\text{н}}^{t_\text{к}} F_j(t, x(t)) dt \leqslant 0, & j &= \overline{1, m_1} \\ J_i &= \int\limits_{t_\text{н}}^{t_\text{к}} F_i(t, x(t)) dt = 0, & i &= \overline{m_1 + 1, m_2}. \end{aligned} \right. \]
    2. Ограничения на управление:
      1. Программное управление: \[ u = u(t). \]
      2. Синтез-управление: \[ u = u(t, x). \]
      3. Специфические ограничения: \[ u \in U. \]
      4. Изопериметрические ограничения: \[ \left\{ \begin{aligned} J_j &= \int\limits_{t_\text{н}}^{t_\text{к}} F_j(t, u(t)) dt \leqslant 0, & j &= \overline{m_2 + 1, m_3} \\ J_i &= \int\limits_{t_\text{н}}^{t_\text{к}} F_i(t, u(t)) dt = 0, & i &= \overline{m_3 + 1, m_4}. \end{aligned} \right. \]
    (оптимального управления). Рассмотрим
    1. систему ОДУ $\dot x = f(x(t), u, t)$, где \[ x \in \R^n, \qquad u \in \R^m \qquad t \in [t_\text{н}, t_\text{к}], \] с начальными условиями $x(t_\text{н}) = x^\text{н}$;
    2. критерий качества \[ J_0(t_\text{н}, x^\text{н}, t_\text{к}, x^\text{к}) \to \inf, \]
    3. ограничения: \[ \left\{ \begin{aligned} J_j(t_\text{н}, x^\text{н}, t_\text{к}, x^\text{к}, u) &\leqslant 0, & j &= \overline{1, m_1}, \\ J_i(t_\text{н}, x^\text{н}, t_\text{к}, x^\text{к}, u) &= 0, & i &= \overline{m_1 + 1, m_2}, \\ u &\in U, & & & \end{aligned} \right. \] где \[ J_k = \int\limits_{t_\text{н}}^{t_\text{к}} F_k(x(t), u, t) dt + \varphi_k(t_\text{н}, x^\text{н}, t_\text{к}, x^\text{к}), \] причём \[ u(t) \in PC, \qquad x(t) \in PC^1. \]

    Рассмотрим совокупность варьируемых параметров \[ q = q(t_\text{н}, t_\text{к}, x(t_\text{н}), x(t_\text{к}), u). \]

    Совокупность $q$ варьируемых параметров называется допустимой, если она удовлетворяет условиям \[ \begin{aligned} \dot x &= f(x(t), u, t), \\ J_k &= \int\limits_{t_\text{н}}^{t_\text{к}} F_k(x(t), u, t) dt + \varphi_k(t_\text{н}, t_\text{к}, x(t_\text{н}), x(t_\text{к})). \end{aligned} \]
    Допустимую совокупность $\tilde q$ называют оптимальной, если для любой другой бесконечно близкой к ней совокупности $q$ выполняется условие \[ J_0(\tilde q) \leqslant J_0(q). \]
    Допустимую совокупность $\tilde q$ называют локально оптимальной в сильном смысле, если существует $\varepsilon \gt 0$ такой, что для любой допустимой совокупности $q$ такой, что \[ \abs{\tilde t_\text{н} - t_\text{н}} + \abs{\tilde t_\text{к} - t_\text{к}} + \max_t \abs{\tilde x(\tilde u, t) - x(u, t)} \lt \varepsilon, \qquad t \in [t_\text{н}, t_\text{к}] \cap [\tilde t_\text{н}, \tilde t_\text{к}], \] выполняется \[ J_0(\tilde q) \leqslant J_0(q). \]

    В дальнейшем будем искать локально оптимальные сильные экстремумы, то есть рассматривать непрерывные функции.

  51. Постановка вариационных задач управления движением. Сильные и слабые вариации условного функционала

    Рассмотрим уравнения движения \[ \dot x = f(x(t), u(t), t), \qquad x \in \R^n, \quad u \in \R^m, \qquad t \in [t_\text{н}, t_\text{к}] \in \R, \] причём \[ f \in C^1, \qquad \pd{f}{x} \in C^1, \] с начальными условиями \[ x(t_\text{н}) = x^\text{н}. \]

    Будем считать, что заданы условия на управление: \[ u_{j1} \leqslant u_j(t) \leqslant u_{j2}, \qquad u_{j1}, u_{j2} \in \overline{\R}. \]

    Если для всех $j$ \[ u_{j1} = -\infty, \qquad u_{j2} = \infty, \] то задача называется задачей классического вариационного исчисления.

    Будем рассматривать управления $u_j(t) \in PC$ с конечным числом точек разрыва $\tau$. Будем считать, что они изолированы, а $u_j(t)$ непрерывны справа.

    Управления, имеющие конечное число точек разрыва и удовлетворяющие ограничениям \[ u_{j1} \leqslant u_j(t) \leqslant u_{j2}, \qquad u_{j1}, u_{j2} \in \overline{\R}, \] будем называть допуститмыми.
    Говорят, что пары $(u, x)$ из допустимого управления и отвечающей ему траектории, удовлетворяющие уравнениям движения, образуют управляемый процесс.

    Будем считать, что также заданы ограничения на траекторию: \[ J_i(t_\text{н}, t_\text{к}, x_i(t_\text{н}), x_i(t_\text{к})) = 0, \qquad i = \overline{1,n}, \quad j = \overline{1,l}, \quad l \leqslant 2n + 2, \] причём считаем, что функции $J_i \in C^1$ и независимы, то есть \[ \rank \paren{ \pd{J_j}{t_\text{н}}, \pd{J_j}{t_\text{к}}, \pd{J_j}{x_i^\text{н}}, \pd{J_j}{x_i^\text{к}} } = l. \]

    Управляемый процесс, удовлетворяющий ограничениям на траекторию, называют допустимым управляемым процессом.

    Зададим критерий качества в виде Больца: \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t), t) dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min, \] причём считаем, что $\varphi_0, F_0, \pd{F_0}{x} \in C^1$.

    Задача вариационного управления движения заключается в поиске допустимого управляемого процесса, удовлетворяющего критерию качества.


    Введём понятие игольчатых вариаций. Рассмотрим управление $u(t)$, при котором минимизируется функционал. Будем варьировать это управление следующим образом. Рассмотрим конечное число моментов времени $t_\sigma$: \[ t_\text{н} \lt t_1 \lt \dots \lt t_n \lt t_\text{к}, \qquad \sigma = \overline{1,n}, \] в которых управление $u(t)$ меняется соответственно на $v_\sigma(t)$. Будем считать, что $v_\sigma(t)$ удовлетворяет ограничением на управление, то есть \[ u_{j1} \leqslant v_{j\sigma} \leqslant u_{j2}. \]

    Введём в рассмотрение величины \[ \Delta t_\sigma \gt 0, \qquad \Delta t_\text{н}, \quad \Delta t_\text{к}, \] построим непересекающиеся интервалы \[ \left\{ \begin{aligned} i_\text{н} &= \begin{cases} [t_\text{н}, t_\text{н} + \Delta t_\text{н}), & \Delta t_\text{н} \gt 0, \\ (t_\text{н} + \Delta t_\text{н}, t_\text{н}], & \Delta t_\text{н} \lt 0, \end{cases} \\ i_\sigma &= [t_\sigma, t_\sigma + \Delta t_\sigma], \\ i_\text{к} &= \begin{cases} [t_\text{к}, t_\text{к} + \Delta t_\text{к}), & \Delta t_\text{к} \gt 0, \\ (t_\text{к} + \Delta t_\text{к}, t_\text{к}], & \Delta t_\text{к} \lt 0. \end{cases} \\ \end{aligned} \right. \] Заметим, что точки разрыва изолированы.

    Используя построенные интервалы, рассмотрим новое управление: \[ u'(t) = \begin{cases} u(t_\text{н}), & t \in i_\text{н}, \\ u(t_\text{к}), & t \in i_\text{к}, \\ v_\sigma, & t \in i_\sigma, \\ u, & t \not \in i_\text{н}, i_\text{к}, i_\sigma. \end{cases} \] Тогда игольчатой вариацией называется функция \[ v(t) = u'(t + \Delta t) - u(t). \]

    Так как \[ u'(t) = u(t), \qquad t \not \in i_\text{н}, i_\text{к}, i_\sigma, \] то \[ v = u(t + \Delta t) - u(t) = \Delta u. \]

    Разобраться до конца, что надо писать, а что нет.
  52. Полная вариация условного функционала: слабое варьирование
    Рассмотрим
    1. уравнение движения \[ \dot x = f(x(t), u(t), t), \]
    2. ограничения на траекторию \[ J_j(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) = 0, \qquad j = \overline{1,l}, \]
    3. критерий качества \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(t, x(t), u(t)) dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min. \]

    Эту задачу можно рассматривать как задачу условной минимизации функционала $J_0$. Перейдём от неё к задаче безусловной минимизации функционала введением множителей Лагранжа: \[ \lambda(t) \in \R^n, \qquad \nu \in \R^l. \] Тогда будем минимизировать функционал \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} \left[ F_0(t, x(t), u(t)) dt + \lambda (\dot x - f) \right] dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \sum\limits_{j=1}^{l} \nu_j J_j. \] Введя обозначения \[ L = F_0 + \lambda (\dot x - f), \qquad R = \varphi_0 + \sum\limits_{j=1}^{l} \nu_j J_j, \] перепишем этот функционал в следующем виде: \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} L(x(t), \dot x, \lambda, u(t), t) dt + R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min. \]

    Найдём полную вариацию этого функционала: \[ \Delta \Phi = \delta \Phi + \dot \Phi \Delta t. \]

    Пользуясь определением функционала действия по Гамильтону \[ S = \int\limits_{t_\text{н}}^{t_\text{к}} L dt, \] можно записать \[ \Delta \Phi = \Delta \int\limits_{t_\text{н}}^{t_\text{к}} L dt + \Delta R = \Delta_1 S + \Delta_2 S + \Delta_1 R = \Delta_1 \Phi + \Delta_2 \Phi, \] где:

    • $\Delta_1$ отвечает за вариации без разрывов, то есть за слабые вариации параметров $x, \dot x, \lambda, u, t$ и за сильные вариации для $\dot x$;
    • $\Delta_2$ отвечает за сильные вариации для управления.

    Рассмотрим для начала вариации без разрывов: \[ \Delta_1 \Phi = \Delta_1 S + \Delta_1 R. \] Известно, что \[ \Delta_1 S = \Delta \int\limits_{t_\text{н}}^{t_\text{к}} L dt = \int\limits_{t_\text{н}}^{t_\text{к}} \delta L dt + \left .\paren{ L \Delta t } \right|_{t_\text{н}}^{t_\text{к}}. \] Рассмотрим изохронную вариацию функции $L$: \[ \delta L(x, \dot x, \lambda, u, t) = \pd{L}{x} \delta x + \pd{L}{\dot x} \delta \dot x + \pd{L}{\lambda} \delta \lambda + \pd{L}{u} \delta u. \] Так как \[ \dv{}{t} \paren{ \pd{L}{\dot x} \delta x } = \dv{}{t} \pd{L}{\dot x} \delta x + \pd{L}{\dot x} \delta \dot x, \] то \[ \pd{L}{\dot x} \delta \dot x = \dv{}{t} \paren{ \pd{L}{\dot x} \delta x } - \dv{}{t} \pd{L}{\dot x} \delta x, \] поэтому \[ \delta L(x, \dot x, \lambda, u, t) = \paren{ \pd{L}{x} - \dv{}{t} \pd{L}{\dot x} } \delta x + \dv{}{t} \paren{ \pd{L}{\dot x} \delta x } + \pd{L}{\lambda} \delta \lambda + \pd{L}{u} \delta u. \] Введём функцию Гамильтона: \[ H = \lambda \dot x - L(x, \dot x, \lambda, u, t), \] где $x$ и $\lambda$ будем воспринимать как аналог обобщённых координат и импульсов соответственно. Из определения \[ L = F_0 + \lambda (\dot x - f) \] следует, что \[ H = -F_0 + \lambda f, \implies H = H(x, \lambda, u, t). \] Пользуясь этим обозначением, а также тем, что \[ \pd{L}{\dot x} = \lambda, \] получаем \[ \delta L = - \paren{ \pd{H}{x} + \dot \lambda } \delta x + \dv{}{t} \paren{ \lambda \delta x } + \paren{ \dot x - \pd{H}{\lambda} } \delta \lambda - \pd{H}{u} \delta u. \] Заметим, что \[ \left\{ \begin{aligned} \pd{L}{x} &= - \pd{H}{x}, \\ \pd{L}{\lambda} &= \dot x - \pd{H}{\lambda}, \\ \pd{L}{u} &= - \pd{H}{u}. \end{aligned} \right. \]

    Рассмотрим теперь второе слагаемое: \[ \begin{aligned} L \Delta t &= \paren{ \lambda \dot x - H } \Delta t = \\ &= \lambda \dot x \Delta t - H \Delta t = \\ &= \lambda \Delta x - \lambda \delta x - H \Delta t. \end{aligned} \]

    Собирая полученные результаты, получаем, что \[ \begin{aligned} \Delta_1 S &= \int\limits_{t_\text{н}}^{t_\text{к}} \delta L dt + \left .\paren{ L \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = \\ &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \cancel{\left. \paren{ \lambda \delta x } \right|_{t_\text{н}}^{t_\text{к}}} + \\ &\phantom{=} + \left. \paren{ \lambda \Delta x - \cancel{\lambda \delta x} - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = \\ &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} \end{aligned} \]

  53. Полная вариация условного функционала: сильное варьирование. Условия Эрдмана-Вейерштрасса
    Рассмотрим
    1. уравнение движения \[ \dot x = f(x(t), u(t), t), \]
    2. ограничения на траекторию \[ J_j(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) = 0, \qquad j = \overline{1,l}, \]
    3. критерий качества \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(t, x(t), u(t)) dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min. \]

    Эту задачу можно рассматривать как задачу условной минимизации функционала $J_0$. Перейдём от неё к задаче безусловной минимизации функционала введением множителей Лагранжа: \[ \lambda(t) \in \R^n, \qquad \nu \in \R^l. \] Тогда будем минимизировать функционал \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} \left[ F_0(t, x(t), u(t)) dt + \lambda (\dot x - f) \right] dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \sum\limits_{j=1}^{l} \nu_j J_j. \] Введя обозначения \[ L = F_0 + \lambda (\dot x - f), \qquad R = \varphi_0 + \sum\limits_{j=1}^{l} \nu_j J_j, \] перепишем этот функционал в следующем виде: \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} L(x(t), \dot x, \lambda, u(t), t) dt + R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min. \]

    Найдём полную вариацию этого функционала: \[ \Delta \Phi = \delta \Phi + \dot \Phi \Delta t. \]

    Пользуясь определением функционала действия по Гамильтону \[ S = \int\limits_{t_\text{н}}^{t_\text{к}} L dt, \] можно записать \[ \Delta \Phi = \Delta \int\limits_{t_\text{н}}^{t_\text{к}} L dt + \Delta R = \Delta_1 S + \Delta_2 S + \Delta_1 R = \Delta_1 \Phi + \Delta_2 \Phi, \] где:

    • $\Delta_1$ отвечает за вариации без разрывов, то есть за слабые вариации параметров $x, \dot x, \lambda, u, t$ и за сильные вариации для $\dot x$;
    • $\Delta_2$ отвечает за сильные вариации для управления.

    Рассмотрим сильные вариации. Обозначим за $u'$ управление, отвечающее траектории сравнения, тогда \[ \begin{aligned} \Delta_2 \Phi &= \Delta_2 S = \\ &= \int\limits_{t_\text{н}}^{t_\text{к}} \left[ L(x, \dot x, \lambda, u', t) - L(x, \dot x, \lambda, u, t) \right] dt = \\ &= \int\limits_{t_\text{н}}^{t_\text{к}} \left[ H(x, \lambda, u, t) - H(x, \lambda, u', t) \right] dt \approx \\ &\approx \sum\limits_{\sigma = 0}^{N + 1} \int\limits_{t_\sigma}^{t_\sigma + \Delta t_\sigma} \left[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \right] dt, \end{aligned} \] где $N$ — количество точек разрыва и \[ t_0 := t_\text{н}, \qquad t_{N+1} := t_\text{к}. \]

    Проверим, является ли функция \[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \] непрерывной как функция времени. Для этого рассмотрим произвольный момент времени $\tau \in [t_\text{н}, t_\text{к}]$ (который, вообще говоря, может совпадать с одной из точек разрыва). Тогда \[ S = \int\limits_{t_\text{н}}^{t_\text{к}} L dt = \int\limits_{t_\text{н}}^{\tau} L dt + \int\limits_{\tau}^{t_\text{к}} L dt. \] Так как \[ \begin{aligned} \Delta_1 S &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \paren{ \lambda \Delta x - H \Delta t } \big|_{t_\text{н}}^{t_\text{к}}, \end{aligned} \] то, варьируя обе части формулы функционала действия и сравнивая полученные результаты, получаем, что \[ \paren{ \lambda \Delta x - H \Delta t } \big|_{\tau - 0} - \paren{ \lambda \Delta x - H \Delta t } \big|_{\tau + 0} = 0. \] Замечая, что \[ \begin{aligned} \at{\Delta x}{\tau - 0} = \at{\Delta x}{\tau + 0} &= \Delta x, \\ \at{\Delta t}{\tau - 0} = \at{\Delta t}{\tau + 0} &= \Delta t \end{aligned} \] в силу непрерывности, причём $\Delta x$ и $\Delta t$ независимы, окончательно получаем, что \[ \begin{aligned} \at{\lambda_i}{\tau - 0} &= \at{\lambda_i}{\tau + 0}, \\ \at{H}{\tau - 0} &= \at{H}{\tau + 0}, & i = \overline{1,n}. \end{aligned} \] Эти равенства называют условиями Эрдмана-Вейерштрасса.

    Итак, если условия Эрдмана-Вейерштрасса выполнены, то функция \[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \] непрерывна как функция времени, поэтому, выделив линейную часть приращения функционала $\Phi$, получим, что \[ \begin{aligned} \Delta_2 \Phi &= \sum\limits_{\sigma = 0}^{N + 1} \int\limits_{t_\sigma}^{t_\sigma + \Delta t_\sigma} \left[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \right] dt = \\ &= \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \end{aligned} \]

    Итак, полная вариация функционала $\Phi$ для конечных и бесконечно малых приращений записывается как \[ \begin{aligned} \Delta \Phi &= \Delta_1 \Phi + \Delta_2 \Phi = \\ &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} + \\ &\phantom{=} + \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \end{aligned} \]

  54. Необходимые условия экстремума для задачи классического вариационного исчисления
    Рассмотрим формулу для полной вариации функционала $\Phi$: \[ \begin{aligned} \Delta \Phi &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} + \\ &\phantom{=} + \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \end{aligned} \]

    Анализ этой формулы позволяет выписать необходимые условия экстремума как для непрерывной функции управления без ограничений, так и для ограниченного кусочно-непрерывного управления.

    Рассмотрим случай, когда управление представляет собой непрерывную функцию без ограничений. Тогда необходимые условия оптимального управления называют необходимыми условиями для классического вариационного исчисления.

    Если на опорной траектории достигается локальный минимум, то $\Delta \Phi \geqslant 0$.

    Так как основные сложности сопряжены с варьированием управления, то проварьируем сначала остальные параметры и выпишем условия, соответствующие этому варьированию.

    При частном выборе на траекториях сравнения управлений, равных оптимальным (т.е. $u' = u$ и $\delta u = 0$), будем иметь внутренний экстремум (так как управление не варьируется, ограничения на него не учитываются), поэтому необходимое условие экстремума — общее условие стационарности: \[ \Delta \Phi = 0. \] Заметим, что в расширенном пространстве допустимых кривых сравнения вариации $\delta x_i, \delta \lambda_i, \Delta t_\text{н}, \Delta t_\text{к}, \Delta x_i^\text{н}, \Delta x_i^\text{к}$ независимы, поэтому получаем следующие условия:

    1. уравнения движения: \[ \dot x_i = \pd{H}{\lambda_i} = f_i(x, u, t), \]
    2. уравнения Эйлера-Лагранжа: \[ \dot \lambda_i = - \pd{H}{x_i} = \pd{F_0}{x_i} - \sum\limits_{j=1}^{n} \lambda_j \pd{f_j(x, u, t)}{x_i}, \]
    3. общее условие трансверсальности: \[ \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = 0 \] Учитывая, что \[ \Delta R = \pd{R}{t_\text{н}} \Delta t_\text{н} + \pd{R}{t_\text{к}} \Delta t_\text{к} + \sum\limits_{i=1}^{n} \pd{R}{x_i^\text{н}} \Delta x_i^\text{н} + \sum\limits_{i=1}^{n} \pd{R}{x_i^\text{к}} \Delta x_i^\text{к}, \] получаем $2n + 2$ развёрнутых условий трансверсальности: \[ \left\{ \begin{aligned} \pd{R}{t_\text{н}} + H_\text{н} &= 0, \\ \pd{R}{t_\text{к}} - H_\text{к} &= 0, \\ \pd{R}{x_i^\text{н}} - \lambda_i^\text{н} &= 0, \\ \pd{R}{x_i^\text{к}} + \lambda_i^\text{к} &= 0. \end{aligned} \right. \] Заметим, что условия трансверсальности нужно решать совместно с уравнениями связей: \[ J_j(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) = 0, \qquad i = \overline{1,m}. \]
    Условия 1-3 справедливы как для случая непрерывного управления, так и для управления в ограничениях.

    Рассмотрим теперь только вариации управления, положив остальные вариации нулю. При слабых вариациях управления для выполнения условия $\Delta \Phi \geqslant 0$ получаем следующее необходимое условие: \[ - \int\limits_{t_\text{н}}^{t_\text{к}} \pd{H}{u} \delta u dt \geqslant 0. \] Пусть $u_j \in (u_{j1}, u_{j2})$, то есть управление на опорной траектории является внутренним значением. Тогда $\delta u$ может принимать как положительные, так и отрицательные значения, поэтому для выполнения $\Delta \Phi \geqslant 0$ должно выполняться условие \[ \pd{H}{u_j} = 0, \qquad u_{j1} \lt u_j \lt u_{j2}. \] Рассмотрим теперь граничные значения управления $u_j$:

    1. Если $u_j = u_{j1}$, то \[ \begin{aligned} \delta u_j = u_j' - u_j \neq 0 &\implies u_j' \neq u_j \\ &\implies u_j' \in (u_{j1}, u_{j2}] \\ &\implies \delta u_j \gt 0 \\ &\implies \pd{H}{u_j} \leqslant 0. \end{aligned} \]
    2. Если $u_j = u_{j2}$, то \[ \begin{aligned} \delta u_j = u_j' - u_j \neq 0 &\implies u_j' \neq u_j \\ &\implies u_j' \in [u_{j1}, u_{j2}) \\ &\implies \delta u_j \lt 0 \\ &\implies \pd{H}{u_j} \geqslant 0. \end{aligned} \]

    Итак, можно записать необходимые условия оптимальности для классического вариационного исчисления:

    1. уравнения движения: \[ \dot x_i = \pd{H}{\lambda_i} = f_i(x, u, t), \]
    2. уравнения Эйлера-Лагранжа: \[ \dot \lambda_i = - \pd{H}{x_i} = \pd{F_0}{x_i} - \sum\limits_{j=1}^{n} \lambda_j \pd{f_j(x, u, t)}{x_i}, \]
    3. общее условие трансверсальности: \[ \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = 0 \] либо $2n + 2$ развёрнутых условий трансверсальности: \[ \left\{ \begin{aligned} \pd{R}{t_\text{н}} + H_\text{н} &= 0, \\ \pd{R}{t_\text{к}} - H_\text{к} &= 0, \\ \pd{R}{x_i^\text{н}} - \lambda_i^\text{н} &= 0, \\ \pd{R}{x_i^\text{к}} + \lambda_i^\text{к} &= 0. \end{aligned} \right. \]
    4. ${\displaystyle \pd{H}{u_j} = 0} \quad \text{при} \quad u_{j1} \lt u_j \lt u_{j2}.$
    Система из уравнений Эйлера-Лагранжа и уравнений движения представляет собой каноническую систему с гамильтонианом \[ H \bydef= -F_0 + \lambda f, \] координатами $x_i$ и импульсами $\lambda_i$. Она отличается от стандартной канонической системы аналитической динамики линейной зависимостью $H$ от $\lambda_i$ и наличием дополнительных переменных $u_j$ — неизвестных функций от времени.
    Заметим, что на участках экстремальной траектории, не содержащих угловых точек, полная производная гамильтониана в силу системы будет равна частной производной по времени; рассмотрим \[ \dv{H(x, \lambda, u, t)}{t} = \pd{H}{t} + \pd{H}{x} \dot x + \pd{H}{\lambda} \dot \lambda + \pd{H}{u} \dot u. \] Так как \[ \left\{ \begin{aligned} \pd{H}{x} \dot x &= \phantom{-} \pd{H}{x} \pd{H}{\lambda}, \\ \pd{H}{\lambda} \dot \lambda &= - \pd{H}{\lambda} \pd{H}{x}, \\ \pd{H}{u} &= 0 && \text{при} \quad u_j \in (u_{j1}, u_{j2}), \\ \dot u_j &= 0 && \text{при} \quad u_j = u_{j1} \quad \text{или} \quad u_j = u_{j2}, \end{aligned} \right. \] то \[ \dv{H}{t} = \pd{H}{t}. \] Таким образом, если гамильтониан явно не зависит от времени, то для любого участка экстремали с непрерывным управлением будет выполняться условие \[ H = h = \const. \] Из условий Эрдмана-Вейерштрасса следует, что в угловых точках гамильтониан $H$ непрерывен, откуда следует, что $h = \const$ является одной и той же для всей экстремальной траектории.
    Пусть $H$ линейно зависит от управления $u_j$, тогда ${\displaystyle \pd{H}{u_j} }$ является непрерывной функции времени, откуда следует, что для всех моментов времени, в которые управление $u_j$ изменяется, выполняется соотношение \[ \pd{H}{u_j} = 0. \] Такие моменты времени называются точками переключения управления $u_j$.
    При решении конкретной задачи можно не вводить в рассмотрение множители $\nu_j$, а развёрнутые условия трансверсальности получать с помощью приравнивания скобок при независимых вариациях в общем уравнении \[ \Delta \varphi_0 + \paren{ \lambda \Delta x - H \Delta t } \big|_{t_\text{н}}^{t_\text{к}} = 0. \]
    Насколько я понимаю, это связано с тем, что $J_j = 0$ — уточнить.
    Добавить пример (конспект Яна, стр. 56).
    Варьирование условного функционала производилось при наличии ограничений \[ J_j(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) = 0. \]
    1. Если даны изопериметрические ограничения вида \[ J_j \leqslant 0, \qquad j = \overline{1, m_1}, \] то на множители Лагранжа $\nu_j$ накладываются дополнительные условия дополняющей нежёсткости: \[ \nu_j J_j = 0, \qquad j = \overline{1, m_1} \] и условия неположительности: \[ \nu_j \leqslant 0, \qquad j = \overline{1, m_1}. \]
    2. Если даны изопериметрические ограничения вида \[ J_j \geqslant 0, \qquad j = \overline{1, m_1}, \] то условие дополнительной нежёсткости сохраняется: \[ \nu_j J_j = 0, \qquad j = \overline{1, m_1}, \] а условие неположительности меняется на условие неотрицательности: \[ \nu_j \geqslant 0, \qquad j = \overline{1, m_1}. \]
    Смысл этих условий заключается в том, что
    • $\nu_j \lt 0$, если ограничение $J_j$ активно, то есть $J_j = 0$;
    • $\nu_j = 0$, если ограничение $J_j$ неактивно, то есть $J_j \lt 0$.
  55. Принцип максимума Понтрягина: формулировки, замечания
    Рассмотрим формулу для полной вариации функционала $\Phi$: \[ \begin{aligned} \Delta \Phi &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} + \\ &\phantom{=} + \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \end{aligned} \]

    Рассмотрим только сильные вариации управления, тогда \[ \Delta \Phi = \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \] Тогда для выполнения условия $\Delta \Phi \geqslant 0$ необходимо, чтобы \[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \geqslant 0, \qquad v_\sigma \in U. \] Считаем, что $x = x(t_\sigma), \lambda = \lambda(t_\sigma), u = u(t_\sigma)$ — значения указанных величин на оптимальной траектории.

    Условие \[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \geqslant 0, \qquad v_\sigma \in U \] вместе с уравнениями Эйлера-Лагранжа \[ \dot \lambda_i = - \pd{H}{x_i} = \pd{F_0}{x_i} - \sum\limits_{j=1}^{n} \lambda_j \pd{f_j(x, t, u)}{x_i} \] называются принципом максимума Понтрягина, так как при выборе ограниченного множества $U$ в виде \[ u_{j1} \leqslant u_j \leqslant u_{j2} \] это условие равносильно тому, что \[ H(x, \lambda, u, t) = \max_{u_{j1} \leqslant u'_j \leqslant u_{j2}} H(x, \lambda, u', t). \]

    Итак, необходимые условия оптимальности управления, имеющего разрывы и ограничения вида $u_{j1} \leqslant u_j(t) \leqslant u_{j2}$:

    1. уравнения движения: \[ \dot x_i = \pd{H}{\lambda_i} = f_i(x, u, t), \]
    2. уравнения Эйлера-Лагранжа: \[ \dot \lambda_i = - \pd{H}{x_i} = \pd{F_0}{x_i} - \sum\limits_{j=1}^{n} \lambda_j \pd{f_j(x, u, t)}{x_i}, \]
    3. общее условие трансверсальности: \[ \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = 0 \] либо $2n + 2$ развёрнутых условий трансверсальности: \[ \left\{ \begin{aligned} \pd{R}{t_\text{н}} + H_\text{н} &= 0, \\ \pd{R}{t_\text{к}} - H_\text{к} &= 0, \\ \pd{R}{x_i^\text{н}} - \lambda_i^\text{н} &= 0, \\ \pd{R}{x_i^\text{к}} + \lambda_i^\text{к} &= 0. \end{aligned} \right. \]
    4. ${ \displaystyle H(x, \lambda, u, t) = \max_{u_{j1} \leqslant u'_j \leqslant u_{j2}} H(x, \lambda, u', t) }$.

    Формулировка принципа максимума

    Рассмотрим уравнения движения \[ \dot x(t) = f(x(t), u(t), t), \qquad x \in \R^n, \quad u \in \R^m, \quad t \in [t_\text{н}, t_\text{к}] \] с начальными условиями $x(t_\text{н}) = x^\text{н}$.

    В качестве критерия качества рассмотрим задачу Больца со свободным правым концом \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t), t) dt + \varphi_0(x(t_\text{к})) \to \inf. \]

    Управление $u(t) \in U$ будем искать в классе кусочно-непрерывных функций, то есть $u(t) \in PC$.

    (принцип максимума Понтрягина).

    Если $u_0(t)$ — оптимальное управление для поставленной задачи, а $x_0(t)$ — соответствующая ему оптимальная траектория, то $u_0$ удовлетворяет условиям максимальности: \[ \max_{u \in U} H(t, x_0(t), \lambda(t), u(t)) = H(t, x_0(t), \lambda(t), u_0(t)), \] где \[ H(t, x(t), \lambda(t), u(t)) = -F_0(x(t), u(t), t) + \lambda(t) f(x(t), u(t), t), \] а множители $\lambda(t) \in C, \lambda(t) \neq 0$ является решением уравнений Эйлера-Лагранжа \[ \dot \lambda = - \pd{H}{x} \] и удовлетворяют условиям трансверсальности: \[ \lambda(t_\text{к}) = - \pd{\varphi_0(x_0(t_\text{к}))}{x_\text{к}}. \]

    В общем случае ПМП является необходимым условием оптимальности, однако он является достаточным для некоторых классов задач (например, для линейно выпуклых — где $f$ линейна по $x$, а $J_0$ — выпуклый)
    (алгоритм использования ПМП).
    1. Найдём $u_0(t)$ из условия максимальности: \[ \max_{u \in U} H(t, x_0(t), \lambda(t), u(t)) = H(t, x_0(t), \lambda(t), u_0(t)). \]
    2. Подставив найденное управление $u_0(t)$ в уравнения движения, найдём траекторию $x_0(t)$.
    3. Подставив найденное управление $u_0(t)$ в уравнения Эйлера-Лагранжа и условия трансверсальности, найдём $\lambda(t)$.
    4. Используя найденные $x_0(t)$ и $\lambda(t)$, можно выразить управление как функцию времени: \[ u_0 = u_0(x_0(t), \lambda(t), t) = u_0(t). \]

    Рассмотрим задачу Лагранжа с закреплённым правым концом и свободным временем. Зададим уравнения движения \[ \dot x(t) = f(x(t), u(t), t), \qquad x \in \R^n, \quad u \in \R^m, \quad t \geqslant t_\text{н} \] с начальными и конечными условиями \[ x(t_\text{н}) = x^\text{н}, \qquad x(t_\text{к}) = x^\text{к}. \] Зададим критерий качества в виде задачи Лагранжа \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t), t) dt \to \inf. \] Будем считать, что $t_\text{к}$ — произволен, а $u \in U(t)$.

    ПМП для этой задачи формулируется так: если $u_0(t)$ — оптимальное управление, а $x_0(t)$ — соответствующая оптимальная траектория, то найдётся ненулевой вектор $\lambda(t) \in R^{n + 1}$ такой, что $\lambda(t) \in C$, а также \[ \lambda_0(t) = \const \leqslant 0, \qquad \dot \lambda_i(t) = - \pd{H}{x_i}, \quad i = \overline{1, n}, \] где \[ H(t, x, u, \lambda) = \sum\limits_{i=1}^{n} \lambda_i f_i + \lambda_0 F_0, \] для которого выполняется условие максимальности: \[ \max_{u \in U} H(t, x_0(t), \lambda(t), u(t)) = H(t, x_0(t), \lambda(t), u_0(t)), \] причём \[ H(t, x_0(t), \lambda(t), u_0(t)) = \int\limits_{t_\text{н}}^{t} \pd{H}{s}(s, x_0(s), \lambda(s), u_0(s)) ds. \]

    Если задача стационарная, то есть \[ f = f(x, u), \qquad F_0 = F_0(x, u), \qquad U(t) = U, \] то из существования оптимального управления $u_0$ и соответствующей ему траектории $x_0$ следует, что существует $\lambda(t) \in R^{n+1}$, удовлетворяющий тем же условиям, что и в формулировке ПМП, а также имеет место тождество \[ H(t, x_0(t), \lambda(t), u_0(t)) \equiv 0. \]
    Для стационарной задачи быстродействия $H = \lambda(t) f(t)$, найдётся \[ \lambda(t) \in \R^n, \qquad \lambda \in C, \qquad \lambda \neq 0, \] для которого \[ \max_{u \in U} H(x_0, \lambda, u) = H(x_0, \lambda, u_0) = \const \geqslant 0. \]
  56. Оптимальное по быстродействию управление в задаче Лагранжа
    Рассмотрим поворот твёрдого тела. Введём две СК:
    • $Oxyz$ — жёстко связанную с телом, причём оси выбираем по главным осям инерции ТТ для точки $O$; тогда \[ A = I_x, \qquad B = I_y, \qquad C = I_z, \] а проекции угловой скорости представимы в виде \[ \vec{\omega}(p, q, r) = (\omega_x, \omega_y, \omega_z). \]
    • $O\xi\eta\zeta$ — неподвижная СК.
    Рассмотрим динамические уравнения Эйлера: \[ \left\{ \begin{aligned} A \dot p + (C - B) qr &= M_x + u_x, \\ B \dot q + (A - C) pr &= M_y + u_y, \\ C \dot r + (B - A) qp &= M_z + u_z, \end{aligned} \right. \] где $u_x, u_y, u_z$ — проекции моментов управления.

    Рассмотрим три случая, при которых можно найти аналитическое решение:

    • Эйлер: $A, B, C$ — 2 из 3 равны
    • Лагранж: $A, B, C$ — 2 из 3 равны
    • Ковалевская

    Пусть $A = C \neq B$, рассмотрим спутник на орбите: \[ \left\{ \begin{aligned} A \dot p + (A - B) qr &= u_x, \\ B \dot q &= u_y, \\ A \dot r + (B - A) qp &= u_z, \end{aligned} \right. \implies \left\{ \begin{aligned} A \dot p &= u_x + (B - A) qr, \\ B \dot q &= u_y, \\ A \dot r &= u_z + (A - B) qp, \end{aligned} \right. \]

    Пусть $B \gt A$. Введём обозначения: \[ u_1 := \frac{u_x}{A}, \qquad u_2 := \frac{u_z}{A}, \qquad u_3 = \frac{u_y}{B}, \qquad a := \frac{q (B - A)}{A}, \] тогда систему можно переписать в виде \[ \left\{ \begin{aligned} \dot p &= \phantom{-}ar + u_1, \\ \dot r &= - ap + u_2, \\ \dot q &= u_3. \end{aligned} \right. \] Представим, что \[ -\nu \leqslant u_1, u_2 \leqslant \nu, \qquad u_3 \equiv 0, \] тогда \[ \dot q = 0 \implies q = \const = q_0 \gt 0 \implies a_0 = \const \gt 0 \] Введя обозначения \[ x_1 := p, \qquad x_2 := r, \] приведём систему к виду $\dot x = f(x, u(t))$: \[ \left\{ \begin{aligned} \dot x_1 &= \phantom{-} a x_2 + u_1, \\ \dot x_2 &= - a x_1 + u_2. \end{aligned} \right. \] Поставим задачу: перевести систему из начального положения \[ x_1(t_\text{н}) = x_1^\text{н}, \qquad x_2(t_\text{н}) = x_2^\text{н} \] в положение \[ x_1(t_\text{к}) = 0, \qquad x_2(t_\text{к}) = 0 \] за минимальное время. Значит, в качестве критерия качества надо взять функционал \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} dt. \] Так как на управление наложены ограничения, воспользуемся принципом максимума Понтрягина.

    1. Введём функцию Гамильтона: \[ H = -F_0 + \lambda f = -1 + \lambda_1 (a x_2 + u_1) + \lambda_2 (u_2 - a x_1). \]
    2. Составим уравнения Эйлера-Лагранжа: \[ \left\{ \begin{aligned} \dot \lambda_1 &= -\pd{H}{x_1} = \phantom{-} a \lambda_2, \\ \dot \lambda_2 &= -\pd{H}{x_2} = - a \lambda_1, \end{aligned} \right. \implies \ddot \lambda_1 = a \dot \lambda_2 = - a^2 \lambda_1, \] Итак, получили уравнение математического маятника: \[ \ddot \lambda_1 + a^2 \lambda_1 = 0. \] Решения этого уравнения находятся в виде \[ \left\{ \begin{aligned} \lambda_1 &= N \sin(a t + \alpha), \\ \lambda_2 &= N \cos(a t + \alpha), \end{aligned} \right. \] где $a$ — круговая частота. Эти решения можно также записать в виде \[ \left\{ \begin{aligned} \lambda_1 &= N \sin(a t + \alpha), \\ \lambda_2 &= N \sin\paren{a t + \alpha + \frac{\pi}{2}}, \end{aligned} \right. \]
    3. Рассмотрим, возможен ли вырожденный случай, то есть одновременное выполнение условий \[ \pd{H}{u_1} = 0, \qquad \pd{H}{u_2} = 0. \] Пользуясь определением гамильтониана, получаем, что этот случай равносилен тому, что \[ \lambda_1 = 0, \qquad \lambda_2 = 0, \] что невозможно.

      Найдём точки переключения управлений: \[ \left\{ \begin{aligned} \pd{H}{u_1} = \lambda_1 &= 0, & \text{—} \quad \text{точки переключения} \; u_1, \\ \pd{H}{u_2} = \lambda_2 &= 0, & \text{—} \quad \text{точки переключения} \; u_2. \end{aligned} \right. \]

    4. Рассмотрим теперь условие максимальности: \[ \max_{\nu \leqslant u \leqslant \nu} H = \max_{\nu \leqslant u \leqslant \nu} \paren{ \lambda_1 u_1 + \lambda_2 u_2 }. \] Из него следует, что \[ \left\{ \begin{aligned} u_1 &= \nu \sign \lambda_1(t), \\ u_2 &= \nu \sign \lambda_2(t). \end{aligned} \right. \]

    Из уравнений движения \[ \left\{ \begin{aligned} \dot x_1 &= \phantom{-} a x_2 + u_1, \\ \dot x_2 &= - a x_1 + u_2 \end{aligned} \right. \] при \[ u_1 = \pm \nu, \qquad u_2 = \pm \nu \] следует, что \[ \left\{ \begin{aligned} x_1 &= M \sin \paren{ a t + \beta } + \frac{u_2}{a}, \\ x_2 &= M \cos \paren{ a t + \beta } - \frac{u_1}{a}. \end{aligned} \right. \] Исключением времени можно получить уравнение для фазовой траектории: \[ M^2 = \paren{ x_1 - \frac{u_2}{a} }^2 + \paren{ x_2 + \frac{u_1}{2} }^2. \] Заметим, что это уравнение задаёт окружность с центром в точке \[ \paren{ \frac{u_2}{a}, -\frac{u_1}{a} }, \] причём при различных значениях управления получаются различные центры.

    Дописать
  57. Метод динамического программирования: вывод уравнения Беллмана, замечания о методе динамического программирования
    Метод динамического программирования является методом синтеза оптимального управления. Он основан на принципе динамического программирования, сформулированным Беллманом.
    Принцип динамического программирования:

    оптимальное управление обладает тем свойством, что для любого начального состояния и использованного начального управления последующее оптимальное управление совпадает с исходным оптимальным управлением относительно состояния, получающегося в результате применения начального управления.

    Другими словами, пусть построена экстремальная траектория, решающая задачу оптимизации по некоторому критерию для управляемого процесса $u(t), x(t)$, переводящего механическую систему из заданного начального состояния $x_\text{н}$ в момент времени $t = t_\text{н}$ в некоторое конечное положение $x_\text{к}$ при $t = t_\text{к}$. Если взять в качестве новой начальной точки любую точку $x(\tau)$ этой траектории, причём $t_\text{н} \lt \tau \lt t_\text{к}$, то оптимальным управлением в случае $F_0(x, u, t) \geqslant 0$ будет оставшаяся часть ранее построенного оптимального управления, отвечающая отрезку $t \in [\tau, t_\text{к}]$. Оба вектора управления (первоначального и укороченного) на этом отрезке совпадают.

    Говорят, что второй вектор управления является сужением первого на отрезке $t \in [\tau, t_\text{к}]$.

    Рассмотрим задачу управления на конечном интервале времени:

    1. уравнения движения: \[ \tag{1} \dot x(t) = f(t, x(t), u), \qquad t_\text{н} \leqslant t \leqslant t_\text{к} \] с начальными условиями $x(t_\text{н}) = x_\text{н}$;
    2. критерий качества: \[ \tag{2} J(u) = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \limto{u \in U} \inf, \]
    3. ограничение на управление: $u \in U$.

    Пусть движение системы происходит на отрезке \[ t_\text{н} \leqslant \tau \leqslant t \leqslant t_\text{к} \] с начальными условиями \[ x(\tau) = x, \qquad x \in \R^n, \] то есть \[ \tag{3} \dot x(t) = f(t, x(t), u), \qquad \tau \leqslant t \leqslant t_\text{к}, \qquad x(\tau) = x. \] Для этой системы рассмотрим задачу минимизации функционала \[ \tag{4} \int\limits_{\tau}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \limto{u \in U} \inf. \]

    Допустимым управлением называется любая измеримая функция $u \in U$ такая, что для всех моментов времени $\tau \in [t_\text{н}, t_\text{к}]$ и $x \in \R^n$ существует решение суженной задачи (3).
    Функцией Беллмана $B(\tau, x)$ называют функцию, равную $\inf$ функционала (4) на траекториях системы (3) по всем допустимым управлениям: \[ \tag{5} B(\tau, x) = \inf_{u \in U} \left[ \int\limits_{\tau}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right]. \]

    Рассмотрим произвольные моменты времени $\tau$ и $\tau_1$: \[ t_\text{н} \leqslant \tau \leqslant \tau_1 \leqslant t_\text{к}. \] На основании принципа динамического программирования запишем, что \[ \tag{6} \begin{aligned} B(\tau, x) &= \inf_{u \in U} \left[ \int\limits_{\tau}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right] = \\ &= \inf_{u \in U} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + \int\limits_{\tau_1}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right] = \\ &= \inf_{\substack{u \in U \\ \tau \leqslant t \leqslant \tau_1}} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + \inf_{\substack{u \in U \\ \tau_1 \leqslant t \leqslant t_\text{к}}} \left[ \int\limits_{\tau_1}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right] \right] = \\ &= \inf_{\substack{u \in U \\ \tau \leqslant t \leqslant \tau_1}} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + B(\tau_1, x(\tau_1)) \right]. \end{aligned} \] Здесь $x(t)$ — решение задачи (3), а управление при $t \in [\tau, \tau_1]$ влияет на \[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt \] и на величину $x(\tau_1)$.

    Представим формулу (6) в виде \[ \tag{7} \inf_{\substack{u \in U \\ \tau \leqslant t \leqslant \tau_1}} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + B(\tau_1, x(\tau_1)) - B(\tau, x) \right] = 0. \] Пусть $B(\tau, x)$ непрерывно дифференцируема, тогда при $\Delta t = \tau_1 - \tau \to 0$ с точностью до малых более высокого порядка малости относительно $\Delta t$ выполняется равенство \[ \tag{8} B(\tau_1, x(\tau_1)) - B(\tau, x) = \dot B(\tau, x) \Delta t, \] где $\dot B(\tau, x)$ — полная производная функции $B$ вдоль траекторий системы (1): \[ \tag{9} \dv{B(\tau, x)}{t} = \pd{B(\tau, x)}{t} + \pd{B(\tau, x)}{x} f(t, x, u). \] Разделив обе части (7) на $\Delta t$ и переходя к пределу при $\Delta t \to 0$, получаем \[ \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \quad \text{где} \quad t_\text{н} \leqslant t \leqslant t_\text{к}, \quad x \in \R^n. \]

    Уравнение \[ \tag{10} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \quad \text{где} \quad t_\text{н} \leqslant t \leqslant t_\text{к}, \quad x \in \R^n \] называют уравнением Беллмана.

    Заметим, что из определения функции Беллмана следует, что \[ \tag{11} B(t_\text{к}, x) = \varphi(x(t_\text{к})), \qquad x \in \R^n. \] Таким образом, если решение задачи (1),(2) оптимального управления существует, а функция Беллмана $B(t, x)$ непрерывно дифференцируема, то справедливы соотношения \[ \begin{gathered} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \\ B(t_\text{к}, x) = \varphi(x(t_\text{к})). \end{gathered} \] Таким образом, решение задачи оптимального управления для системы ОДУ сводится к решению одного уравнения в частных производных с граничными условиями (аналогично методу Якоби для решения канонических уравнений).

    Существуют случаи, когда решение ДУЧП не приводит к решению исходной задачи:
    1. В заданном классе допустимых управлений не всегда существует такое управление, при котором достигается $\inf$ в определении функции Беллмана.
    2. $B(t,x)$ не всегда обладает гладкостью, поэтому решение уравнения Беллмана не обязательно совпадает с соответствующей функцией Беллмана.
    3. Если функция Беллмана удовлетворяет уравнению Беллмана, то отсюда не следует, что управление, при котором достигается $\inf$ в уравнении Беллмана, является оптимальным.

      Например, при этом уравнении вообще может не существовать решение уравнений движения (1).

    4. Решение задачи (10), (11) может быть не единственным, поэтому потребуется дополнительное исследование для установления того, какое же из решений является функцией Беллмана для исходной задачи оптимального управления.
  58. Построение управления с помощью метода динамического программирования

    Рассмотрим задачу управления на конечном интервале времени:

    1. уравнения движения: \[ \tag{1} \dot x(t) = f(t, x(t), u), \qquad t_\text{н} \leqslant t \leqslant t_\text{к} \] с начальными условиями $x(t_\text{н}) = x_\text{н}$;
    2. критерий качества: \[ \tag{2} J(u) = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \limto{u \in U} \inf, \]
    3. ограничение на управление: $u \in U$.

    Управление, реализующее \[ \begin{gather} \tag{10} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \\ \tag{11} B(t_\text{к}, x) = \varphi(x(t_\text{к})), \end{gather} \] является С-управлением (т.е. $u = u(t, x)$). Приведём условия, при которых МДП приводит к решению исходной задачи (1), (2).

    Пусть существует единственное непрерывно дифференцируемое решение задачи (10)-(11) $B_0$ и существует допустимое управление $u_0(t, x)$ такое, что \[ \tag{12} \inf_{u \in U} \left[ \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = \pd{B_0(t,x)}{x} f(t, x, u_0) + F_0(t, x, u_0). \] Тогда С-управление $u_0(t,x)$ является оптимальным, а соответствующая функция Беллмана есть $B_0(t,x)$.
    (построение С-управления с помощью МДП):
    1. Находим управление $u = u(t, x, B)$, доставляющее минимум левой части уравнения (10).
    2. Подставляем это управление в (10), получаем нелинейное уравнение в частных производных относительно функции $B(t,x)$. Краевое условие имеет вид (11).
    3. Решая поставленную задачу, получаем $B(t,x)$.
    4. Подставляя найденное значение $B(t,x)$ в выражение $u(t, x, B)$, находим оптимальное С-управление $u(t,x) = u(t, x, B(t, x))$.
    На основании теоремы можно утверждать, что если решение $B(t,x)$ уравнения Беллмана единственно, а найденное управление $u(t,x)$ допустимо, то $u(t,x)$ — оптимальное С-управление, а $B(t,x)$ — функция Беллмана.
  59. Связь метода динамического программирования с принципум максимума Понтрягина

    Рассмотрим задачу управления на конечном интервале времени:

    1. уравнения движения: \[ \tag{1} \dot x(t) = f(t, x(t), u), \qquad t_\text{н} \leqslant t \leqslant t_\text{к} \] с начальными условиями $x(t_\text{н}) = x_\text{н}$;
    2. критерий качества: \[ \tag{2} J(u) = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \limto{u \in U} \inf, \]
    3. ограничение на управление: $u \in U$.

    С помощью МДП мы свели эту задачу к решению задачи Коши \[ \begin{gather} \tag{10} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \\ \tag{11} B(t_\text{к}, x) = \varphi(x(t_\text{к})). \end{gather} \] Пусть существует единственное непрерывное решение $B(t,x)$ этой задачи с непрерывными производными \[ \pd{B}{t}, \quad \pd{B}{x}, \quad \ppdv{B}{t}{x}, \quad \ppdv{B}{x}{t} \] и допустимое управление $u_0(t,x)$, удовлетворяющее уравнению \[ \tag{12} \inf_{u \in U} \left[ \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = \pd{B_0(t,x)}{x} f(t, x, u_0) + F_0(t, x, u_0). \] Тогда $u_0$ является оптимальным. Пусть $x_0(t)$ — соответствующая оптимальная траектория.

    Введём обозначения: \[ \tag{13} \begin{aligned} \lambda(t) &= -\pd{B}{x}(t, x(t)), \\ H(t, x, u, \lambda) &= -F_0(t, x, u) + \lambda f(t, x, u). \end{aligned} \] Тогда из (12) следует, что \[ \pd{B(t, x_0)}{x} f(t, x_0, u_0) + F_0(t, x_0, u_0) = \min_{u \in U} \left[ \pd{B(t, x_0)}{x} f(t, x_0, u) + F_0(t, x_0, u) \right]. \] Отсюда и из (13) следует, что \[ \tag{14} \begin{aligned} \max_{u \in U} \left[ - \pd{B(t, x_0)}{x} f(t, x_0, u) - F_0(t, x_0, u) \right] &= \max_{u \in U} \left[ \lambda f(t, x_0, u) - F_0(t, x_0, u) \right] = \\ &= \max_{u \in U} H(t, x_0, u, \lambda) = \\ &= H(t, x_0, u_0, \lambda). \end{aligned} \] На основании (10) и (12) имеем: \[ \pd{B(t,x)}{t} = -\pd{B(t, x)}{x} f(t, x, u_0) - F_0(t, x, u_0) = H(t, x, u_0, \lambda). \] Так как частные производные \[ \ppdv{B}{t}{x} = \ppdv{B}{x}{t} \] существуют и непрерывны, то при $x = x_0$ в силу (13) получаем \[ \tag{15} \ppdv{B}{t}{x} = - \dot \lambda(t) = \pd{H}{x}(t, x_0, u_0, \lambda). \] Дифференцируя обе части (11) по $x$ и полагая $x = x_0$, получаем, что \[ \tag{16} \pd{B}{x}(t_\text{к}, x_0(t_\text{к})) = -\lambda(t_\text{к}) = \pd{\varphi_0(x_0(t_\text{к}))}{x}. \]

    Из (15) и (16) следует, что $\lambda(t)$ — решение задачи Коши \[ \tag{17} \begin{aligned} \dot \lambda(t) &= - \pd{H(t, x_0, u_0, \lambda)}{x}, \\ \lambda(t_\text{к}) &= - \pd{\varphi_0(x_0(t_\text{к}))}{x}. \end{aligned} \]

    Условия (14) и (17) совпадают с условиями ПМП.

    Таким образом, МДП позволяет свести задачу оптимального управления к исследованию задачи Коши (10)-(11) для нелинейного уравнения в частных производных. С помощью же ПМП решение задач управления сводится к изучению краевых задач для систем ОДУ, что представляется более простым.

  60. Оптимальное по быстродействию управление вращательным движением в случае Эйлера

    Рассмотрим задачу о наискорейшем успокоении ТТ, совершающего вращательные движения относительно центра масс $O$ (случай Эйлера). Тогда точка $O$ — центр подвижной системы координат $Ox_1 x_2 x_3$, жёстко связанной с телом. Оси этой системы являются главными центральными осями инерции тела. Обозначим проекции вектора кинетического момента на эти оси как $x_1, x_2, x_3$, то есть \[ K = \paren{ x_1, x_2, x_3 } = \paren{ Ap, Bq, Cr }, \] где $\omega = \paren{ p, q, r }$ — координаты угловой скорости ТТ $\vec{\omega}$ в системе $O x_1 x_2 x_3$, а $A,B,C$ — главные центральные моменты инерции ТТ.

    Динамические уравнения Эйлера в этом случае для однородного поля тяжести (то есть вращение тела происходит под действием одной только силы тяжести $\vec{P}$) имеют вид \[ \left\{ \begin{aligned} A \dot p + (C - B) qr &= 0, \\ B \dot q + (A - C) pr &= 0, \\ C \dot r + (B - A) qp &= 0. \end{aligned} \right. \]

    Введём управление $u = (u_1, u_2, u_3)$. Примем обозначения \[ \eta_1 = \frac{B - C}{CB}, \qquad \eta_2 = \frac{C - A}{AC}, \qquad \eta_3 = \frac{A - B}{AB}. \] Учитывая, что \[ \dot x_1 = A \dot p, \qquad \dot x_2 = B \dot q, \qquad \dot x_3 = C \dot r, \] перепишем динамические уравнения Эйлера в следующем виде: \[ \tag{18} \begin{aligned} \dot x_1 &= \eta_1 x_2 x_3 + u_1, \\ \dot x_2 &= \eta_2 x_1 x_3 + u_2, \\ \dot x_3 &= \eta_3 x_1 x_2 + u_3. \end{aligned} \] Здесь $u_1, u_2, u_3$ — проекции управляющего момента $\bvec{u}$ на соответствующие оси $O x_1 x_2 x_3$. На управление принято ограничение \[ \tag{19} \abs{u} = \sqrt{u_1^2 + u_2^2 + u_3^2} \leqslant b. \] В начальный момент времени $t_0 = 0$ задано начальное значение $x(0) = x_0$.

    Требуется перейти в начало координат за кратчайшее время $T$.

    Для решения поставленной задачи воспользуемся МДП. Согласно определению, функция Беллмана в рассматриваемой задаче имеет смысл минимума времени успокоения, то есть $B \gt 0$. Так как уравнения движения (18) и ограничения на управления (19) не зависят явно от времени, то время успокоения $T$ зависит только от $x(0)$ и не зависит от момента начала движения, следовательно, и $B$ тоже зависит только от $x(0)$, то есть \[ B = B(x), \implies \pd{B}{t} = 0. \] Так как подынтегральная функция $F_0 = 1$, то уравнение Беллмана запишется в виде \[ \begin{gather} \tag{20} \inf_{u: \; \abs{u} \leqslant b} \left[ \pd{B}{x_1} \eta_1 x_2 x_3 + \pd{B}{x_2} \eta_2 x_1 x_3 + \pd{B}{x_3} \eta_3 x_1 x_2 + \pd{B}{x_1} u_1 + \pd{B}{x_2} u_2 + \pd{B}{x_3} u_3 \right] = -1, \\ \tag{21} B(x(T)) = 0, \quad \text{т.к.} \quad \varphi_0 \equiv 0. \end{gather} \] Согласно алгоритму использования МДП, найдём значение $u(t, x, B)$, доставляющее минимум левой части (20). Так как первые три слагаемых не зависят от $u$, необходимо найти $u$, при котором достигается $\inf$ выражения \[ \tag{22} \pd{B}{x_1} u_1 + \pd{B}{x_2} u_2 + \pd{B}{x_3} u_3 = \dp{\vec{\nabla} B}{\vec{u}}, \qquad \abs{u} \leqslant b. \] При заданном $\vec{\nabla} B$ выражение достигает минимума, если $\abs{u} = b$, а сам вектор $u$ направлен противоположно градиенту, то есть \[ \tag{23} \vec{u} = - b \frac{\vec{\nabla} B}{\abs{\vec{\nabla} B}}. \] Подставим это выражение в уравнение Беллмана, учитывая, что \[ \begin{gathered} \abs{\vec{\nabla} B} = \sqrt{ \paren{ \pd{B}{x_1} }^2 + \paren{ \pd{B}{x_2} }^2 + \paren{ \pd{B}{x_3} }^2 }, \\ \dp{\vec{\nabla} B}{\vec{u}} = - \abs{\vec{\nabla} B} \abs{u} = - b \frac{\abs{\vec{\nabla} B}^2}{\abs{\vec{\nabla} B}}; \end{gathered} \] получаем, что \[ \tag{24} \pd{B}{x_1} \eta_1 x_2 x_3 + \pd{B}{x_2} \eta_2 x_1 x_3 + \pd{B}{x_3} \eta_3 x_1 x_2 - b \abs{\vec{\nabla} B} = -1. \]

    Заметим, что $\eta_1 + \eta_2 + \eta_3 = 0$. Функцию $B(x)$ будем искать при выполнении условия \[ \pd{B}{x_i} = \psi(x) x_i, \] где $\psi(x)$ — некоторая непрерывная функция фазовых переменных. Тогда \[ \abs{\vec{\nabla} B} = \abs{\psi(x)} \sqrt{ x_1^2 + x_2^2 + x_3^2 }, \] а уравнение (24) принимает вид \[ \psi(x) x_1 x_2 x_3 \underbrace{\paren{ \eta_1 + \eta_2 + \eta_3 }}_{0} - b \abs{\psi(x)} \sqrt{ x_1^2 + x_2^2 + x_3^2 } = -1, \] откуда следует, что \[ b \abs{\psi(x)} \sqrt{ x_1^2 + x_2^2 + x_3^2 } = 1, \] или, иначе, \[ \abs{\psi(x)} = \frac{1}{b \sqrt{ x_1^2 + x_2^2 + x_3^2 }}. \] Учитывая, что $B \gt 0$, получаем, что \[ \pd{B}{x_i} = \frac{x_i}{b \sqrt{ x_1^2 + x_2^2 + x_3^2 }}, \] откуда следует, что \[ B = \frac{\sqrt{ x_1^2 + x_2^2 + x_3^2 }}{b}. \] Полученная функция обращается в 0 в конечной точке $x(T) = 0$, следовательно, $B(x)$ удовлетворяет граничному условию \[ B(x(T)) = 0. \]

    Определим управление: \[ \begin{aligned} \vec{u} &= - b \frac{\vec{\nabla} B}{\abs{\vec{\nabla} B}} = \\ &= - \frac{bx}{\sqrt{ x_1^2 + x_2^2 + x_3^2 }} = \\ &= - \frac{bx}{\abs{x}}. \end{aligned} \] Минимальное время торможения равно \[ \min(T - t_0) = \min T = B(x(0)) = \frac{\sqrt{ x_1^2(0) + x_2^2(0) + x_3^2(0) }}{b}. \]

    Таким образом, оптимальное гашение угловой скорости тела осуществляется управляющим моментом, направленным в обратную сторону кинетического момента, а не угловой скорости.

  61. Определение: динамические уравнения Эйлера
    Рассмотрим движение ТТ относительно неподвижной точки $O$. Введём две СК: неподвижную $O\xi\eta\zeta$ и жёстко связанную с ТТ $Oxyz$, причём оси $Ox, Oy, Oz$ направлены вдоль главных осей инерции для точки $O$.
    Уравнения \[ \begin{aligned} A \dot p + (C - B) qr = M_x, \\ B \dot q + (A - C) pr = M_y, \\ C \dot r + (B - A) pq = M_z, \end{aligned} \] где \[ A = J_{xx}, \quad B = J_{yy}, \quad C = J_{zz}, \] а $\omega = \paren{p, q, r}$ — угловая скорость ТТ с координатами в $Oxyz$, называют динамическими уравнениями Эйлера.
  62. Разные вопросы

  63. Определение: кинематические уравнения Эйлера
    Чтобы полностью описать движение твёрдого тела с неподвижной точкой, к динамическим уравнениям Эйлера необходимо добавить кинематические уравнения Эйлера, связывающие проекции $(p,q,r)$ угловой скорости твёрдого тела $\bvec{\omega}$ в СК $Oxyz$ и углы Эйлера: \[ \left\{ \begin{aligned} p &= \dot\psi \sin\theta \sin\varphi + \dot\theta \cos\varphi, \\ q &= \dot\psi \sin\theta \cos\varphi - \dot\theta \sin\varphi, \\ r &= \dot\psi \cos\theta + \dot\varphi, \end{aligned} \right. \]
    где:
    • $O\xi\eta\zeta$ — неподвижная СК;
    • $Oxyz$ — подвижная СК;
    • $ON$ — линия узлов, образуемая пересечением плоскостей $O\xi\eta$ и $Oxy$;
    • $\psi$ — угол прецессии — угол между $O\xi$ и $ON$;
    • $\theta$ — угол нутации — угол между $O\zeta$ и $Oz$;
    • $\varphi$ — угол чистого вращения — угол между $Ox$ и $ON$.
    Скорости $\dot\psi, \dot\varphi, \dot\theta$ направлены по осям $O\xi, Oz, ON$, соответственно.