Связи, заданные равенствами \[ \Phi_\alpha (t; q_1, \dots, q_r; \dot q_1, \dots, \dot q_r) = 0, \] называют неосвобождающими (удерживающими, двусторонними).
Рассмотрим несвободную систему с удерживающей связью \[ f(x,y,z,t) = 0. \] По определению виртуального перемещения, оно должно удовлетворять этой связи, то есть \[ f(x + \delta x, y + \delta y, z + \delta z, t) = 0. \] Рассмотрим разложение функции $f(x + \delta x, y + \delta y, z + \delta z, t)$ в ряд в окрестности точки $0$: \[ f(x, y, z, t) + \pd{f}{x}\delta x + \pd{f}{y} \delta y + \pd{f}{z} \delta z + \cdots = 0. \] Отбрасывая члены высшего порядка малости (в силу того, что $\delta x, \delta y, \delta z$ — бесконечно малые перемещения) и учитывая, что $f(x,y,z,t) = 0$ для любых $x,y,z,t$, получаем, что \[ \pd{f}{x}\delta x + \pd{f}{y} \delta y + \pd{f}{z} \delta z = 0. \]
Рассмотрим теперь истинное перемещение. Для него так же \[ f(x + dx, y + dy, z + dz, t + dt) = 0. \] Разложение в ряд в окрестности точки 0: \[ f(x, y, z, t) + \pd{f}{x} dx + \pd{f}{y} dy + \pd{f}{z} dz + \pd{f}{t} dt + \cdots = 0. \] Пользуясь аналогичными рассуждениями, приходим к равенству \[ \pd{f}{x} dx + \pd{f}{y} dy + \pd{f}{z} dz + \pd{f}{t} dt = 0. \] Нетрудно видеть, что если связь стационарная, то ${\displaystyle \pd{f}{t} = 0}$, а предыдущее уравнение принимает вид \[ \pd{f}{x} dx + \pd{f}{y} dy + \pd{f}{z} dz = 0. \]
Если связи идеальны, то общее уравнение механики для данной системы запишется в виде \[ \sum_{\nu=1}^{3N} \paren{ m_\nu \ddot{x}_\nu - X_\nu } \delta x_\nu = 0. \] Связи удерживающие, поэтому они накладывают на вариации следующие ограничения: \[ \sum_{\nu=1}^{3N} \pd{f_i}{x_\nu} \delta x_\nu = 0, \qquad i = \overline{1,k}. \] Умножим обе части уравнений неголономных связей на $dt$: \[ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \frac{d x_\nu}{\cancel{dt}} \cancel{dt} + a_\rho(t) dt = 0, \qquad \rho = \overline{1, r}. \] Перейдём к изохронному варьированию: $\delta t = 0$, поэтому ограничения, накладываемые неголономными связями на вариации, примут следующий вид: \[ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \delta x_\nu = 0, \qquad \rho = \overline{1, r}. \] Итак, имеем $k+r$ ограничений на вариации, следовательно, среди $3N$ вариаций $k+r$ будут зависимыми.
Введём в рассмотрение множители Лагранжа: $\lambda_1(t), \dots, \lambda_k(t)$ для голономных связей и $\mu_1(t), \dots, \mu_r(t)$ — для неголономных. Домножим уравнения связей на соответствующие множители и вычтем из общего уравнения механики: \[ \sum_{\mu=1}^{3N} \paren{ m_\nu \ddot{x}_\nu - X_\nu - \sum_{i=1}^k \lambda_i \pd{f_i}{x_\nu} - \sum_{\rho=1}^r \mu_\rho a_{\rho \nu} } \delta x_\nu = 0. \] Выберем $\lambda_i$ и $\mu_\rho$ так, чтобы какие-либо $r+k$ скобок обнулились. Считая оставшиеся $3N - r-k$ вариаций независимыми, воспользуемся тем фактом, что сумма произведений некоторых выражений на произвольные величины равна нулю только в том случае, когда все эти выражения по отдельности обращаются в ноль. Таким образом, оставшиеся $3N - r-k$ выражений также равны нулю.
Итак, имеем $3N+r+k$ уравнений \[ \left\{ \begin{aligned} m_\nu \ddot{x}_\nu - X_\nu - \sum_{i=1}^k \lambda_i \pd{f_i}{x_\nu} - \sum_{\rho=1}^r \mu_\rho a_{\rho \nu} &= 0, & \nu = \overline{1,3N}, \\ f_j(x,t) &= 0, & j = \overline{1,k}, \\ \sum_{\nu=1}^{3N} a_{\rho \nu}(t) \dot{x}_{\nu} + a_\rho(t) &= 0, & \rho = \overline{1, r}. \end{aligned} \right. \] относительно $3N+r+k$ неизвестных $x_\nu, \lambda_i, \mu_\rho$.
Эти уравнения называют уравнениями Лагранжа I рода.
Заметим, что из второго закона Ньютона следует, что \[ m_\nu \ddot{x}_\nu - X_\nu - R_\nu = 0, \qquad \nu = \overline{1,3N}, \] поэтому реакции идеальных связей (вернее, их проекции) можно найти из уравнений \[ R_\nu = \sum_{i=1}^k \lambda_i \pd{f_i}{x_\nu} + \sum_{\rho=1}^r \mu_\rho a_{\rho \nu}. \]
В силу независимости вариаций обобщённых координат из общего уравнения механики \[ \sum_{i=1}^s \paren{ \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i} - Q_i } \delta q_i = 0 \] следует, что \[ \dv{}{t} \pd{T}{\dot{q}_i} - \pd{T}{q_i} = Q_i, \qquad i=\overline{1,s}. \]
Механический смысл первого интеграла $H(q,p) = h$: по определению \[ H(q,p,t) = \sum_{k=1}^s p_k \dot{q}_k(q,p,t) - L(q, \dot{q}(q,p,t), t). \] Если $H = H(q,p)$, то \[ \begin{aligned} H(q,p) &= \sum_{k=1}^s p_k \dot{q}_k(q,p) - L(q, \dot{q}(q,p)) = \\ &= \sum_{k=1}^s \pd{L}{\dot{q}_k} \dot{q}_k(q,p) - L(q, \dot{q}(q,p)). \end{aligned} \] Так как \[ L = T - \Pi = T_2 + T_1 + T_0 - \Pi, \] где \[ \begin{aligned} T_2 &= \frac{1}{2} \sum_{i,k=1}^s a_{ik} \dot{q}_i \dot{q}_k, \\ T_1 &= \sum_{p=1}^s a_p \dot{q}_p, \\ T_0 &= \frac{1}{2} \sum_{j=1}^N m_j \paren{ \pd{\bvec{r}_j}{t} }^2, \end{aligned} \] то \[ \sum_{k=1}^s \pd{L}{\dot{q}_k} \dot{q}_k = 2T_2 + T_1. \]
Теперь заметим, что, подставив $p_i = C_i = \const$, в гамильтониан, мы также избавим каноническую систему от переменной импульса $p_i$, то есть снова понизим её размерность на 1.
Так как левая часть уравнения Гамильтона-Якоби не зависит от $S$, то полный интеграл этого ДУЧП представим в виде функции \[ S = S(t, q_1, \dots, q_n, a_1, \dots, a_n) + a_{n+1}, \] которую называют главной функцией Гамильтона.
Подставим полученную функцию $q$ во вторую группу уравнений и продифференцируем их по $t$: \[ \ppdv{S}{t}{a_i} + \sum_{k=1}^n \ppdv{S}{q_k}{a_i} \dv{q_k}{t} = 0, \qquad i = \overline{1,n}. \] С другой стороны, подставляя полный интеграл \[ S = S(t, q_1, \dots, q_n, a_1, \dots, a_n) + a_{n+1} \] в уравнение Гамильтона-Якоби и дифференцируя полученное тождество по $a_i$, приходим к равенствам: \[ \ppdv{S}{t}{a_i} + \sum_{k=1}^n \pd{H}{(\partial S /\partial q_k)} \ppdv{S}{q_k}{a_i} = 0, \qquad i = \overline{1,n}. \] Вычитая из полученных равенств предыдущие и учитывая равенства \[ \left\{ \begin{aligned} \pd{S}{q_i} &= p_i, \\ \pd{S}{a_i} &= b_i, & i = \overline{1,n}, \end{aligned} \right. \] получаем, что \[ \sum_{k=1}^n \ppdv{S}{q_k}{a_i} \paren{ \dv{q_k}{t} - \pd{H}{p_k} } = 0, \qquad i = \overline{1,n}. \] Так как \[ \det \paren{ \ppdv{S}{q_i}{a_k} } \neq 0, \qquad (t,q,a) \in D, \] то \[ \dot{q}_i = \pd{H}{p_i}, \qquad i = \overline{1,n}. \] Аналогичным образом, подставляя полученную функцию $q$ в равенства \[ p_i = \pd{S}{q_i}, \qquad i = \overline{1,n} \] и дифференцируя полученные тождества по $t$, а также подставляя полный интеграл $S$ в уравнение Гамильтона-Якоби и дифференцируя его по $q_i$, получаем вторую группу канонических уравнений.
Рассмотрим теперь обобщённые координаты $q = (q_1, \dots, q_s)$: \[ \begin{aligned} x_\nu &= x_\nu(q_1, \dots, q_s, t), & \nu &= \overline{1,3N}, \\ \bvec{r}_j &= \bvec{r}_j(q_1, \dots, q_s, t), & j &= \overline{1,N}. \end{aligned} \] Тогда \[ \begin{aligned} \dot{x}_\nu &= \dv{}{t} x_\nu(q,t) = \pd{x_\nu}{t} + \sum_{i=1}^s \pd{x_\nu}{q_i} \dot{q}_i, \\ \bvec{v}_j &= \dv{}{t} \bvec{r}_j(q,t) = \pd{\bvec{r}_j}{t} + \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dot{q}_i. \end{aligned} \] Рассмотрим вариацию скорости: \[ \delta \bvec{v}_j = \sum_{i=1}^s \ppdv{\bvec{r}_j}{q_i}{t} \delta q_i + \sum_{i,k=1}^s \ppdv{\bvec{r}_j}{q_i}{q_k} \dot{q}_k \delta q_i + \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta \dot{q}_i. \] Продифференцируем равенство \[ \delta \bvec{r}_j = \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \delta q_i \] по $t$: \[ \begin{aligned} \dv{}{t} \delta \bvec{r}_j &= \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dv{}{t} \delta q_i + \sum_{i=1}^s \paren{ \sum_{k=1}^s \ppdv{\bvec{r}_j}{q_k}{q_i} \dot{q}_k + \ppdv{\bvec{r}_j}{t}{q_i} } \delta q_i = \\ &= \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \dv{}{t} \delta q_i + \sum_{i,k=1}^s \ppdv{\bvec{r}_j}{q_k}{q_i} \dot{q}_k \delta q_i + \sum_{i=1}^s \ppdv{\bvec{r}_j}{t}{q_i} \delta q_i. \end{aligned} \] Вычтем полученное равенство из уравнения вариации скорости: \[ \sum_{i=1}^s \pd{\bvec{r}_j}{q_i} \paren{ \delta \dot{q}_i - \dv{}{t} \delta q_i } = 0. \] Так как \[ \rank \paren{ \pd{x_\nu}{q_i} } = s, \] то равенство возможно только при \[ \delta \dot{q}_i = \dv{}{t} \delta q_i. \]
Используя основной дифференциальный принцип \[ \dv{}{t} \paren{p \delta q} = \delta L, \] получаем, что \[ \delta \int\limits_{t_1}^{t_2} L dt = \left.\paren{ p \delta q }\right|_{t_1}^{t_2}. \]
Если $(t_1, t_2)$ — произвольный промежуток, причём \[ \left. \delta q_i \right|_{t_1} = \left. \delta q_i \right|_{t_2} = 0, \quad i = \overline{1,s}, \] то равенство \[ \delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \delta q } \right|_{t_1}^{t_2} \] примет вид \[ \delta \int\limits_{t_1}^{t_2} L dt = 0. \]
Будем предполагать, что функция действия $W(q^1, q^2, t_1, t_2)$ определена в некоторой области $D_W \subset \mathbb{R}^{2s+2}$.
Из определения функции действия (то есть в силу того, что движение истинное) следует, что \[ \Delta t = dt, \quad \Delta q = dq, \quad \Delta W = dW, \] поэтому уравнение \[ \Delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \Delta q - H \Delta t } \right|_{t_1}^{t_2} \] примет вид \[ \begin{aligned} dW &= \left. \paren{ p dq - H dt } \right|_{t_1}^{t_2}, \\ \implies W &= \left. \paren{ p q - H t } \right|_{t_1}^{t_2}. \end{aligned} \] Тогда \[ \left\{ \begin{aligned} \pd{W}{q_2} &= p^2 = \left. p \right|_{t_2}, \\ \pd{W}{t_2} &= -H(q^2, p^2, t_2). \end{aligned} \right. \] Подставляя первое уравнение во второе, получаем \[ \pd{W}{t_2} + H\paren{q^2, \pd{W}{q_2}, t_2} = 0 \] то есть функция действия $W = W(q^1, q^2, t_1, t_2)$ задаёт $s+1$-параметрическое семейство решений уравнений Гамильтона-Якоби по переменным $q^2, t_2$ при таких значениях параметров $q^1, t_1$, что $(q^1, q^2, t_1, t_2) \in D_W$.Среди кинематически возможных вариаций выделим только те, которые соответствуют выполнению равенства \[ T + \Pi = h, \] из которого следует, что \[ \Delta h = \pd{h}{\dot{q}} \Delta \dot q + \pd{h}{q} \Delta q = 0. \] Считаем вариации $\Delta q$ независимыми, а $\Delta t$ выберем так, чтобы выполнялось предыдущее уравнение.
Из формул \[ \begin{aligned} \Delta q &= \delta q + \dot q \Delta t, \\ \Delta \dot q &= \delta \dot q + \ddot q \Delta t \end{aligned} \] следует \[ \begin{aligned} \dv{}{t} \Delta q &= \dv{}{t} \delta q + \ddot q \Delta t + \dot q \dv{}{t} \Delta t = \\ &= \Delta \dot q + \dot q \dv{}{t} \Delta t, \\ \implies \Delta \dot q &= \dv{}{t} \Delta q - \dot q \dv{}{t} \Delta t. \end{aligned} \] Тогда \[ \begin{aligned} \Delta h &= \pd{h}{\dot{q}} \Delta \dot q + \pd{h}{q} \Delta q = \\ &= \pd{h}{\dot{q}} \dv{}{t} \Delta q - \pd{h}{\dot{q}} \dot q \dv{}{t} \Delta t + \pd{h}{q} \Delta q = 0, \end{aligned} \] откуда следует равенство \[ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q = \pd{h}{\dot{q}} \dot q \dv{}{t} \Delta t. \]
В рассматриваемом случае \[ \pd{\Pi}{\dot{q}} = 0, \quad T = T_2, \] причём $T_2$ — квадратичная форма по $\dot{q}_i$, поэтому \[ \pd{h}{\dot{q}} \dot{q} = \pd{\paren{T + \Pi}}{\dot{q}} \dot{q} = \pd{T_2}{\dot{q}} \dot{q} = 2T_2 = 2T. \]
Подставляя полученное уравнение в формулу \[ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q = \pd{h}{\dot{q}} \dot q \dv{}{t} \Delta t, \] приходим к \[ \dv{}{t} \Delta t = \frac{1}{2T} \paren{ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q }. \] Интегрируя это равенство от $t_1$ до $t$, получаем \[ \Delta t = \Delta t_1 + \int\limits_{t_1}^t \frac{1}{2T} \paren{ \pd{h}{\dot{q}} \dv{}{t} \Delta q + \pd{h}{q} \Delta q } dt, \] где
Обратимся теперь к формуле для полной вариации функционала действия: \[ \Delta \int\limits_{t_1}^{t_2} L dt = \left. \paren{ p \Delta q - H \Delta t } \right|_{t_1}^{t_2}. \] Учитывая условия \[ \Delta t_1 = 0, \quad \left. \Delta q \right|_{t_1, t_2} = 0, \] получаем, что \[ \Delta \int\limits_{t_1}^{t_2} L dt = -h \Delta t_2. \] Кроме того, из формулы \[ L = 2T - h \] следует, что \[ \Delta \int\limits_{t_1}^{t_2} L dt = \Delta \int\limits_{t_1}^{t_2} 2T dt - h \Delta t_2, \] поэтому \[ \Delta \int\limits_{t_1}^{t_2} 2T dt = 0, \] то есть полная вариация действия по Лагранжу равна нулю.
Удачый выбор обобщённых координат может существенно облегчить исследования уравнений движения, которые при любом выборе координат \[ q_i' = q_i'(q_1, \dots, q_k, t), \qquad q_i' \in C^2, \quad \overline{1,s} \] можно записать в форме Лагранжа II-го рода или в каноническом виде.
Если одновременно с заменой координат перейти к новым обобщённым импульсам по формулам \[ \begin{aligned} q_i' &= q_i'(q_1, \dots, q_s, p_1, \dots, p_s, t), \\ p_i' &= p_i'(q_1, \dots, q_s, p_1, \dots, p_s, t), \end{aligned} \] то в общем случае уравнения движения не сохраняют канонического вида. Однако при определённых условиях это преобразование к новым переменным позволяет вместо уравнений \[ \begin{aligned} \dot q = \phantom{-} \pd{H}{p}, \\ \dot p = - \pd{H}{q} \end{aligned} \] с произвольной функцией $H(q, p, t)$ получить канонические уравнения относительно новых переменных с новой функцией Гамильтона $H'(q', p', t)$.
Заметим, что уравнение \[ p \delta q + Q \delta P = \delta S(q,P,t) \] равносильно системе \[ \left\{ \begin{aligned} p_i &= \pd{S}{q_i}, \\ Q_i &= \pd{S}{P_i}, \end{aligned} \right. \] откуда следует, что \[ \begin{aligned} \delta L + \dot Q \delta P + Q \delta \dot P &= \delta \paren{ p \dot q + Q \dot P + \pd{S}{t} }, \implies \\ \implies \delta \paren{ L - p \dot q - \pd{S}{t} } &= \dot P \delta Q + \cancel{Q \delta \dot P} - \dot Q \delta P - \cancel{Q \delta \dot P}, \implies \\ \implies \delta \paren{ L - p \dot q - \pd{S}{t} } &= \dot P \delta Q - \dot Q \delta P. \end{aligned} \] Воспользуемся тем, что \[ \dot P \delta Q = \dv{}{t} \paren{ P \delta Q } - P \delta \dot Q, \] тогда \[ \delta \paren{ L - p \dot q - \pd{S}{t} + \dot P Q } = \dv{}{t} \paren{ P \delta Q }. \] Используя определение гамильтониана, это равенство можно записать в виде \[ \delta \paren{ - H - \pd{S}{t} + \dot P Q } = \dv{}{t} \paren{ P \delta Q }. \] Рассмотрим теперь основной дифференциальный принцип в новых координатах: \[ \dv{}{t} \paren{ P \delta Q } = \delta L', \] причём $L'$ можно выразить через гамильтониан в новых координатах: \[ H' = P \dot Q - L' \implies L' = P \dot Q - H', \] откуда следует, что \[ \dv{}{t} \paren{ P \delta Q } = \delta \paren{ P \dot Q - H' }. \] Но \[ \delta \paren{ - H - \pd{S}{t} + \dot P Q } = \dv{}{t} \paren{ P \delta Q }, \] откуда следует, что \[ H' = H + \pd{S}{t}. \]
Попробуем найти такую производящую функцию $S(q, p', t)$, чтобы контактное преобразование переводило исходные переменные $q, p$ в постоянные величины \[ p_i' = \alpha_i = \const, \qquad q_i' = \beta_i = \const. \] Такая функция должна удовлетворять равенствам \[ p_i = \pd{S}{q_i} = p_i(q, p', t), \qquad q_i' = \pd{S}{\alpha_i} = \beta_i. \] Кроме того, новые переменные должны удовлетворять каноническим уравнениям с гамильтонианом \[ H' = H + \pd{S}{t}. \] В этом случае \[ \begin{aligned} \dot q_i' &= 0 = \pd{H'}{p'}, \\ \dot p_i' &= 0 = \pd{H'}{q'}, & i = \overline{1,s}. \end{aligned} \] Следовательно, новая функция Гамильтона $H'(q', p', t)$ не зависит от новых переменных $q', p'$. Тогда должно выполняться равенство \[ H\paren{ q, \pd{S}{q}, t } + \pd{S}{t} = f(t), \] которое называют уравнением Гамильтона-Якоби. Правая часть представляет собой произвольную функцию времени $f(t)$.
Вместо этого уравнения можно рассмотреть другое уравнение в частных производных, которому должна удовлетворять производящая функция $\tilde S(q, \alpha, t)$: \[ H\paren{ q, \pd{\tilde S}{q}, t } + \pd{\tilde S}{t} = 0, \] где \[ \tilde S = S - \int\limits_{t_0}^{t} f(\tau) d\tau. \]
Таким образом, для решения поставленной задачи нужно найти полное решение (полный интеграл) уравнения Гамильтона-Якоби, которое будет зависеть от $s$ постоянных $\alpha$ и аддитивной постоянной $\alpha_0$ в виде \[ \tilde S = \psi(q, \alpha, t) + \alpha_0. \] Тогда задача интегрирования канонических уравнений заменяется нахождением решения уравнения Гамильтона-Якоби. Если функция $\tilde S$ получена, она порождает контактное преобразование \[ p_i = \pd{\psi}{q_i}, \qquad \beta_i = \pd{\psi}{\alpha_i}. \] Разрешая последние уравнения относительно $q$, получим явное решение исходных уравнений движения: \[ q_i = q_i(t, \alpha, \beta), \qquad p_i = p_i(t, \alpha, \beta). \]
Если рассматривать движение механической системы со стационарными связями, то функция Гамильтона не зависит явно от времени. Тогда можно искать решение $\u{S}$ уравнения Гамильтона-Якоби вида \[ H\paren{ q, \pd{\u{S}}{q} } = h. \] После этого получим \[ S(q, \alpha, t) = -h t + \u{S}(q, \alpha), \] где $h = \alpha_1$.
Момент инерции материальной точки относительно оси $l$ — величина $mh^2$, где $m$ — масса точки, $h$ — расстояние до оси $l$.
Пусть $\rho(x,y,z)$ — плотность тела — непрерывная функция координат в области $V$, а $h(x,y,z)$ — расстояние точки $(x,y,z)$ до оси $l$.
Пусть система координат $Oxyz$ фиксирована. Рассмотрим пучок прямых $l$, проходящих через точку $O$. Относительно каждой из осей $l$ этого пучка данное тело имеет свой момент инерции $J_l$. Наглядную картину распределения моментов инерции $J_l$ твёрдого тела (в зависимости от выбора оси $l$) даёт эллипсоид инерции.
Пусть $\bvec{e} = (\alpha, \beta, \gamma)$ — единичный вектор, направленный вдоль $l$. Взяв на $l$ произвольную точку $M(x,y,z)$ и обозначая $OM = R$, получаем \[ x = R \alpha, \quad y = R \beta, \quad z = R \gamma. \] Тогда из формулы \[ J_l = J_{xx} \alpha^2 + J_{yy} \beta^2 + J_{zz} \gamma^2 - 2 J_{yz} \beta \gamma - 2 J_{zx} \gamma \alpha - 2 J_{xy} \alpha \beta \] получаем \[ k^2 = J_{xx} x^2 + J_{yy} y^2 + J_{zz} z^2 - 2 J_{yz} y z - 2 J_{zx} z x - 2 J_{xy} x y, \] где $k^2 = J_l R^2$. Данная формула задаёт поверхность второго порядка. Будем считать, что $k = \const$, поэтому \[ R = \frac{k}{\sqrt{J_l}}. \] Так как $J_l$ существенно больше нуля, то $R \lt \infty$ и, следовательно, задаёт эллипсоид (единственная поверхность 2 порядка, не имеющая бесконечно удалённых точек). Этот эллипсоид и называется эллипсоидом инерции. Центр эллипсоида находится в точке $O$, а $k$ определяет масштаб. Итак, с точностью до выбора масштаба $k$ каждой точке $O$ тела соответствует свой эллипсоид инерции. Главные оси эллипсоида инерции называют главными осями инерции тела для точки $O$. Если точка $O$ совпадает с центром масс, то построенный для неё эллипсоид инерции называют центральным, а его главные оси — главными центральными осями инерции.
Положим \[ J_{xy} = J_{yx}, \quad J_{yz} = J_{zy}, \quad J_{zx} = J_{xz} \] (это следует из определения произведений инерции) и рассмотрим матрицу квадратичной формы \[ (J) = \begin{pmatrix} J_{xx} & -J_{xy} & -J_{xz} \\ -J_{yx} & J_{yy} & -J_{yz} \\ -J_{zx} & -J_{zy} & J_{zz} \end{pmatrix} \]
Пусть $\bvec{K}_O$ — вектор кинетического момента твёрдого тела относительно неподвижной точки $O$. Тогда \[ \begin{aligned} \bvec{K}_O &= \sum \bvec{r}_i \times m_i \bvec{v}_i = \\ &= \sum \bvec{r}_i \times m_i \paren{ \bvec{\omega} \times \bvec{r}_i } = \\ &= \bvec{\omega} \sum m_i r_i^2 - \sum m_i \bvec{r}_i (\dp{\bvec{r}_i}{\bvec{\omega}}), \end{aligned} \] где $\bvec{r}_i, \bvec{v}_i$ — радиус-вектор относительно точки $O$ и скорость произвольной точки тела; $\bvec{\omega}$ — угловая скорость твёрдого тела.
Пусть $O\xi\eta\zeta$ — неподвижная система координат, а $Oxyz$ — СК, жёстко связанная с твёрдым телом.
Пусть $p,q,r$ — координаты вектора $\bvec{\omega}$ в подвижной СК $Oxyz$, а $K_x, K_y, K_z$ — координаты $\bvec{K}_O$ в той же СК $Oxyz$. Тогда, проектируя формулу \[ \bvec{K}_O = \bvec{\omega} \sum m_i r_i^2 - \sum m_i \bvec{r}_i (\dp{\bvec{r}_i}{\bvec{\omega}}) \] на оси $x, y, z$, получим \[ \begin{aligned} K_x &= p \sum m_i (y_i^2 + z_i^2) - q \sum m_i x_i y_i - r \sum m_i x_i z_i, \\ K_y &= q \sum m_i (x_i^2 + z_i^2) - p \sum m_i y_i x_i - r \sum m_i y_i z_i, \\ K_z &= r \sum m_i (x_i^2 + y_i^2) - p \sum m_i z_i x_i - q \sum m_i z_i y_i, \end{aligned} \] то есть \[ \begin{aligned} K_x &= J_{xx} p - J_{xy} q - J_{xz} r, \\ K_y &= -J_{yx} p + J_{yy} q - J_{zz} r, \\ K_z &= -J_{zx} p - J_{zy} q + J_{zz} r, \end{aligned} \] или, иначе, \[ \bvec{K}_O = (J) \bvec{\omega}. \]
Если за подвижные оси взять главные оси инерции для точки $O$, то тензор инерции становится диагональным, и координаты $\bvec{K}_O$: \[ K_x = J_{xx}p, \quad K_y = J_{yy} q, \quad K_z = J_{zz} r. \]
Выразим кинетическую энергию твёрдого тела как функцию компонент вектора $\bvec{\omega}$: \[ \begin{aligned} 2T &= \sum m_i \dp{\bvec{v}_i}{\bvec{v}_i} = \\ &= \sum m_i \bvec{v}_i \paren{ \bvec{\omega} \times \bvec{r}_i } = \\ &= \sum \bvec{\omega} \paren{ \bvec{r}_i \times m_i \bvec{v}_i } = \\ &= \bvec{\omega} \sum \paren{ \bvec{r}_i \times m_i \bvec{v}_i } = \\ &= \bvec{\omega} \bvec{K}_O. \end{aligned} \] Здесь:
В подвижной СК \[ \bvec{\omega} = (p,q,r), \quad \bvec{K}_O = (K_x, K_y, K_z), \] поэтому \[ 2T = J_{xx} p^2 + J_{yy} q^2 + J_{zz} r^2 - 2 J_{yz} qr - 2 J_{zx} rp - 2 J_{xy} qp. \]
Если за подвижные оси взяты главные оси инерции тела для точки $O$, то это уравнение принимает вид \[ 2T = J_{xx} p^2 + J_{yy} q^2 + J_{zz} r^2. \]
В неподвижной СК $O\xi\eta\zeta$ запишем теорему об изменении кинетического момента: \[ \dv{\bvec{K}_O}{t} = \bvec{M}_O, \] где $\bvec{M}_O$ — главный момент всех внешних сил относительно неподвижной точки $O$.
Справедлива формула: \[ \dv{\bvec{P}}{t} = \rdv{\bvec{P}}{t} + \vp{\bvec{\omega}}{\bvec{P}}, \] где $\bvec{P}$ — произвольный вектор.
Используя эту формулу, получаем \[ \dv{\bvec{K}_O}{t} = \rdv{\bvec{K_O}}{t} + \vp{\bvec{\omega}}{\bvec{K_O}} = \bvec{M}_O. \] Спроецируем эту формулу на оси подвижной СК $Oxyz$, направленные по главным осям инерции твёрдого тела в точке $O$: \[ \begin{aligned} \dv{K_x}{t} + q K_z - r K_y &= M_x, \\ \dv{K_y}{t} + r K_x - p K_z &= M_y, \\ \dv{K_z}{t} + p K_y - q K_x &= M_z. \end{aligned} \] Учитывая выражения \[ K_x = J_{xx}p, \quad K_y = J_{yy} q, \quad K_z = J_{zz} r \] и вводя обозначения \[ J_{xx} = A, \quad J_{yy} = B, \quad J_{zz} = C, \] получаем уравнения, которые называют динамическими уравнениями Эйлера: \[ \begin{aligned} A \dot p + (C - B) qr = M_x, \\ B \dot q + (A - C) pr = M_y, \\ C \dot r + (B - A) pq = M_z. \end{aligned} \]
Чтобы полностью описать движение твёрдого тела с неподвижной точкой, к динамическим уравнениям Эйлера необходимо добавить кинематические уравнения Эйлера, связывающие проекции $(p,q,r)$ угловой скорости твёрдого тела $\bvec{\omega}$ в СК $Oxyz$ и углы Эйлера: \[ \left\{ \begin{aligned} p &= \dot\psi \sin\theta \sin\varphi + \dot\theta \cos\varphi, \\ q &= \dot\psi \sin\theta \cos\varphi - \dot\theta \sin\varphi, \\ r &= \dot\psi \cos\theta + \dot\varphi, \end{aligned} \right. \]С учётом этого, динамические уравнения Эйлера примут вид \[ \tag{3} \begin{aligned} A\dot p + (C - B) qr &= P(\gamma_2 z_C - \gamma_3 y_C), \\ B\dot q + (A - C) rp &= P(\gamma_3 x_C - \gamma_1 z_C), \\ C\dot r + (B - A) pq &= P(\gamma_1 y_C - \gamma_2 x_C). \end{aligned} \] Из (2) и (3) получаем систему из 6 нелинейных ОДУ 1-го порядка относительно 6 неизвестных функций времени $\gamma_1, \gamma_2, \gamma_3, p, q, r$.
Если $\gamma_1, \gamma_2, \gamma_3, p, q, r$ найдены как функции времени, то для полного решения задачи (т.е. для определения эйлеровых углов как функций времени) необходимо из любого из кинематических уравнений Эйлера \[ \left\{ \begin{aligned} p &= \dot\psi \sin\theta \sin\varphi + \dot\theta \cos\varphi, \\ q &= \dot\psi \sin\theta \cos\varphi - \dot\theta \sin\varphi, \\ r &= \dot\psi \cos\theta + \dot\varphi, \end{aligned} \right. \] найти $\psi(t)$ одной квадратурой: например, исключим из первых двух уравнений $\dot\theta$, тогда \[ p \sin \varphi + q \cos \varphi = \dot \psi \sin \theta, \] откуда \[ \dot \psi = \frac{p \sin\varphi + q \cos\varphi}{\sin\theta}, \] а $\theta(t)$ и $\varphi(t)$ определяются непосредственно через $\gamma_1(t), \gamma_2(t), \gamma_3(t)$, так как \[ \begin{aligned} \gamma_1 &= \sin \theta \sin \varphi, \\ \gamma_2 &= \sin \theta \cos \varphi, \\ \gamma_3 &= \cos \theta. \end{aligned} \]
Установлено, что для полного решения системы (2)-(3) достаточно знать 4 независимых интеграла вместо 6.
Можно указать следующие первые интегралы:
Интегрируя это равенство, получаем, что \[ T = -P \xi_C + \const. \] Так как \[ 2T = J_{xx} p^2 + J_{yy} q^2 + J_{zz} r^2 = A p^2 + B q^2 + C r^2, \] а \[ \xi_C = \dp{\bvec{r}_C}{\bvec{e}} = x_C \gamma_1 + y_C \gamma_2 + z_C \gamma_3, \] то \[ \tag{6} \frac{1}{2} \paren{ A p^2 + B q^2 + C r^2 } = -P \paren{ x_C \gamma_1 + y_C \gamma_2 + z_C \gamma_3 } + \const; \] это равенство и называют интегралом энергии.
Остаётся найти ещё один интеграл, независимый от (4)-(6). Сделать это удалось только для трёх частных предположений относительно движущегося тела и условий его движения:
Рассмотрим классификацию ограничений:
Рассмотрим совокупность варьируемых параметров \[ q = q(t_\text{н}, t_\text{к}, x(t_\text{н}), x(t_\text{к}), u). \]
В дальнейшем будем искать локально оптимальные сильные экстремумы, то есть рассматривать непрерывные функции.
Рассмотрим уравнения движения \[ \dot x = f(x(t), u(t), t), \qquad x \in \R^n, \quad u \in \R^m, \qquad t \in [t_\text{н}, t_\text{к}] \in \R, \] причём \[ f \in C^1, \qquad \pd{f}{x} \in C^1, \] с начальными условиями \[ x(t_\text{н}) = x^\text{н}. \]
Будем считать, что заданы условия на управление: \[ u_{j1} \leqslant u_j(t) \leqslant u_{j2}, \qquad u_{j1}, u_{j2} \in \overline{\R}. \]
Будем рассматривать управления $u_j(t) \in PC$ с конечным числом точек разрыва $\tau$. Будем считать, что они изолированы, а $u_j(t)$ непрерывны справа.
Будем считать, что также заданы ограничения на траекторию: \[ J_i(t_\text{н}, t_\text{к}, x_i(t_\text{н}), x_i(t_\text{к})) = 0, \qquad i = \overline{1,n}, \quad j = \overline{1,l}, \quad l \leqslant 2n + 2, \] причём считаем, что функции $J_i \in C^1$ и независимы, то есть \[ \rank \paren{ \pd{J_j}{t_\text{н}}, \pd{J_j}{t_\text{к}}, \pd{J_j}{x_i^\text{н}}, \pd{J_j}{x_i^\text{к}} } = l. \]
Зададим критерий качества в виде Больца: \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t), t) dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min, \] причём считаем, что $\varphi_0, F_0, \pd{F_0}{x} \in C^1$.
Введём понятие игольчатых вариаций. Рассмотрим управление $u(t)$, при котором минимизируется функционал. Будем варьировать это управление следующим образом. Рассмотрим конечное число моментов времени $t_\sigma$: \[ t_\text{н} \lt t_1 \lt \dots \lt t_n \lt t_\text{к}, \qquad \sigma = \overline{1,n}, \] в которых управление $u(t)$ меняется соответственно на $v_\sigma(t)$. Будем считать, что $v_\sigma(t)$ удовлетворяет ограничением на управление, то есть \[ u_{j1} \leqslant v_{j\sigma} \leqslant u_{j2}. \]
Введём в рассмотрение величины \[ \Delta t_\sigma \gt 0, \qquad \Delta t_\text{н}, \quad \Delta t_\text{к}, \] построим непересекающиеся интервалы \[ \left\{ \begin{aligned} i_\text{н} &= \begin{cases} [t_\text{н}, t_\text{н} + \Delta t_\text{н}), & \Delta t_\text{н} \gt 0, \\ (t_\text{н} + \Delta t_\text{н}, t_\text{н}], & \Delta t_\text{н} \lt 0, \end{cases} \\ i_\sigma &= [t_\sigma, t_\sigma + \Delta t_\sigma], \\ i_\text{к} &= \begin{cases} [t_\text{к}, t_\text{к} + \Delta t_\text{к}), & \Delta t_\text{к} \gt 0, \\ (t_\text{к} + \Delta t_\text{к}, t_\text{к}], & \Delta t_\text{к} \lt 0. \end{cases} \\ \end{aligned} \right. \] Заметим, что точки разрыва изолированы.
Используя построенные интервалы, рассмотрим новое управление: \[ u'(t) = \begin{cases} u(t_\text{н}), & t \in i_\text{н}, \\ u(t_\text{к}), & t \in i_\text{к}, \\ v_\sigma, & t \in i_\sigma, \\ u, & t \not \in i_\text{н}, i_\text{к}, i_\sigma. \end{cases} \] Тогда игольчатой вариацией называется функция \[ v(t) = u'(t + \Delta t) - u(t). \]
Так как \[ u'(t) = u(t), \qquad t \not \in i_\text{н}, i_\text{к}, i_\sigma, \] то \[ v = u(t + \Delta t) - u(t) = \Delta u. \]
Эту задачу можно рассматривать как задачу условной минимизации функционала $J_0$. Перейдём от неё к задаче безусловной минимизации функционала введением множителей Лагранжа: \[ \lambda(t) \in \R^n, \qquad \nu \in \R^l. \] Тогда будем минимизировать функционал \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} \left[ F_0(t, x(t), u(t)) dt + \lambda (\dot x - f) \right] dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \sum\limits_{j=1}^{l} \nu_j J_j. \] Введя обозначения \[ L = F_0 + \lambda (\dot x - f), \qquad R = \varphi_0 + \sum\limits_{j=1}^{l} \nu_j J_j, \] перепишем этот функционал в следующем виде: \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} L(x(t), \dot x, \lambda, u(t), t) dt + R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min. \]
Найдём полную вариацию этого функционала: \[ \Delta \Phi = \delta \Phi + \dot \Phi \Delta t. \]
Пользуясь определением функционала действия по Гамильтону \[ S = \int\limits_{t_\text{н}}^{t_\text{к}} L dt, \] можно записать \[ \Delta \Phi = \Delta \int\limits_{t_\text{н}}^{t_\text{к}} L dt + \Delta R = \Delta_1 S + \Delta_2 S + \Delta_1 R = \Delta_1 \Phi + \Delta_2 \Phi, \] где:
Рассмотрим для начала вариации без разрывов: \[ \Delta_1 \Phi = \Delta_1 S + \Delta_1 R. \] Известно, что \[ \Delta_1 S = \Delta \int\limits_{t_\text{н}}^{t_\text{к}} L dt = \int\limits_{t_\text{н}}^{t_\text{к}} \delta L dt + \left .\paren{ L \Delta t } \right|_{t_\text{н}}^{t_\text{к}}. \] Рассмотрим изохронную вариацию функции $L$: \[ \delta L(x, \dot x, \lambda, u, t) = \pd{L}{x} \delta x + \pd{L}{\dot x} \delta \dot x + \pd{L}{\lambda} \delta \lambda + \pd{L}{u} \delta u. \] Так как \[ \dv{}{t} \paren{ \pd{L}{\dot x} \delta x } = \dv{}{t} \pd{L}{\dot x} \delta x + \pd{L}{\dot x} \delta \dot x, \] то \[ \pd{L}{\dot x} \delta \dot x = \dv{}{t} \paren{ \pd{L}{\dot x} \delta x } - \dv{}{t} \pd{L}{\dot x} \delta x, \] поэтому \[ \delta L(x, \dot x, \lambda, u, t) = \paren{ \pd{L}{x} - \dv{}{t} \pd{L}{\dot x} } \delta x + \dv{}{t} \paren{ \pd{L}{\dot x} \delta x } + \pd{L}{\lambda} \delta \lambda + \pd{L}{u} \delta u. \] Введём функцию Гамильтона: \[ H = \lambda \dot x - L(x, \dot x, \lambda, u, t), \] где $x$ и $\lambda$ будем воспринимать как аналог обобщённых координат и импульсов соответственно. Из определения \[ L = F_0 + \lambda (\dot x - f) \] следует, что \[ H = -F_0 + \lambda f, \implies H = H(x, \lambda, u, t). \] Пользуясь этим обозначением, а также тем, что \[ \pd{L}{\dot x} = \lambda, \] получаем \[ \delta L = - \paren{ \pd{H}{x} + \dot \lambda } \delta x + \dv{}{t} \paren{ \lambda \delta x } + \paren{ \dot x - \pd{H}{\lambda} } \delta \lambda - \pd{H}{u} \delta u. \] Заметим, что \[ \left\{ \begin{aligned} \pd{L}{x} &= - \pd{H}{x}, \\ \pd{L}{\lambda} &= \dot x - \pd{H}{\lambda}, \\ \pd{L}{u} &= - \pd{H}{u}. \end{aligned} \right. \]
Рассмотрим теперь второе слагаемое: \[ \begin{aligned} L \Delta t &= \paren{ \lambda \dot x - H } \Delta t = \\ &= \lambda \dot x \Delta t - H \Delta t = \\ &= \lambda \Delta x - \lambda \delta x - H \Delta t. \end{aligned} \]
Собирая полученные результаты, получаем, что \[ \begin{aligned} \Delta_1 S &= \int\limits_{t_\text{н}}^{t_\text{к}} \delta L dt + \left .\paren{ L \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = \\ &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \cancel{\left. \paren{ \lambda \delta x } \right|_{t_\text{н}}^{t_\text{к}}} + \\ &\phantom{=} + \left. \paren{ \lambda \Delta x - \cancel{\lambda \delta x} - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} = \\ &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} \end{aligned} \]
Эту задачу можно рассматривать как задачу условной минимизации функционала $J_0$. Перейдём от неё к задаче безусловной минимизации функционала введением множителей Лагранжа: \[ \lambda(t) \in \R^n, \qquad \nu \in \R^l. \] Тогда будем минимизировать функционал \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} \left[ F_0(t, x(t), u(t)) dt + \lambda (\dot x - f) \right] dt + \varphi_0(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \sum\limits_{j=1}^{l} \nu_j J_j. \] Введя обозначения \[ L = F_0 + \lambda (\dot x - f), \qquad R = \varphi_0 + \sum\limits_{j=1}^{l} \nu_j J_j, \] перепишем этот функционал в следующем виде: \[ \Phi = \int\limits_{t_\text{н}}^{t_\text{к}} L(x(t), \dot x, \lambda, u(t), t) dt + R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) \to \min. \]
Найдём полную вариацию этого функционала: \[ \Delta \Phi = \delta \Phi + \dot \Phi \Delta t. \]
Пользуясь определением функционала действия по Гамильтону \[ S = \int\limits_{t_\text{н}}^{t_\text{к}} L dt, \] можно записать \[ \Delta \Phi = \Delta \int\limits_{t_\text{н}}^{t_\text{к}} L dt + \Delta R = \Delta_1 S + \Delta_2 S + \Delta_1 R = \Delta_1 \Phi + \Delta_2 \Phi, \] где:
Рассмотрим сильные вариации. Обозначим за $u'$ управление, отвечающее траектории сравнения, тогда \[ \begin{aligned} \Delta_2 \Phi &= \Delta_2 S = \\ &= \int\limits_{t_\text{н}}^{t_\text{к}} \left[ L(x, \dot x, \lambda, u', t) - L(x, \dot x, \lambda, u, t) \right] dt = \\ &= \int\limits_{t_\text{н}}^{t_\text{к}} \left[ H(x, \lambda, u, t) - H(x, \lambda, u', t) \right] dt \approx \\ &\approx \sum\limits_{\sigma = 0}^{N + 1} \int\limits_{t_\sigma}^{t_\sigma + \Delta t_\sigma} \left[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \right] dt, \end{aligned} \] где $N$ — количество точек разрыва и \[ t_0 := t_\text{н}, \qquad t_{N+1} := t_\text{к}. \]
Проверим, является ли функция \[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \] непрерывной как функция времени. Для этого рассмотрим произвольный момент времени $\tau \in [t_\text{н}, t_\text{к}]$ (который, вообще говоря, может совпадать с одной из точек разрыва). Тогда \[ S = \int\limits_{t_\text{н}}^{t_\text{к}} L dt = \int\limits_{t_\text{н}}^{\tau} L dt + \int\limits_{\tau}^{t_\text{к}} L dt. \] Так как \[ \begin{aligned} \Delta_1 S &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \paren{ \lambda \Delta x - H \Delta t } \big|_{t_\text{н}}^{t_\text{к}}, \end{aligned} \] то, варьируя обе части формулы функционала действия и сравнивая полученные результаты, получаем, что \[ \paren{ \lambda \Delta x - H \Delta t } \big|_{\tau - 0} - \paren{ \lambda \Delta x - H \Delta t } \big|_{\tau + 0} = 0. \] Замечая, что \[ \begin{aligned} \at{\Delta x}{\tau - 0} = \at{\Delta x}{\tau + 0} &= \Delta x, \\ \at{\Delta t}{\tau - 0} = \at{\Delta t}{\tau + 0} &= \Delta t \end{aligned} \] в силу непрерывности, причём $\Delta x$ и $\Delta t$ независимы, окончательно получаем, что \[ \begin{aligned} \at{\lambda_i}{\tau - 0} &= \at{\lambda_i}{\tau + 0}, \\ \at{H}{\tau - 0} &= \at{H}{\tau + 0}, & i = \overline{1,n}. \end{aligned} \] Эти равенства называют условиями Эрдмана-Вейерштрасса.
Итак, если условия Эрдмана-Вейерштрасса выполнены, то функция \[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \] непрерывна как функция времени, поэтому, выделив линейную часть приращения функционала $\Phi$, получим, что \[ \begin{aligned} \Delta_2 \Phi &= \sum\limits_{\sigma = 0}^{N + 1} \int\limits_{t_\sigma}^{t_\sigma + \Delta t_\sigma} \left[ H(x, \lambda, u, t) - H(x, \lambda, v_\sigma, t) \right] dt = \\ &= \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \end{aligned} \]
Итак, полная вариация функционала $\Phi$ для конечных и бесконечно малых приращений записывается как \[ \begin{aligned} \Delta \Phi &= \Delta_1 \Phi + \Delta_2 \Phi = \\ &= -\int\limits_{t_\text{н}}^{t_\text{к}} \left[ \paren{ \pd{H}{x} + \dot \lambda } \delta x + \paren{ \pd{H}{\lambda} - \dot x } \delta \lambda + \pd{H}{u} \delta u \right] dt + \\ &\phantom{=} + \Delta R(t_\text{н}, t_\text{к}, x^\text{н}, x^\text{к}) + \left. \paren{ \lambda \Delta x - H \Delta t } \right|_{t_\text{н}}^{t_\text{к}} + \\ &\phantom{=} + \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \end{aligned} \]
Анализ этой формулы позволяет выписать необходимые условия экстремума как для непрерывной функции управления без ограничений, так и для ограниченного кусочно-непрерывного управления.
Рассмотрим случай, когда управление представляет собой непрерывную функцию без ограничений. Тогда необходимые условия оптимального управления называют необходимыми условиями для классического вариационного исчисления.
Если на опорной траектории достигается локальный минимум, то $\Delta \Phi \geqslant 0$.
Так как основные сложности сопряжены с варьированием управления, то проварьируем сначала остальные параметры и выпишем условия, соответствующие этому варьированию.
При частном выборе на траекториях сравнения управлений, равных оптимальным (т.е. $u' = u$ и $\delta u = 0$), будем иметь внутренний экстремум (так как управление не варьируется, ограничения на него не учитываются), поэтому необходимое условие экстремума — общее условие стационарности: \[ \Delta \Phi = 0. \] Заметим, что в расширенном пространстве допустимых кривых сравнения вариации $\delta x_i, \delta \lambda_i, \Delta t_\text{н}, \Delta t_\text{к}, \Delta x_i^\text{н}, \Delta x_i^\text{к}$ независимы, поэтому получаем следующие условия:
Рассмотрим теперь только вариации управления, положив остальные вариации нулю. При слабых вариациях управления для выполнения условия $\Delta \Phi \geqslant 0$ получаем следующее необходимое условие: \[ - \int\limits_{t_\text{н}}^{t_\text{к}} \pd{H}{u} \delta u dt \geqslant 0. \] Пусть $u_j \in (u_{j1}, u_{j2})$, то есть управление на опорной траектории является внутренним значением. Тогда $\delta u$ может принимать как положительные, так и отрицательные значения, поэтому для выполнения $\Delta \Phi \geqslant 0$ должно выполняться условие \[ \pd{H}{u_j} = 0, \qquad u_{j1} \lt u_j \lt u_{j2}. \] Рассмотрим теперь граничные значения управления $u_j$:
Итак, можно записать необходимые условия оптимальности для классического вариационного исчисления:
Рассмотрим только сильные вариации управления, тогда \[ \Delta \Phi = \sum\limits_{\sigma=0}^{N+1} \left[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \right] \abs{ \Delta t_\sigma }. \] Тогда для выполнения условия $\Delta \Phi \geqslant 0$ необходимо, чтобы \[ H(x, \lambda, u, t_\sigma) - H(x, \lambda, v_\sigma, t_\sigma) \geqslant 0, \qquad v_\sigma \in U. \] Считаем, что $x = x(t_\sigma), \lambda = \lambda(t_\sigma), u = u(t_\sigma)$ — значения указанных величин на оптимальной траектории.
Итак, необходимые условия оптимальности управления, имеющего разрывы и ограничения вида $u_{j1} \leqslant u_j(t) \leqslant u_{j2}$:
В качестве критерия качества рассмотрим задачу Больца со свободным правым концом \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t), t) dt + \varphi_0(x(t_\text{к})) \to \inf. \]
Управление $u(t) \in U$ будем искать в классе кусочно-непрерывных функций, то есть $u(t) \in PC$.
Если $u_0(t)$ — оптимальное управление для поставленной задачи, а $x_0(t)$ — соответствующая ему оптимальная траектория, то $u_0$ удовлетворяет условиям максимальности: \[ \max_{u \in U} H(t, x_0(t), \lambda(t), u(t)) = H(t, x_0(t), \lambda(t), u_0(t)), \] где \[ H(t, x(t), \lambda(t), u(t)) = -F_0(x(t), u(t), t) + \lambda(t) f(x(t), u(t), t), \] а множители $\lambda(t) \in C, \lambda(t) \neq 0$ является решением уравнений Эйлера-Лагранжа \[ \dot \lambda = - \pd{H}{x} \] и удовлетворяют условиям трансверсальности: \[ \lambda(t_\text{к}) = - \pd{\varphi_0(x_0(t_\text{к}))}{x_\text{к}}. \]
Рассмотрим задачу Лагранжа с закреплённым правым концом и свободным временем. Зададим уравнения движения \[ \dot x(t) = f(x(t), u(t), t), \qquad x \in \R^n, \quad u \in \R^m, \quad t \geqslant t_\text{н} \] с начальными и конечными условиями \[ x(t_\text{н}) = x^\text{н}, \qquad x(t_\text{к}) = x^\text{к}. \] Зададим критерий качества в виде задачи Лагранжа \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} F_0(x(t), u(t), t) dt \to \inf. \] Будем считать, что $t_\text{к}$ — произволен, а $u \in U(t)$.
ПМП для этой задачи формулируется так: если $u_0(t)$ — оптимальное управление, а $x_0(t)$ — соответствующая оптимальная траектория, то найдётся ненулевой вектор $\lambda(t) \in R^{n + 1}$ такой, что $\lambda(t) \in C$, а также \[ \lambda_0(t) = \const \leqslant 0, \qquad \dot \lambda_i(t) = - \pd{H}{x_i}, \quad i = \overline{1, n}, \] где \[ H(t, x, u, \lambda) = \sum\limits_{i=1}^{n} \lambda_i f_i + \lambda_0 F_0, \] для которого выполняется условие максимальности: \[ \max_{u \in U} H(t, x_0(t), \lambda(t), u(t)) = H(t, x_0(t), \lambda(t), u_0(t)), \] причём \[ H(t, x_0(t), \lambda(t), u_0(t)) = \int\limits_{t_\text{н}}^{t} \pd{H}{s}(s, x_0(s), \lambda(s), u_0(s)) ds. \]
Рассмотрим три случая, при которых можно найти аналитическое решение:
Пусть $A = C \neq B$, рассмотрим спутник на орбите: \[ \left\{ \begin{aligned} A \dot p + (A - B) qr &= u_x, \\ B \dot q &= u_y, \\ A \dot r + (B - A) qp &= u_z, \end{aligned} \right. \implies \left\{ \begin{aligned} A \dot p &= u_x + (B - A) qr, \\ B \dot q &= u_y, \\ A \dot r &= u_z + (A - B) qp, \end{aligned} \right. \]
Пусть $B \gt A$. Введём обозначения: \[ u_1 := \frac{u_x}{A}, \qquad u_2 := \frac{u_z}{A}, \qquad u_3 = \frac{u_y}{B}, \qquad a := \frac{q (B - A)}{A}, \] тогда систему можно переписать в виде \[ \left\{ \begin{aligned} \dot p &= \phantom{-}ar + u_1, \\ \dot r &= - ap + u_2, \\ \dot q &= u_3. \end{aligned} \right. \] Представим, что \[ -\nu \leqslant u_1, u_2 \leqslant \nu, \qquad u_3 \equiv 0, \] тогда \[ \dot q = 0 \implies q = \const = q_0 \gt 0 \implies a_0 = \const \gt 0 \] Введя обозначения \[ x_1 := p, \qquad x_2 := r, \] приведём систему к виду $\dot x = f(x, u(t))$: \[ \left\{ \begin{aligned} \dot x_1 &= \phantom{-} a x_2 + u_1, \\ \dot x_2 &= - a x_1 + u_2. \end{aligned} \right. \] Поставим задачу: перевести систему из начального положения \[ x_1(t_\text{н}) = x_1^\text{н}, \qquad x_2(t_\text{н}) = x_2^\text{н} \] в положение \[ x_1(t_\text{к}) = 0, \qquad x_2(t_\text{к}) = 0 \] за минимальное время. Значит, в качестве критерия качества надо взять функционал \[ J_0 = \int\limits_{t_\text{н}}^{t_\text{к}} dt. \] Так как на управление наложены ограничения, воспользуемся принципом максимума Понтрягина.
Найдём точки переключения управлений: \[ \left\{ \begin{aligned} \pd{H}{u_1} = \lambda_1 &= 0, & \text{—} \quad \text{точки переключения} \; u_1, \\ \pd{H}{u_2} = \lambda_2 &= 0, & \text{—} \quad \text{точки переключения} \; u_2. \end{aligned} \right. \]
Из уравнений движения \[ \left\{ \begin{aligned} \dot x_1 &= \phantom{-} a x_2 + u_1, \\ \dot x_2 &= - a x_1 + u_2 \end{aligned} \right. \] при \[ u_1 = \pm \nu, \qquad u_2 = \pm \nu \] следует, что \[ \left\{ \begin{aligned} x_1 &= M \sin \paren{ a t + \beta } + \frac{u_2}{a}, \\ x_2 &= M \cos \paren{ a t + \beta } - \frac{u_1}{a}. \end{aligned} \right. \] Исключением времени можно получить уравнение для фазовой траектории: \[ M^2 = \paren{ x_1 - \frac{u_2}{a} }^2 + \paren{ x_2 + \frac{u_1}{2} }^2. \] Заметим, что это уравнение задаёт окружность с центром в точке \[ \paren{ \frac{u_2}{a}, -\frac{u_1}{a} }, \] причём при различных значениях управления получаются различные центры.
оптимальное управление обладает тем свойством, что для любого начального состояния и использованного начального управления последующее оптимальное управление совпадает с исходным оптимальным управлением относительно состояния, получающегося в результате применения начального управления.
Другими словами, пусть построена экстремальная траектория, решающая задачу оптимизации по некоторому критерию для управляемого процесса $u(t), x(t)$, переводящего механическую систему из заданного начального состояния $x_\text{н}$ в момент времени $t = t_\text{н}$ в некоторое конечное положение $x_\text{к}$ при $t = t_\text{к}$. Если взять в качестве новой начальной точки любую точку $x(\tau)$ этой траектории, причём $t_\text{н} \lt \tau \lt t_\text{к}$, то оптимальным управлением в случае $F_0(x, u, t) \geqslant 0$ будет оставшаяся часть ранее построенного оптимального управления, отвечающая отрезку $t \in [\tau, t_\text{к}]$. Оба вектора управления (первоначального и укороченного) на этом отрезке совпадают.
Рассмотрим задачу управления на конечном интервале времени:
Пусть движение системы происходит на отрезке \[ t_\text{н} \leqslant \tau \leqslant t \leqslant t_\text{к} \] с начальными условиями \[ x(\tau) = x, \qquad x \in \R^n, \] то есть \[ \tag{3} \dot x(t) = f(t, x(t), u), \qquad \tau \leqslant t \leqslant t_\text{к}, \qquad x(\tau) = x. \] Для этой системы рассмотрим задачу минимизации функционала \[ \tag{4} \int\limits_{\tau}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \limto{u \in U} \inf. \]
Рассмотрим произвольные моменты времени $\tau$ и $\tau_1$: \[ t_\text{н} \leqslant \tau \leqslant \tau_1 \leqslant t_\text{к}. \] На основании принципа динамического программирования запишем, что \[ \tag{6} \begin{aligned} B(\tau, x) &= \inf_{u \in U} \left[ \int\limits_{\tau}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right] = \\ &= \inf_{u \in U} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + \int\limits_{\tau_1}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right] = \\ &= \inf_{\substack{u \in U \\ \tau \leqslant t \leqslant \tau_1}} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + \inf_{\substack{u \in U \\ \tau_1 \leqslant t \leqslant t_\text{к}}} \left[ \int\limits_{\tau_1}^{t_\text{к}} F_0(t, x(t), u) dt + \varphi_0(x(t_\text{к})) \right] \right] = \\ &= \inf_{\substack{u \in U \\ \tau \leqslant t \leqslant \tau_1}} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + B(\tau_1, x(\tau_1)) \right]. \end{aligned} \] Здесь $x(t)$ — решение задачи (3), а управление при $t \in [\tau, \tau_1]$ влияет на \[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt \] и на величину $x(\tau_1)$.
Представим формулу (6) в виде \[ \tag{7} \inf_{\substack{u \in U \\ \tau \leqslant t \leqslant \tau_1}} \left[ \int\limits_{\tau}^{\tau_1} F_0(t, x(t), u) dt + B(\tau_1, x(\tau_1)) - B(\tau, x) \right] = 0. \] Пусть $B(\tau, x)$ непрерывно дифференцируема, тогда при $\Delta t = \tau_1 - \tau \to 0$ с точностью до малых более высокого порядка малости относительно $\Delta t$ выполняется равенство \[ \tag{8} B(\tau_1, x(\tau_1)) - B(\tau, x) = \dot B(\tau, x) \Delta t, \] где $\dot B(\tau, x)$ — полная производная функции $B$ вдоль траекторий системы (1): \[ \tag{9} \dv{B(\tau, x)}{t} = \pd{B(\tau, x)}{t} + \pd{B(\tau, x)}{x} f(t, x, u). \] Разделив обе части (7) на $\Delta t$ и переходя к пределу при $\Delta t \to 0$, получаем \[ \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \quad \text{где} \quad t_\text{н} \leqslant t \leqslant t_\text{к}, \quad x \in \R^n. \]
Заметим, что из определения функции Беллмана следует, что \[ \tag{11} B(t_\text{к}, x) = \varphi(x(t_\text{к})), \qquad x \in \R^n. \] Таким образом, если решение задачи (1),(2) оптимального управления существует, а функция Беллмана $B(t, x)$ непрерывно дифференцируема, то справедливы соотношения \[ \begin{gathered} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \\ B(t_\text{к}, x) = \varphi(x(t_\text{к})). \end{gathered} \] Таким образом, решение задачи оптимального управления для системы ОДУ сводится к решению одного уравнения в частных производных с граничными условиями (аналогично методу Якоби для решения канонических уравнений).
Например, при этом уравнении вообще может не существовать решение уравнений движения (1).
Рассмотрим задачу управления на конечном интервале времени:
Управление, реализующее \[ \begin{gather} \tag{10} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \\ \tag{11} B(t_\text{к}, x) = \varphi(x(t_\text{к})), \end{gather} \] является С-управлением (т.е. $u = u(t, x)$). Приведём условия, при которых МДП приводит к решению исходной задачи (1), (2).
Рассмотрим задачу управления на конечном интервале времени:
С помощью МДП мы свели эту задачу к решению задачи Коши \[ \begin{gather} \tag{10} \inf_{u \in U} \left[ \pd{B(t, x)}{t} + \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = 0, \\ \tag{11} B(t_\text{к}, x) = \varphi(x(t_\text{к})). \end{gather} \] Пусть существует единственное непрерывное решение $B(t,x)$ этой задачи с непрерывными производными \[ \pd{B}{t}, \quad \pd{B}{x}, \quad \ppdv{B}{t}{x}, \quad \ppdv{B}{x}{t} \] и допустимое управление $u_0(t,x)$, удовлетворяющее уравнению \[ \tag{12} \inf_{u \in U} \left[ \pd{B(t, x)}{x} f(t, x, u) + F_0(t, x, u) \right] = \pd{B_0(t,x)}{x} f(t, x, u_0) + F_0(t, x, u_0). \] Тогда $u_0$ является оптимальным. Пусть $x_0(t)$ — соответствующая оптимальная траектория.
Введём обозначения: \[ \tag{13} \begin{aligned} \lambda(t) &= -\pd{B}{x}(t, x(t)), \\ H(t, x, u, \lambda) &= -F_0(t, x, u) + \lambda f(t, x, u). \end{aligned} \] Тогда из (12) следует, что \[ \pd{B(t, x_0)}{x} f(t, x_0, u_0) + F_0(t, x_0, u_0) = \min_{u \in U} \left[ \pd{B(t, x_0)}{x} f(t, x_0, u) + F_0(t, x_0, u) \right]. \] Отсюда и из (13) следует, что \[ \tag{14} \begin{aligned} \max_{u \in U} \left[ - \pd{B(t, x_0)}{x} f(t, x_0, u) - F_0(t, x_0, u) \right] &= \max_{u \in U} \left[ \lambda f(t, x_0, u) - F_0(t, x_0, u) \right] = \\ &= \max_{u \in U} H(t, x_0, u, \lambda) = \\ &= H(t, x_0, u_0, \lambda). \end{aligned} \] На основании (10) и (12) имеем: \[ \pd{B(t,x)}{t} = -\pd{B(t, x)}{x} f(t, x, u_0) - F_0(t, x, u_0) = H(t, x, u_0, \lambda). \] Так как частные производные \[ \ppdv{B}{t}{x} = \ppdv{B}{x}{t} \] существуют и непрерывны, то при $x = x_0$ в силу (13) получаем \[ \tag{15} \ppdv{B}{t}{x} = - \dot \lambda(t) = \pd{H}{x}(t, x_0, u_0, \lambda). \] Дифференцируя обе части (11) по $x$ и полагая $x = x_0$, получаем, что \[ \tag{16} \pd{B}{x}(t_\text{к}, x_0(t_\text{к})) = -\lambda(t_\text{к}) = \pd{\varphi_0(x_0(t_\text{к}))}{x}. \]
Из (15) и (16) следует, что $\lambda(t)$ — решение задачи Коши \[ \tag{17} \begin{aligned} \dot \lambda(t) &= - \pd{H(t, x_0, u_0, \lambda)}{x}, \\ \lambda(t_\text{к}) &= - \pd{\varphi_0(x_0(t_\text{к}))}{x}. \end{aligned} \]
Условия (14) и (17) совпадают с условиями ПМП.
Таким образом, МДП позволяет свести задачу оптимального управления к исследованию задачи Коши (10)-(11) для нелинейного уравнения в частных производных. С помощью же ПМП решение задач управления сводится к изучению краевых задач для систем ОДУ, что представляется более простым.
Рассмотрим задачу о наискорейшем успокоении ТТ, совершающего вращательные движения относительно центра масс $O$ (случай Эйлера). Тогда точка $O$ — центр подвижной системы координат $Ox_1 x_2 x_3$, жёстко связанной с телом. Оси этой системы являются главными центральными осями инерции тела. Обозначим проекции вектора кинетического момента на эти оси как $x_1, x_2, x_3$, то есть \[ K = \paren{ x_1, x_2, x_3 } = \paren{ Ap, Bq, Cr }, \] где $\omega = \paren{ p, q, r }$ — координаты угловой скорости ТТ $\vec{\omega}$ в системе $O x_1 x_2 x_3$, а $A,B,C$ — главные центральные моменты инерции ТТ.
Динамические уравнения Эйлера в этом случае для однородного поля тяжести (то есть вращение тела происходит под действием одной только силы тяжести $\vec{P}$) имеют вид \[ \left\{ \begin{aligned} A \dot p + (C - B) qr &= 0, \\ B \dot q + (A - C) pr &= 0, \\ C \dot r + (B - A) qp &= 0. \end{aligned} \right. \]
Введём управление $u = (u_1, u_2, u_3)$. Примем обозначения \[ \eta_1 = \frac{B - C}{CB}, \qquad \eta_2 = \frac{C - A}{AC}, \qquad \eta_3 = \frac{A - B}{AB}. \] Учитывая, что \[ \dot x_1 = A \dot p, \qquad \dot x_2 = B \dot q, \qquad \dot x_3 = C \dot r, \] перепишем динамические уравнения Эйлера в следующем виде: \[ \tag{18} \begin{aligned} \dot x_1 &= \eta_1 x_2 x_3 + u_1, \\ \dot x_2 &= \eta_2 x_1 x_3 + u_2, \\ \dot x_3 &= \eta_3 x_1 x_2 + u_3. \end{aligned} \] Здесь $u_1, u_2, u_3$ — проекции управляющего момента $\bvec{u}$ на соответствующие оси $O x_1 x_2 x_3$. На управление принято ограничение \[ \tag{19} \abs{u} = \sqrt{u_1^2 + u_2^2 + u_3^2} \leqslant b. \] В начальный момент времени $t_0 = 0$ задано начальное значение $x(0) = x_0$.
Требуется перейти в начало координат за кратчайшее время $T$.
Для решения поставленной задачи воспользуемся МДП. Согласно определению, функция Беллмана в рассматриваемой задаче имеет смысл минимума времени успокоения, то есть $B \gt 0$. Так как уравнения движения (18) и ограничения на управления (19) не зависят явно от времени, то время успокоения $T$ зависит только от $x(0)$ и не зависит от момента начала движения, следовательно, и $B$ тоже зависит только от $x(0)$, то есть \[ B = B(x), \implies \pd{B}{t} = 0. \] Так как подынтегральная функция $F_0 = 1$, то уравнение Беллмана запишется в виде \[ \begin{gather} \tag{20} \inf_{u: \; \abs{u} \leqslant b} \left[ \pd{B}{x_1} \eta_1 x_2 x_3 + \pd{B}{x_2} \eta_2 x_1 x_3 + \pd{B}{x_3} \eta_3 x_1 x_2 + \pd{B}{x_1} u_1 + \pd{B}{x_2} u_2 + \pd{B}{x_3} u_3 \right] = -1, \\ \tag{21} B(x(T)) = 0, \quad \text{т.к.} \quad \varphi_0 \equiv 0. \end{gather} \] Согласно алгоритму использования МДП, найдём значение $u(t, x, B)$, доставляющее минимум левой части (20). Так как первые три слагаемых не зависят от $u$, необходимо найти $u$, при котором достигается $\inf$ выражения \[ \tag{22} \pd{B}{x_1} u_1 + \pd{B}{x_2} u_2 + \pd{B}{x_3} u_3 = \dp{\vec{\nabla} B}{\vec{u}}, \qquad \abs{u} \leqslant b. \] При заданном $\vec{\nabla} B$ выражение достигает минимума, если $\abs{u} = b$, а сам вектор $u$ направлен противоположно градиенту, то есть \[ \tag{23} \vec{u} = - b \frac{\vec{\nabla} B}{\abs{\vec{\nabla} B}}. \] Подставим это выражение в уравнение Беллмана, учитывая, что \[ \begin{gathered} \abs{\vec{\nabla} B} = \sqrt{ \paren{ \pd{B}{x_1} }^2 + \paren{ \pd{B}{x_2} }^2 + \paren{ \pd{B}{x_3} }^2 }, \\ \dp{\vec{\nabla} B}{\vec{u}} = - \abs{\vec{\nabla} B} \abs{u} = - b \frac{\abs{\vec{\nabla} B}^2}{\abs{\vec{\nabla} B}}; \end{gathered} \] получаем, что \[ \tag{24} \pd{B}{x_1} \eta_1 x_2 x_3 + \pd{B}{x_2} \eta_2 x_1 x_3 + \pd{B}{x_3} \eta_3 x_1 x_2 - b \abs{\vec{\nabla} B} = -1. \]
Заметим, что $\eta_1 + \eta_2 + \eta_3 = 0$. Функцию $B(x)$ будем искать при выполнении условия \[ \pd{B}{x_i} = \psi(x) x_i, \] где $\psi(x)$ — некоторая непрерывная функция фазовых переменных. Тогда \[ \abs{\vec{\nabla} B} = \abs{\psi(x)} \sqrt{ x_1^2 + x_2^2 + x_3^2 }, \] а уравнение (24) принимает вид \[ \psi(x) x_1 x_2 x_3 \underbrace{\paren{ \eta_1 + \eta_2 + \eta_3 }}_{0} - b \abs{\psi(x)} \sqrt{ x_1^2 + x_2^2 + x_3^2 } = -1, \] откуда следует, что \[ b \abs{\psi(x)} \sqrt{ x_1^2 + x_2^2 + x_3^2 } = 1, \] или, иначе, \[ \abs{\psi(x)} = \frac{1}{b \sqrt{ x_1^2 + x_2^2 + x_3^2 }}. \] Учитывая, что $B \gt 0$, получаем, что \[ \pd{B}{x_i} = \frac{x_i}{b \sqrt{ x_1^2 + x_2^2 + x_3^2 }}, \] откуда следует, что \[ B = \frac{\sqrt{ x_1^2 + x_2^2 + x_3^2 }}{b}. \] Полученная функция обращается в 0 в конечной точке $x(T) = 0$, следовательно, $B(x)$ удовлетворяет граничному условию \[ B(x(T)) = 0. \]
Определим управление: \[ \begin{aligned} \vec{u} &= - b \frac{\vec{\nabla} B}{\abs{\vec{\nabla} B}} = \\ &= - \frac{bx}{\sqrt{ x_1^2 + x_2^2 + x_3^2 }} = \\ &= - \frac{bx}{\abs{x}}. \end{aligned} \] Минимальное время торможения равно \[ \min(T - t_0) = \min T = B(x(0)) = \frac{\sqrt{ x_1^2(0) + x_2^2(0) + x_3^2(0) }}{b}. \]
Таким образом, оптимальное гашение угловой скорости тела осуществляется управляющим моментом, направленным в обратную сторону кинетического момента, а не угловой скорости.