状態空間表現を用いた1次元倒立振子

May 12, 2022

状態空間表現を用いた，1次元フライホイール倒立振子の制御を説明します。

状態空間表現を用いた3次元倒立振子の製作での辺倒立の制御に用います。 3次元での理論を低次元化したものになります．

1. 運動方程式

物理変数を以下に示します。

物理変数
$m_b$	ボディの質量
$m_w$	ホイールの質量
$I_b$	ピボット点周りのボディの慣性モーメント
$I_w$	ホイール回転軸周りのホイールの慣性モーメント
$l_b$	ボディ重心とピボット点間の距離
$l_w$	ホイール回転軸とピボット点間の距離
$c_b$	ボディの回転動摩擦係数
$c_w$	ホイールの回転動摩擦係数
$i$	モータへの入力電流
$\tau$	ホイールに作用するモータトルク
$k_\tau$	モータのトルク定数
$\theta_b$	ピボット点周りのボディの回転角
$\dot\theta_w$	ホイールの回転速度

ピボット点周りのボディの運動方程式は次の通りです。

$$ (I_b + m_wl_w^2) \ddot\theta_b = (m_bl_b + m_wl_w)g\ \text{sin}\theta_b - (\tau - c_w\theta_w) - c_b\dot\theta_b $$

ホイール回転軸周りのホイールの運動方程式は次の通りです。

$$ I_w(\ddot\theta_b + \ddot\theta_w) = \tau -c_w\dot\theta_w $$

2. 状態方程式

2.1 非線形状態方程式

状態量を$\theta_b,\dot\theta_b,\dot\theta_w$とします。運動方程式より，$\ddot\theta_b,\ddot\theta_w$は次のようになります。

$$ \ddot\theta_b = \dfrac{(m_bl_b + m_wl_w)g\ \text{sin}\theta_b - (\tau - c_w\dot\theta_w) - c_b\dot\theta_b}{I_b + m_wl_w^2} $$

$$ \ddot\theta_w = \dfrac{(I_b + I_w + m_wl_w^2)(\tau - c_w\dot\theta_w)}{I_w(I_b + m_wl_w^2)} - \dfrac{(m_bl_b + m_wl_w)g\ \text{sin}\theta_b - c_b\dot\theta_b}{I_b + m_wl_w^2} $$

非線形状態方程式は以下のようになります。 $$ \dot x = f(x) + Bu $$

$$ \dot x=\left[ \begin{matrix} \dot\theta_b\\ \ddot\theta_b\\ \ddot\theta_w \end{matrix} \right],\quad u = i,\quad \tau = k_\tau u $$ $$ f(x)=\left[ \begin{matrix} \dot\theta_b\\ \dfrac{(m_bl_b + m_wl_w)g\ \text{sin}\theta_b + c_w\dot\theta_w - c_b\dot\theta_b}{I_b + m_wl_w^2}\\ -\dfrac{(I_b + I_w + m_wl_w^2)c_w\dot\theta_w}{I_w(I_b + m_wl_w^2)} - \dfrac{(m_bl_b + m_wl_w)g\ \text{sin}\theta_b - c_b\dot\theta_b}{I_b + m_wl_w^2} \end{matrix} \right]$$ $$ B=\left[ \begin{matrix} 0\\ -\dfrac{k_\tau}{I_b + m_wl_w^2}\\ \dfrac{k_\tau(I_b + I_w + m_wl_w^2)}{I_w(I_b + m_wl_w^2)} \end{matrix} \right] $$

2.2 線形化

$f(x)$を平衡点$x = 0$周りでテイラー展開で1次近似します。

$$ f(x)=Ax $$

$$ A=\left.\dfrac{\partial f}{\partial x}\right|_{x=0}= \left.\left[ \begin{matrix} \dfrac{\partial \dot\theta_b}{\partial \theta_b} & \dfrac{\partial \dot\theta_b}{\partial \dot\theta_b} & \dfrac{\partial \dot\theta_b}{\partial \dot\theta_w}\\ \dfrac{\partial \ddot\theta_b}{\partial \theta_b} & \dfrac{\partial \ddot\theta_b}{\partial \dot\theta_b} & \dfrac{\partial \ddot\theta_b}{\partial \dot\theta_w}\\ \dfrac{\partial \ddot\theta_w}{\partial \theta_b} & \dfrac{\partial \ddot\theta_w}{\partial \dot\theta_b} & \dfrac{\partial \ddot\theta_w}{\partial \dot\theta_w}\\ \end{matrix} \right]\right|_{x=0}= \left[ \begin{matrix} 0 & 1 & 0 \\ \dfrac{(m_bl_b + m_wl_w)g}{I_b + m_wl_w^2} & -\dfrac{c_b}{I_b + m_wl_w^2} & \dfrac{c_w}{I_b + m_wl_w^2}\\ -\dfrac{(m_bl_b + m_wl_w)g}{I_b + m_wl_w^2} & \dfrac{c_b}{I_b + m_wl_w^2} & -\dfrac{c_w(I_b + I_w + m_wl_w^2)}{I_b + m_wl_w^2} \end{matrix} \right] $$

よって線形状態方程式は $$\dot x = Ax + Bu$$ となり，システムは可制御です。

また，出力方程式は

$$ y=Cx $$

$$ C= \left[ \begin{matrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{matrix} \right] $$

となり，システムは可観測です。

2.3 離散化

0次ホールドで離散化します。制御周期は$t_s$とします。

$$ x_{k+1} = A_dx_k + B_du_k $$

$$ y_k = C_dx_k $$

$$ A_d=e^{At_s},\quad B_d = \int_{0}^{t_s} e^{At}dtB,\quad C_d = C $$

3. 最適制御

離散時間LQRの最適制御を設計します。

$$u_k = -K_dx_k$$

4. $\theta_b, \dot\theta_b$の推定

3次元倒立振子での姿勢推定を用います。ピッチ角$\theta$あるいはロール角$\phi$が$\theta_b$に対応します。

5. 実機実験

今後追記します。