t - 生体運動制御システム研究室

topics
• 
• 
• 
• 
計算論的神経科学とは�
運動制御に関わる脳・筋肉の生理学的知見�
ニューロンモデル・単純パーセプトロン�
生体における運動学習制御のための学習モデル
–  教師あり学習
–  逆モデル学習�
•  ヒト腕運動の運動計画
–  運動の滑らかさに関する最適化モデル
–  運動のばらつきを基にしたモデル
•  ヒトの指の運動について�
ヒト腕の随意運動のための�
計算問題�
•  2点間到達運動における3つの計算問題�
–  軌道計画�
–  座標変換�
–  制御�
•  ヒトはどのような軌道を選んでいるのか？�
ヒト腕の随意運動の軌道計画�
•  随意運動：自分の意志に従って行なわれた運動�
–  手を目標物へ移動させる到達運動�
–  物を手で掴む把持運動�
–  字を書くための書字運動�
反射運動
自動運動
ヒトの腕の随意運動の特徴�
•  フィッツの法則 ��
(Fitts, 1954)
早い運動は不正確で
ゆっくりした運動は正確
という関係を定量的に
表す�
MT�
D
W
: 運動時間
: 運動距離
: 運動目標の幅�
•  1/3乗則��
(Lacquaniti et al.,1993)
曲線運動で、カーブの
きつい所は遅く、緩い所
は早いという関係を定
量的に表す�
v(t)
ρ(t)
k
: 接線速度
: 曲率半径
: 定数�
2点間到達運動�
水平面内で行われるある点からある点まで
手を伸ばす運動�
実現可能な軌道（手先の軌跡や速度のプロファ
イル）は無限にある�
2点間到達運動の計測実験�
•  水平面内、2関節の腕
の到達運動を計測�
手先軌跡
–  Morasso(1981)
–  Abend(1982) •  普遍的な特徴を見出す�
ü 手先の軌跡はほぼ直線�
ü 手先の速度は1つの�
ピークをもつベル型�
なぜこのような特徴をもつ
軌道になるのか？
接線速度
加速度
腕運動の滑らかさを考慮した
運動計画モデル�
始点と終点を結ぶ軌道の中で、ある評価関数を
最小にする軌道を選んでいる�
•  躍度最小モデル
CJ =
1
2
Z
tf
0
•  トルク変化最小モデル
Flash & Hogan(1985)
�
(
)
✓
3
d x
dt3
◆2
+
✓
3
d y
dt3
◆2
dt ! min
Uno et.al (1988)�
C⌧ =
1
2
Z
tf
0
(✓
d⌧s
dt
◆2
+
✓
d⌧e
dt
ヒト腕の運動の特徴を良く再現する�
最適化関数の目的が不明�
なぜ滑らかな軌道が好ましいのか？�
◆2 )
dt ! min
終端誤差分散最小モデル�
Harris & Wolpert(1998)
•  なぜヒトの運動はばらつくのか？�
–  まったく同じ運動を繰り返すことはできない�
�
•  運動指令にノイズがのっているから�
–  そのため、運動の終端も正確に到達できない�
–  それでも、なるべく正確に到達したい
ノイズの性質が運動の正確性に影響�
信号依存性ノイズ
Signal Dependent Noise(SDN)
•  運動指令に正規分布のノイズが加わる
•  ノイズの分散が元の信号の振幅の2乗に
比例すると仮定
一般的なガウスノイズは振幅は一定�
u(t)
uout (t)
noise(t)
：本来の運動指令
：実際に筋肉に加わる運動指令
：信号依存性ノイズ
信号依存性ノイズ
Signal Dependent Noise(SDN)
•  運動指令が小さい
⇒ノイズが小さい
⇒運動が意図した
��通りに行われやすい
•  運動指令が大きい
⇒ノイズが大きい
⇒運動が意図から
��外れやすい�
終端誤差分散最小モデル
•  仮定の下では終端の分散を小さくするため
には、運動指令をなるべく小さくした方が
良い�
•  結果的にトルク変化を小さくするような��
滑らかな軌道を生成�
終端誤差分散最小モデル�
Harris & Wolpert(1998)
運動指令依存ノイズの仮
定のもとに、終端の分散
が最小になるような軌道
を計画
i : 試行回数
ˆ (t) : 終端目標位置
x
2点間到達運動ではトルク
変化最小軌道のように、ヒ
ト腕運動を良く再現する
終端誤差分散最小モデル�
Harris & Wolpert(1998)
腕が描く楕円軌道を予測すると、1/3乗則と一致
ジャーク最小軌道、トルク変化最小軌道と同様
v(t)
ρ(t)
k
: 接線速度
: 曲率半径
: 定数�
終端誤差分散最小モデル
急速眼球運動（サッケード）
の運動パターンも再現可能�
眼球の回転角が大きくなる
と運動の対称性が崩れる
トルク変化最小モデルでは
再現不可能�
For arm movements, the required accuracy varies with the task, as
for example in the difference between pointing to someone in a
room compared with threading a needle. When pointing at targets,
it is empirically observed that movement duration increases with
the accuracy demanded by the task. This relationship is captured
empirically by Fitt’s law, in which the required accuracy is determined by the width of the target (Fig. 4a). For any given movement
imum-variance solutions duration, signal-dependent noise places a lower limit on the final
tures of natural saccadic positional variance given by the minimum-variance trajectory.
movements and asym- Conversely, given a movement accuracy constraint, specified in
4
. terms of final positional variance, there is a minimum duration of
ded deceleration phase
トルク変化最小モデルなどはばらつきは考慮しない�
ptimal trajectories capture movement which can achieve this. We propose that this minimum
mpirically (Fig. 2c). The duration trajectory will
of the final
MT�the limits
: 運動時間
A be chosen, given
rise time for all saccades
endpoint
a linear
MT =
a + bvariance
log2 imposed by the task.
A By assuming
: 運動距離
saccade amplitudes above relationship between the
Wrequired final endpoint standard deviation
W
: 運動目標の幅�
lly. Although it has been
a
Observed
Predicted
b
m limits on the control
800
800
predicts this saturation
rajectories for amplitudes
700
700
dest changes in the time
600
600
parameters had a much
al position, it is necessary
ment period. The miniooth symmetric velocity
rofile produced by bangin qualitative agreement
st motoneuronal firing
終端誤差分散最小モデル
Parametric
sensitivity
250
200
150
100
0
0
500
400
300
200
100
0
50
100 200
Movement duration (ms)
c
Movement duration (ms)
Fittsの法則とも一致
2
4
Log2(2A/W)
6
500
400
300
200
100
0
2
4
Log2(2A/W)
6
最適フィードバック制御モデル
Todorov(2002)�
•  最適フィードバック制御とカルマンフィルタを組み
合わせた制御モデル
•  信号依存性ノイズの影響を最小にし、目標のタ
スクを行うように制御
•  事前の軌道計画は不必要
最適制御とは�
•  制御理論
–  古典制御
•  線形システムの入出力に注目
•  入力信号u(t)、出力信号y(t)をラプラス変換した
U(s), Y(s)の比である伝達関数G(s) = Y(s)/U(s)でシ
ステムを表現
–  現代制御
•  入出力だけではなく、システムの状態を表現する
状態変数を導入
•  システムの特性を状態変数の連立の1次微分方程
式で表現
古典制御でのシステムの表現�
•  ダンパ・質量・ばね系�
バネとダンパでつながれた物体の運動方程式
d2 y(t)
dy(t)
u(t) = M
+B
+ Ky(t)
2
dt
dt
u(t)�
ラプラス変換をする�
U (s) = M s2 Y (s) + BsY (s) + KY (s)
y(t)�
= (M s2 + Bs + K)Y (s)
Y (s)
G(s) =
U (s)
=
1
M s2 + Bs + K
伝達関数�
伝達関数の極などの解析によって制御システムを設計�
現代制御でのシステムの表現�
•  ダンパ・質量・ばね系
d2 y(t)
dy(t)
u(t) = M
+B
+ Ky(t)
2
dt
dt
状態変数として x1 (t) = y(t) と x2 (t) = y(t)
˙
d
x1 (t) = y(t)
˙ = x2 (t)
dt
d
B
K
1
x2 (t) = y¨(t) =
y(t)
˙
y(t) +
u(t)
dt
M
M
M
K
B
1
=
x1 (t)
x2 (t) +
u(t)
M
M
M
u(t)�
y(t)�
y(t) =
1 0
出力方程式�
x1 (t)
x2 (t)
d
dt
x1 (t)
x2 (t)
=
状態方程式�
0
K
M
1
B
M
x1 (t)
x2 (t)
+
0
1
M
u(t)
状態変数表現�
システムをn階の微分方程式で表すより連立
1階常微分方程式で記述し、微分方程式を
一般的に求める�
d
x(t) = Ax(t) + Bu(t)
dt
y(t) = Cx(t) + Du(t)
x:状態変数（n次元ベクトル）
u:入力（m次元ベクトル）
y:出力（l次元ベクトル）
A:n×n行列
B:n×m行列
C: l×n行列
D: l×m行列
状態変数の取り方は一意でない�
状態方程式の解�
˙
x(t)
= Ax(t) + Bu(t)
y(t) = Cx(t) + Du(t)
t
x(t) = eAt x(0) +
eA(t
)
Bu( )d
0
e
At
1 2 2
= In + At + A t + · · ·
2!
1 k k
=
A t
eAt：状態推移行列�
k!
k=0
t
y(t) = CeAt x(0) +
CeA(t
0
零入力応答（u(t)=0)
)
Bu( )d + Du(t)
零状態応答x(0)=0
例題
状態方程式
0
˙
x(t)
=
6
出力方程式�
y(t) =
1
0
x(0) =
u(t) = 1
1
5
x(t) +
0
1
u(t)
T
x(t)
0
零状態応答�
0
(t
0)
ステップ応答�
例題
0
A=
1
6
| I
5
の固有値、固有ベクトルを求める�
A| = ( + 5) + 6 =
2
+5 +6
= ( + 2)( + 3)
固有値は−2, −3。それぞれに対応する固有ベクトルを求めると�
1
2
T =
,
1
2
1
3
1
3
,
=
2
0
0
3
とすると
例題
A=T T
1
Ak = (T T
1
=
e
At
2
1 k
) =T
1
3
=
=
1 k k
A t =
k!
=T
k=0
1
( 2)
0
k=0
1
3
k
1
T
k!
( 2)k tk
0
k
0
0
1
3
1
k!
T
2
1
2
k=0
k
k
1
2
0
( 3)k
T
1
3
k
3
2
1 k
t
0
( 3)k tk
T
1
1
1
例題
e
At
1
k=0 k! (
=T
2t)k
0
0
1
3
2t
=
1
2
e
=
3e 2t 2e 3t
6e 2t + 6e 3t
0
e
1
k=0 k! (
3t)k
0
3
2
3t
e 2t e 3t
2e 2t + 3e 3t
T
1
1
1
例題
t
y(t) =
1
0
e
A(t
0
)
u( )d
1
0
t
=
(3e
2(t
)
2e
3(t
)
)u( )d
0
0
=
(e
2s
e
3s
)u(t
s)d
(s = t
)
t
1
1
2s 0
3s
=
e
e
t
2
3
1
1
2t
=
1 e
1
2
3
1 1 2t 1 3t
=
e
+ e
6 2
3
0
t
e
3t
システムが安定なのは
Aの固有値がすべて負
であること�
時間領域での制御系の設計�
•  状態フィードバック制御則
–  状態変数にある適当なゲインを乗じて制御入
力を決定
u(t) = Kx(t)
˙
x(t)
= Ax(t) + Bu(t) = (A BK)x(t)
•  A−BFの固有値を望ましい値になるように
Kを決定する→極配置法
•  どんな場合でも任意の位置に配置できる
か？→NO
可制御の概念
可制御�
•  任意の初期時刻t0に対して状態がx0にある
とき、有限時間t1において任意の状態x1に
システムをもっていくような入力u(t)が存在
すること。行列A,Bによって決定
•  極配置により任意の初期状態を原点に近
づけるような制御系＝レギュレータ�
可観測�
•  入力が既知であるシステムにおいて、初期
時刻t0から任意の時刻t1までの出力y(t)を
観測することによって初期状態x0の状態が
一意に決定できるとき、可観測
•  x0がわかれば任意の時刻の状態を知ることが
できる
•  行列A,Cで決定
•  状態を推定する機構を制御系に加える
→オブザーバー�
最適制御�
•  フィードバック制御によって制御するシステムが多入
力の場合、フィードバックゲインが無数存在する(不
良設定問題)与えられた制御目標に加えて、ある評
価関数を最小にする制御入力を求める
•  通常は制御入力に関する評価関数を加える
1
J(x0 ) =
2
xT Qx + uT Ru dt
0
Q, Rは適当な次元の定数行列、
Qは準正定行列、Rは正定行列�
•  特に、制御量を一定に保つ定値制御が目的である
場合を最適レギュレータ問題�
最適レギュレータ問題の解�
リカッチ(Riccati)方程式
AT P + P A P BR 1 B T P + Q = 0
この式を満たすn×nの対称行列Pが存在し、さらに
K0 = R 1 B T P とおくと
u(t) = K0 x(t) を用いた閉ループ系
x(t)
˙
= (A BK0 )x(t) が安定になるならば、
この制御ゲイン K0 を使った閉ループ制御系が
評価関数を最小にする
Pは数値的に解く�
カルマンフィルタ�
•  状態方程式で表されたシステムの制御系設計で
は状態変数のフィードバックが重要
•  出力の観測値から実時間の状態推定値を得るオ
ブザーバ（状態観測器）が重要
•  センサによって得られる出力信号は雑音を含む
–  雑音の除去はフィルタ
•  誤差の2乗和平均値が最小になる推定器
–  最適フィルタリング問題
•  状態方程式で表された最適フィルタをカルマン
フィルタ
カルマンフィルタ�
•  ウィナーのフィルタ理論をカルマンフィルタを
状態空間に展開
•  雑音除去だけでなく、一部の状態から全状
態を推定するオブザーバ機能を合わせもつ
カルマンフィルタの構成�
•  システムの状態方程式
˙
x(t)
= Ax(t) + w,
x(t0 ) = x0
初期値x0は次を満たす確率変数
E [x0 ] = x0 ,
E (x0 x0 )(x0
x 0 ) T = S0
wは雑音。平均値、共分散は
E [w(t)] = 0,
E (w(t)wT ( ) = W (t
)
•  観測ベクトル
y(t) = Cx(t) + v
vも雑音�
E [v(t)] = 0,
E (v(t)vT ( ) = V (t
)
カルマンフィルタの構成�
wとvとx0は相互に独立と仮定
ˆ (t) とするとき、
状態ベクトル x(t) の推定値を x
ˆ (t) の 2 次形式の平均値
推定誤差 e(t) = x(t) x
T
J
=
E
e(t)
M e(t)
e
を最小とする推定機構を与えるものが
カルマンフィルタ
定常状態ではゲイン行列は定数行列�
ˆ˙ (t) = Aˆ
x
x(t) + L (y
ˆ) ,
Cx
ˆ (t0 ) = x
ˆ0
x
カルマンフィルタゲイン�
•  定数行列の定常カルマンフィルタゲインは
L = SC T V
1
•  n×n行列Sは次のリカッチ代数方程式の正
定解
AS + SAT + W
SC T V
1
CS = 0
•  カルマンフィルタの推定行列eは次式の解
e˙ = (A
LC) e + w
Lv
最適レギュレータとカルマンフィルタ
の双対性�
•  最適レギュレータとカルマンフィルタの係
数行列、ゲインに対応関係�
最適レギュレータ問題�
最適フィルタリング問題
A��システム行列�
AT �システム行列�
B �入力行列�
CT �観測行列�
Q �状態の重み行列�
W �システム雑音共分散�
R �制御の重み行列�
V ��観測雑音共分散�
K �最適レギュレータゲイン�
LT� 最適フィルタゲイン�
カルマンフィルタを含む
最適レギュレータ�
•  状態ベクトルx(t)を直接観測できず、観測
方程式の出力y(t)のみが得られる場合の
最適制御則
–  状態ベクトルの真値の代わりにカルマンフィル
タの出力を使う
カルマンフィルタを併合した
最適レギュレータ�
•  確率的な外乱や雑音の影響を受ける制御
系の最適制御を考える
状態方程式
˙
x(t)
= Ax(t) + Bu(t) + w,
初期値の仮定
E [x0 ] = 0,
x(t0 ) = x0
E x0 x0 T = X0
システム雑音の仮定�
E [w(t)] = 0,
E (w(t)wT ( ) = W (t
)
カルマンフィルタを併合した
最適レギュレータ�
観測ベクトルを与える観測方程式
y(t) = Cx(t) + v
観測雑音の仮定
E [v(t)] = 0,
E (v(t)vT ( ) = V (t
wとvとx0は相互に独立と仮定
評価関数は定常状態であることを考えると
1
1
J(x0 ) = lim
E
xT Qx + uT Ru dt
tf
tf
2 0
1
= E xT Qx + uT Ru
2
)
カルマンフィルタを併合した
最適レギュレータ�
評価関数を最小化する制御入力は
u (t) =
Kx(t)
K=R
1
BT P
ただし、行列Pはリカッチ方程式の正定解
AT P + P A P BR 1 B T P + Q = 0
このときの評価関数の値は
1
Js = tr [P W ]
2
カルマンフィルタを含む
最適レギュレータ�
ˆ (t) を与えるカルマンフィルタは
状態推定値 x
ˆ˙ (t) = Aˆ
x
x(t) + Bu(t) + L (y
ˆ (t0 ) = 0
x
ˆ (t))
Cx
最適ゲインおよびカルマンフィルタゲインは�
K=R
1
BT P
L = SC T V 1
リカッチ方程式は�
0 = AT P + P A
P BR
0 = AS + SAT + W
1
BT P + Q
SC T V
1
CS
カルマンフィルタを含む
最適レギュレータ�
•  状態が直接測定できない場合の最適制御
の問題が、状態が直接測定できるときの最
適制御問題と最適状態推定の問題の二つ
の問題に分離できる
��→�分離定理
•  最適な制御入力は
u (t) =
Kx(t)
•  そのときの評価関数の値は�
1
Js = tr P W + K T RKS
2
最適フィードバック制御モデル
Todorov(2002)�
•  最適フィードバック制御とカルマンフィルタを組み
合わせた制御モデル
•  信号依存性ノイズの影響を最小にし、目標のタ
スクを行うように制御
逆ダイナミクスの解き方�
•  順モデルを用いる方法�
ü  順モデル：制御対象と同じ入出力をもつモデル�
目標位置�
目標軌道�
+
−
予測軌道�
制御器
運動指令�
制御対象
実現軌道�
順モデル
•  逆モデルを用いる方法�
ü  逆モデル：制御対象と入出力が逆であるモデル�
目標軌道�
制御器
運動指令�
制御対象
実現軌道�
複雑なダイナミクス方程式を脳が解いているのか？�
59�
ばらつきが経由点
付近で極小になる�
実際のヒトの運動の
ばらつきより小さい�
適切なSDNは？�
信号強度依存
ノイズを大きくする�
l  運動のばらつきが
大きくなる
l  運動の再現性が
向上する
トレードオフ�
運動制御が
不安定になる�
l  制御が安定し、ばらつきの大きさを含めて運動を
再現できる適切な信号強度依存ノイズの調査
ヒト腕の到達運動の計測実験�
•  計測環境�
monitor�
モニタを水平に置いて
始点、経由点、終点を
提示�
Via
point�
marker�
O
P
T
O
T
R
A
K�
End
point�
Start
point�
サンプリング周期
100[Hz]で計測�
原点位置�
sitting subject�
運動条件�
運動時間[ms]�
経由点0個� 経由点1個� 経由点2個� 経由点3個�
500�
600�
750�
1520�
ヒト腕の到達運動の計測実験�
•  始点、経由点、終点の配置(原点：肩位置)�
経由点0個�
Start point
(-0.25,0.32)
Via point1
(-0.17,0.44)
End point
(0.15,0.32)
Via point2
(0.03,0.20)
経由点1個�
End point
(0.11,0.32)
Start point
(-0.25,0.32)
経由点3個�
経由点2個�
End point
(0.11,0.32)
Start point
(-0.25,0.32)
Via point1
(-0.07,0.42)
Via point1
(-0.15,0.37)
Start point
(-0.25,0.32)
Via point3
(0.05,0.37)
Via point2
(-0.05,0.32)
End point
(0.15,0.32)
ヒト腕到達運動の再現実験�
制御対象の予測モデル�
フィードバックに
おける時間遅れ�
信号強度依存ノイズ()
σu：ノイズパラメータ�
px/y (t) : 手先位置 p˙ x/y (t) : 手先速度 fx/y (t) : 手先の力
ux/y (t) : 運動指令 1/2,t (t) : 平均 0、分散 1 の正規乱数
m : 手先の質量
: フィードバックの時定数
t : ステップ幅
ヒト腕到達運動の再現実験� 𝝈↑𝟐 [𝒘]= 𝝈↓𝒖
信号強度依存ノイズ�
p と u 両方の値を変えて
シミュレーションを行う
p
2
[w] = u |u|
↑𝒑 �
pと
u
両方の値を変えて
シミュレーションを行う
手先の力�
べき乗数𝑝について変形�
ヒト腕到達運動の再現実験�
実験条件�
•  σu = 0.4, 1.0, 1.2, 1.4, 1.6, 2.0, 4.0
•  p = 1.0, 1.5, 2.0, 2.5, 3.0
•  計算回数：20回�
l  指定した始点、経由点、終点を通過する運動を再現
l  シミュレーション上の運動時間は計測結果に合わせた�
66�
SDNの振幅を増やした実験�
0.5
0.45
経由点0個�
0.5
0.35
0.4
0.3
0.35
0.25
0.3
0.2
-0.3
-0.2
-0.1
0
0.1
経由点1個�
0.45
Y[m]
Y[m]
0.4
0.55
average measured trajectory
s u =0.4
s u =1.0
s u =1.2
s u =1.4
s u =1.6
s u =2.0
s u =4.0
start and end point
0.25
-0.3
0.2
-0.2
0.5
経由点2個�
0.45
Y[m]
0.4
0.35
average measured trajectory
s u =0.4
s u =1.0
s u =1.2
s u =1.4
s u =1.6
s u =2.0
s u =4.0
start and end point
via point
0.44
0.42
経由点3個�
0.4
0.38
0.1
0.2
再現できない�
average measured trajectory
s u =0.4
s u =1.0
s u =1.2
s u =1.4
s u =1.6
s u =2.0
s u =4.0
start and end point
via point
0.36
0.3
0.25
0.34
0.2
0.32
0.15
-0.3
0
X[m]
Y[m]
0.55
average measured trajectory
s u =0.4
s u =1.0
s u =1.2
s u =1.4
s u =1.6
s u =2.0
s u =4.0
start and end point
via point
-0.1
X[m]
Measured trajectory�
u =0.4
u =1.0
u =1.2
u =1.4
u =1.6
u =2.0
u =4.0
-0.2
-0.1
0
X[m]
0.1
0.2
0.3
-0.3
-0.2
-0.1
0
X[m]
0.1
0.2
-3
2
2
2
variance[m
] ]2 variance[m
2variance[m
2
2
variance[m
] ]2 variance[m
2variance[m
2
]
]] variance[m
]
]
] variance[m
]variance[m
] variance[m
iance[m
] variance[m
variance[m
]variance[m
-3
1.5×10 -3
2.0×10
-3
1.0×10 -3
1.5×
10
-3 -3
2.0×
10 -3 -3
2
2
2
2
2.0×
1010
1.5×
2.0×
10
経由点0個�
-3
-3
1.0×
1.5×
1010 -3
1.5×
10-3
u
-4
0
-3
-3
0
0.0×10-4-4 0
5.0×
10
0.0×
10
5.0×
10
-3
-3
1.0×
1010 -3
1.0×
-3
0
u
u
u
u
u
u
u
0
0.1
0
0
0.1
0
0.0×
10-40
0.0×
10
5.0×10 -30-4
1.0×1010 00
5.0×
0.0×
10
u
u
0
-4
u
u
-3
0.0×10-4
5.0×
10
-3
5.0×
1.0×10
10
u
u
2.0×10
-4
5.0×
10 -3
1.0×
10
1.0×10-3-3 -3
1.5×
1010
1.0×
1.5×
10
-3
2.0×10 -3
2.0×10
5.0×
10 -4
-3
5.0×
1.0×10
10-3
1.5×10 -3
2.0×100
0.0×
10
0.0×
10-4
0.1
5.0×10-3-30-4
1.0×
1010
0.1
5.0×
1.0×
10
-3 0
1.5×
10
-3 -3
2.0×
10 10
2.0×
1.5×
10
0
-4 経由点2個�
0.0×
10
5.0×10-3
-3 0
0.1
1.0×
1.5×
1010
1.5×
10
1.5×1010
1.0×
s u=0.4
s u=1.0
s u=1.2
measured trajectory
ssuu=1.4
=0.4
ssuu=1.6
=1.0
measured trajectory
ssuu=2.0
=1.2 measured trajectory
ss u=4.0
=0.4
suu=1.4
s u=0.4
s u=1.0
s u=1.6
s u=1.0
measured trajectory
s u=1.2
measured trajectory
s u=2.0
s u=1.2
=0.4
=1.4
uu=4.0
s uss=0.4
s u=1.4
u
=1.0 u
s uu=1.6
measured trajectory
s u=1.0
s =0.4
s u=1.6
measured trajectory
s =1.0
=1.2
s uu=2.0
s =1.2
u
s u=2.0
s uss=1.2
=0.4
s =1.4
u=4.0
=1.4
u
u
s =1.6
measured trajectory
s u=4.0
s uss=1.4
s =2.0
u=1.0
u=1.6 u
s =4.0
s us=0.4
s us=1.6
u=1.2
u=2.0
s us=1.0
uu=1.4
=4.0 u
s us=2.0
measured trajectory
s us=1.2
u=1.6
s u=0.4
=4.0
s us=1.4
measured trajectory
u=2.0 u
s u=1.0
s u=0.4
s us=1.6
u=4.0
s
=1.2
measured trajectory
s u=1.0
s uu=2.0 u
ss u=1.4
=0.4
u 0.8
s u=1.2
0.3
0.4
0.5measured 0.6 trajectory
0.7 s u=4.0
u
=1.6
s
=1.0
0.2time[sec]0.3
0.4 s u=0.4 u 0.5
0.6 s u=1.4
s u=1.2
=2.0
s u=1.6
measured trajectory
s =1.0s u=1.4
time[sec]
s =0.4u
uu=4.0
s
measured trajectory
s =1.0
s u=2.0
s u=1.2ss u=0.4
=1.6
s =1.2
u
s =1.4
0.2
0.3
0.4
0.5
0.6 s u=4.0
s =2.0
ヒト腕到達運動の再現実験�
-3
1.5×10 -3
2.0×10 -3
2.0×10
0.2
0.1
0.1
0.4
time[sec]
0.6
0.2
0.30.8
0.2
time[sec] 0.3
2
2 2
2 22
2
2
2
2
2 variance[m
2
variance[mvariance[m
]]
2variance[m
] ] ] variance[m
variance[m
] variance[m
]
riance[m
] 2
]
variance[m
variance[m
]variance[m
] 2]variance[m
]
] variance[m
variance[m
ariance[m
]
2.0×10
s u=0.4
-3
s u=1.0
2.0×10
s u=1.2
measured trajectory
ssuu=1.4
=0.4
-3
1.5×10 -3
ssuu=1.6
=1.0 2.0×10 -3
2.0×10
measured trajectory
ssuu=2.0
=1.2 measured trajectory
=0.4
sssuuu=4.0
=1.4
-3
s u=0.4
10-3-3
s u=1.0 1.5×
2.0×
10
s u=1.6 1.0×
10
s u=1.0
measured trajectory
s u=1.2
s u=2.0
s u=1.2
-3
=0.4
s =1.4
10 -3
s uuu=4.0 1.0×
1.5×
10 -3 -3
s u=1.4
10
=1.0 2.0×
s uu=1.6
2.0×
1010
1.5×
measured trajectory
s =0.4
s u=1.6
measured trajectory
measured trajectory
suu=2.0
=1.2
s =1.0
-3
s =1.2
s u=2.0
=0.4
1.0×
1100-4-3-3
sssuu=0.4
s =1.4
=1.4 1.5×
=4.0
1.0×
10
8.0×
1
0
u
u
s =1.6
1.5×10
s u=4.0
=1.0
sssuu=1.0
s =2.0
=1.6
u
s =4.0
=1.2
sssuu=1.2
-3
-4
measured trajectory
u=2.0 5.0×
10
-3
1.0×
1
0
1.0×
10
=1.4
1.0×10 -3 -3
sssuuu=1.4
=0.4
=4.0 1.0×
1.5×1010
-4 -3
=1.6
sssuuu=1.6
=1.0 2.0×
8.0×110
0-4
measured trajectory
=2.0
sssuuu=2.0
=1.2 5.0×
6.0×
10 -4-3
10
measured trajectory
5.0×
10
sss u=4.0
=0.4
1.0×
10-3
10
suuu=4.0
=1.4 1.0×
s u=0.4
-4-3
s u=1.0 8.0×
1
0
s u=1.6 1.0×10 0
s u=1.0
10
measured trajectory
s =1.2 0.0×
0.0×
10-4-4 0
0.2
0.3
0.4
0.5
0.1
0.2
s uu0.6
=2.0 5.0×
10 -3 -4
s u=1.2
6.0×
1
0
1.0×
10
=0.4
s0.5
=1.4
0.2time[sec] 0.3
0.4
0.6
0
0.1
5.0×
10
-3
s uuu=4.0 1.5×10
s u=1.4
-4-4
-3
1.0×
10
s
=1.0
8.0×10
4.0×
1
0
measured trajectory
uu=1.6 1.0×
time[sec] measured trajectory
s u=1.6
s =0.4
=1.2 0.0×10-4-40
s uu=2.0
s =1.0
5.0×
6.0×
110
0 -4
s u=2.0
s =1.2
ss u=4.0
=0.4
8.0×
10
=1.4
8.0×
1
0
s =1.4
0.2
0.3
0.4
0.5
0.6
0
0.1
u
u
s =1.6
s u=4.0
s
=1.0
-4
s =2.0
s u =1.6 4.0×10 0
-4
time[sec] s =4.0 ss uu=1.2
-4
6.0×
10 10
0.0×
-4 0
6.0×
10
10
5.0×
10
u=2.0 8.0×
0.0×
10
-4
0.2
0.3
0.4
0.6-3 0
ss0.5
0.1
1.0×
10
2.0×
1
0
uu=1.4
=4.0
0.1
0.2
0.3 s =1.6 4.0×100.4
0 0.5
-4
4.0×10 -4
u
time[sec]
0
s
=2.0
0.0×
6.0×
1010-4
time[sec]
u
-4
101
2.0×
-4
0.2
0.3
0.4
4.0×
1000.6
0
0.1
s u0.5
=4.0 2.0×
6.0×
10
-3
-3
-3
-4
0
-3
-4
-4
-4
1
0.4
0.4
00
0.0×
0.0×
110
0-4 -40
0
2.0×110
00.6
0.5 5.0×
0.6 00
0.5
-4
-4
1.2
4.0×10
10-40
2.0×
u
u
u
u
u
u
u
経由点3個�
u
ばらつきが
s u=1.4s uu=1.0
s =4.0計測データ
s u=1.6s uu=1.2
0.4 s u=2.0s u=1.4
0.5に近づく�
0.6
u
u
u
time[sec]
0.2
0.3
0.1 0.6 0.2
time[sec]
0.2
0.3
s u =1.6
s u =2.0
s u =4.0
0.3s =1.6
s u=4.0 u
0.4
s u=2.0
time[sec]
0.4 s u=4.0
0.5
0.6
time[sec]
1.5
2
0.1 0.5 0.2
0.3
0.4 1.5 0.5
time[sec] 1
20.6
-4
0.0×
10
Measured trajectory�
=0.4
経由点1個�
=1.0
=1.2
=1.4
=1.6
=2.0
=4.0
0.5
1
0.5
0
終端誤差分散最小モデル
最適制御モデル�
•  信号依存性ノイズ(SDN)が前提
–  実験的にもいくつかの根拠はある
•  評価関数の目的が明確�
•  複雑な計算が不要�
•  運動終端の誤差は運動の度に得られるので、
最適軌道を学習するのが容易
•  運動のばらつきの主要因がSDNか？�
–  最も単純な到達運動でも結論がでているわけ
ではない
定期試験�
•  8月5日（火）�14：40〜 A2-101�
•  授業資料・ノートの持ち込み可�
–  参考書は×。頑張ってコピーしてきた場合はO.K.
–  3択問題（簡単な計算を必要とする問題も含む）
–  論述問題�

Download Report