四脚ロボットのためのサッカー行動設計
(新井教授・湯浅助教授)
RoboCup(ロボットサッカー世界大会)は,実世界で動くロボットの知能を考えるための標準問題である.東京大学チーム“ARAIBO”はその中のSONY Four-Legged Robot Leagueに,1999年から毎年参加している.
ロボットサッカーでは,情報(自己位置等)を実時間で得る必要があり,それらの情報が曖昧なまま行動決定するためのアルゴリズム研究が行われている.当チームでは,情報の曖昧さを考慮した動的計画法を,ロボットが最短時間で,攻撃に適した方向からボールに近づくというタスクに対して適用した.この問題では,歩行は目的地に近づく反面,自己位置を曖昧にし,観測行動は自己位置の曖昧さを減らす反面,時間を消費するため,ロボットは,観測行動を的確な時に行う必要がある.そこで,状態空間に自己位置の情報の曖昧さを表す一次元を加え(Fig.1),一つの行動にかかる時間を負の報酬として,オフライン(PC上)で動的計画法を解き,現在の状態から,選択すべき行動を求めるための状態-行動マップを得た.
マップは,巨大な多次元配列であるため,PCからロボットのメモリに移すためにベクトル量子化によって圧縮した.圧縮に用いる歪み測度には,圧縮によるマップの最適性の損失(到達時間の増加)を抑えるため,行動をとった後の状態価値の差を用いた(Fig.2).
Fig.3は,ロボットが,マップに基づいてボールへ近づいている様子を示している.ロボットは,一度観測を行ったのみで,正しい方向からボールに接近した.この例のように,ロボットの自己位置がかなり曖昧であってもタスクに支障がない場合,マップが無駄な観測行動を抑制することを確認した.
Keywords: RoboCup, Quadruped Robots, Soccer Behavior
References
Takeshi Fukase, Yuichi Kobayashi, Ryuichi Ueda, Takanobu Kawabe and Tamio Arai: “Real-time Decision Making under Uncertainty of Self-Localization Results,”The RoboCup 2002 International Symposium.
Fig.1State transition in
the extended state space
上田隆一,小林祐一,深瀬武,新井民夫,湯浅秀男,太田順:“一様分布に基づく高速モンテカルロ自己位置同定”,第19回日本ロボット学会学術講演会公演論文集,pp.1007-1008,2001.
Fig.2 The difference of
action-value
Fig.3 An
example of experiments