Emergent Behavior −創発的行動 −

近年,ロボットはより複雑,多様で動的な環境において動作することが求められるようになってきており,複雑な環境の変化や多様な作業要求に適応できるシステムの柔軟性,拡張性,耐故障性などが要求されてきている.従来のロボット工学においては,環境やロボットに関する明示的なモデルに基づき,あらかじめ設計者がロボットの最適な動作計画法を設計してシステムに組み込むという方法が採られてきたが,上のような状況に対してはこのようなアプローチをとることがきわめて難しい.なぜなら,ロボットが置かれるであろう状況とそれに対する適切な行動をあらかじめ規定することが困難であり,ロボットの適切な入出力関係を事前に規定することが不可能となるからである.このような状況に対応するには,複雑・動的な環境との相互作用を通じて自らの内部構造を変化させ,あるいは新たな構造を創出し,さらには生物のように自己組織化や進化を行う機能を埋め込まれたシステム,即ち創発システムとしてロボットの内部構造を設計する必要がある.

本研究グループでは以上の背景を踏まえ,創発システムとしてのロボットの実現を目指した研究を行っている.具体的な研究事例を以下に示す.

1) 部分観測環境下における自律的状態分割による強化学習

ロボットの行動獲得において有望な手法として強化学習が注目されている.しかし,従来の強化学習手法は, (1) 環境に Markov 性を仮定している, (2) 状態が設計者によりあらかじめ離散化されている,という 2 つの限定から,実世界で動作するロボットに対してはその適用が限られている.本研究では,環境を部分観測 Markov 決定過程としてモデル化し,部分観測性に対応可能な状態表現の上で,ロボットの得る観測値の空間を環境との相互作用に基づいて自律的に分割するという方法で,上記の 2 つの問題を同時に解決する強化学習システムの構築を目指す.

2) 視覚情報に基づく状態空間の自律的生成

実世界で動くロボットには,多様な入出力構造に適応することが求められる.本研究では,多次元の入力として視覚入力を例にとり,世界に関する事前の知識を仮定せず,評価信号に基づいて自律的に視覚入力から有用な情報を取り出す過程を扱う.評価信号としてロボット自身のもつ接触センサ情報などを用い,多次元の評価信号から適切な状態と行動とを自己組織する方法について研究している.

3) 多数の動的要素の挙動の協調と大域的秩序形成の理論

多数の分散した動的要素の挙動が協調し,全体としてまとまった全体挙動を示すための原理に関する基礎的な理論研究,およびその原理を用いた超並列画像処理システムや群ロボットシステムにおける協調動作の獲得といった応用研究を行っている.

動的要素を画素と見なして本研究の成果を応用すれば,動的な画素による超並列画像処理システムができる.また,動的要素を自律移動ロボットと見なした場合は,群ロボットシステムが協調動作を実現するための原理となる.このように本研究は非常に一般的な協調原理に関するものであり,多様な対象に応用可能である.