自律分散型超並列動画像認識システム
(湯浅助教授・新井教授)

ランダムドットキネマトグラムの1例(動画:MPEG)
ランダムドットキネマトグラムの認識結果(動画:MPEG)
実際の動画像(動画:MPEG)
実動画像認識(高解像度版、11MB)(動画:MPEG)

 人間は,処理速度の遅い神経細胞を超並列に動作させることにより非常に高速な視覚認識を実行している.この並列処理における情報伝達は,各神経細胞がシナプス結合している部分的・局所的な伝達である.それにもかかわらず,人間は統一のとれた外界を認識できる.各神経細胞は,部分的な情報をどのように統合しているのであろうか.これは,自律分散システムにおける研究主題のひとつである大域的秩序の自己組織化問題である.

本研究室では,多数の動的画素を結合した超並列動画像認識システムに関する研究を行っている.濃淡値を乱数で与えたランダムテクスチャ(RT)の背景上でRT3次元物体を回転運動させる動画像(RDKRandom Dot Kinematograph)を見ると,運動物体がその3次元形状を伴って浮かび上がり背景と分離して知覚される.一時停止して静止画にすると,それまで知覚していた形状は背景に紛れ込んで消失する.これは,人間が動き情報のみから3次元形状を認識していることの証拠である.

本研究では,局所・並列的な動画像認識を実現するモデルとして反応拡散方程式を取り上げ,多数の動的画素の自己組織化を理論的に実現した.動画像の動き情報はオプティカルフローと呼ばれるが,誤差がのりやすく画面全体で正確に求めることは非常に難しい.しかし背景と物体でオプティカルフローの平均的な性質が大きく異なり,それを反応拡散方程式系により分離パターンを自己組織的に実現する.背景と物体の区別はその境界のみで明確になるので,ポテンシャル汎関数をもつ関数空間における勾配系により,画面全体を物体領域と背景領域に組織化する.具体的には,物体(+1)と背景(-1)の双安定な動的画素を拡散結合させ,それらの境界で判定される結果を周辺へ拡散させることにより,画面全体が背景と物体に自己組織化される.

シミュレーションにより,従来の画像認識手法では認識不可能なRDKが,明確に分離・認識されることを示した(Fig. 1).また,背景全体が運動している(頭を動かして見る場合に相当)場合でも,その中から移動物体を分離して認識できることも分かった.こちらも,従来の画像処理・認識システムでは認識が大変困難な動画像である.実際にカメラを動かしたり止めたりして動いている人間を撮影した実動画像に応用した場合,カエルの目のように動いている人間(あるいは手や足など)のみを正確に分離・認識できることが示された.

参考文献

1)大倉昭人,湯浅秀男,新井民夫:自律分散的アプローチによる運動物体の3次元形状認識,第19回日本ロボット学会学術講演会講演論文集, pp.853-854, 2001.

  

Fig. 1 Autonomous-decentralized image processing