Research Abstract |
本研究は,知識発見の原理の究明と実働化を目指して,特にデータ圧縮技術との関連に着目しながら,理論と応用の両面から研究を展開することを目的としている.データ圧縮は,コルモゴロフ複雑性の理論に基づいてデータ間の類似性を測る汎用の尺度としても用いられることが注目されており,種々の可逆圧縮アルゴリズムによる実験結果も示されてきている.我々はこれを画像の類似性指標として用いた場合の効果と問題点を検証し,既存の理論を,画像や音声データで主に用いられる非可逆圧縮にも適用できるように拡張した.また,強化学習の枠組みにおいて,エージェントと環境の間の通信の遅延が学習の効率に与える影響を調べ,遅延を考慮した学習アルゴリズムを新たに提案して,計算機実験によりその効果を検証した.さらに,観測したイベント列に頻出するパターンと,それを生成するモデルの尤もらしさを保証する定理がある種の隠れマルコフモデルに対して成立することが知られていたが,我々はこの性質がさらに一般化したモデルにおいても成立することを証明した.応用面に関しては,実ロボットを用いた試行実験を支援するために,ハードウェアを含むシステム一式を構築した.このことにより,長時間に渡る大規模なデータ収集や自律学習に要する手間が大幅に軽減できるようになった.一方,パズル問題に関しては,覆面算を網羅的に生成して解析するためのツールとして有限オートマトンを用い,その挙動を調べた.また,複数の時系列データから,そこに内在する相互関係を知識として抽出するために,まずその基盤技術として問題をマルチトラック文字列として定式化し,照合問題や頻出パターン発見問題,そしてそれを効率よく行うための索引構造に関する基本的な成果を得た.
|