研究課題/領域番号 |
23300051
|
研究機関 | 東北大学 |
研究代表者 |
篠原 歩 東北大学, 情報科学研究科, 教授 (00226151)
|
研究分担者 |
成澤 和志 東北大学, 情報科学研究科, 助教 (40583323)
|
研究期間 (年度) |
2011-04-01 – 2015-03-31
|
キーワード | 機械学習 / 人工知能 / データ圧縮 / 知識発見 / アルゴリズム |
研究概要 |
文字列の多重集合をマルチトラック文字列とよび,その上での新しいパターン照合としてトラック間の置換を許した順列パターン照合を定式化した.これは複数のセンサーデータ系列に内在するパターンの検出をモデル化したものである.置換によってトラック数Nに関してN!通りの組み合わせ爆発が起こるため,素朴な方法では現実的な大きさのNに対して全く歯が立たない.この問題に対して,オートマトンを用いた効率のよいアルゴリズムを提案し,その計算量を解析した.また,データベースに蓄えたマルチトラックデータに対する検索に有用な索引構造として,マルチトラック接尾辞木と,マルチトラック・ポジションヒープを提案し,その構築アルゴリズムを示した.さらに,通常の文字列に対して文字の置換を許したパラメータ化照合に対しても,ポジションヒープが定義でき,それを効率よく構築できることを示した.また,直線的プログラムで圧縮表現された文字列とパターンの照合問題である圧縮パターン照合問題に対して,ハッシュを用いた確率的なアプローチによって従来法よりも省領域で照合が行えるアルゴリズムを提案した. 一方,文字列の基本的な繰り返し構造に関して,左右に延長不可能な極大の繰り返し構造である「連」についての研究をさらに押し進めた.長さnの文字列に含まれる連の最大数ρ(n)に関する「連予想」ρ(n)<n について,本研究では文字列に内在する性質を利用して探索空間の削減したアルゴリズムの開発と実装の工夫により,これがn≦57までは成立していることを検証した.あわせてそこまでのρ(n)の厳密な値とそれを与える文字列を具体的に求めた.これらの文字列の系列に特有のパターンが見つけていくことが今後の課題として残っている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究は,知識発見の原理の究明と実働化を目指して,特にデータ圧縮の技術との関連に着目しながら理論と応用の両面から研究を展開しているものである.理論面に関しては,上述の通り,マルチトラック文字列の照合問題という新たな問題を定式化し,それを効率 よく解くことができた.また圧縮された文字列を展開することなく照合するという課題に対しても進展があった.さらに,データ圧縮の重要な要素となる繰り返し構造について,最も基本的な文字列としての性質に関する連の最大数に関しても進展があった. 一方,応用面に関しては,申請書に記載したように,ゲームAIやロボット制御に関する実問題への取り組みにも力を入れている.ETロボコンにおいて,東北地区大会,そしてチャンピオンシップ大会それぞれにおいて優秀な成績を残すことができた. 以上のことから,おおむね順調に進展していると自己評価している.
|
今後の研究の推進方策 |
おおむね順調に研究が進展しているので,理論面と応用面,それぞれの方向について,当初の計画に沿って研究を進めて行く予定である. まず,今年度の研究で得られたマルチトラック文字列の照合問題に関しては,実応用を目指すためには特に,小さな相違や誤りを許した近似照合に取り組む必要がある.特にセンサーのような数値列や画像を対象とする場合には,厳密照合だけにこだわっていてはあまり有用な応用は見込めない.しかしながら一般に,通常の文字列においても,近似を許した照合となると急に計算量が増大することが知られている.特に文字列の挿入や削除によって長さが異なる可能性のある場合にはさらに困難な問題となる.本研究において我々は,トラック間の置換も許した照合を行おうとしているため,現状のハードウエアで現実的なデータに対する実働システムを構築するためには,さまざまな工夫が必要となる.今後は,ハッシュや近傍探索の手法に着目することでそれを打破することを目指す. 一方,文字列の繰り返し構造である連については,その個数のみならず,指数和という尺度に注目する予定である.文字列の指数和の最大数についてもその上界と下界の間のギャップを縮める研究が近年,精力的に行われているが,我々も大規模な計算機実験を併用しながらこの課題にチャレンジしていく予定である. 応用面に関しても,昨年度と同様に,それぞれの具体的な問題に対して取り組み,そこで得られる知見を理論解析にフィードバックさせることで相補的なさらなる進展を目指す.
|