研究課題/領域番号 |
24650073
|
研究機関 | 富山大学 |
研究代表者 |
村山 立人 富山大学, 大学院理工学研究部(工学), 講師 (80360650)
|
キーワード | 不可逆圧縮 / 保存量 / データマイニング / 推測統計 / 十分統計量 / 大偏差原理 / 情報統計力学 / 相転移 |
研究概要 |
本研究では、深宇宙探査やゲノム情報処理などのデータマイニング諸分野での適用を想定したデータ圧縮の方法論を検証し、特定の信号検出などを目的に計測されているデータ系列の集約方法を改良したいと考えている。特に、本年度は、不可逆圧縮過程を数理的に基礎付ける「レート・歪み関数」の特性に注目し、それがデータ系列の効率的集約に及ぼす原理的な影響等について数値的・解析的に分析した。その結果、計測データが離散的な確率過程と解釈できるとき、計測時のノイズを相殺する目的で積極的に重複したデータを取得すると、まるで磁性体を加熱していった時に磁化を消失する「相転移現象」を思い起こさせるような最適圧縮率の急激な応答反応が発見された。つまり、計測システムが全体として消費できる通信資源に定量的な意味での制限があるとき、各データはその重複度に相応した不可逆圧縮過程を受けることになるが、その最適な圧縮率の値は外部ノイズの値と共に変化し、まるで磁性体の相転移を彷彿とさせる理論曲線が描けたのである。前年度までの研究では、この理論曲線は二次転移と呼ばれる連続転移にのみ対応すると予想されていたが、今回、通信資源の制限を若干緩和することによって、一次転移と呼ばれる不連続転移に対応するケースもあることが理論的に確認された。また、上記の現象を推測統計の枠組みで再考することによって、データ系列の十分統計量を記述する際に重要となる古典的指標を再発見し、それを現代的なデータマイニングの立場から再評価することにも成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
不可逆圧縮過程が計測データの統計的性質に及ぼす影響については、当初の研究計画では必ずしも予想できなかった内容ではあるが、非常に興味深い現象を発見することができた。つまり、ある種の分散符号化の枠組みにおいて、符号化の空間的自由度に関する制約条件が緩くなった時、外部ノイズに対するデータ圧縮率の最適応答が不連続な挙動を示すことが明らかになったのである。これは磁性体を加熱していくと、ある温度で磁化を消失する現象(一次相転移)を思い起こさせる現象であり、工学的にはアドホックネットワークの研究などに応用が期待できると考えられる。
|
今後の研究の推進方策 |
今後は、本年度に得られた成果を理論的に基礎付けると共に、国際的な学術論文に掲載されるように努力していく。特に、本研究で提唱している理論的メカニズムが、どのようにして工学的な付加価値を生み出すのかについて、さまざまなユースケースを検証したい。具体的には、各センサーがアドホックネットワークを形成している場合や、外部ノイズに現実的な階層構造を仮定したモデルなどを検討している。
|