大量に蓄積されたデータにより,私たちは新たな知識を発見できるようになった.一方で,その大量さは同時にこれまで利用できたデータマイニングアルゴリズムを適用できない規模となっている.本研究では,「近傍領域」と呼ばれる局所的な構造に着目することで,この状況を打破しようというものである.具体的には,次の二つの課題を設定した. 課題1:現実の問題に対する適切な「大事さ」に関するパラメータのモデル化 課題2:課題1で得られたパラメータを元に,近傍領域を効率よく計算するアルゴリズムの開発 これらの課題のもとで,2022年度はいくつかの非自明なアルゴリズムを得ることができた.具体的には,部分構造を効率よく列挙する,および,部分構造を徐々に変化させる遷移問題に対してのアルゴリズム構築である.期間全体を通じて,課題2に関して,列挙アルゴリズム構築のための基盤的な手法について,その端緒を得ることができた.具体的には,解グラフ技法と呼ばれる手法を用いた列挙アルゴリズムのさらなる高度化である.現在推進している課題(課題番号:22K17849)はこの課題を一つのモチベーションとして設定した課題である.課題1については想定の目標には到達できなかった.その具体的な原因は,コロナ禍による人的交流の極端な減少による実問題の収集のハードルの高さが考えられる.昨今,機械学習における説明可能性のみならず,非明示的な指標を背後に持った k-best 列挙などのアルゴリズムに対して,一定程度,その説得力を持つことが要請されている.本課題終了後も,継続してこのような問題について取り組んでいく.
|