2019 Fiscal Year Research-status Report
Project/Area Number |
19K20350
|
Research Institution | National Institute of Informatics |
Principal Investigator |
和佐 州洋 国立情報学研究所, 情報学プリンシプル研究系, 特任助教 (00781337)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 知識発見 / データマイニング / 列挙 / グラフ |
Outline of Annual Research Achievements |
大量に蓄積されたデータにより,新たな知識発見ができるようになった.一方で,その大量さは同時にこれまで利用できたデータマイニングアルゴリズムが適用できない規模となっている.本研究では,「近傍領域」と呼ばれる構造に着目することで,この状況を打破しようというものである.本研究における近傍領域とは,ある着目した要素Xに関する「Xが重要であるような」部分的な構造である.これは例えば,何らかのネットワークにおいてXをハブとして持つ構造などがそれに当たる.具体的には,次の二つの課題を設定した.これらの課題を克服することで,知識発見技術のさらなる発展を狙う. 課題1: 現実の問題に対する適切な「大事さ」に関するパラメータのモデル化. 課題2: 課題1 で得られたパラメータを元に,近傍領域を効率よく計算するアルゴリズムの開発. この二つの課題で得られた成果を利用することで,知識発見技術の更なる発展を実現することが本研究の目標である.2019年度は,仮想的なデータを想定し課題2に注力した.その成果として,グラフ構造に着目し,いくつかの種類の近傍領域を計算するためのアルゴリズムを開発および,問題の困難さの証明を行った.具体的には, (A) 指定された3頂点を含むシュタイナー部分グラフを効率よく計算するアルゴリズムの開発,および,一般化した際の難しさの証明した.さらに, (B) 指定された頂点を結ぶパスやサイクル,あるいは,それらを切断するセパレーターを計算する問題の難しさの証明した.(A) に関してはドイツで開催された国際会議(MFCS 2019)に採択され,発表を行った.また,(B)に関しては,現在論文投稿準備中である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
やや遅れているとした理由は,課題1に関する成果を想定よりも得られなかったことによる.この原因は,実データの収集が想像以上に進まなかったことが大きな要因となっている.したがって2019年度では仮想的なデータに対する構造,つまり,多くのデータで着目されるであろう構造を想定し,特に,連結性に関連する研究を行った.まず,(A)における近傍領域は,直感的には,指定された頂点を"うまく繋ぐ"構造であり,それらを発見するアルゴリズムの研究である.グラフ全体の連結性を維持する最小の構造のに関する研究は行われてきたが,指定されたものだけを羅列し,それらを関する評価の研究は,少なくとも理論面ではあまり行われてこなかった.(A)での成果を通じて,アルゴリズムの開発,および,困難さの証明を行うことができた.また,(B)に関しては,パスやサイクルなどはグラフの連結性を説明するための要素として見なすことができ,グラフ構造の解析において重要な役割を果たす.この問題は,基礎的な問題であり重要ではあるが,一方でその計算は困難であることを示した.今後の実応用に向けては厳密解ではなく,近似解を得る方法がより妥当であることが確認されたのは大きな成果だった.したがって,課題1に関してその進捗は遅れているが,課題2に関しては想定以上の成果を得られたため,やや遅れているの評価とした.
|
Strategy for Future Research Activity |
2年次以降は,課題1に特に注力する.連結性に関わる近傍領域を持つデータを発見することが望ましいが,それにとらわれず,SNSや,防災,医療,などの様々なデータから,共通するあるいは固有な近傍領域を発見することに注力する.また,課題2に関しては,連結性に着目した近傍領域の理論的なアルゴリズムを開発した.これらの知見を利用して,効率良いアルゴリズムの構築すること,また,(A)に関しては理論的に興味深い未解決問題を副次的に得ることができたので,それらを解決することにも注力する.さらに,課題1を通じて得られた近傍領域に対するアルゴリズムの開発も引き続き行う予定である.
|
Research Products
(1 results)