2019 Fiscal Year Research-status Report
Project/Area Number |
19K20218
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
宮内 敦史 国立研究開発法人理化学研究所, 革新知能統合研究センター, 特別研究員 (80804202)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | ネットワーク解析 / コミュニティ検出 / ロバスト最適化 / モデル化 / アルゴリズム設計 |
Outline of Annual Research Achievements |
令和元年度においては,本研究課題の進展に寄与する三つの成果を得た: ・一つ目は,ネットワーク・データがもつ不確実性を考慮した,頑健な密グラフ抽出法の設計である.密グラフ抽出に対する代表的な最適化モデルとして,最密部分グラフ問題が知られている.この問題では,平均次数が最大となる部分グラフを求めることが要求される.最適解や近似解が効率的に計算でき,様々な応用の場面で利用されているが,データが不確実な場合には適切なモデルとは言えない.実際,最密部分グラフ問題の最適解は,数少ない頂点や枝が取り除かれただけで非連結となる場合がある.本研究では,いくつかの頂点や枝が取り除かれても連結性を保つような部分グラフで,平均次数が最大となるものを求める最適化モデルを導入した.これに対して,グラフ理論の道具を用いることで,精度保証付き近似アルゴリズムを設計した. ・二つ目は,ハイパーグラフに対するコミュニティ検出法の設計である.ハイパーグラフは通常のグラフを一般化した構造であり,各枝に任意の個数の頂点を含むことができる.コミュニティ検出に対しては,代表的な最適化モデルとしてコンダクタンス最小化が知られている.通常のグラフの場合には,Personalized PageRankを用いた精度保証付き近似アルゴリズムが与えられている.本研究では,このアルゴリズムを拡張し,ハイパーグラフに対する精度保証付き近似アルゴリズムを設計した.提案アルゴリズムは,実際に高速に近似解を計算することができ,実用上も有用である. ・三つ目は,密グラフ抽出の新たな応用先を提示した成果である.具体的には,クラウドソーシングの中心的な研究課題である意見集約において,密グラフ抽出のアルゴリズムが有用であることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は,ネットワーク上のコミュニティ検出に対して,不確実性を考慮した最適化モデルの導入とそれに対するアルゴリズムの設計を行うことで,既存研究では実現し得なかった頑健なコミュニティ検出法を開発することである.不確実性として,ネットワーク・データがもつ不確実性とコミュニティ検出の利用者がもつ不確実性の二つを考慮する.
上述の通り,令和元年度においては,ネットワーク・データがもつ不確実性を考慮した密グラフ抽出法を設計した.密グラフ抽出では,部分グラフの内部の枝数のみを考慮し,外部とのつながりは考慮しない.したがって,密グラフ抽出はコミュニティ検出の要件を必ずしも満たしてはいない.しかしながら,最初からコミュニティ検出の要件を満たすことは難しいため,まずは密グラフ抽出のアルゴリズムを設計するのは自然である.実際,研究計画にもそのように記述している.現段階で密グラフ抽出の成果が得られたことについては,一定の評価ができる.また,これに加えて,ハイパーグラフに関する成果や,密グラフ抽出の新たな応用先に関する成果なども出している.
以上より,おおむね順調に進展していると評価できる.
|
Strategy for Future Research Activity |
上述の通り,ネットワーク・データがもつ不確実性に対しては,密グラフ抽出のアルゴリズムを設計することができた.今後の研究として,これをコミュニティ検出に拡張することが挙げられる.また,ネットワーク・データがもつ不確実性を記述するモデルは複数考えられるため,他の有用なモデルについても検討を行う.
さらに,利用者がもつ不確実性を考慮したコミュニティ検出法を設計する必要がある.通常,コミュニティ検出法の利用者は,自身の得たい構造が曖昧なまま,コミュニティ検出法を利用する.そのため,ある方法で検出された構造が所望のものでなかった場合,また別の方法を試す,という試行を延々と繰り返す.これは利用者にとって大きな負担である.この問題に対処するため,今後の研究として,多様なコミュニティ構造を複数個出力するようなアルゴリズムの設計が挙げられる.
本研究課題の推進によって有意義な成果を得るためには,最適化やデータマイニングの分野において望まれている成果を正しく把握する必要がある.これらの分野の研究は,欧米を中心に行われているため,そこで開催される国際会議やワークショップなど(オンライン開催されるものを含む)に参加し,各国の研究者との交流を図っていく.
|
Causes of Carryover |
令和元年度においては,当初,高性能なコンピュータを用いた計算機実験を行うことを想定していた.しかし実際には,研究の理論的な側面を重視して進めることとなった.そのため,コンピュータを導入するために計上していた物品費が未使用となり,次年度使用額244,169円が生じた.令和2年度において,当初の目的通りに使用する予定である.
|
Research Products
(3 results)