2020 Fiscal Year Research-status Report
Project/Area Number |
19K20218
|
Research Institution | The University of Tokyo |
Principal Investigator |
宮内 敦史 東京大学, 大学院情報理工学系研究科, 助教 (80804202)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | ネットワーク解析 / コミュニティ検出 / 密グラフ抽出 / オンライン学習 / 多層ネットワーク / モデル化 / アルゴリズム設計 |
Outline of Annual Research Achievements |
令和二年度においては,本研究課題の進展に寄与する二つの成果を得た: ・一つ目は,ネットワーク・データがもつ不確実性を考慮した,頑健な密グラフ抽出法の設計である.密グラフ抽出に対する代表的な最適化モデルとして,最密部分グラフ問題が知られている.この問題では,平均次数が最大となる部分グラフを求めることが要求される.最適解や近似解が効率的に計算でき,様々な応用の場面で利用されているが.データが不確実な場合には適切なモデルとは言えない.実際,入力として枝重み付きグラフが与えられるが,実用上は真の枝重みは手に入らない場合が多い.本研究では,枝重みの推定値を適切に用いることで,枝重みが不確実な状況でも密グラフを抽出できるアルゴリズムを設計した.特に,提案アルゴリズムは,枝一本ずつの推定値の取得を必要とせず,いくつかの枝の推定値の和しか取得できない場合でも,所望の密グラフを抽出できることが理論的に保証されている.計算機実験によって,提案アルゴリズムの実用上の性能も確認した. ・二つ目は,多層ネットワーク上の密グラフ抽出法の設計である.多層ネットワークとは,一つの頂点集合上に複数の枝集合が定義された,通常のグラフの一般化である.頂点集合上の複数種類の関係や枝集合の不確実性を考慮する際に有用である.多層ネットワークに対しては,最密部分グラフ問題の一般化が考えられているが,強い近似困難性が示されており,精度保証の劇的な改善は見込めない.本研究では,多層ネットワーク上の密グラフ抽出に対して,新たな最適化モデルを導入した.提案モデルでは,頂点部分集合を一つ抽出するのではなく,頂点部分集合上の確率分布を計算することを目的としている.提案モデルに対して,線形計画法を用いた厳密解法を設計し,インスタンスのサイズを小さくする前処理法も提案した.計算機実験によって,提案アルゴリズムの実用上の性能も確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は,ネットワーク上のコミュニティ検出に対して,不確実性を考慮した最適化モデルの導入とそれに対するアルゴリズムの設計を行うことで,既存研究では実現し得なかった頑健なコミュニティ検出法を開発することである.不確実性として,ネットワーク・データがもつ不確実性とコミュニティ検出の利用者がもつ不確実性の二つを考慮する.
令和二年度の一つ目の成果では,ネットワーク・データがもつ不確実性を考慮した密グラフ抽出法を設計した.密グラフ抽出では,部分グラフの内部の枝数のみを考慮し,外部とのつながりは考慮しない.したがって,密グラフ抽出はコミュニティ検出の要件を必ずしも満たしてはいない.しかしながら,最初からコミュニティ検出の要件を満たすことは難しいため,まずは密グラフ抽出のアルゴリズムを設計するのは自然である.実際,研究計画にもそのように記述している.また,二つ目の成果では,多層ネットワーク上の密グラフ抽出において,頂点部分集合を一つ抽出するのではなく,頂点部分集合上の確率分布を計算するアルゴリズムを設計した.これを利用することで,複数の頂点部分集合を提示することができ,密グラフ抽出の利用者がもつ不確実性に対応することができる.
以上より,おおむね順調に進展していると評価できる.
|
Strategy for Future Research Activity |
上述の通り,コミュニティ検出よりも要件の少ない密グラフ抽出に対して,ネットワーク・データがもつ不確実性や利用者がもつ不確実性を考慮した,頑健なアルゴリズムの設計を行った.今後の研究として,これらをコミュニティ検出に拡張することが挙げられる.また,これらの不確実性への対処方法は複数考えられるため,他の方法についても考察していく.
|
Causes of Carryover |
令和二年度においては,新型コロナウイルス感染症の流行により,情報系のほぼ全ての国際会議がオンラインで開催された.本研究課題に関連する成果が採択された二つの国際会議(KDD 2020とICML 2020)もオンラインで開催され,旅費の約80万円が次年度使用額として生じた.また,令和二年度においては,当初,高性能なコンピュータを用いた計算機実験を行うことを想定していた.しかし実際には,現在所有しているコンピュータで済ませることができたため,物品費の約50万円が次年度使用額として生じた.令和三年度において,当初の目的通りに使用する予定である.
|
Research Products
(7 results)