グラフ構造のダイナミクスを模倣する確率的形式グラフ体系の学習可能性の探究
Project/Area Number |
21K12021
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Fukuoka Institute of Technology |
Principal Investigator |
正代 隆義 福岡工業大学, 情報工学部, 教授 (50226304)
|
Co-Investigator(Kenkyū-buntansha) |
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
内田 智之 広島市立大学, 情報科学研究科, 教授 (70264934)
鈴木 祐介 広島市立大学, 情報科学研究科, 講師 (10398464)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | 機械学習 / 形式グラフ体系 / 確率的形式グラフ体系 / グラフ生成規則 / グラフ系列マイニング |
Outline of Research at the Start |
グラフ構造を持ったデータ、例えば化学化合物の分子構造や社会学におけるソーシャルネットワークなどが、どのように生成され、変化していくかというグラフの動的な構造的変化を直接扱うことができる形式体系として確率的形式グラフ体系を導入し、その学習理論の構築を目標とする。具体的には、グラフ構造の統計的な分布情報を利用する確率的形式グラフ体系を導入し、その上で、計算論的学習理論に基づいた現実的時間で計算可能な学習アルゴリズムの設計と解析を行う。
|
Outline of Annual Research Achievements |
本研究課題では、グラフ構造データの生成過程を形式化した確率的形式グラフ体系を導入し、その学習理論を構築することを目標としている。この目標に向けて、2023年度は形式グラフ体系の計算論的学習理論に基づく基礎的研究を進めてきた。具体的な研究成果は次の通りである。 (1) 線形順序項木パターンに対する効率のよい並列照合アルゴリズム: HTMLやXMLデータなどの順序木構造からパターンを発見するため、Suzukiらは線形順序項木パターンを提案した。線形順序項木パターンとは、共通部分順序木構造を構造的変数でつなげた順序木パターンである。本研究課題では、特に変数次数2のパターンに対する効率の良い並列アルゴリズムを提案し、これによりパターン照合の速度と精度を向上させた。 (2) 正規パターンのコンパクト性の検証と拡張: 正規パターンとは各変数が1回しか出現しない記号列であり、これに対してSatoらは特徴集合と包含関係のコンパクト性を示した。本研究では、まずこの結果を詳細に検証し、証明の誤りを修正した。さらに、非隣接変数正規パターンについても同様の結果を示し、これに基づいて効率的な学習アルゴリズムの設計可能性を明らかにした。 (3) 縮約可能変数を持つ線形順序項木パターンの多項式時間照合アルゴリズム: 縮約可能変数を持つ線形順序項木パターンに注目し、これに対する多項式時間で計算可能な照合アルゴリズムを提案した。このアルゴリズムは、従来の線形順序項木パターンより表現力が増したパターンに対する照合を高速かつ正確に行うことができるものである。 以上の研究により、2023年度は形式グラフ体系の学習理論に関する新しい知見を得ることができた。今後の研究では、さらに複雑なグラフ構造や形式グラフ体系などの多様なパターンに対する適用を目指して、研究を進める計画である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究課題の研究期間における主要な到達目標の一つは、形式グラフ体系およびその生成グラフ言語に対する計算論的学習理論の構築である。2023年度には、質問学習モデルという計算論的学習理論の主要な学習モデルに注目し、形式グラフ体系の計算論的学習理論に基づく基礎研究を実施した。研究過程で、グラフ構造パターンの特別な例である正規パターンに関する先行研究を詳細に検証し、形式グラフ体系の学習理論における基礎となる新たな知見を得た。特に、非隣接変数正規パターンのコンパクト性に関する定理を証明することに成功し、これはグラフ構造パターンの効率的な学習アルゴリズム設計への顕著な進展である。一方で、形式グラフ体系に適用する分布学習を用いた質問学習アルゴリズムについては、国際会議での発表後、論文誌への投稿作業が進行中であるが、本研究課題の研究期間における進行予定に比べ遅れが見られる。2024年度は各研究成果の論文誌への投稿を優先して、研究を進める予定である。以上より、現状の進行状況をやや遅れているとした。
|
Strategy for Future Research Activity |
2021年度から2023年度にかけての研究成果を基に、確率的手法を用いた形式グラフ体系の学習理論をさらに展開する予定である。当初の計画に従い、グラフ構造パターン照合問題に対する効率的な並列アルゴリズムを提案するなど、形式グラフ体系の学習プロセスを機械学習のソフトウェア及びハードウェアの両面から高速化する基盤を構築したと考えている。2024年度は、これまでの各研究成果の論文誌への投稿を優先し、研究活動を推進する。加えて、グラフ畳み込みネットワーク(GCN)をオラクルとする質問学習モデルを用いた人工データ及び実データによる学習精度の詳細な分析を行い、形式グラフ体系の表現クラスに対する学習精度の確率的評価を実施する。最終的には、形式グラフ体系の学習理論に関する研究成果を論文誌に公表し、その成果に基づく各課題の総括を行う予定である。
|
Report
(3 results)
Research Products
(22 results)