研究課題/領域番号 |
20H00595
|
研究機関 | 北海道大学 |
研究代表者 |
有村 博紀 北海道大学, 情報科学研究院, 教授 (20222763)
|
研究分担者 |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
平田 耕一 九州工業大学, 大学院情報工学研究院, 教授 (20274558)
山本 章博 京都大学, 情報学研究科, 教授 (30230535)
喜田 拓也 北海学園大学, 工学部, 教授 (70343316)
ジョーダン チャールズハロルド 北海道大学, 情報科学研究院, 助教 (60647577)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
キーワード | 離散構造学習 / 大規模半構造データ / 次世代機械学習技術 / データマイニング / 知識基盤形成 |
研究実績の概要 |
本研究では,実世界の大規模半構造データを対象とした離散構造学習アルゴリズムと,高速半構造マイニングに基づく周辺技術について研究を実施している.(a)実世界の膨大かつ多様な半構造データを対象とし,高度な種々の機械学習タスクにおいて, データに内在する知識を, 解釈性の高い離散的な予測モデルとして取り出せる高速な離散構造学習アルゴリズム技術とその周辺技術を研究開発した: a1.実世界半構造データに対する超高速な離散構造学習アルゴリズム技術では,整数計画法を用いた反実仮想説明技術の提案が人工知能分野のトップ国際会議で採択・発表された[Kanamori+, IJCAI2020, AAAI2021].a2.高効率属性抽出技術の研究開発として,平田は,根付きラベル付きキャタピラの編集距離の変種やパターンマッチングの研究,および,深層学習によるグラム染色画像からの菌の分類と検出の研究を進めた.a4.半構造データマイニングの一般理論の構築では,ジョーダンはQBFを用いた高性能論理ソルバ利用のための高水準言語SO(TC)の提案・実装を始めた.b1.知識連係技術の研究では,喜田はデータストリーム)中に頻出する部分系列を発見するための省メモリアルゴリズムを開発した.b2.知識発見研究に関する啓蒙活動として,山本・宇野・喜田らは,機械学習分野のトップ学術雑誌であるMachine Learning誌において,発見科学に関する特集号を編集し,その最新動向を紹介した(2020.6). この離散構造学習アルゴリズムを,現実の多様な半構造データに適用するための周辺技術を開発した.c 上記で研究開発した知識発見技術について,理論的な性能解析を行い,その結果を元に最適化し,離散構造学習エンジンを実装し,知識基盤形成のための周辺技術の実装を行った.さらに性能および有用性評価のための実証実験を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度は,コロナ感染予防措置による各種制限が行われ,出張制限および研究集会の開催中止・延期が生じた.これについては,研究打ち合わせはオンラインで実施し,国内・国外研究集会での成果発表についてはコロナ感染予防措置の解除まで延期し,各研究項目における領域策定と,技術の設計と開発を先行して行うことで対応した.
|
今後の研究の推進方策 |
現在,順調に研究と開発が進んでいるので,研究開発した技術について,理論解析と計算機実験を行いつつ,改善点の洗い出しと,改良を行う予定である.また,実世界知識獲得に関する問題について,引き続き,離散構造処理問題としての定式化と解法の設計を進める.研究を遂行する上での変更点として,本年全世界的に実施されたコロナ感染予防措置による各種の行動制限と活動制限により,国際会議等参加を伴う,技術調査および成果発表を,コロナ感染予防制限が解除される次年度以降に延期し,代わりに次年度以降の技術の設計と開発を先行して実施することとし,これ以外は,予定通り,研究計画を実施する予定である.
|