研究課題/領域番号 |
22K12056
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60100:計算科学関連
|
研究機関 | 筑波大学 |
研究代表者 |
長谷川 秀彦 筑波大学, 図書館情報メディア系, 教授 (20164824)
|
研究分担者 |
手塚 太郎 筑波大学, システム情報系, 教授 (40423016)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2025年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | クリロフ部分空間法 / 大規模疎行列 / 収束性判定 / 機械学習 / 畳み込みニューラルネットワーク / 自己注意ネットワーク / CNN / SAN / 反復法 / 行列画像 / 疎行列 |
研究開始時の研究の概要 |
テストデータセット内の行列に対して、以下の点を検討することになる: ・各種反復解法を用いて収束データを取得すること ・行列の特性を保持して、行列データを機械学習に適した画像データに変換する方法を検討すること ・疎行列から作成した画像に対する効果的な機械学習方法を検討ルこと ・画像データと収束データを組み合わせて、どこまで正確な予測が可能かを明らかにすること
|
研究実績の概要 |
クリロフ部分空間法は大規模疎行列を係数とする連立一次方程式の解法としてもっとも効率的な手法のひとつであるが、理論は収束が保証されていても、実際は一部の行列で収束しない。もし与えられた行列に対するクリロフ部分空間法の収束が事前に判定できれば、その行列に対しては別の解法を適用すれば、全体として計算資源の節約になる。 本研究では深層学習を用い、収束の成否がすでに知られている大規模行列の集合によって新規に与えられた行列の収束性を判定する分類器を訓練することを試みる。行列は2次元に配置された有限個の実数データであるため、行列を画像化し、深層学習による画像認識において広く使われているネットワーク構造である畳み込みニューラルネットワーク(CNN)によって判別する手法を開発した。 しかしCNNが画像認識において有効であるのは、隣り合うピクセルや領域の間で高い相関があり、それを畳み込みによって平均化できるためと考えられている。いっぽう、行列の値を画像化したデータにおいては、隣接しあう行や列の要素間に一般の画像と同様の相関があるとは考えられない。そこで、より自由度が高く、離れた領域間の相関も見つけられるアテンションメカニズム、特に自己注意ネットワーク(SAN: self-attention network)の考え方を取り入れることで、判定精度の向上を達成しようとしている。 n×n個の実数値(次元数 nは行列によって異なる)を持つ行列を、同一サイズの画像データに変換して機械学習に利用するための画像化法についても検討が必要だが、こちらの問題については未着手である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
研究代表者の退職に関連した研究以外の業務の増大、研究分担者の長期海外滞在にともなう研究環境ならびに研究内容の変化によって、本研究にさける時間が予想外に少なくなったため、進捗は芳しくない。 研究代表者による予備的な研究では畳み込みニューラルネットワーク(CNN)を収束性判定の分類器として使用していた。 CNNにおける畳み込みは近接する行同士、列同士をまとめていくという演算であるが、行列データにおいて隣り合う隣り合う行同士、列同士に類似性があるとは考えにくく、畳み込みが妥当な帰納バイアスであるのか疑問が残る。近年、空間的に近接するとは限らない素子同士をデータにもとづいて統合していく枠組みとして、アテンションネットワークが高い性能をおさめている。 そこで2022年度は、自己注意ネットワークの代表的なモデルであるSAN (self-attention network)の一部を分離器として組み込む実装を行った。SANは自己注意ブロック(self-attention block)を多数重ねる構成をしているが、これをベースとなるCNNに追加するモデルを実装し、評価実験を行っている。
|
今後の研究の推進方策 |
引き続き自己注意メカニズムの有効性を検証すると共に、収束性判定の学習によって得られる重みがどのような意味を持つのかを明らかにしていく。 SHapley Additive exPlanations (SHAP)などの解釈可能化手法を導入することでどのような帰納バイアスが有効となっているのかを分析し、数値解析の視点からも興味深い知見を得ることを目指す。
|