自然言語処理向け深層学習技術の応用によるプログラムの並列性抽出

Research Project

Project/Area Number	22K11972
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 60050:Software-related
Research Institution	Osaka University
Principal Investigator	置田真生大阪大学, 大学院情報科学研究科, 准教授 (50563988)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000) Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000) Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000) Fiscal Year 2022: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Keywords	自動並列化 / Transformer / OpenMP / 文脈理解 / ソースコード解析 / 並列化ディレクティブ
Outline of Research at the Start	本研究では，深層学習に基づく機械翻訳技術を応用して，C言語プログラムを自動的に並列化することを試みる．そのために，ソースコード解析技術と深層学習モデルを組み合わせて，プログラムに含まれる並列性・並列化可能性の抽出を実現する．具体的には，OpenMPプログラムに付与された並列化ディレクティブを正解ラベルとして深層学習モデルを訓練し，並列プログラムの構造・文脈を学習する教師あり学習手法を確立する．さらに，訓練した学習モデルを用いて，逐次のC言語プログラムにディレクティブを自動挿入するシステムの開発を目指す．
Outline of Annual Research Achievements	本研究の全体構想は，静的プログラム解析技術と自然言語処理向けの深層学習モデル（Transformer;以降，TX）を組み合わせて，並列プログラムの構造を学習する教師あり学習手法を開発し，プログラムに含まれる本質的な並列性・並列化可能性の抽出を実現することである．この構想の下，本研究では次の2つの目的の達成を目指している．(1)プログラムの並列性解析に適したTX向け表現形式の探求，および(2)TXを応用したOpenMP並列プログラムの自動生成．令和5年度は，令和4年度から引き続き，目的(1)の研究を対象に，「TXはforループの並列化可能性を理解できるか？」という問いを探求した．令和4年度の成果は，OpenMP並列プログラムを学習データに用いてプログラミング言語向けの拡張を施したTXを訓練することで，高い適合率でforループの並列化可能性を判定できることを示した．しかし，TXの制約上1000トークンを越える長いプログラムを入力できないt点，および再現率が低く見落としが多い点の2つの課題があった．令和5年度は，まず，Recurrent Memory Transformer（以降，RMT）の技術を用いて我々のTXを拡張することで，前者の課題を解決した．次に，RMTが備えるメモリ機構の重要度を調整することで，高い適合率を保ったまま再現率を向上できることを発見した．結果，適当率と再現率ともに0.9を越える精度を達成し，TXがforループの並列化可能性を実用レベルで判定できる能力を持つことを示した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 昨年度に変更した研究計画に鑑みて，概ね順調に進展している．変更後の研究計画では，令和5年度は主に(1)プログラムの並列性解析に適したTX向け表現形式の探求に取り組み，並行して年度の後半に(2)TXを応用したOpenMP並列プログラムの自動生成に取り組む予定であった．前者については，「研究実績の概要」に示した通り，高い適当率と再現率の両立を達成でき，自動並列化のための表現形式を実用レベルで確立できたと考えている．後者については，強化学習を組み合わせたOpenMP指示文の自動挿入に関する研究に着手した．最初のアイデアを実装して実験を繰り返している段階で，まだ実用的な結果を得られていない．引き続いての研究が必要である．
Strategy for Future Research Activity	令和6年度は，まず，令和4-5年度に取り組んだ研究（プログラムの並列性解析に適したTX向け表現形式の探求）について成果をまとめ，国際会議およびジャーナルでの発表を目指す．次に，研究計画に従って，TXを応用したOpenMP並列プログラムの自動生成の研究に引き続き取り組む．具体的には，TXを用いたOpenMP指示文の生成と，強化学習あるいは遺伝的アルゴリズムを組み合わせ，信頼性が高くかつ高性能なループ自動並列化手法の確立を目指す．

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(5 results)

All 2023 2022

All Presentation (5 results)

[Presentation] 状態ベクトルに基づく並列量子回路シミュレーションにおける量子ビット交換の削減のための演算スケジューリング2023
- Author(s)
  寺西勇裕, 平岡昇真, 水上渉, 置田真生, 伊野文彦
- Organizer
  第185回情報処理学会ハイパフォーマンスコンピューティング研究会
- Related Report
  2023 Research-status Report
[Presentation] 自由視点画像を高速に生成するためのオンラインレンダリング2023
- Author(s)
  荒川雄登, 置田真生, 伊野文彦
- Organizer
  第22回情報科学技術フォーラム
- Related Report
  2023 Research-status Report
[Presentation] Forループの並列化可能性の判定における穴埋め言語学習の応用2022
- Author(s)
  西村佳, 置田真生, 伊野文彦
- Organizer
  第185回情報処理学会ハイパフォーマンスコンピューティング研究会
- Related Report
  2022 Research-status Report
[Presentation] ニューラルアーキテクチャ探索におけるガウス過程回帰の精度向上のためのバギング手法2022
- Author(s)
  羽田遼音, 置田真生, 伊野文彦
- Organizer
  電子情報通信学会情報論的学習理論と機械学習研究会 (IBISML)
- Related Report
  2022 Research-status Report
[Presentation] 量子回路の反復シミュレーションにおける実行パスの集約による重複計算の排除2022
- Author(s)
  青山昂生, 置田真生, 伊野文彦
- Organizer
  第7回情報処理学会量子ソフトウェア研究会
- Related Report
  2022 Research-status Report

自然言語処理向け深層学習技術の応用によるプログラムの並列性抽出

Principal Investigator

置田 真生 大阪大学, 大学院情報科学研究科, 准教授 (50563988)

¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)

Current Status of Research Progress

Reason

Report

Research Products

[Presentation] 状態ベクトルに基づく並列量子回路シミュレーションにおける量子ビット交換の削減のための演算スケジューリング2023

Author(s)

Organizer

Related Report

[Presentation] 自由視点画像を高速に生成するためのオンラインレンダリング2023

Author(s)

Organizer

Related Report

[Presentation] Forループの並列化可能性の判定における穴埋め言語学習の応用2022

Author(s)

Organizer

Related Report

[Presentation] ニューラルアーキテクチャ探索におけるガウス過程回帰の精度向上のためのバギング手法2022

Author(s)

Organizer

Related Report

[Presentation] 量子回路の反復シミュレーションにおける実行パスの集約による重複計算の排除2022

Author(s)

Organizer

Related Report

置田真生大阪大学, 大学院情報科学研究科, 准教授 (50563988)