• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多階層マルチスケール・ソフトウェア分析基盤に関する研究開発

研究課題

研究課題/領域番号 21H03416
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分60050:ソフトウェア関連
研究機関奈良先端科学技術大学院大学

研究代表者

飯田 元  奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (20232126)

研究分担者 藤原 賢二  東京都市大学, メディア情報学部, 講師 (80782622)
崔 恩瀞  京都工芸繊維大学, 情報工学・人間科学系, 助教 (90755943)
研究期間 (年度) 2021-04-01 – 2024-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
13,650千円 (直接経費: 10,500千円、間接経費: 3,150千円)
2023年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2022年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
キーワードソフトウェア分析基盤 / ソフトウェア・アナリティクス / リポジトリ・マイニング / ソフトウェアリポジトリマイニング / データマイニング / コード解析
研究開始時の研究の概要

ソフトウェア・リポジトリを対象とした分析(ソフトウェア・アナリティクス)において、作業同士を関連付けた「より深化した分析」や、プロジェクト間を横断した「より広範囲の分析」などの試行を容易にするために,異なるスケールによるリポジトリデータの抽象化手段と分析機構を統合して高速に実行できる「多階層マルチスケール・ソフトウェア分析基盤」を提案・開発し、ソフトウェアやプロジェクトの多面的分析・理解に貢献する

研究実績の概要

本研究では、複数の異なる抽象化階層の定量的指標に対する横断的な分析を可能とする「多階層マルチスケール・ソフトウェア分析基盤」の確立を目指して、「ソフトウェアを解釈する異なる抽象化レベルごとにその変更履歴と依存関係を蓄積し、実務者や研究者からのクエリ要求に基づき、条件に合致するデータを容易に引き出し可能な基盤」の構築に取り組んでいる。本期間中には下記3課題を並行してすすめた。
課題1)多階層マルチスケール型データモデルおよびクエリ言語HMSQLの設計:ソフトウェアの論理的モデルから物理的実装に至るまでの抽象的階層構造を表現可能な多階層マルチスケール型データモデルを設計するために、各階層別のデータ構造と相互依存関係についてさらなる調査・整理を行った。特に、開発者の生産性やプロジェクトの活発さを測る際に必要となる追跡作業のためのクエリ構造について、その表現方法を明らかにした。
課題2)大規模並列分散HMSQL クエリ実行エンジンの設計・実装:並列分散処理フレームワークDaskを基盤に用い、GitHub上の公開イベントデータセットGHArchiveを対象に、課題1で扱った分散クエリを実行し、多数のリポジトリを大規模横断的に分析して、開発者の生産性を解析するアプリケーションの試作と評価を実施した。
課題3)多階層融合型ソフトウェア・アナリティクス手法の実証:本分析基盤での深化型アナリティクスと横断型アナリティクスの事例として、複数の分析を実践した。具体的には、深化型分析として、ファジングが特定のプロジェクトに及ぼす影響を評価した。また、特定プロジェクトにおけるクラスレベルでのバグ予測手法の評価を行った。横断型分析として、OSS開発者の属性が技術的負債の除去に及ぼす効果の分析を行った。また,多種多様なプロジェクトから構築したコード補完モデルを特定のプロジェクトに特化させる際の影響を分析した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

課題1においては、初年度目標で実施した多階層マルチスケール型データモデルの概要設計を深化させるために、各階層別のデータ構造と相互依存関係についてさらなる調査・整理を行い、さらに開発者の生産性の分析を題材に、そのクエリ構造の表現方法を明らかにするなど、具体課題にも取り組むことができたため、概ね順調に進捗していると考えられる。
課題2においては、並列分散処理フレームワークであるDaskを基盤として用い、課題1で扱った分散クエリを実行するアプリケーションの試作と評価を実施することができており、計画通りに進捗していると考えられる。
課題3においては、深化型アナリティクスと横断型アナリティクスの事例として、複数のプロジェクト分析を実践し、予定通りに本プラットフォームのユースケースの蓄積を行なうことができた。次年度以降も引き続き分析事例の蓄積を行なうと同時に、試作プラットフォームにおけるレプリケーションの実施方法の検討に着手する予定である。

今後の研究の推進方策

進捗は概ね順調であり、今後は各課題間の連携をより強化した上でプラットフォームの実装に向けた作業に着する予定である。具体的には、課題1においては各階層別のデータ構造と相互依存関係に基づいた言語仕様の詳細設計を、課題2においては、クエリデータの詳細設計を、課題3においては、引き続き分析事例の蓄積を行なうと同時に、試作プラットフォームにおけるレプリケーションの実施方法の検討に着手する予定である

報告書

(2件)
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (14件)

すべて 2023 2022

すべて 雑誌論文 (3件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (11件) (うち国際学会 3件)

  • [雑誌論文] Commit-Based Class-Level Defect Prediction for Python Projects2023

    • 著者名/発表者名
      Khine Yin Mon, Masanari Kondo, Eunjong Choi, Osamu Mizuno
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E106.D 号: 2 ページ: 157-165

    • DOI

      10.1587/transinf.2022MPP0003

    • ISSN
      0916-8532, 1745-1361
    • 年月日
      2023-02-01
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 欠陥混入コミット特定のための開発履歴へのファジング適用2023

    • 著者名/発表者名
      小菅 遙生, 藤原 賢二
    • 雑誌名

      情報処理学会第85回全国大会講演論文集

      巻: 1 ページ: 207-208

    • 関連する報告書
      2021 実績報告書
  • [雑誌論文] コードクローン検索手法の調査2022

    • 著者名/発表者名
      崔 恩瀞、藤原 裕士、吉田 則裕、水野 修
    • 雑誌名

      コンピュータ ソフトウェア

      巻: 39 号: 3 ページ: 3_47-3_59

    • DOI

      10.11309/jssst.39.3_47

    • ISSN
      0289-6540
    • 年月日
      2022-07-22
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] An Empirical Investigation on the Performance of Domain Adaptation for T5 Code Completion2023

    • 著者名/発表者名
      Daisuke Fukumoto, Yutaro Kashiwa, Toshiki Hirao, Kenji Fujiwara, Hajimu Iida
    • 学会等名
      The 30th International Conference on Software Analysis, Evolution and Reengineering (SANER2023)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 欠陥混入コミット特定のための開発履歴へのファジング適用2023

    • 著者名/発表者名
      小菅 遙生,藤原 賢二
    • 学会等名
      情報処理学会第85回全国大会講演論文集
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 複数プロジェクトにおいて技術的負債の除去に貢献するOSS開発者の分析にむけて2023

    • 著者名/発表者名
      菱川 潤哉,福本 大介,ポルマニラタナタイ ソラタチ,柏 祐太郎,平尾 俊貴,藤原 賢二,飯田 元
    • 学会等名
      電子情報通信学会技術研究報告,第122巻,第348号
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Data Flow Graphを用いた自動コードレビューに向けて2023

    • 著者名/発表者名
      井原 輝人,福本 大介,柏 祐太郎,平尾 俊貴,藤原 賢二,飯田 元
    • 学会等名
      ウィンターワークショップ2023論文集
    • 関連する報告書
      2022 実績報告書
  • [学会発表] プロジェクトに適したコード補完モデルの実現に向けて2023

    • 著者名/発表者名
      福本 大介,柏 祐太郎,平尾 俊貴,藤原 賢二,飯田 元
    • 学会等名
      ウィンターワークショップ2023論文集
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Investigating the Generalizability of Deep Learning-based Clone Detectors2023

    • 著者名/発表者名
      Eunjong Choi, Norihiro Fuke, Yuji Fujiwara, Norihiro Yoshida, Katsuro Inoue
    • 学会等名
      The 31st IEEE/ACM International Conference on Program Comprehension
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] An Empirical Investigation on the Performance of Domain Adaptation for T5 Code Completion2023

    • 著者名/発表者名
      Daisuke Fukumoto, Yutaro Kashiwa, Toshiki Hirao, Kenji Fujiwara, Hajimu Iida
    • 学会等名
      The 30th IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER), Mar. 2023.
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] テストコードのリファクタリングがテスト実行時間へ及ぼす影響調査にむけて2023

    • 著者名/発表者名
      堀川 康生, 福本 大介, 柏 祐太郎, 市川 嘉裕, 飯田 元
    • 学会等名
      ソフトウェアサイエンス研究会(SIGSS)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] ラピッドリリースの採択がSelf-Admitted Technical Debtの導入に与える影響調査にむけて2023

    • 著者名/発表者名
      渡邉 未来, 福本 大介, 柏 祐太郎, 山口 賢一, 飯田 元
    • 学会等名
      ソフトウェアサイエンス研究会(SIGSS)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 複数プロジェクトにおいて技術的負債の除去に貢献するOSS開発者の分析にむけて2023

    • 著者名/発表者名
      菱川 潤哉, 福本 大介, ポルマニラタナタイ ソラタチ, 柏 祐太郎, 平尾 俊貴, 藤原 賢二, 飯田 元
    • 学会等名
      知能ソフトウェア工学研究会 (KBSE)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Data Flow Graphを用いた自動コードレビューに向けて2023

    • 著者名/発表者名
      井原 輝人, 福本 大介, 柏 祐太郎, 平尾 俊貴, 藤原 賢二, 飯田 元
    • 学会等名
      情報処理学会/ソフトウェア工学研究会 ウィンターワークショップ2023・イン・富山
    • 関連する報告書
      2021 実績報告書

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi