研究課題/領域番号 |
19K11907
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 工学院大学 |
研究代表者 |
位野木 万里 工学院大学, 情報学部(情報工学部), 教授 (10739634)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 技術文書の理解支援 / 要求仕様書の要約 / 要求工学 / 自然言語処理 / 大規模言語モデルの活用 / 自動要約 / 記述状況の要約 / 定量要約 / 自然言語処理技術 / 非機能要求の分類 / 重要文抽出 / 抽出型要約 / 要求仕様の要約 / 非機能要求の要約 / 機能要求の要約 / 要求獲得 / 要求仕様の自動要約 / 生産性向上 |
研究開始時の研究の概要 |
本研究では基幹系情報システム等の膨大な量の要求仕様書の自動要約ツールを実現する.開発するツールは,システム構築の背景や目的等の特性,基本設計工程で必要となる設計情報,リスクのある要求の要点を抽出することからなる要約を自動化する.本研究では,ベテラン技術者による要求仕様書を要約するためのノウハウを形式知化し,開発ツールに組み込み,AIに基づく自然言語処理技術を当該ツールに融合し,要求仕様書の自動要約の精度向上と要約知識の学習に適用する.本研究により,初級の技術者を含むステークホルダが膨大な量の要求仕様書を素早く理解し基本設計に進むことや,レガシーシステムの保守業務の効率化に貢献する.
|
研究実績の概要 |
本研究では、大規模情報システムの要求仕様書の効率的な理解のために、記述内容を(1)システム構築の背景や目的、(2)機能要求、(3)非機能要求に分類し、各分類に対して自然言語処理技術に基づく要約技術を用いることを提案し、使い分けの手法を定義した。本研究では、(1)システム構築の背景や目的については、単語の出現頻度に基づく重要文抽出に基づく手法、(2)機能要求に対しては、アクター、データ、画面、振る舞い等の設計要素別に定義内容を一覧化するキーワード抽出に基づく手法、(3)非機能要求においては、要求仕様書に含まれる非機能要求を入力として、Convolutional Neural Networkとドメインオントロジーに基づく2つの自動文書分類技術を組み合わせ、非機能要求の自動分類結果を定量的観点で視覚化することで要約データを生成する手法を開発した。また、(3)の手法について、従来手法と比較し分類精度が向上したことにより、定義が不十分な非機能要求の種類を特定しやすく、要求仕様書中のリスクの発見と防止に有効であることを確認した。 令和4年度は、文書の構造やページ間の類似性からなる要求仕様書全体の記述状況の可視化による自動要約手法について、実装方法のバリエーションを洗い出し、試作プログラムにより実現可能性について検証した。具体的には、自然言語処理モデルBERTと、GPT-3などの大規模言語モデルを用いて手法を実現した。本手法のバリエーションとしては、技術文書の全体要約において、前者の場合には重要文抽出を、後者の場合には抽象型要約によってトピックを特定することで区別した。また、特定したトピックを用いて要求仕様書の各ページの記述状況を自動可視化する実現方法に関して、全体大規模言語モデルの種類によらない汎用アーキテクチャを明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
3つの視点による要求仕様書の要約手法、記述状況の要約手法において、新たな大規模言語モデルが様々提案されてきている。新たな大規模言語モデルと連携させた上で、実際の要求仕様書や実際のエンジニアによる適用評価が未実施のため。
|
今後の研究の推進方策 |
考案した要求仕様書の要約手法について、評価対象の要求仕様書のデータを拡充すること、ならびに実際のエンジニアにより適用評価を行う。令和4年度は、重要文抽出、キーワード抽出、分類と定量化要約の観点での要約の組み合わせと、記述状況の生成による要約機能の開発の総まとめとして、開発環境構築、プログラム試作を行い、自然言語処理モデルBERTと、GPT-3などの大規模言語モデルによる本手法の実装を行った。令和5年度では、実装したツールについて、とくに実際の要求仕様書や実際のエンジニアによる適用評価を行い、手法へのフィードバックを行う。また、要約情報の生成パターンの種類、種類別の要約情報の利活用のノウハウを明らかにし、ノウハウの公開、共有方法についても具体化する。
|