研究課題
本研究では、大規模情報システムの要求仕様書の効率的な理解のために、記述内容を(1)システム構築の背景や目的、(2)機能要求、(3)非機能要求に分類し、各分類に対して自然言語処理技術に基づく要約技術を用いることを提案し、使い分けの手法を定義した。本研究では、(1)システム構築の背景や目的については、単語の出現頻度に基づく重要文抽出に基づく手法、(2)機能要求に対しては、アクター、データ、画面、振る舞い等の設計要素別に定義内容を一覧化するキーワード抽出に基づく手法、(3)非機能要求においては、要求仕様書に含まれる非機能要求を入力として、Convolutional Neural Networkとドメインオントロジーに基づく2つの自動文書分類技術を組み合わせ、非機能要求の自動分類結果を定量的観点で視覚化することで要約データを生成する手法を開発した。また、(3)の手法について、従来手法と比較し分類精度が向上したことにより、定義が不十分な非機能要求の種類を特定しやすく、要求仕様書中のリスクの発見と防止に有効であることを確認した。令和4年度は、文書の構造やページ間の類似性からなる要求仕様書全体の記述状況の可視化による自動要約手法について、実装方法のバリエーションを洗い出し、試作プログラムにより実現可能性について検証した。具体的には、自然言語処理モデルBERTと、GPT-3などの大規模言語モデルを用いて手法を実現した。本手法のバリエーションとしては、技術文書の全体要約において、前者の場合には重要文抽出を、後者の場合には抽象型要約によってトピックを特定することで区別した。また、特定したトピックを用いて要求仕様書の各ページの記述状況を自動可視化する実現方法に関して、全体大規模言語モデルの種類によらない汎用アーキテクチャを明らかにした。
3: やや遅れている
3つの視点による要求仕様書の要約手法、記述状況の要約手法において、新たな大規模言語モデルが様々提案されてきている。新たな大規模言語モデルと連携させた上で、実際の要求仕様書や実際のエンジニアによる適用評価が未実施のため。
考案した要求仕様書の要約手法について、評価対象の要求仕様書のデータを拡充すること、ならびに実際のエンジニアにより適用評価を行う。令和4年度は、重要文抽出、キーワード抽出、分類と定量化要約の観点での要約の組み合わせと、記述状況の生成による要約機能の開発の総まとめとして、開発環境構築、プログラム試作を行い、自然言語処理モデルBERTと、GPT-3などの大規模言語モデルによる本手法の実装を行った。令和5年度では、実装したツールについて、とくに実際の要求仕様書や実際のエンジニアによる適用評価を行い、手法へのフィードバックを行う。また、要約情報の生成パターンの種類、種類別の要約情報の利活用のノウハウを明らかにし、ノウハウの公開、共有方法についても具体化する。
令和4年度は、新型コロナ感染防止のために学会参加を絞り込む状況が継続した。令和5年度は、実際の要求仕様書や実際のエンジニアによる適用評価を行い、論文投稿ならびに学会参加により研究成果を公開する予定であり、投稿料、学会参加費等で研究費を使用する。
すべて 2023 2022 その他
すべて 雑誌論文 (1件) 学会発表 (4件) 備考 (1件)
情報サービス産業協会 JISA 会報(JISA Quarterly)
巻: 145 ページ: 45-53
http://www.ns.kogakuin.ac.jp/~wwa1076/