研究課題/領域番号 |
17K00116
|
研究機関 | 福岡大学 |
研究代表者 |
中西 恒夫 福岡大学, 工学部, 教授 (70311785)
|
研究分担者 |
吉村 賢治 福岡大学, 工学部, 教授 (40167002)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
古庄 裕貴 福岡大学, 工学部, 助教 (90781807) [辞退]
田辺 利文 福岡大学, 工学部, 助教 (80330900)
廣重 法道 福岡大学, 工学部, 助教 (30736228)
|
研究期間 (年度) |
2017-04-01 – 2023-03-31
|
キーワード | 自然言語処理 / 並列構造 / 日本語句構造文法 / 形態素 / 要求定義 |
研究実績の概要 |
本研究では,既存開発文書から追加/変更に係る要求を抽出すべく,既存開発文書を機械的処理の容易な単文に分割し,得られた単文に対して,語の概念構造や品詞を基とする一定のルールに基づく加工を施すアプローチを採ってきた。 単文分解については,日本語句構造文法に基づくチャート法により,日本語文に構文解析を施し,解析に失敗した場合は文中に並列構造があるものとみなして並列構造の解析を行う方式を採った。並列構造の解析にあたっては,構造解析木の部分の相同性を見つけることで行った。前年度は並列構造推定後に単文分解し,構文解析をやり直していたが,今年度は推定した並列構造を「並列項」として表現し,前段の解析結果を捨てずに再利用するよう,並列構造解析のアルゴリズムを改良した。入力文によっては,実際には曖昧性のない並列構造文であっても,並列構造部に曖昧性を含んだかたちの解析結果が得られる場合があり,そのときは曖昧部の推定が必要となる。 本研究では,形態素レベルのパターンマッチングを行うツール morfgrep/morfawk が副産物として開発されている。今年度はこれらツールを拡張し,文節の係り受け構造に対してもパターンマッチングが行える morfawk.ja を開発した。形態素のシーケンスに対してパターンマッチングをかける morfgrep/morfawk では,意味的には同じであってもシーケンスの異なる日本語記述にマッチングする場合,そのマッチングパターンの記述は直感性に劣る,複雑なものとなっていた。形態素の係り受け構造,いわばツリー構造にマッチングをかける morfawk.ja では,そのような場合でもマッチングパターンの記述が自然かつ簡潔なものとすることができる。 本研究では,さらにこれらの成果を結合して,既存開発文書から追加/変更に係る派生的要求を抽出ツールの開発を目指していたが,期間中の達成は成らなかった。
|