2016 Fiscal Year Research-status Report
Project/Area Number |
15K12094
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
島津 明 北陸先端科学技術大学院大学, シニアプロフェッサー (60293388)
|
Co-Investigator(Kenkyū-buntansha) |
NGUYEN MinhLe 北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (30509401)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 書換え / テキスト構造 / 可読性 / 自然言語処理 / 法令工学 |
Outline of Annual Research Achievements |
本研究は、1次元制約のあるテキストによる情報伝達の高度化に向けて、可読性を高める構造的書換えモデルを明らかにすることを目的とする。ここで構造と言うのは、テキストにおける文の並び方、談話標識、論理的関係、並列性などに関する構造である。従来の可読性に関する研究はテキスト構造の捉え方が不十分であるとの立場から、本研究は主に法律条項を対象に構造的書換えに着目して構造的書換え法を明らかにする新しいアプローチに挑戦するものである。 平成28年度は、前年度に引き続き、国民年金法の条項を対象に、構造的書換えの枠組みをさらに明確にし、具体的に構造的書換えを行い、コーパス作成を行うとともに、構造的書換えの自動化の検討などを行った。 構造的書換えの枠組みについては、平成27年度に基本を決めた。具体的には、本研究の代表者らが過去に人手で行った国民年金法の書換え(島津 明、国民年金法の構造的書換え、JAIST Press、2009)を手がかりに、様々な可能性を検討し、過去に行った被験者実験の結果を考慮し、機械化を目指す立場から、形態素構造や構文構造を踏まえ、条項の要件効果構造的を基本とした。平成28年度は、対象条項を広げてテキスト分析をさらに進め、構造的書換えの枠組みをより明確にした。具体的には、様々な条項表現に対応して、埋め込み文や長い名詞句を記号で置き換えることなどにより長文へ対処する書換えをより明確化した。個別の言語表現についても分かりやくする書換えをより明確化した。このような枠組みに基づき、平成27年度に行った分と合わせて、国民年金法の主要部分である第1章から第9章について、コーパスを作成した。 自動化については、構造的書き換えのベースである要件効果構造の要素の認識に関して、深層学習の適用を試み、有望な結果を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、テキストをどのように構造的に書換えるか明確にし、テキストを構造的に書換えたコーパスを作ることが基本となる。これがあって構造的書換えの自動化や可読性の評価ができる。平成28年度は、前年に分析しなかった条項についても、構造的書換えを試み、コーパスの作成を進め、枠組みをより明確にし、平成27年度に分析した部分の見直しも行い、目標のコーパスを作成した。法律条項以外の対象は、経済記事について見出しを手掛かりにした構造化を検討した。 構造的書換えでは、分析対象を広げ、元文の形態素構造や構文構造を基本としつつも、条項の要件効果構造を分かりやすくし、個別の言語表現を簡素化する枠組みをより明確化した。具体的には、条項の要件効果構造については、長文を避けること、適当に改行すること、数式を利用することなどによる書換えを一層明確化した。言語表現の簡素化については、対象の言語表現を増やし言語表現の書換えを一層明確化した。書換えは書換え規則として表現され、現時点で約80ある。 注釈コーパスは、平成27年度に続き研究協力者とともに作成し、平成27年度分と合わせると、国民年金法の主要部分である第2章から第9章をカバーする。 構造的書換えの自動化は、手続き的方法と機械学習による方法の研究を進めた。手続き的方法については、これまでの分析に基づいて条項の言語的特徴と構造的書換えの関係の体型化が必要である。機械学習による方法については、構造的書き換えのベースである要件効果構造の要素の認識に深層学習の適用を試み、有望な結果を得た。具体的にはベトナムのビジネス法を対象に幾つかの方法を取り上げ、recurrent neural network による方法が最先端の結果と遜色ないことを示した。
|
Strategy for Future Research Activity |
条項の要件効果構造に基づく構造的書換えの機械的方法を研究する。具体的には機械学習を用いる方法及び手続き的方法と書換え規則による方法を検討する。構造的書換えの効果について、被験者実験による評価を試みる。 機械学習を用いる方法については、前年度に引き続き深層学習の適用を検討する。手続き的方法については、条項の言語的特徴と構造的書換えの関係を明確化し、具体化を検討する。 構造的書換えの効果については、代表者らが過去に作成したツールの利用を試み、内容に関する質問応答により評価する方法を具体化し、被験者実験を試みる。 本研究は国民年金法を主な対象にしているが、新聞の経済記事などについても引き続き検討を続ける。
|
Causes of Carryover |
主にコーパスのデータチェック作業委託の完了が3月になることが見込まれ執行しなかったため
|
Expenditure Plan for Carryover Budget |
次年度に未完了作業の委託などに使用する。
|