2015 Fiscal Year Research-status Report
Project/Area Number |
15K12094
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
島津 明 北陸先端科学技術大学院大学, シニアプロフェッサー (60293388)
|
Co-Investigator(Kenkyū-buntansha) |
NGUYEN MinhLe 北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (30509401)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 書換え / テキスト構造 / 可読性 / 自然言語処理 |
Outline of Annual Research Achievements |
本研究は、1次元制約のあるテキストによる情報伝達の高度化に向けて、可読性を高める構造的書換えモデルを明らかにすることを目的とする。ここで構造と言うのは、テキストにおける文の並び方、談話標識、論理的関係、並列性などに関する構造である。従来の可読性に関する研究はテキスト構造の捉え方が不十分であることから、本研究は構造的書換えに着目し構造的書換え法を明らかにする新しいアプローチに挑戦するものである。 平成27年度は、計画に沿って、国民年金法の条項を対象に、構造的書換えの具体化やコーパス作成などを主に進めた。具体的には、構造的書換えの原則を考え、その説明書や手順書の検討、テキスト属性との関係の分析や注釈コーパスの作成、可読性評価のための被験者実験の検討を行った。この他、国民年金法以外に新聞の経済記事を対象として構造的書換えの可能性を検討した。これらの研究により構造的書換えが明確になり、今期以降の研究の展開が可能になる。 構造的書換えの明確化は、報告者らが過去に人手で行った国民年金法の書換え(島津 明、国民年金法の構造的書換え、JAIST Press、2009)を手がかりに、様々な可能性を検討した。過去に行った被験者実験の結果を考慮し、機械化を目指す立場から、形態素構造や構文構造を踏まえた構造的書換えを基本とすることにし、構造的書換えの説明書や手順書を作成した。手順書に基づいて、研究協力者が国民年金法の条項を書換え、注釈コーパスを作成した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、テキストをどのように構造的に書換えるか明確にし、テキストを構造的に書換えたコーパスを作ることが基本となる。これがあって、構造的書換えの自動化や可読性の評価ができる。本研究の1年目は、この構造的書換えの明確化とコーパスの作成が主である。コーパスは目標の7割程度を作成した。 構造的書換えの明確化では、様々な検討に基づいて構造的書換えの原則を考え、その説明書や手順書に従って、研究協力者が国民年金法の第2章から第6章の7割の条項を書換え、注釈コーパスを作成した。注釈コーパスは、元条項と書換え結果からなり、それらには、語分割情報、主題、要件、効果などの付加情報が加えられている。 構造的書換えを明確化するために、要件効果構造などの論理的骨子が論理記号により陽に分かるようにするスタイル、テキストを囲む枠やアンダーラインなどの図形を利用するスタイル、長い句を記号により置き換え、主文の論理的骨子が簡素にするスタイル、重要部分とそれ以外のフォントの大きさを変えるスタイル、重要部分の主辞を太文字にするスタイル、これらの組み合わせなどを検討した。幾つかの条項にこれらのスタイルを適用し、読みやすさを研究協力者とともに評価し、過去に行った被験者実験の結果も参考にして、コーパス化する構造的書換えの基本を決めた。
|
Strategy for Future Research Activity |
引き続きコーパスの作成を進める。分析テキストが増え、様々な表現を見ることにより、既に行った構造的書換えの改良も検討し、書換えの原則の見直し、手順書の改良、それに基づく既成コーパスの修正を行う。 複数の書換え原則が適用な場合についての適用指針についても検討する。書換えた結果、テキスト量が増えることは必ずしもよいとは言えない。簡明化と全体量のバランスなどを検討する。 構造的書換えコーパスに対して、条項毎にどのような書換え原則が使われたか、どのような言語的特徴が関係しているかなどを分析する。分析に基づいて構造的書換えの機械化を検討し、機械化を試み評価する。条項の構造的書換えは条項の要件効果構造がキーとなることから、条項の要件効果構造の解析などを考量した機械化も検討する。 構造的書換えの効果を確かめるために被験者実験を検討し、具体化して効果を評価するとともに、他の構造的書換えの可能性についても模索する。
|
Causes of Carryover |
構造的書換えコーパスの作成を言語データ作成の専門会社に外注したが、作業者の確保に時間を要し、年度内に予定の3割ができなかったため
|
Expenditure Plan for Carryover Budget |
平成27年度にできなかった分のコーパスの作成の外注費に使用する。
|