2015 Fiscal Year Annual Research Report
多義語の意味の自動特定機能を組み入れたやさしい日本語による読解支援環境の構築
Project/Area Number |
15H03219
|
Research Institution | Tokyo International University |
Principal Investigator |
川村 よし子 東京国際大学, 言語コミュニケーション学部, 教授 (40214704)
|
Co-Investigator(Kenkyū-buntansha) |
北村 達也 甲南大学, 知能情報学部, 教授 (60293594)
金庭 久美子 立教大学, 外国語学部, 講師 (60733772)
前田 ジョイス 東京国際大学, 言語コミュニケーション学部, 教授 (90275800)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 日本語教育 / 読解支援 / 共生社会 / やさしい日本語 / 多義語 / 意味 / 慣用表現 / Web環境 |
Outline of Annual Research Achievements |
本研究は、平成24-26年度基盤研究(B)で開発を進めてきたやさしい日本語書き換えシステムをさらに発展させ、多義語の意味の特定も可能なやさしい日本語による読解支援環境をWeb上に構築することを目指している。これよって、日本語学習者のみならず、日本在住の日本語非母語話者や日本人の年少者や高齢者など、いわゆる共生社会における日本語弱者にとって有用な読解支援を提供することが可能になる。 初年度の中心となる研究は、難易度の高い多義語の書き換えリストの作成と意味決定パターンの抽出である。そのため、書き換え候補の精度を高める際、書き換えが利用者にとって有用であるよう、当該語句の出現頻度情報を重視することにした。具体的な研究方法は次のとおりである。 a. 難易度の高い多義語の選定:難易度の高い単語の選定対象としては、初級(旧日本語能力試験の出題基準をもとにした3級と4級)の語以外を対象とした。すでに前研究で集めたリストに加えて形容動詞(形状詞)とサ変動詞(名詞・サ変可能)を中心に多義語リストを作成した。 b. 書き換えリストの作成:書き換えリストは、見出し語の前後の助詞にまで配慮し、やさしい日本語での書き換えをおこなった。リスト作成にあたっては、コーパスをもとにして、できるだけ多様な書き換え候補を併記するとともに、各書き換え候補に該当する例文を収集した。 c. 意味の決定パターンの抽出と分類:本年度はサ変動詞+名詞で構成される複合名詞について、コンピュータでの判定を考慮してN-gram情報をもとに意味決定が可能かどうかを調査した。 d.新聞コーパスを活用した慣用表現使用実態調査:N-gram情報の分析の結果、新聞コーパスの有用性が判明したため、新聞コーパスにおいて使用頻度の高い慣用表現の抽出を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
サ変動詞及び形容動詞の多義語リストは完成し、それを搭載したやさしい日本語書き換えシステムは予定通り稼働している。ただし、多義語の意味の特定に関して、研究当初は構文解析技術を用いることを視野に入れていたが、調査の結果、多義語の意味の特定には、構文解析より、むしろ、慣用表現およびコロケーションをもとに分析したほうが、より汎用性が高いことが判明した。そのため、2015年度は使用頻度の高い慣用表現を抽出することにした。次年度は、これをもとに慣用表現に対応できるシステムに改良していくことに軌道修正した。さらに、次年度以降、コロケーションにも配慮して多義語の意味の特定が行えるようにシステムを整えていく予定である。その際、Webコーパスや新聞コーパスだけでは十分な情報が得られないことが想定されるため、シソーラスも参照できる仕組みを取り入れ、より多くの表現に対して意味の特定が可能なシステムにしていく。
|
Strategy for Future Research Activity |
コーパスを利用した調査の結果、多義語の意味の特定には、慣用表現およびコロケーションへの対応が有用であることが判明した、そのため、現在、Web上の情報の集約であるグーグルN-gramと新聞コーパスを利用して、慣用表現およびコロケーション情報を抽出し、リスト化を行っている。今後はこのデータをもとにして書き換えリストを拡充するとともに、シソーラスも活用して汎用性を高め、多義語の意味の特定可能なやさしい日本語書き換えシステムの完成を目指していく。
|
Research Products
(15 results)