研究課題/領域番号 |
17K18481
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
研究分野 |
文学、言語学およびその関連分野
|
研究機関 | 長岡技術科学大学 |
研究代表者 |
山本 和英 長岡技術科学大学, 工学研究科, 准教授 (40359708)
|
研究期間 (年度) |
2017-06-30 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2019年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2018年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | やさしい日本語 / 平易化 / 対訳コーパス / テキスト平易化 / ニューラル機械翻訳 / WordNet / USMT / 自然言語処理 / 自動平易化 / 人工知能 / 教育工学 |
研究成果の概要 |
(1)やさしい日本語かどうかを自動判定するやさしい日本語チェッカーを作成してWebアプリとして一般に公開した (2)このツールを使って50,000文規模からなる入力文とやさしい日本語テキストの対訳コーパスを収集した。これは現時点で平易化コーパスとして日本語唯一であると同時に世界最大規模である。同時に、2000語から構成されるやさしい日本語の語彙・文法を定義した。さらに、クラウドソーシングを利用して前述のやさしい日本語コーパスを拡張し、35000文(両者で85000文)のコーパスを構築した。 (3)以上のコーパスを用いて、日本語平易化に関する各種研究を実施した。
|
研究成果の学術的意義や社会的意義 |
やさしい日本語に対する潜在需要と一般の関心は高く、NHK News Web Easy や自治体などで徐々に社会的に認知される段階に入りつつある。そのような中で、日本語で唯一の平易化コーパスを構築して公開した意義は非常に大きい。日本語の自動平易化研究は語彙平易化を除けば現時点で本研究課題のみであり、自然言語処理への貢献も非常に大きいと考える。政府や自治体からのお知らせがもし自動でやさしい日本語に変換することができれば情報保障の観点から非常に有益で、本研究課題はそのための基礎を構築できたと考えている。
|