研究実績の概要 |
(1)やさしい日本語 2,000語の選定:下記項目(3)に述べるやさしい日本語コーパスの作成と同時に書き換えに使用する基礎語彙2,000語を(試行錯誤を重ねた上で)独自に定義した。語彙リストは http://box.jnlp.org/easy-japanese/words2 で公開している。 (2)やさしい日本語チェッカーの公開:上記項目(1)で定義した基礎日本語2,000語が入力文中にどの程度含まれているかを瞬時に視覚化するツール「やさしい日本語チェッカー」を作成し、一般に公開した(http://box.jnlp.org/easy-japanese/checker)。次項で述べるコーパスの作成時にもこのツールを用いた。 (3)やさしい日本語対訳コーパスの作成と公開:項目(2)で作成したツールを用いて、5万文に対して上記2,000語の語彙のみで書き換える作業を行った。この結果作成したコーパスを一般公開した(http://www.jnlp.org/SNOW/T15)。 (4)やさしい日本語対訳コーパスの拡張:上記(3)で作成したコーパスとは別に、3万5千文規模の文に対して2,000語の語彙で書き換える作業をクラウドソーシングによって作成した。 (5)やさしい日本語換言辞書の作成:上記(3)のコーパス中に出現しない単語に対して、やさしい日本語2,000語で書き換えた換言辞書20,000語をクラウドソーシングによって作成した。
|