2007 Fiscal Year Annual Research Report
Project/Area Number |
16200009
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 Nagoya University, 大学院・工学研究科, 教授 (30205918)
|
Co-Investigator(Kenkyū-buntansha) |
宇津呂 武仁 筑波大学, 大学院・システム情報工学研究科, 准教授 (90263433)
山本 和英 長岡技術科学大学, 電気系, 准教授 (40359708)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)
藤田 篤 名古屋大学, 大学院・工学研究科, 助教 (10402801)
|
Keywords | 基本語彙 / 機能表現 / 慣用句 / 言い換え / テキストの難易度 / リーダビリティ / 電子化辞書 |
Research Abstract |
本年度は、以下の成果を上げた。 1.日本語の中核となる語彙を列挙した日本語基本語彙JC2.2を編纂した。この語彙表は、211の機能表現と177の慣用表現を含む、5814語(表現)を収録している。この語彙表では、単に語を列挙するだけでなく、既存の語彙表への対応、既存の国語辞典での重要語指定の有無、形容詞の主要な派生形、および、動詞の自他の対応・可能形などを、付加的情報として明示している。 2.昨年度までに編纂した日本語機能表現辞書に意味的階層構造を新たに導入し、与えられた表層形に対して、意味的に等価な表層形を列挙する機能を実現した。この機能を用いて、機能表現を言い換えるシステムを実現した。このシステムでは、出力の文体と難易度を指定することができる。 3.小中高の文部科学省検定教科書と大学教養課程の教科書からサンプルテキストを抽出した教科書コーパス(サンプルテキスト数1478、総文字数約100万字)を編纂した。 4.上記の教科書コーパスを規準テキストとして、日本語テキストの難易度を推定するシステムを実現した。このシステムの推定精度は、相関係数0.92、平均二乗平方根誤差(RMSE)1.41であり、これまでに提案されている難易度推定システムより優れている。 5.述語句に対して、多数の同義表現を生成・提示するフレーザル・シソーラスを、言い換え候補生成モジュールと意味的等価性・置換可能性推定モジュールの2つのモジュールから構成されるシステムで実現した。
|
Research Products
(18 results)