研究課題/領域番号 |
16200009
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 名古屋大学 (2005-2007) 京都大学 (2004) |
研究代表者 |
佐藤 理史 名古屋大学, 工学院工学研究科, 教授 (30205918)
|
研究分担者 |
宇津呂 武仁 筑波大学, 大学院・システム情報工学研究科, 准教授 (90263433)
山本 和英 長岡技術科学大学, 電気系, 准教授 (40359708)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)
藤田 篤 名古屋大学, 大学院・工学研究科, 助教 (10402801)
|
研究期間 (年度) |
2004 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
48,620千円 (直接経費: 37,400千円、間接経費: 11,220千円)
2007年度: 12,350千円 (直接経費: 9,500千円、間接経費: 2,850千円)
2006年度: 13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)
2005年度: 13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)
2004年度: 10,270千円 (直接経費: 7,900千円、間接経費: 2,370千円)
|
キーワード | 基本語彙 / 機能表現 / 慣用句 / 言い換え / リーダビリティ / 辞書 / テキストの難易度 / 電子化辞書 / 基本語 / 複合辞 / 用例データベース / 機能表現用例コーパス / 語構成 / 境界認定 / 文末整形 |
研究概要 |
本研究の主な成果は次のとおりである。 1. 日本語の中核となる語彙を列挙した日本語基本語彙JC2.2を編纂した。この語彙表は、211の機能表現と177の慣用表現を含む、5814語(表現)を収録している。 2. 機能表現341語とその出現形16,711件を階層的に整理した、日本語機能表現辞書を編纂した。この辞書を用いて、機能表現を言い換えるシステムを実現した。 3. 「現代語複合辞用例集」に準拠した日本語複合辞用例データベースMUST1を編纂した。このデータベースを利用した機械学習により、テキスト中の機能表現を検出するシステムを実現した。 4. 小中高の文部科学省検定教科書と大学教養課程の教科書からサンプルテキストを抽出した教科書コーパス(サンプルテキスト数1478、総文字数約100万字)を編纂した。この教科書コーパスを規準テキストとして、日本語テキストの難易度を推定するシステムを実現した。 5. 述語句に対して、多数の同義表現を生成・提示するフレーザル・シソーラスを実現した。 6. 応用指向の言い換え・言語変換として、「サ変動詞+名詞」の複合名詞への言い換え、理解補助を目指した動詞句の言い換え、「新幹線要約」のための文末の言い換えを実現した。また、要約の新しい手法として、要約事例を用例として利用したニュース記事要約を提案・実現した。 7. 上記成果のうち、JC2.2, MUST1,難易度推定システムを一般に公開した。
|