2006 Fiscal Year Annual Research Report
Project/Area Number |
16200009
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 大学院工学研究科, 教授 (30205918)
|
Co-Investigator(Kenkyū-buntansha) |
宇津呂 武仁 筑波大学, 大学院システム情報工学研究科, 助教授 (90263433)
山本 和英 長岡技術科学大学, 電気系, 助教授 (40359708)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
藤田 篤 名古屋大学, 大学院工学研究科, 助手 (10402801)
|
Keywords | 基本語 / 機能表現 / 慣用句 / 言い換え / テキストの難易度 / 電子化辞書 |
Research Abstract |
本年度の主な研究成果は、次の通りである。 1.電子化辞書の作成のためのデータ整理 わかりやすい日本語の規格の中心となる電子化辞書の作成のための準備を進めた。基本語のデータを集約するとともに、約5000語の基本語を第一次案として選定した。これを国語辞典の重要語と比較する作業を進めている。これと平行して、複数の語から構成される基本単位である機能表現(複合辞)と慣用句のデータを整理した。これらにより、電子化辞書の見出しを最終的に決定する準備がほぼ整った。 2.機能表現辞書の作成、および、解析方法の検討 機能表現に関するデータを整理し、主要な機能表現の出現形をほぼ網羅した「日本語機能表現一覧」を作成した。これと平行してテキスト中に含まれる機能表現を自動的に検出する手法について研究を進めた。形態素解析/機能表現チャンキング/機能表現を考慮した係り受け、という3ステップからなる解析系を実現した。 3.テキストの難易度判定手法 あらかじめ難易度別に訓練テキストを用意し、それらから作成した言語モデル(文字unigram)との類似度に基づいて、テキストの難易度を判定する手法を実現した。 4.フレーザルシソーラス フレーズ単位で言い換えを生成するフレーザルシソーラスという概念を提唱し、そのプロトタイプを試作した。 この他に、言い換え表現の自動抽出、国語辞典の語釈文に対するアノテーション(ある種の言い換えコーパス)等を研究し、成果を上げた。
|
Research Products
(6 results)