研究課題/領域番号 |
17500163
|
研究機関 | 武蔵工業大学 |
研究代表者 |
上原 徹三 武蔵工業大学, 工学部, 教授 (60257102)
|
研究分担者 |
荒井 秀一 武蔵工業大学, 工学部, 助教授 (20212590)
清水 由美子 武蔵工業大学, 環境情報学部, 助教授 (30298020)
|
キーワード | 自然言語処理 / 日本語情報処理 / 機械翻訳 / 文法情報 / 辞書 / コーパス / 格フレーム情報 / 係り受け関係 |
研究概要 |
次の諸点を実施した。 1.研究実施計画の第1点である、現代語の文法知識を利用した古典文の現代文への変換について、目的通りの進行である。即ち、平安時代の古典文から現代文への変換を対象に、索引による辞書検索を含めて格フレーム辞書に基づく変換処理を試作した。その処理手順は次の通りである(評価と改良は次年度の課題である)。 (1)単語分け・品詞付けされた古典文の各単語を古語辞典の訳語に置換える(訳語は複数個あり得る)。 (2)次に訳語列中の動詞の格パターン(動詞に係り得る名詞の概念と格助詞の記述)と名詞の概念とを現代語辞書から求め、この組み合わせによって訳文候補(原文の各単語に対する訳語候補の組み合わせ)の妥当性を判定する。 (3)訳語列の選択:格パターンと概念情報から、訳語列の妥当性を判断し、妥当性の高い候補を選び出す。 2.研究実施計画の第2点である文法情報の獲得法については、計画を練り直し、コーパスを利用した獲得法を検討中である。それは上の変換結果の正しさを自動的に評価する手段がないため、変換結果に基づく文法情報の獲得の効率が低いためである。新たに検討中の方法は、文法情報が付されたコーパスに基づく単語辞書情報や単語属性の獲得法である。コーパスの関係データベース化により、データベースの検索機能による情報収集を行なうことを検討している。 3.現代文の係り受け解析に格パターンの一種である結合価パターン(各動詞が取る格助詞の組)を用いる効果を調べる実験を実施した。この検討は本研究以前から実施していたが、本年度に一応の結果を得たため学会で報告した。これは、本研究の実施事項として掲げてはいないが、上の変換処理で用いる妥当性判定手法(上記の1.(2)を参照)と関連が強いので、一環の研究の一つとしてここに記した。
|