• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

形態素の複合化処理による中日機械翻訳に関する研究

研究課題

研究課題/領域番号 04680021
研究種目

一般研究(C)

配分区分補助金
研究分野 情報学
研究機関北海道大学

研究代表者

栃内 香次  北海道大学, 工学部, 教授 (50001178)

研究期間 (年度) 1992
研究課題ステータス 完了 (1992年度)
配分額 *注記
1,800千円 (直接経費: 1,800千円)
1992年度: 1,800千円 (直接経費: 1,800千円)
キーワード中日機械翻訳 / 形態素解析 / 複合語 / 意味属性 / 多品詞語 / 多義語
研究概要

現在一般的な機械翻訳手法は、原言語文の形態素解析、構文解析を行って文を構文要素に分解し、それを目的言語の構文要素に変換してから各要素及び要素間の意味解析を行って翻訳結果を得るという形態が多い。しかしながら、漢字べた書きで表記され、かつ日本語の助詞のような格マーカーを持たない中国語文では、形態素ならびに構文の意味依存性が大きく、また多品詞語、多義語が多いために上のように各解析段階を分離する手法は適していない。
本研究では、このような性質を持つ中国語文の形態素解析を効率的に行うために、隣接する単語間の意味属性を利用して可能な場合は隣接語をあらかじめ複合化することにより、多品詞語、多義語に起因するあいまいさを解消する手法の研究を行った。本研究により得られた成果の概要を以下に示す。
1.中国語の教科書及び科学技術文献49編(1,862文)を調査し,基本的な中国語文における隣接語間の複合化規則25個を抽出した。また、これらの複合化規則を適用する際の優先順位を求め、4段階の順位があることを見出した。
2.これらの複合化規則及び優先順位と、特別な形式を持つ三向動詞、ならびに動詞、名詞のいずれにもなりうる兼用品詞を含む場合の処理規則を組み合わせ、隣接語からの複合語生成アルゴリズムを構成した。
3.このアルゴリズムに基づく複合語生成実験システムを構築した。
4.日本語教育用の教科書,科学技術文献などから選んだ400文(15,598字)について複合語の生成実験を行った結果,複合語になるべき語、総数437語のうち415語が正しく生成され,本アルゴリズムが良好な性能をもつことが確認された。

報告書

(1件)
  • 1992 実績報告書
  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] 范 莉馨、任 福継、宮永 喜一、栃内 香次: "中日機械翻訳における中国語複合語の自動合成について" 情報処理学会論文誌. 33. 1103-1113 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 范 莉馨、任 福継、宮永 喜一、栃内 香次: "文の構造特徴を利用した中日機械翻訳システム(中国語)" 中国学協協会青年学術会議論文集. 232-237 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 金 紅蘭、宮永 喜一、栃内 香次: "日中機械翻訳における複合語処理" 平成4年電気関係学会北海道支部連合大会講演論文集. 422- (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 范 莉馨、任 福継、宮永 喜一、栃内 香次: "機械翻訳における中国語の離合詞について" 1993年電子情報通信学会春季大会講演論文集. 6-122- (1993)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 金 紅蘭、宮永 喜一、栃内 香次: "韓中機械翻訳における韓国語格助詞の処理" 1993年電子情報通信学会春季大会講演論文集. 6-123- (1993)

    • 関連する報告書
      1992 実績報告書

URL: 

公開日: 1992-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi