• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2002 年度 研究成果報告書概要

大規模な日英対訳コーパスから対訳文型パターンを自動獲得するためのプログラムの研究

研究課題

研究課題/領域番号 12558035
研究種目

基盤研究(B)

配分区分補助金
応募区分展開研究
研究分野 知能情報学
研究機関鳥取大学

研究代表者

池原 悟  鳥取大学, 工学部, 教授 (70283968)

研究期間 (年度) 2000 – 2002
キーワード機械翻訳 / 自然言語処理 / 文型パターン / 知識自動獲得
研究概要

この研究は、機械翻訳などで必要とする意味解析技術の実現を狙って、日本語と英語の「表現意味辞書」の開発に必要な意味的構造パターンを自動的に抽出するため、大規模な日本語と英語の対訳コーパス対象に、意味的な対応関係にある表現構造を発見し抽出するためのプログラムを研究開発するものである。平成12年度は、(1)日英対訳データベースの構築、(2)文型抽出に適した要素置き換え方式の検討、(3)統語的文型パターン抽出方式の検討を行った。具体的には、(1)では、入手済みの日英対訳文ファイルを統合して対訳DBを作成する一方、対訳DBの形態素解析と構文解析を行い、タグ付きのDBを作成した。(2)では、既存の共起表現抽出プログラムを使用した実験的検討により、日本語の単文、名詞、句、複文・重文のパターン情報を抽出するのに適した文要素置き換え規則を求めた。また、(3)では部分試作を含め、(1)文間の係り受け構造の同一性と類似性を判定するアルゴリズム、(2)文間で係り受け関係が一致する文要素のみを発見して抽出するアルゴリズム、(3)抽出された日本語パターンに対応する英語表現の部分を発見するアルゴリズムの検討を行った。平成13年度は、初年度の検討結果に基づき、統語構造情報付きの文型パターン抽出プログラムを試作すると共に、日本語パターンに対応する英語部分表現の抽出プログラムを試作した。平成14年度は、100万件の日英対訳例文を対象に、半自動的に対訳文型パターンを抽出するための実験を開始し、抽出した文型パターンの評価と性能に関する検討を行った。
以上の結果、人で作業のみでは困難と見られていた大規模な対訳コーパスからの対訳文型パターンの抽出において、大幅なコスト削減ができる見通しとなり、この成果を用いて日英言語表現の意味辞書開発のプロジェクトを開始したところである。

  • 研究成果

    (12件)

すべて その他

すべて 文献書誌 (12件)

  • [文献書誌] 池原悟: "究極の翻訳方式の実現に向けて=類推思考の原理に基づく翻訳方式="AAMT Journal. No.33. 1-7 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 池原悟, 村上仁一, 宮本健司: "「AのB」型名詞句の日英翻訳規則について"情報処理学会論文誌. Vol.43, No.7. 2300-2308 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 池原悟, 村上仁一, 的場和幸: "日英機械翻訳のための時間表現の意味と対応関係の解析"情報処理学会論文誌. Vol.44, No.2. 451-465 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 池原悟, 佐良木昌, 宮崎正弘, 池田尚志, 新田義彦, 白井諭, 柴田勝征: "等価的類推思考の原理による機械翻訳方式"電子情報通信学会 言語と思考研究会. TL2002-34. 7-12 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 道祖尾太祐, 村上仁一, 徳久雅人, 池原悟: "日英対訳パターンの自動抽出について"情報処理学会 自然言語処理研究会. NL-153-15. 113-118 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 金出地真人, 徳久雅人, 村上仁一, 池原悟: "結合価文法による動詞と名詞の訳語選択能力の評価"情処研報 自然言語処理研究会. 2003-NL-153-16. 119-124 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Satoru Ikehara: "Analogical Mapping Method for MT based on Semantic Typology"AAMT Journal. Vol.33. 1-7 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Satoru IKEHARA, Junichi MURAKAMI, Kenji MIYAMOTO: "Translation Rules for Japanese Noun Phrase "A to B""Journal of the IPSJ (Information Processing Society of Japan). Vol.43, No.7. 2300-2308 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] SATORU IKEHARA, JUNICHI MURAKAMI and KAZUYUKI MATOBA: "Meaning Analysis and Correspondence of Time Expressions for Japanese to English Machine Translations"Journal of the IPSJ (Information Processing Society of Japan). Vol.44, No.2. 451-465 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Satoru Ikehara, Masahiro Nitta, Naoshi Ikeda, Satoshi Shirai, Katsumata Shibata: "Analogical Mapping Method for MT based on Semantic Typology"SIG-TL of IEICE (The Institute of Electronics, Information and Communication Engineers). TL2002-34. 7-12 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Daisuke Sainoo, Junichi Murakami, Masato Tokushima, Satoru Ikehara: "Toward automatic extraction of Japanese/English expression pattern pairs"SIG-NL of IPSJ. NL-153-15. 113-118 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Masato Kanadechi, Masato Tokuhisa, Junichi Murakami, Satoru Ikehara: "Evaluation of Word Selection using Valency Grammar for Japanese Verb and Nouns"SIG-NL of IPSJ. NL-153-16. 119-124 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より

URL: 

公開日: 2004-04-14  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi