• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

辞書自動編纂のためのテクノロジー

研究課題

研究課題/領域番号 21300094
研究機関名古屋大学

研究代表者

佐藤 理史  名古屋大学, 大学院・工学研究科, 教授 (30205918)

キーワード多言語処理 / 辞書自動編纂 / 外国人名対訳 / カタカナ語 / 人名判定 / トランスリタレーション / オノマトペ
研究概要

本研究では、実際に複数の辞書の自動編纂を実現することを通して、辞書編纂の自動化に必要な設計・編纂法と、それに対応する自動編纂技術を開発することを目的としている。本年度は次のことを行った。
(1) 高品質な外国人名対訳辞書の自動編纂を目指し、昨年度収集した対訳データのクリーニング(雑音除去)に取り組んだ。個々の対訳の採否判定には、ウェブサーチエンジンから得られる各種ヒット数、統計的手法により計算される人名らしさ、対応関係のもっともらしさ等を用いて総合的に判定する方法を採用したが、高い精度を実現することはかなり難しいことがわかった。同時に、精度を測定する方法にも工夫が必要であることが明らかになった。
(2) 選択型(非生産型)トランスリタレーションのシステムを実装し、さらなる改良を行って、速度を数倍向上させた。このシステムを利用することによって、2つの言語の大規模人名リストから対訳を発見(収集)することができることを確認した。これにより、2つの言語で、それぞれ高品質、かつ巨大な人名リストを編纂することができれば、高品質な外国人名対訳辞書を自動編纂することができる見通しを得た。
(3) カタカナ語の自動編纂に必要な要素技術を検討した。原綴推定に関しては、短い語は既存の辞書を利用し、長い語は選択型トランスリタレーションを利用する。カタカナ8文字以上であれば、選択型トランスリタレーションで原綴推定が実用的な精度で実現できる見通しを得た。
(4) 言い換え辞書の自動編纂の一つの要素技術として、オノマトペの言い換えを自動収集する方法を実現した。この方法は、「きっぱり(強く)と否定する」、「きっぱりと(潔く)諦める」のように、文脈(動詞との共起)に応じて異なる言い換えを見つけることができる点に特徴がある。

  • 研究成果

    (4件)

すべて 2011 2010 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件) 備考 (1件)

  • [雑誌論文] Non-Productive Machine Transliteration2010

    • 著者名/発表者名
      Satoshi Sato
    • 雑誌名

      Riao-2010 (9th international conference on Adaptivity, Personalization and Fusion of Heterogeneous Information)

    • 査読あり
  • [雑誌論文] A Person-Name Filter for Automatic Compilation of Bilingual Person-Name Lexicons2010

    • 著者名/発表者名
      Satoshi Sato, Sayoko Kaide
    • 雑誌名

      Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10)

    • 査読あり
  • [学会発表] オノマトペを言い換える表現の自動収集2011

    • 著者名/発表者名
      古武泰樹, 佐藤理史, 駒谷和範
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-10
  • [備考]

    • URL

      http://kotoba.nuee.nagoya-u.ac.jp

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi