• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

辞書自動編纂のためのテクノロジー

研究課題

研究課題/領域番号 21300094
研究機関名古屋大学

研究代表者

佐藤 理史  名古屋大学, 大学院・工学研究科, 教授 (30205918)

キーワード他言語処理 / 辞書自動編纂 / 外国人名対訳 / カタカナ語 / 人名判定 / 翻字
研究概要

本年度は、外国人名対訳辞書の自動編纂技術の高精度化に取り組んだ。これと平行して、カタカナ語辞書の自動編纂に必要な技術の開発を行った。主な研究成果は、以下の通りである。
(1)ウェブのサーチエンジンを利用して、外国人名の翻字・逆翻字を行うシステム(ウェブに基づくトランスリタレーションシステム)の改良および評価を行い、高い精度で翻字・逆翻字を実行できることを確認した。
(2)上記のシステムを組み込んだ対訳クローラーによる外国人名対訳収集と、その後の編集処理により、40万件の外国人名対訳辞書を自動編纂した。この辞書を利用して、ウェブ上に存在する信頼できる対訳の数を60万件と推定した。
(3)自動編纂した外国人名対訳辞書の検索システム、および、辞書に存在しない場合に(1)のシステムを呼び出して動的に対訳を推定するシステムを統合し、誰もが利用できるシステムとして、ウェブ上で公開した。
(4)対訳辞書自動編纂の精度向上のキーとなる、人名判定技術の改良を行い、再現率0.94、精度0.97の人名判定フィルタを実現した。
(5)高速な対訳収集を可能とするために、非生産的トランスリタレーションと呼ぶ新しい翻字方式を提案するとともに、それを高速に実行するアルゴリズムを考案した。
(6)上記方式を、カタカナ語一般の対訳の推定への適用可能性について検討し、長いカタカナ語に対しては良好な結果を得た。

  • 研究成果

    (4件)

すべて 2010 2009 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件) 備考 (1件)

  • [雑誌論文] Crawling English-Japanese Person-Name transliterations from the Web2009

    • 著者名/発表者名
      Satoshi Sato
    • 雑誌名

      Proc.of WWW-2009

      ページ: 1151-1152

    • 査読あり
  • [雑誌論文] Web-Based Transliteration of Person Names2009

    • 著者名/発表者名
      Satoshi Sato
    • 雑誌名

      Proc.of WI-2009

      ページ: 273-278

    • 査読あり
  • [学会発表] 大規模候補リストを利用したトランスリタレーション2010

    • 著者名/発表者名
      佐藤理史
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京大学 (東京都)
    • 年月日
      2010-03-11
  • [備考]

    • URL

      http://kotoba.nuee.nagoya-u.ac.jp/tsumugi

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi