2009 Fiscal Year Annual Research Report
Project/Area Number |
21300094
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 Nagoya University, 大学院・工学研究科, 教授 (30205918)
|
Keywords | 他言語処理 / 辞書自動編纂 / 外国人名対訳 / カタカナ語 / 人名判定 / 翻字 |
Research Abstract |
本年度は、外国人名対訳辞書の自動編纂技術の高精度化に取り組んだ。これと平行して、カタカナ語辞書の自動編纂に必要な技術の開発を行った。主な研究成果は、以下の通りである。 (1)ウェブのサーチエンジンを利用して、外国人名の翻字・逆翻字を行うシステム(ウェブに基づくトランスリタレーションシステム)の改良および評価を行い、高い精度で翻字・逆翻字を実行できることを確認した。 (2)上記のシステムを組み込んだ対訳クローラーによる外国人名対訳収集と、その後の編集処理により、40万件の外国人名対訳辞書を自動編纂した。この辞書を利用して、ウェブ上に存在する信頼できる対訳の数を60万件と推定した。 (3)自動編纂した外国人名対訳辞書の検索システム、および、辞書に存在しない場合に(1)のシステムを呼び出して動的に対訳を推定するシステムを統合し、誰もが利用できるシステムとして、ウェブ上で公開した。 (4)対訳辞書自動編纂の精度向上のキーとなる、人名判定技術の改良を行い、再現率0.94、精度0.97の人名判定フィルタを実現した。 (5)高速な対訳収集を可能とするために、非生産的トランスリタレーションと呼ぶ新しい翻字方式を提案するとともに、それを高速に実行するアルゴリズムを考案した。 (6)上記方式を、カタカナ語一般の対訳の推定への適用可能性について検討し、長いカタカナ語に対しては良好な結果を得た。
|