2010 Fiscal Year Annual Research Report
Project/Area Number |
21300094
|
Research Institution | Nagoya University |
Principal Investigator |
佐藤 理史 名古屋大学, 大学院・工学研究科, 教授 (30205918)
|
Keywords | 多言語処理 / 辞書自動編纂 / 外国人名対訳 / カタカナ語 / 人名判定 / トランスリタレーション / オノマトペ |
Research Abstract |
本研究では、実際に複数の辞書の自動編纂を実現することを通して、辞書編纂の自動化に必要な設計・編纂法と、それに対応する自動編纂技術を開発することを目的としている。本年度は次のことを行った。 (1) 高品質な外国人名対訳辞書の自動編纂を目指し、昨年度収集した対訳データのクリーニング(雑音除去)に取り組んだ。個々の対訳の採否判定には、ウェブサーチエンジンから得られる各種ヒット数、統計的手法により計算される人名らしさ、対応関係のもっともらしさ等を用いて総合的に判定する方法を採用したが、高い精度を実現することはかなり難しいことがわかった。同時に、精度を測定する方法にも工夫が必要であることが明らかになった。 (2) 選択型(非生産型)トランスリタレーションのシステムを実装し、さらなる改良を行って、速度を数倍向上させた。このシステムを利用することによって、2つの言語の大規模人名リストから対訳を発見(収集)することができることを確認した。これにより、2つの言語で、それぞれ高品質、かつ巨大な人名リストを編纂することができれば、高品質な外国人名対訳辞書を自動編纂することができる見通しを得た。 (3) カタカナ語の自動編纂に必要な要素技術を検討した。原綴推定に関しては、短い語は既存の辞書を利用し、長い語は選択型トランスリタレーションを利用する。カタカナ8文字以上であれば、選択型トランスリタレーションで原綴推定が実用的な精度で実現できる見通しを得た。 (4) 言い換え辞書の自動編纂の一つの要素技術として、オノマトペの言い換えを自動収集する方法を実現した。この方法は、「きっぱり(強く)と否定する」、「きっぱりと(潔く)諦める」のように、文脈(動詞との共起)に応じて異なる言い換えを見つけることができる点に特徴がある。
|
Research Products
(4 results)