研究課題/領域番号 |
17200018
|
研究機関 | 東京大学 |
研究代表者 |
影浦 峡 東京大学, 大学院・教育学研究科, 助教授 (00211152)
|
研究分担者 |
小山 照夫 情報・システム研究機構国立情報学研究所, 人間・社会情報研究系, 教授 (80124410)
辻 慶太 筑波大学, 大学院・図書館情報メディア研究科, 助教授 (30333545)
戸田 愼一 東洋大学, 社会学部, 教授 (10183493)
佐藤 理史 名古屋大学, 大学院・工学研究科, 教授 (30205918)
竹内 孔一 岡山大学, 大学院・自然科学研究科, 講師 (80311174)
|
キーワード | 翻訳支援システム / 自動専門語彙編集 / 対訳文書抽出 / 翻訳者向けエディタ / 慣用句自動検索 |
研究概要 |
本年度は、以下の研究とシステムの実装を進めた。 (1)システムの仕様と翻訳支援環境:翻訳者への聞き取りを通して、翻訳支援ツールに対する具体的な要求仕様を明らかにすると同時に、翻訳者のレファレンス・ツール利用について類型化した。また、これに基づいて、翻訳者向けのエディタ・インタフェースを実装した。このインタフェースでは、とりわけ様々なレファレンス機能を翻訳元文書に組み込んで自動的に参照し必要に応じて翻訳文書作成領域にコピー&ペーストできるようにしたことに加え、どのような参照操作を行った後でも、常に作業の制御が翻訳文書作成領域に戻るようにすることで、翻訳者の翻訳リズムを一貫して維持する仕様になっている。 (2)既訳関連文書のリサイクルと高度活用:インターネット上に存在する様々な翻訳文書を、登録したキーワードやURLに基づいて、原文書とともに抽出するシステムを開発実装した。現在は、辞書およびテキストの特性を考慮したDPマッチングによるテキスト領域のアライソメントを行い、引用句や分野に依存した連語・専門用語・固有名の抽出とリサイクルの手法について研究を進めている。 (3)基盤辞書の構築整備と辞書の動的構成法:基本辞書の入力整備を進め、とりわけ様々な言語の固有名・人名データを充実させた。これに基づき、ローマ字表記の人名等から翻字規則を用いて自動的に可能なカタカナ表記の文字列を生成し、それをインターネット上に存在するデータにより検証するシステムを実装した。また、専門用語辞書を活用して、翻字規則の活用と同様の考えを活用し、複合語の構成要素合成法に基づいて、可能な対訳表現候補を生成し、インターネット上の情報により検証するシステムを開発中である。 (4)既存の高品質辞書で内容的にはほぼ充実している熟語・慣用句について、その異形・バリエーションを含むテキスト中の出現形と自動的に辞書エントリーをマッチングさせる手法を開発するために、英語慣用句のバリエーション・データを構築し、バリエーションのパターンを類型化した。また、これに基づき、シンタグマティックな異形に対しては、辞書エントリーを自動的にマッチさせるシステムを実装した。
|