研究課題/領域番号 |
25240051
|
研究機関 | 東京大学 |
研究代表者 |
影浦 峡 東京大学, 大学院情報学環, 教授 (00211152)
|
研究分担者 |
阿辺川 武 国立情報学研究所, コンテンツ科学研究系, 准教授 (00431776)
藤田 篤 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所多言語翻訳研究室, 主任研究員 (10402801)
内山 将夫 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所多言語翻訳研究室, 主任研究員 (70293496)
|
研究期間 (年度) |
2013-04-01 – 2018-03-31
|
キーワード | 知識アーカイヴ / 翻訳知 / 協調翻訳 / 翻訳教育 / 機械翻訳 |
研究実績の概要 |
本年度は、以下の研究開発を行った。交付申請時の項目に即して記載する。 (a) 「みんなの翻訳実習」システムの改善。今年度の課題は、翻訳知ログアーカイヴのエンドユーザ向け可視化と解析メカニズムの実装、及び、試験利用で見えてきたQReditの修正画面の機能強化を行った。可視化については、辞書引き・修正統計のグラフ化に加えてQRedit比較モードの画面改変を行った。 (b) 翻訳知のモデル化。試験利用で収集されたアーカイヴデータが当初構想していた規模にならなかったため、データに基づく協調行動・辞書参照行動の分析を行う代わりに、「みんなの翻訳実習」システムが提供する「足場」カテゴリーと翻訳力との関係に関する理論的な分析を行った。修正プロセスに関しても、実行動ではなく修正カテゴリーの論理的階層に基づき、行動の当為モデルを作成した。 (c) 翻訳知活用メカニズムの開発。人間による誤りカテゴリ付与と誤り修正のログを分析し、データに基づき、誤り検出ステップの定式化を行った。当初は、自動的な誤り検出とカテゴリ提示の手法の開発につなげる予定であったが、データ量の問題から、今年度は、人間が理解できる決定木型の修正カテゴリ付与支援メカニズムを開発した。 (d) 「みんなの翻訳実習」システムの試験利用者の拡大とフィードバックメカニズムの整備、及びドキュメントの整備を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
システム開発と実験、多言語化、テストユーザの拡大は順調に進んでいる。 一方、翻訳プロジェクト・翻訳行動に関する実利用データ収集のデータ量が、とりわけ日本の翻訳教育環境の中で予定の利用が実現できなかったため、当初見込みよりも少なく、そのため、データに基づく翻訳知のモデル化と翻訳プロセス支援の自動化の研究が少し当初予定よりも遅れている。関連して、モデル化と自動支援のテーマについては、研究発表もずれ込んでいる。 一方、これらの実証的な研究の遅れに対し、翻訳知のモデル化をめぐって、研究計画調書段階で想定していた、翻訳修正、辞書・情報資源活用、対話の位置づけにつき、ISO17100(翻訳サービス標準)の発行などにより、巨視的な観点から「翻訳力」「翻訳者力」として理論的に整理する契機と必要性が発生した。そのため、今年度は、この新たに生じた理論的問題と我々の翻訳支援システムが提供する「足場」との関係を理論的に定式化し、翻訳知のボトムアップなモデルを位置づけるマクロなカテゴリーの整理を進めることで、研究全体としての進捗ペースを保つことができた。 従って、研究全体としては概ね順調ということもできるが、やや遅れ気味の研究モジュールがあるため、「やや遅れている」とした。
|
今後の研究の推進方策 |
全体としては、開発・分析・試験利用について、当初計画通りに研究を進める。今年度、少し遅れた、データに基づく翻訳知のモデル化と自動的支援の手法については、データ収集の遅れを取り戻すために、体系的な翻訳実験をいくつかのサイトで行うこととする。また、翻訳の学習におけるメタ言語としての「足場」の存在意義と翻訳力・翻訳者力との関係という、今年度新たに見つかった重要な研究課題に関しては、並行して研究課題に組込み、研究を続ける。 研究成果の公表については、本研究プロジェクトでは、認知度を高めるために、翻訳・機械翻訳関連の研究者が中心となる国内外の会議、翻訳者や翻訳業界団体が中心となる国内外の会議を中心に、デモも交えた発表を中心に進めてきた。これにより、本プロジェクトで開発している翻訳支援システムは一定程度の知名度を得ることができたため、今後は、システムの理念と概念をめぐる研究成果、データを用いた研究成果、言語処理との接続に関する研究成果を、論文誌に発表していくことにも力を入れる。
|