研究課題/領域番号 |
17K13494
|
研究機関 | 福島大学 |
研究代表者 |
マクマイケル ウィリアム 福島大学, 経済経営学類, 助教 (40761284)
|
研究期間 (年度) |
2017-04-01 – 2019-03-31
|
キーワード | ターミノロジー / 東日本大震災 / 通訳学 |
研究実績の概要 |
本研究では、原子力災害に関連する概念用語の適切な定義づけと効果的な使用を検証するために以下の3つのフェーズにより研究を遂行している。 1)概念用語集作成のために原子力関連書籍の電子データのテキスト抽出及びマイニングを行う。 2)体系的なデータベースを構築するとともに、用語集及び学習テキストを作成する。これらを英語で行われる震災関連プログラム等のテキストとして使用し、読解力の変化やディスカッション参加率への影響等に関する実証的検証を行う。 3)翻訳メモリデータとしての活用モデルを形成するため、実際の翻訳現場で活用し、翻訳作業の効率性や、訳語の統一などの観点から分析・評価を行う。
研究1年目である29年度では、上述する3つのフェーズの内、フェーズ1と2の大部分を完了させた。具体的には、原子力災害に関連したメディア媒体(新聞など)からテキストを抽出し、およそ500万ワード以上のコーパスを基にA) 東日本大震災に適した通訳研修者用の用語集と、B) 研修者向け学習テキストを作成した。また、これら教材を基に通訳案内士向けの研修を6回開催した。なお、辞書学の分野における権威の先生方との学術交流の結果、当初予定していた研究計画を変更し、英語概念用語のコーパスの抽出先を「メディア媒体及び研究論文、音声データなど」から、より現代用語のコーパスの研究手法として一般的である「新聞などのメディア媒体に限定したコーパス」に変更し、また、抽出するコーパスのワード数も大幅に増やした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
実績の概要にある通り、若干の研究手法の変更を行ったことと、それに関連してコーパスの量を20万語程度から、500万語程度へ増やしたことでフェーズ1の研究が予定よりも時間がかかった。また、コーパスの抽出先を海外のメディア媒体に限定した為、LexisNexisやCanadian Newsstandなどのビッグデータのネットワークを活用した抽出プロセスが必須となり、そういった研究基盤が国内にはなく、申請者に提供してくれたカナダ・ブリティッシュコロンビア大学へ出張する必要が生じたため、作業の遅れにつながった。さらには、当初の研究計画ではあくまで英語と日本語の固有表現を抽出することで機械翻訳の質を向上させることに着目点を置いていたが、肝心な翻訳過程の中での訳語そのものの容認性や、誤訳がされやすい単語・新語の特定をするというプロセスが抜けている事が他の研究者から指摘された。そこで、新たな段階の研究をフェーズ2の後半に入れる事としたため、フェーズ3に移行する時期も、当初の計画より遅れることが予想されている。
|
今後の研究の推進方策 |
2018年8月末までに、英訳が存在している日本語新聞の震災関連記事のコーパスを集め、単語の容認性を含む比較検証を行う。また、29年度に用語集と表現集の作成を行い、それを計6回の通訳案内士向け復興用語研修という形で実践教材として使用したが、そのフィードバックの分析と、30年度も引き続き研修会を設けることで訳が難しい言葉などを特定し分析をする予定である。さらに、29年度でデータベースの構築を完了しているTrados翻訳メモリの、フェーズ3での実証実験の環境を整え、10月から11月を準備期間、12月を実証研究時期、そして、1月から2月を検証成果分析及び発表時期としたい。なお、発表の場所として現在当初の予定であったNAFSA年次大会ではなく2019年のAPAIE年次大会を予定している。
|
次年度使用額が生じた理由 |
当初の予定で購入予定であったソフトが別予算で購入できたことで予算が余った事に加え、データ整理における人件費の活用が前述する理由により、30年度に繰り越しとなったため。
|