研究課題/領域番号 |
20K12563
|
研究機関 | 立教大学 |
研究代表者 |
松下 佳世 立教大学, 異文化コミュニケーション学部, 准教授 (90746679)
|
研究分担者 |
古川 典代 神戸松蔭女子学院大学, 文学部, 教授 (70411270)
吉田 理加 順天堂大学, 国際教養学部, 非常勤講師 (20761951)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 通訳 / コーパス / 記者会見 / 中国語 / スペイン語 |
研究実績の概要 |
本研究は、我が国の通訳研究の活性化ならびに、将来的なAI(人工知能)による自動通訳の精度向上を目的として、すでに構築済みの日本語と英語の間の大規模な通訳コーパス(JNPCコーパス)の対象言語を広げ、新たに日本語と中国語、日本語とスペイン語の間の通訳の対訳コーパスを構築し、サブコーパスとして加えるものである。令和2年度は、3年間の研究期間の初年度に当たったが、新型コロナウイルス感染症の広がりを受け、研究計画の後ろ倒しを余儀なくされた。具体的には、JNPCコーパスに収録済みの日本語を起点言語とした記者会見について、中国語とスペイン語の同時通訳者による新たな訳出を録音する予定であったが、緊急事態宣言などの影響もあり、全8本の音声の録音を終えたのは秋になってからであった。また、実際の録音作業の際も、同時通訳ブースは密閉できなかったため、そのことにより生じた雑音を後処理で消去するなど手間を要する作業となった。しかし、年度の終盤にかけては、収録した音声をコーパス化する作業が順調に進み、録音した音源すべてをアノテーションツール「ELAN」に取り込むことができた。また、日本記者クラブの公式YouTubeページで公開されている会見動画のうち、日中通訳付きの動画15本、日西通訳付きのもの24本を特定し、構築予定のコーパスの全体像が確定した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究実績の概要で述べたとおり、新型コロナウイルス感染症拡大の影響で多少の遅れは出たものの、その遅れは後半にかけて取り戻すことができた。特に最大の課題であった同時通訳者による訳出の録音については、コロナ禍ということで、通常であれば多忙につき協力を取り付けることが難しいベテラン通訳者の参加を得ることができ、質の高い訳出を録音することに成功した。特に日中通訳については、日本語母語話者2名と中国語母語話者2名の協力が得られたため、異なる性質のデータをバランスよく入手することができた。令和3年度以降はデータ収集作業は発生しないため、新型コロナウイルス感染症による更なる影響は想定されておらず、今後はさらに順調にコーパス構築を進めていけるものと考えている。
|
今後の研究の推進方策 |
令和3年度は、通訳付き記者会見動画をアノテーションツール「ELAN」に取り込む作業を継続する。本研究課題に先立って行われたJNPCコーパスを構築した際に使用していた自動書き起こしツールが、令和2年9月にサービスの提供を終了してしまったため、その代替となるツールを探し、精度を検証することが急務となる。また、すでにELANに取り込み済みのデータについて、校正者を募り、訓練を施した上で、校正作業を進めていく。令和4年度には完成済みのデータの一部を活用した応用研究を開始できるように、令和3年度中に一定数の会見について、コーパス収録用データの完成を目指す。
|
次年度使用額が生じた理由 |
新型コロナウイルス感染症の拡大により、当初予定よりもコーパスの構築に必要な新規の通訳音声の録音が遅れた。これにより、データの加工に着手できたのが年度後半から終盤となり、通年分で予定していた人件費が浮いた形となった。また、研究の打ち合わせのための旅費も掛からなかったため、結果として予算が余った。令和3年度においては、遅れを取り戻すべく人員を割いて作業を進めるため、次年度使用額はこの人件費の増加分に充てる。また、移動の規制が緩和される状況になれば、対面での会合や校正者の研修も実施したいので、これらも見込んで、令和3年度分としても一定の額を請求した。
|