研究課題/領域番号 |
23K21697
|
補助金の研究課題番号 |
21H03500 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 奈良女子大学 (2024) 奈良先端科学技術大学院大学 (2021-2023) |
研究代表者 |
須藤 克仁 奈良女子大学, 生活環境科学系, 教授 (00396152)
|
研究分担者 |
中村 哲 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (30263429)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2024年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2021年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
|
キーワード | 機械翻訳 / 構成性 / 長文翻訳 / 文脈を考慮した翻訳 / 順送り訳 / 文脈依存翻訳 / 自然言語処理 / 音声翻訳 / 分割統治 / 深層学習 |
研究開始時の研究の概要 |
長く複雑な入力に対する頑健な機械翻訳の実現を目指し、(1)入力をより短く簡単な部分構造に分割して下訳を作成した後全体の訳を構成する分割統治的アプローチによる機械翻訳方式の実証と、(2)その際文脈情報を考慮することで必ずしも構成的でない自然言語の翻訳における頑健性向上を目指す。
|
研究実績の概要 |
2023年度は研究項目1と研究項目2を一部統合する形での取り組みを行った。 1) 分割統治型翻訳においては節分割により文内文脈情報が失われるという問題に対処するため、文内文脈情報を明示的に与えた形で翻訳モデルの学習を行うことにより、分割を要する複雑な構造の文に対する翻訳の自動評価値が向上することを示した。 2) 音声翻訳のための音声セグメント分割手法について、追加検証・分析を行い海外雑誌論文に採録された他、より短い時間幅で漸進的に音声分割を行う形のストリーミング同時音声翻訳手法を提案し、既存手法を上回る性能が得られることを示した。 3) 漸進的機械翻訳のための評価手法である Average Token Delay を提案し、昨年度提案した Prefix Alignment 法による漸進的機械翻訳の効果検証がより正確に行えるようになった。関連成果が国際会議論文1件採択、国内雑誌論文1件採録。 4) 細かい単位で入力分割を行う漸進的機械翻訳の研究用データとして、文内文脈を考慮しつつ適切な補足を加えた訳出を行う、500文規模の人手による順送り訳データの作成を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
分割統治型翻訳については適用範囲が限られてはいるものの、適用範囲内で効果が得られることが分かり、また文内文脈情報の効果も明らかになったことから本研究計画の問いについて一定の前向きな結果が得られたと言える。 また、音声翻訳における入力発話分割やそれを推し進めた漸進的機械翻訳についても効率面・精度面での向上が達成でき、有効性を示すことができた。 データ整備については、当初計画の階層的な構造という形ではなく、漸進的な翻訳という方針に切り替え、少量だが高品質な順送り訳データを作成することができた。
|
今後の研究の推進方策 |
最終年度はこれまでの成果のさらなる検証と雑誌論文化を行うとともに、作成した順送り訳データの活用をすすめ、本研究計画のまとめとなる機械翻訳・音声翻訳技術を確立する。
|