Project/Area Number |
23K21697
|
Project/Area Number (Other) |
21H03500 (2021-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2021-2023) |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Nara Women's University (2024) Nara Institute of Science and Technology (2021-2023) |
Principal Investigator |
須藤 克仁 奈良女子大学, 生活環境科学系, 教授 (00396152)
|
Co-Investigator(Kenkyū-buntansha) |
中村 哲 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (30263429)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,290,000 (Direct Cost: ¥13,300,000、Indirect Cost: ¥3,990,000)
Fiscal Year 2024: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2023: ¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2022: ¥5,850,000 (Direct Cost: ¥4,500,000、Indirect Cost: ¥1,350,000)
Fiscal Year 2021: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
|
Keywords | 機械翻訳 / 構成性 / 長文翻訳 / 文脈を考慮した翻訳 / 順送り訳 / 文脈依存翻訳 / 自然言語処理 / 音声翻訳 / 分割統治 / 深層学習 |
Outline of Research at the Start |
長く複雑な入力に対する頑健な機械翻訳の実現を目指し、(1)入力をより短く簡単な部分構造に分割して下訳を作成した後全体の訳を構成する分割統治的アプローチによる機械翻訳方式の実証と、(2)その際文脈情報を考慮することで必ずしも構成的でない自然言語の翻訳における頑健性向上を目指す。
|
Outline of Annual Research Achievements |
2023年度は研究項目1と研究項目2を一部統合する形での取り組みを行った。 1) 分割統治型翻訳においては節分割により文内文脈情報が失われるという問題に対処するため、文内文脈情報を明示的に与えた形で翻訳モデルの学習を行うことにより、分割を要する複雑な構造の文に対する翻訳の自動評価値が向上することを示した。 2) 音声翻訳のための音声セグメント分割手法について、追加検証・分析を行い海外雑誌論文に採録された他、より短い時間幅で漸進的に音声分割を行う形のストリーミング同時音声翻訳手法を提案し、既存手法を上回る性能が得られることを示した。 3) 漸進的機械翻訳のための評価手法である Average Token Delay を提案し、昨年度提案した Prefix Alignment 法による漸進的機械翻訳の効果検証がより正確に行えるようになった。関連成果が国際会議論文1件採択、国内雑誌論文1件採録。 4) 細かい単位で入力分割を行う漸進的機械翻訳の研究用データとして、文内文脈を考慮しつつ適切な補足を加えた訳出を行う、500文規模の人手による順送り訳データの作成を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
分割統治型翻訳については適用範囲が限られてはいるものの、適用範囲内で効果が得られることが分かり、また文内文脈情報の効果も明らかになったことから本研究計画の問いについて一定の前向きな結果が得られたと言える。 また、音声翻訳における入力発話分割やそれを推し進めた漸進的機械翻訳についても効率面・精度面での向上が達成でき、有効性を示すことができた。 データ整備については、当初計画の階層的な構造という形ではなく、漸進的な翻訳という方針に切り替え、少量だが高品質な順送り訳データを作成することができた。
|
Strategy for Future Research Activity |
最終年度はこれまでの成果のさらなる検証と雑誌論文化を行うとともに、作成した順送り訳データの活用をすすめ、本研究計画のまとめとなる機械翻訳・音声翻訳技術を確立する。
|