研究課題
若手研究(A)
本研究は、言語資源の少ない低資源言語を対象に、近縁言語間の対訳辞書を網羅的に生成するための言語資源生成サービスネットワークを構築することを目的とした。基盤研究では、ピボット言語を介して二つの対訳辞書から対象言語間の対訳辞書を高精度に生成する対訳辞書の帰納的生成手法を考案した。また、複数の対象言語の対訳辞書を効率的に生成するために、帰納的生成手法と人手による作成を組み合わせた最適プランを算出するアルゴリズムを考案した。実証研究では、基盤研究の成果を実装したクラウドソーシングのための協調作業支援サービスを構築し、7つのインドネシアの民族語の21編の対訳辞書を作成した。
辞書やコーパス、機械翻訳などの言語資源の偏在が、言語資源の少ない低資源言語の問題を生じさせ、母語の異なる話者間でデジタルデバイドを引き起こしている。特に、多様な言語の存在するアジアにおいて顕著である。本研究は、このような社会的な問題に対して、低資源言語の対訳辞書を網羅的に生成する手法を提案し、インドネシアの民族語での実証を通して大きく貢献している。さらに、本研究は、言語資源作成時の品質だけでなく、費用対効果という新しい観点も導入することで、人手の作成作業を避けることのできない低資源言語の言語資源生成を大規模化へと発展させるものである。
すべて 2021 2020 2019 2018 2017 その他
すべて 国際共同研究 (3件) 雑誌論文 (11件) (うち国際共著 4件、 査読あり 8件、 オープンアクセス 6件) 学会発表 (17件) (うち国際学会 11件、 招待講演 3件) 図書 (4件) 備考 (2件)
ヒューマンインタフェース学会論文誌
巻: 23 号: 2 ページ: 145-152
10.11184/his.23.2_145
130008043056
ACM Transactions on Asian and Low-Resource Language Information Processing
巻: 20 号: 2 ページ: 1-28
10.1145/3448215
Information
巻: 11(2), 67 号: 2 ページ: 1-12
10.3390/info11020067
Optimization Based Model Using Fuzzy and Other Statistical Techniques Towards Environmental Sustainability
巻: - ページ: 41-54
10.1007/978-981-15-2655-8_3
Journal of Data Science and Its Applications (JDSA)
巻: Vol. 2, No. 2 ページ: 50-60
Massively Multi-Agent Systems II
巻: 11422 ページ: 53-65
10.1007/978-3-030-20937-7_4
Journal of Physics: Conf. Series
巻: 1192 ページ: 012001-012001
10.1088/1742-6596/1192/1/012001
International Journal of Electrical and Computer Engineering
巻: Vol. 9, No. 1 ページ: 531-538
IEEE Computer
巻: Vol. 51, Issues 6, 号: 6 ページ: 72-81
10.1109/mc.2018.2701643
International Journal of Software Engineering and Knowledge Engineering
巻: Vol. 28, No. 1 号: 01 ページ: 79-96
10.1142/s0218194018500043
巻: Vol. 17, No. 2 号: 2 ページ: 1-29
10.1145/3138815
http://langsphere.org
http://langsphere.org/id/