• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 研究成果報告書

低資源言語のための言語資源作成サービスネットワークの構築

研究課題

  • PDF
研究課題/領域番号 17H04706
研究種目

若手研究(A)

配分区分補助金
研究分野 ウェブ情報学・サービス情報学
研究機関立命館大学 (2018-2021)
京都大学 (2017)

研究代表者

村上 陽平  立命館大学, 情報理工学部, 准教授 (00435786)

研究期間 (年度) 2017-04-01 – 2021-03-31
キーワードサービスコンピューティング / Webサービス / 低資源言語 / 言語資源 / クラウドソーシング
研究成果の概要

本研究は、言語資源の少ない低資源言語を対象に、近縁言語間の対訳辞書を網羅的に生成するための言語資源生成サービスネットワークを構築することを目的とした。基盤研究では、ピボット言語を介して二つの対訳辞書から対象言語間の対訳辞書を高精度に生成する対訳辞書の帰納的生成手法を考案した。また、複数の対象言語の対訳辞書を効率的に生成するために、帰納的生成手法と人手による作成を組み合わせた最適プランを算出するアルゴリズムを考案した。実証研究では、基盤研究の成果を実装したクラウドソーシングのための協調作業支援サービスを構築し、7つのインドネシアの民族語の21編の対訳辞書を作成した。

自由記述の分野

サービスコンピューティング

研究成果の学術的意義や社会的意義

辞書やコーパス、機械翻訳などの言語資源の偏在が、言語資源の少ない低資源言語の問題を生じさせ、母語の異なる話者間でデジタルデバイドを引き起こしている。特に、多様な言語の存在するアジアにおいて顕著である。本研究は、このような社会的な問題に対して、低資源言語の対訳辞書を網羅的に生成する手法を提案し、インドネシアの民族語での実証を通して大きく貢献している。さらに、本研究は、言語資源作成時の品質だけでなく、費用対効果という新しい観点も導入することで、人手の作成作業を避けることのできない低資源言語の言語資源生成を大規模化へと発展させるものである。

URL: 

公開日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi