2020 Fiscal Year Annual Research Report
Language Services Network for Bilingual Dictionary Creation in Low Resource Languages
Project/Area Number |
17H04706
|
Research Institution | Ritsumeikan University |
Principal Investigator |
村上 陽平 立命館大学, 情報理工学部, 准教授 (00435786)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | サービスコンピューティング / Webサービス / 低資源言語 / 言語資源 / クラウドソーシング |
Outline of Annual Research Achievements |
基盤研究では、「適応的な辞書生成プランニング」と「超問題を用いたクラウドソーシングの品質制御手法」に取り組んだ。「適応的な辞書生成プランニング」では、作成する辞書サイズを分割し、辞書の生成プロセスを複数回繰り返し実行することで、対訳辞書の帰納的生成手法の適合率の推定を事後確率で順次更新して、適合率の推定精度を少しずつ実測値に近づけて適応的に辞書生成のプランニングを行う。一方、「超問題を用いたクラウドソーシングの品質制御手法」では、クラウドソーシングによって人手で対訳辞書を作成する際に、多数決の精度を向上させる超問題を用いて対訳の評価結果を集約することで、最終成果物の対訳辞書の正確性を向上させる手法を提案している。多様な能力分布のワーカー群を用いて、提案手法をシミュレーションによって評価したところ、生成された対訳辞書の正確性は、ワーカーの能力平均がいずれの場合であっても、タスクのランダム割り当てよりも常に高くなることを検証した。実際に、5段階に分けられたミナンカバウ語の能力別に4人ずつ合計20人のインドネシア人被験者を用いて実証実験を行った。提案手法をインドネシア語とミナンガカウ語の1000語の対訳辞書作成に適用することで、提案手法はランダム割り当てよりも、生成された対訳辞書の正確性を3%向上させることを確認した。前者の成果は、ACM Transactions on Asian and Low-Resource Language Information Processingに採録され、後者は13th Edition of Language Resources and Evaluation Conference (LREC2022)に投稿中である。
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|