研究課題/領域番号 |
23K21730
|
補助金の研究課題番号 |
21H03561 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 立命館大学 |
研究代表者 |
村上 陽平 立命館大学, 情報理工学部, 教授 (00435786)
|
研究分担者 |
PITUXCOOSUVARN MONDHEERA 立命館大学, 情報理工学部, 助教 (10875941)
林 冬惠 岡山大学, 環境生命自然科学学域, 准教授 (90534131)
石田 亨 早稲田大学, 理工学術院, 教授(任期付) (20252489)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2024年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2022年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2021年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
|
キーワード | マルチエージェントシステム / クラウドソーシング / 低資源言語 / ブロックチェーン / サービスコンピューティング / シェアリングエコノミー / 言語資源 |
研究開始時の研究の概要 |
本研究は,信頼できる第三者の存在しない環境において,マルチエージェントシステムとブロックチェーンを用いて,耐改ざん性とプライバシー保護を両立したシェアリングエコノミーを構築する.これにより,低資源言語の言語資源作成者が利用者から直接的に報酬を得ることで,持続可能な低資源言語の言語資源開発を実現することを目指す.具体的には,エージェントを各ユーザの端末に配備した超分散マルチエージェントシステムを構築し,言語資源の品質を保証するためのエージェント間のプロトコルを考案し,信頼性のある低資源言語の言語資源の集積を図る.
|
研究実績の概要 |
基盤研究では、「言語資源開発のためのインタラクションプロトコルの設計」と「超分散マルチエージェントシステムの構築」に取り組んだ。「言語資源開発のためのインタラクションプロトコルの設計」では、作成した言語資源を効果的に利用するために、ニューラルネットワークに基づく近縁言語の対訳辞書生成手法を考案した。本手法では、インドネシアの地方語のような近縁言語間では同根語が多く存在するため、対訳ペアの綴りが類似するという特性を利用し、低資源言語のような小規模データでもニューラルネットワークのSeq2Seqモデルで訳語を生成できることを示した。単語のトークン化の手法として、文字ベースとBPE(Byte Pair Encoding)ベースのトークン化を用い、インドネシア語とミナンカバウ語間の対訳生成タスクにおいて、それぞれ精度0.84,0.80を達成した。また、インドネシア語とミナンカバウ語の既知のスペル変換規則を適用したルールベース手法よりも114%精度を向上させた。さらに、このようなニューラルネットワークを複数連携させて精度を向上させるために、分散した言語資源を中央に集約することなく学習を可能とする連邦学習をプロトコルに導入した。本プロトコルでは、既存の連邦学習とは異なり、各エージェントが自分の目的に合致する他のエージェントを動的に選択しながら、言語資源から学習したモデルを交換してモデルの精度を高める。ドメインの異なる3エージェント間で提案プロトコルを適用したところ、従来手法と比較して、各エージェントにおいて平均22.7%精度を改善した。一方、「超分散マルチエージェントシステムの構築」では、実証実験に向けて、昨年度開発した超分散マルチエージェントシステム用のシナリオ記述言語を用いて、言語資源の協働作成プロトコルを記述し、言語資源協働作成支援システムのプロトタイプを開発している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
基盤研究では、主に「言語資源開発のためのインタラクションプロトコルの設計」に取り組み、ニューラルネットワークや連邦学習を応用することで、人手で生成された言語資源から構築されたモデルの正確性を向上させており、おおむね順調に進展している。特に、低資源言語の言語資源作成では、作業者の確保が難しく、人手で作成した小規模の言語資源からいかに高精度のモデルを学習するかが重要な課題となる。提案手法は、近縁言語であれば、ニューラルネットワークのSeq2seqモデルを用いて、人手で作成した小規模の対訳データを学習させることで、既存のルールベース手法よりも対訳を高精度で作成できることを検証している。また、学習した複数のモデルを連携させるために、連邦学習を適用し、既存手法とは異なり連携相手となるエージェントを動的に選択可能とすることで、さらに精度の向上が可能であることを検証している。 また、「超分散マルチエージェントシステムの構築」においても、昨年度開発した超分散マルチエージェントシステムのシナリオ記述言語を用いて、言語資源の協働作成支援プロトコルを記述しており、おおむね順調に進展している。 一方、実証研究では、インドネシアでの実証実験の計画を優先的に進めている。超分散マルチエージェントシステムを用いた言語資源協働作成支援システムのプロトタイプを構築中であり、実証に向けた準備を進めている。
|
今後の研究の推進方策 |
COVID-19の影響でウィーン大学との連携が予定よりも大幅に遅れたため、バックアッププランとしてこれまで並行して準備を進めてきた、インドネシアでのインドネシア地方語の対訳辞書協働作成実験に絞って実証研究を進める。具体的には、イスラミックリアウ大学やテレコム大学と連携して、現地での作業者を募集し、現在構築中の超分散マルチエージェントシステムを用いた言語資源協働作成支援システムによって、インタラクションプロトコルと超分散マルチエージェントシステムの有効性を検証していく。
|