• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

言語資源エコシステムのためのシェアリングエコノミーの構築

Research Project

Project/Area Number 21H03561
Allocation TypeSingle-year Grants
Research InstitutionRitsumeikan University

Principal Investigator

村上 陽平  立命館大学, 情報理工学部, 教授 (00435786)

Co-Investigator(Kenkyū-buntansha) PITUXCOOSUVARN MONDHEERA  立命館大学, 情報理工学部, 助教 (10875941)
林 冬惠  岡山大学, 環境生命自然科学学域, 准教授 (90534131)
Project Period (FY) 2021-04-01 – 2025-03-31
Keywordsサービスコンピューティング / マルチエージェントシステム / ブロックチェーン / シェアリングエコノミー / 低資源言語 / 言語資源
Outline of Annual Research Achievements

基盤研究では、「言語資源開発のためのインタラクションプロトコルの設計」と「超分散マルチエージェントシステムの構築」に取り組んだ。「言語資源開発のためのインタラクションプロトコルの設計」では、作成した言語資源を効果的に利用するために、ニューラルネットワークに基づく近縁言語の対訳辞書生成手法を考案した。本手法では、インドネシアの地方語のような近縁言語間では同根語が多く存在するため、対訳ペアの綴りが類似するという特性を利用し、低資源言語のような小規模データでもニューラルネットワークのSeq2Seqモデルで訳語を生成できることを示した。単語のトークン化の手法として、文字ベースとBPE(Byte Pair Encoding)ベースのトークン化を用い、インドネシア語とミナンカバウ語間の対訳生成タスクにおいて、それぞれ精度0.84,0.80を達成した。また、インドネシア語とミナンカバウ語の既知のスペル変換規則を適用したルールベース手法よりも114%精度を向上させた。さらに、このようなニューラルネットワークを複数連携させて精度を向上させるために、分散した言語資源を中央に集約することなく学習を可能とする連邦学習をプロトコルに導入した。本プロトコルでは、既存の連邦学習とは異なり、各エージェントが自分の目的に合致する他のエージェントを動的に選択しながら、言語資源から学習したモデルを交換してモデルの精度を高める。ドメインの異なる3エージェント間で提案プロトコルを適用したところ、従来手法と比較して、各エージェントにおいて平均22.7%精度を改善した。一方、「超分散マルチエージェントシステムの構築」では、実証実験に向けて、昨年度開発した超分散マルチエージェントシステム用のシナリオ記述言語を用いて、言語資源の協働作成プロトコルを記述し、言語資源協働作成支援システムのプロトタイプを開発している。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

基盤研究では、主に「言語資源開発のためのインタラクションプロトコルの設計」に取り組み、ニューラルネットワークや連邦学習を応用することで、人手で生成された言語資源から構築されたモデルの正確性を向上させており、おおむね順調に進展している。特に、低資源言語の言語資源作成では、作業者の確保が難しく、人手で作成した小規模の言語資源からいかに高精度のモデルを学習するかが重要な課題となる。提案手法は、近縁言語であれば、ニューラルネットワークのSeq2seqモデルを用いて、人手で作成した小規模の対訳データを学習させることで、既存のルールベース手法よりも対訳を高精度で作成できることを検証している。また、学習した複数のモデルを連携させるために、連邦学習を適用し、既存手法とは異なり連携相手となるエージェントを動的に選択可能とすることで、さらに精度の向上が可能であることを検証している。
また、「超分散マルチエージェントシステムの構築」においても、昨年度開発した超分散マルチエージェントシステムのシナリオ記述言語を用いて、言語資源の協働作成支援プロトコルを記述しており、おおむね順調に進展している。
一方、実証研究では、インドネシアでの実証実験の計画を優先的に進めている。超分散マルチエージェントシステムを用いた言語資源協働作成支援システムのプロトタイプを構築中であり、実証に向けた準備を進めている。

Strategy for Future Research Activity

COVID-19の影響でウィーン大学との連携が予定よりも大幅に遅れたため、バックアッププランとしてこれまで並行して準備を進めてきた、インドネシアでのインドネシア地方語の対訳辞書協働作成実験に絞って実証研究を進める。具体的には、イスラミックリアウ大学やテレコム大学と連携して、現地での作業者を募集し、現在構築中の超分散マルチエージェントシステムを用いた言語資源協働作成支援システムによって、インタラクションプロトコルと超分散マルチエージェントシステムの有効性を検証していく。

  • Research Products

    (13 results)

All 2024 2023 Other

All Int'l Joint Research (2 results) Journal Article (2 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (8 results) (of which Int'l Joint Research: 3 results) Remarks (1 results)

  • [Int'l Joint Research] ウィーン大学(オーストリア)

    • Country Name
      AUSTRIA
    • Counterpart Institution
      ウィーン大学
  • [Int'l Joint Research] イスラミックリアウ大学/テレコム大学(インドネシア)

    • Country Name
      INDONESIA
    • Counterpart Institution
      イスラミックリアウ大学/テレコム大学
  • [Journal Article] 児童の多言語コミュニケーションにおけるファシリテータの対話行為分析2024

    • Author(s)
      元澤 海月、村上 陽平、Mondheera Pituxcoosuvarn
    • Journal Title

      ヒューマンインタフェース学会論文誌

      Volume: 26 Pages: 77~86

    • DOI

      10.11184/his.26.1_77

    • Peer Reviewed
  • [Journal Article] Neural Network-Based Bilingual Lexicon Induction for Indonesian Ethnic Languages2023

    • Author(s)
      Resiandi Kartika、Murakami Yohei、Nasution Arbi Haza
    • Journal Title

      Applied Sciences

      Volume: 13 Pages: 8666~8666

    • DOI

      10.3390/app13158666

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] マルチエージェント強化学習を用いたニューラル機械翻訳の連携2024

    • Author(s)
      北川 勘太朗, 張 禹王, 村上 陽平
    • Organizer
      電子情報通信学会総合大会
  • [Presentation] サービス連携関係に基づくソフトクラスタリング2024

    • Author(s)
      松本 賢司, 村上 陽平
    • Organizer
      電子情報通信学会総合大会
  • [Presentation] Deep Knowledge Tracing用いた対訳作成タスクの予測2024

    • Author(s)
      山本 涼太郎, 村上 陽平
    • Organizer
      電子情報通信学会総合大会
  • [Presentation] 感情予測モデルに基づく絵文字埋め込み2024

    • Author(s)
      森 叶葉, 村上 陽平, Mondheera Pituxcoosuvarn
    • Organizer
      電子情報通信学会総合大会
  • [Presentation] Code-Mixing Strategies for Computer Mediated Communication with Non-Native Speakers2023

    • Author(s)
      Mondheera Pituxcoosuvarn, Yohei Murakami, Shinnosuke Yamada
    • Organizer
      International Conference on Advances in Information Technology
    • Int'l Joint Research
  • [Presentation] Service Clustering with Graph Embedding of Heterogeneous Networks2023

    • Author(s)
      Yohei Murakami, Narifumi Oi, Koki Okubo
    • Organizer
      IEEE/WIC International Conference on Web Intelligence and Intelligent Agent Technology
    • Int'l Joint Research
  • [Presentation] Detection for Cultural Difference in Impression Using Masked Language Model2023

    • Author(s)
      Mondheera Pituxcoosuvarn, Yohei Murakami, Kaede Miwa
    • Organizer
      HCI International 2023
    • Int'l Joint Research
  • [Presentation] ニューラル機械翻訳の連合学習のための協調エージェント2023

    • Author(s)
      北川勘太朗, 張禹王, 村上陽平
    • Organizer
      人工知能と知識処理研究会(AI)&合同エージェントワークショップ2023
  • [Remarks] Indonesia Language Sphere

    • URL

      https://langsphere.org

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi