• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Compositionality and Interpretation of Word Embeddings

Research Project

Project/Area Number 19K12099
Research InstitutionTokyo Metropolitan University

Principal Investigator

小町 守  東京都立大学, システムデザイン研究科, 教授 (60581329)

Project Period (FY) 2019-04-01 – 2022-03-31
Keywords単語分散表現 / 深層学習 / 文法誤り訂正 / 意味変化
Outline of Annual Research Achievements

本年度は昨年度から引き続き文法誤り訂正における単語分散表現の分析を継続しつつ、通時的な単語分散表現の学習に関する研究と分析に着手しました。
前者では、文法誤り訂正に焦点を絞って、どのような情報が言語を跨いて転移可能であるか、ということを明らかにすることに取り組みました。言語を跨いだ文法誤り訂正においては、ヨーロッパの言語同士のように同じアルファベットを用いる言語では部分文字列(サブワード)の重なりが見られる一方、日本語と英語のように異なる文字を用いる言語では部分文字列に重なりがないのですが、それでも文法知識の転移が可能であることを示しました。この研究は2021年度内に論文誌に採択されました。
後者では、単語の意味が歴史的に変化していく現象を単語分散表現を用いて捉えられるかどうか、というテーマについて、日本語および英語のデータを用いて取り組みました。先行研究ではそれぞれの時期を分けて単語分散表現を学習していましたが、本研究では全ての時期のデータを混ぜて自己相互情報量に基づいて学習することで、より高精度に単語の意味変化を捉えられることを示しました。また、文脈を考慮した単語分散表現を用いることで、日本語の単語の意味変化を検出することが可能であることも検証しました。それぞれの研究は査読付きの国際会議にて発表しました。
研究期間全体では、単語より小さい単位での単語分散表現の学習については、機械翻訳を題材にして日中翻訳における単語分散表現学習における最適な入力の粒度を探究し、文法誤り訂正においても日本語・英語・ドイツ語・ロシア語など複数の言語でどのような知識が転移可能であるかを明らかにしました。情報理論的な解釈については、当初の目的通りには進展しませんでしたが、通時的な意味変化を捉えるための単語分散表現の学習において情報理論的な背景を持つアプローチを採用し、解釈性の高い手法を提案しました。

  • Research Products

    (4 results)

All 2022 2021

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (2 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] 言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正2022

    • Author(s)
      山下郁海, 金子正弘, 三田雅人, 勝又智, Imankulova Aizhan, 小町守
    • Journal Title

      自然言語処理

      Volume: 29 Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] Using Sub-character Level Information for Neural Machine Translation of Logographic Languages2021

    • Author(s)
      Zhang Longtu and Komachi Mamoru
    • Journal Title

      ACM Transactions on Asian and Low-Resource Language Information Processing

      Volume: 20 Pages: 1~15

    • DOI

      10.1145/3431727

    • Peer Reviewed / Open Access
  • [Presentation] Analyzing Semantic Changes in Japanese Words Using BERT2021

    • Author(s)
      Kazuma Kobayashi, Taichi Aida and Mamoru Komachi
    • Organizer
      35th Pacific Asia Conference on Language, Information and Computation (PACLIC 2021)
    • Int'l Joint Research
  • [Presentation] A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences2021

    • Author(s)
      Taichi Aida, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura, Daichi Mochihashi
    • Organizer
      35th Pacific Asia Conference on Language, Information and Computation (PACLIC 2021)
    • Int'l Joint Research

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi