2022 Fiscal Year Annual Research Report
常識的知識を活用した言語理解・推論に基づく議論マイニングの新展開
Project/Area Number |
19H01118
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
岡崎 直観 東京工業大学, 情報理工学院, 教授 (50601118)
|
Co-Investigator(Kenkyū-buntansha) |
荒牧 英治 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (70401073)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 自然言語処理 |
Outline of Annual Research Achievements |
研究項目1では、大規模言語データから学習した単語埋め込みを、人間が構築した知識に適応させることで、意味を捉える性質を改善できるだろうか、という問いに取り組んだ。具体的には、語義間の意味関係を教師信号として、文脈依存型単語埋め込みおよび語義埋め込み同士の距離を調節する手法を提案した。提案手法を語義曖昧性解消タスクで評価したところ、知識ベース語義曖昧性解消の最高精度を達成した。本研究成果は言語処理学会年次大会で発表したところ、優秀賞との評価を得た。 研究項目2では、ソーシャルメディアの自然言語処理プラットフォームの構築を進めた.これは(1)Twitterテキストからの位置情報推定,(2)想定発信先(テキストの読み手の想定)の推定,(3)発言による炎上のリスク(侮辱や名誉毀損などの訴訟リスク)の推定といったソーシャルメディアを利活用するために有益な情報を付与するシステムを統合したものである.それぞれのシステムについては言語処理学会年次大会にて発表を行った.特に,(2)は,企業賞を受賞するなど評価を得た. 研究項目3では、研究項目2の成果と統合するため、画像や動画とテキストの両方を入力して推論するアーキテクチャの研究に取り組んだ。複数文および複数画像から成るマルチモーダル文書を理解するシステムの構築を目指し、文書内における画像を意味的に望ましいテキストに割り当てる新たなタスクImage-to-Text Matching (ITeM)を提案した論文が自然言語処理というジャーナル論文に採択された。また、動画とテキストの両方を入力して翻訳を行うデータセットに対して、動画から与えられる知識が機械翻訳に与える影響を調べた研究は、Journal of Information Processingというジャーナル論文に採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究プロジェクトは4年目が経過し、雑誌論文や国際会議などの査読付きの論文発表が増えてきている。また、本報告書には含めていないが、現段階で2023年度の成果として査読付き論文の発表が3件予定されている。また、2022年度の成果を言語処理学会第29回年次大会で発表したところ、優秀賞およびスポンサー賞を受賞するなど、本プロジェクトの研究成果の対外的な評価も高まっている。このように、残り1年間で成果をまとめていく目途がたっているため、本プロジェクトは順調に進展していると考える。
|
Strategy for Future Research Activity |
2023年度は本プロジェクトの最終年度であるので、研究成果を査読付きジャーナルや国際会議で発表するのはもちろんのこと、本プロジェクトで開発した言語資源やソフトウェアの公開、実社会での応用などに注力していく。昨年度の自然言語処理プラットフォーム技術はツイートを対象とし、スコアやカテゴリで出力するという共通の入出力を備えている。これをWebAPI化し、一般に研究利用可能なように実装する。なお、現在Twitter社のAPIの利用について、今後も継続的に利用可能かどうか見通しが立っていない。このため、Twitter以外のSNSへの対応も検討し、継続的に利用可能な実装とし、公開に向けて準備を進める。 なお、2023年11月末にリリースされたChatGPT以来、生成系AIの研究開発が過熱している。生成系AI、特に大規模言語モデルは人間を代替する存在になりつつあり、幅広い分野の広範囲な分野の転換点になり得る。現状では、大規模言語モデルはタスクに特化したモデルに性能面で及ばないという見方が大勢であるが、大規模言語モデルの中に蓄積されている常識的な知識を引き出したり、大規模言語モデルの推論能力を検証する研究が増えてくると思われる。2023年度は大規模言語モデルを本プロジェクトに応用することについて、検討をさらに進めたい。
|