研究課題/領域番号 |
21K17801
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 奈良先端科学技術大学院大学 (2022) 東京工業大学 (2021) |
研究代表者 |
上垣外 英剛 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (40817649)
|
研究期間 (年度) |
2021-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 知識グラフ / 知識グラフの補完 / 知識グラフの埋め込み / 負例サンプリング損失 / 視覚と言語の融合タスク / 視覚と言語の融合モデル / 事前学習済み言語モデル / BERT / 言語と画像 / 画像生成 / Infoboxの生成 / 外部知識の利用 / 知識と画像 / 共参照解消 / 知識グラフ埋め込み / KGE / 共参照解析 / 深層学習 / 構造学習 |
研究開始時の研究の概要 |
既存の共参照解析器では,スコア上ではわずかなエンティティ間の結合の誤りであっても,最終的に出力するクラスタが誤って分割・統合されてしまう問題が存在する. この問題を解決するために直接クラスタ単位でのスコアを予測することが可能な共参照解析器を提案・実装する.また提案手法が実際の予測に寄与するかを確認するために,タスクにおける共通データセットを用いて共参照解析性能を従来手法と比較する.さらに後段のタスクであるニューラル文書要約においても提案法を用いた場合の有用性を検証するための性能評価を行う.最終的には上記を通して提案法の利点・欠点を明らかにし,これらの結果を論文にまとめた上で国際会議にて発表する.
|
研究成果の概要 |
近年登場した,事前学習済み言語モデルを用いて大域的な情報を活用可能な共参照解析器を知識グラフにより支援することを目的に,知識グラフに対する補完を学習する際の理論的な分析を行なった.また,その分析に基づいて,疎な知識グラフにおける補完性能を向上させる技術についても提案した.さらに事前学習済み言語モデルが言語と画像の融合分野へと進出したことに対応し,言語と画像の両面からモデルに含まれるエンティティに関する知識を検証するタスク及びデータセットを作成し,またどのような構造のモデルが適しているかについても検証した.さらにエンティティを利用して自然言語生成モデルを制御可能かについても検証した.
|
研究成果の学術的意義や社会的意義 |
本研究では事前学習済み言語モデルに基づいた共参照解析手法を支援することを目的に,知識グラフの補完性能の向上及び視覚と画像の融合分野において事前学習済み言語モデルに含まれている知識についてを検証するためのタスク及びデータセットを提案し,実際の検証を行なった.これらの成果は事前学習済み言語モデルの学習過程では通常明示的に与えられることがない知識を扱うものであり,昨今の事前学習済み言語モデルの急速な発展の後にも利用価値を持つことが期待できる.特に視覚と画像の融合分野においてはテキストの生成および画像の生成の両面において性能向上の観点から重要な研究成果であり,共参照解析に限定されない活用が期待される.
|