研究課題/領域番号 |
20H04148
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 京都大学 |
研究代表者 |
下平 英寿 京都大学, 情報学研究科, 教授 (00290867)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
17,810千円 (直接経費: 13,700千円、間接経費: 4,110千円)
2022年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2021年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2020年度: 6,890千円 (直接経費: 5,300千円、間接経費: 1,590千円)
|
キーワード | 多変量解析 / 次元削減 / 分散表現 / 表現学習 / グラフ埋め込み / 自然言語処理 / ニューラルネットワーク / 加法構成性 / パターン認識 |
研究開始時の研究の概要 |
画像,タグ,文書などの多様なドメインのマルチモーダルデータから関連性を考慮してニューラルネットによって情報統合し共通空間で表現する新しい柔軟な多変量解析の方法論を提案・発展させる.画像認識や自然言語処理などの大規模データに取り組み,その経験を理論にフィードバックすることによって,次元削減したベクトルの加減算など共通空間の演算による推論の枠組みの構築を目指し,高度な思考を実現するステップとする.
|
研究成果の概要 |
関連性データの埋め込みがどのように情報を表現しているかを理解するための研究を行った.具体的には,埋め込んだベクトルの加減算によるアナロジー計算の基礎となる加法構成性や,それに関係した埋め込みの性質を調べた.通常の加法構成性ではベクトルの和によって意味が同時に成立すること(AND)を表すが,意味のどちらかが成立すること(OR)は頻度重み付き重心,意味の否定(NOT)は対象単語集合の重心に原点を取り直した上で負の方向であることを示した.また,一種の対照学習(SGNS)で得られる単語ベクトルのノルムの2乗がカルバック・ライブラー(KL)情報量で近似され「意味の強さ」を表すことを理論と実験で示した.
|
研究成果の学術的意義や社会的意義 |
本研究は,関連性データの埋め込みと表現学習に関する新たな知見を提供しました.加法構成性や埋め込みの性質に関する結果は,単語や概念をベクトルで表現する方法に関する理論的な理解を深めることに貢献しました.これにより,なぜニューラルネットが効果的に機能するのか,その原理を理解する道を開くことが期待されます.
|