研究課題/領域番号 |
23K18497
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 東京電機大学 |
研究代表者 |
高橋 達二 東京電機大学, 理工学部, 教授 (00514514)
|
研究分担者 |
岡本 洋 東京大学, 大学院工学系研究科(工学部), 特任研究員 (00374067)
布山 美慕 立命館大学, 文学部, 准教授 (30797311)
西郷 甲矢人 長浜バイオ大学, バイオサイエンス学部, 教授 (80615154)
|
研究期間 (年度) |
2023-06-30 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2024年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2023年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | 類推推論 / 圏論 / 自然変換 / マルコフ連鎖 / ページランク / クラスタリング / 階層性 / 不定自然変換理論 / 圏代数 / 連想ネットワーク / 心理実験 |
研究開始時の研究の概要 |
人間は抽象化・概念化した知識を迅速に対応づける (類推推論) ことで、新奇環境に適応できる (転移学習)。類推は、人間レベルの転移学習を実現するための鍵であり、「一を聞いて十を知る」高い学習能力を支えている。しかし既存の類推アルゴリズムは、入力となる知識構造に対し、人手による高度な抽象化とツリー構造への整理を必要とし、そのうえ計算量も膨大なため、認知的現実性と工学的実用性の両方を欠く。そこで本研究では、マルコフ連鎖モジュラ分解と不定自然変換理論を用い、最も一般的かつ基本的な知識構造である重み付き有向ネットワーク上での概念化と類推を実現する。
|
研究実績の概要 |
「単語ネットワークの階層化による概念化の実現と分析」と「階層的連想ネットワーク上での類推推論の実現」の二つを行った。知識構造は一般的に(制限づけられた)有向ネットワークである。人間の知識も単語をノード、その間の関係をエッジとしたある種のネットワークと考えられる。そこで特に関連や類似のデータセットであるSimLex-999, WordSim353 (英語)、JWSAN (日本語) や word2vec などによる単語分散表現から単語ネットワークを形成し、その上で布山・西郷・高橋によるTINT (不定自然変換理論) と分担岡本らによるMDMC(マルコフ連鎖モジュラ分解) によるクラスタリングによる類推推論の実現と階層性の分析を行なった。特に、自然言語処理の手法でまだ十分扱えていない意味の類似性に基づくネットワークと、従来の共起・連想関係のネットワークの性質の違いを、多解像度のクラスタリングにより詳細に分析することで、言語知識構造としてのネットワークの理解を深めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
単語ネットワーク、特に円環構造の仮定されている感情語のクラスタリングについて、研究成果について国際会議で発表し、ジャーナルへの投稿準備中である。類推推論については理論的分析と一般化を進めている。実質1年半の研究期間であるが、順調に当初の目標が達成できる見込みである。
|
今後の研究の推進方策 |
単語クラスタリングについては、ネットワークデータをベクトルデータに変換できるという機能があることが発見された。この点について可能性を追求する。類推推論については、基本アルゴリズムができているので、理論的な整理を進めて論文投稿に進む。
|