研究課題/領域番号 |
26540144
|
研究機関 | 早稲田大学 |
研究代表者 |
林 良彦 早稲田大学, 理工学術院, 教授 (80379156)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 感性情報処理 / 想起 / 意味的類似度 / 意味ネットワーク / 機械学習 |
研究実績の概要 |
本研究課題の2年目である平成27年度は,主に以下の課題に取り組んだ. (1) 想起の強さ・方向性の機械学習による予測方式の提案と評価: 昨年度の予備検討に基づき,想起関係の強さ(Aという概念がBという概念をどのくらい想起させるか),および,方向性(A,Bの2つの概念があるとき,どちらからどちらへの想起関係が存在しうるか)を機械学習によろ予測する方式を検討し,相関関係の強さについては従来研究で報告されている値(相関係数:0.13程度)を大きく上回る結果(相関係数:0.4以上),方向性については良好な精度(F値:0.85) を得ることができた.特に,単語・語義・概念に関する分散表現ベクトルの差分が想起関係の強さ・方向性の双方の予測において大きな役割を果たしていることを実験的に明らかにした.さらに,想起の双方向の強さを同時に予測する手法や,機械学習の手段に関する比較などについて比較実験を行い,知見を蓄積した.国内学会発表:2件. (2) 想起関係を取り込んだ非対称な意味的類似度に関する基礎検討: 上記の結果を受け,語義・概念に関する分散表現ベクトルとの統合の可能性,単語の類似度・関連度をもとに,文の類似度を計算する方式について基礎検討を進めた.国内学会発表:1件. (3) 想起関係の適用に関する検討: 別プロジェクトで進めている情報・知識伝達のための対話システムにおいて,想起を含む意味情報を利用する方法について検討した.査読付き国際会議:1件,国内学会発表:1件.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
想起関係の強さ・方向性の予測に関しては,当初の見込みを大きく上回る良好な精度を達成できた.また,単語・語義・概念の分散表現を有効に利用する方法を明らかにすることができた.しかしながら,これらの機序を詳しく分析するところまでは至らなかった.また,当初予定していた想起データ(現状は英語)の日本語化を達成することはできなかった.以上を勘案し,総合的には「おおむね順調に進展している」と自己評価する.
|
今後の研究の推進方策 |
想起関係の強さ・方向性の予測方式については,予想以上に良好な結果を得ている.しかし,その理由を明確化する分析が必要である.また,機械学習に用いた各属性の有効性について詳しい分析を行う必要がある.さらには,前年度に検討した,意味ネットワークにおける概念連鎖を属性として取り込む方法を詳細化する必要がある.これらの過程においては,人出による評定データを収集・作成し,必要に応じて被験者実験を行う.想起データの他言語化(日本語化)については,その費用対効果を再検討し,実施の可否を再判断する.文間の意味的類似度への想起関係の組み込みについては,引き続き検討を進めるとともに,その非対称性を活かした適用領域(例:含意関係への適用)の明確化を図る.
|
次年度使用額が生じた理由 |
当初は想起データの他言語化(日本語化)を実施予定であり,そのための費用を見込んでいた.しかし,より重要な想起関係の強さ・方向性の予測に関する研究が良好な見通しとなったため,こちらを優先して研究を進めたため,次年度使用額が生じた.
|
次年度使用額の使用計画 |
これまでの研究の進捗内容から,想起データをいたずらに他言語化するよりも,想起の機序をより詳しく分析し,さらには,工学的な適用への提言を行うことの方が重要であるのではないかと考えるようになった.このため,想起データの他言語化に関しては費用対効果を再検討し,場合によっては研究費を,想起データのより詳しい分析や,その結果のデータベース化などのためのデータ分析・整理のために利用する.
|