研究課題/領域番号 |
15H02713
|
研究機関 | 電気通信大学 |
研究代表者 |
内海 彰 電気通信大学, 大学院情報理工学研究科, 教授 (30251664)
|
研究分担者 |
猪原 敬介 くらしき作陽大学, 子ども教育学部, 講師 (10733967)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | ベクトル空間モデル / 意味空間 / 単語の意味 / 記号接地 / 多義 |
研究実績の概要 |
平成29年度は,以下の研究成果を得た. (1) 語彙の意味獲得における記号接地メカニズムの解明に向けて,言語情報から生成させる意味空間による様々な情報(意味情報や感覚運動情報だけではなく,抽象概念の獲得に必要とされる情緒・感情,社会関係,認知に関する情報)の表現可能性について分析する手法を開発した. (2) 単語の多義を表現する意味空間モデルの生成方法として,前年度までに提案したモデルを改良したDP+ICE法(文脈クラスタリングに density peak 法,文脈表現に ICE 法を用いる)と,TM+HDP法(文脈表現としてのトピックモデルに階層ディリクレ過程を適用してクラスタリングを行う手法)の2種類を提案し,その性能を評価した.その結果,DP+ICE法が従来の手法やTM+HDP法に比べて多義の表現性能が高いことを明らかにした.本結果の一部は IJCAI 2017 併設のワークショップで発表した. (3) 前年度にインターネット調査によって収集した日本語単語対の類似度・関連度の評定データセットを分析・整理して,日本語意味空間の性能評価用データとして公開できる状態にした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
個人的な健康上の理由もあって,平成29年度はあまり研究を進めることができなかった.その中でも単語の多義を表現する手法に関して一定の成果が得られた.また,最終年度である平成30年度に向けて,意味空間の新たな調査方法やそれを用いた意味空間の洗練法に関するアイデアを得たことは大きいと考えている.
|
今後の研究の推進方策 |
ベクトル空間モデルによって生成される単語ベクトルに含まれる情報にはどのような種類があるのが,それらの表現可能性の違いはあるのか,単語ベクトルの研究が記号接地や身体性認知の研究にどのような知見を与えうるか,言語統計情報だけでどこまでが学習可能なのか,などの点に関して,今までの研究を踏まえて,まとまった結論を提示できるようにしたい.また,単語ベクトルやその身体性認知への可能性に関する学術論文を2件,単語類似度・関連度データセットに関する学術論文を1件投稿することを目標とする.
|