研究課題/領域番号 |
15H02713
|
研究機関 | 電気通信大学 |
研究代表者 |
内海 彰 電気通信大学, 大学院情報理工学研究科, 教授 (30251664)
|
研究分担者 |
猪原 敬介 電気通信大学, 大学院情報理工学研究科, 特別研究員 (10733967)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | ベクトル空間モデル / 意味空間 / 単語の意味 / 記号接地 / 多義 |
研究実績の概要 |
(1) 語彙の意味獲得における記号接地メカニズムの解明を目指して,言語情報と画像情報から単語のマルチモーダル意味ベクトルを生成する際に,具象語と抽象語で異なる手法を用いて意味ベクトルを生成する新たな手法を提案し,抽象語は言語情報を用いて間接的に実世界に接地するという身体性認知の最新理論の計算論的妥当性を示した.本成果は国際会議CogSci2016で発表した. (2) 単語の多義を考慮した意味空間モデルの生成手法として,単語ごとに適切な語義数を自動的に推定しながらクラスタリングを行って語義ベクトルを生成する手法を提案し,語義数を固定する従来手法に比べて性能が向上することを確認した. (3) 自然言語処理に必要な言語資源が入手困難な少資源言語に対して,画像情報のみによる多言語意味空間を生成し,それを用いることによって英語と少資源言語間,または少資源言語間の対訳辞書を構築する手法を提案し,その予備的な性能評価を行った.対象とする少資源言語は13言語(アイルランド語,アムハラ語,イディッシュ語,グジャラート語,シンハラ語,スコットランド・ゲール語,スンダ語,ネパール語,パンジャブ語,ベンガル語,マケドニア語,マラーティー語,ヨルバ語)とした. (4) 日本語意味空間の性能評価用データセットとして,日本語単語対の類似度および関連度の評定データをインターネット調査を通じて広範囲な年齢層に対して大規模に収集した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
ベクトル空間モデルに関する課題について一定の研究成果は得られているとともに,当初予定していなかった成果(少資源言語への応用)などが得られているが,それらの成果を論文や国際会議で発表するレベルにまで達成できていない点が不十分である.
|
今後の研究の推進方策 |
今までに得られている成果をより詳細に分析・再検討して,場合によっては改良することによって,学術論文として発表できるレベルにしていきたい.
|