研究課題/領域番号 |
18K11549
|
研究機関 | 徳島大学 |
研究代表者 |
吉田 稔 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)
|
研究分担者 |
北 研二 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (90509754)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 数値情報解析 / 健康情報解析 / SNS解析 |
研究実績の概要 |
単語分散表現と数値分布表現を統合する研究においては、単純な連結による統合のみならず、単語分散表現の次元の中に数値の分布を埋め込むという新たな手法を開発した。これにより、複数の単位に関わる分布表現を固定次元の表現に埋め込むことが可能になった。また、得られた単語分散表現を用いることにより、関連する単語の類義語抽出において、同義語と対義語の弁別能力をある程度向上させることができることを確認した。 食事画像と言語の関連では、Twitter上で収集した画像に多く見られる、無関係な画像(ノイズ画像)を、画像特徴量を利用したフィルタリングで除く手法について研究を行った。 ユーザーの睡眠時間とツイートの関係については、得られたデータについて詳細な分析を行い、botなどのノイズが影響を及ぼしていることを確認したため、ノイズを除去した新たなデータセットを行い、睡眠時間と関連の深い単語の抽出等を行った。 その他、ユーザーの趣味に関する研究として、「オンラインゲームのプレイヤー募集ツイート」「飲食店へのレビューツイート」「観光地でのツイート」を分析する研究を行ったほか、「小説の自動要約」「音楽視聴者への推薦」といった研究も行った。 ユーザーの感情分析に関しては、引き続き、闘病に関するブログを分析し、そこで使われている単語を、食事や血糖値、感情といったカテゴリに分類する研究を行ったほか、Twitterのユーザーの性格診断に関する研究も行った。
|