研究課題/領域番号 |
18K11549
|
研究機関 | 徳島大学 |
研究代表者 |
吉田 稔 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)
|
研究分担者 |
北 研二 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 助教 (90509754)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | テキストマイニング / 健康情報 / グラウンディング |
研究実績の概要 |
テキスト中の数値と言語の関係の学習について、本年度は、単語分散表現と数値の分布表現を統合する手法について主に研究を進めた。さらに、学習された単語分散表現を文字列抽出に応用することにより、数値に特有の文字列表現を分散表現の観点から取得する手法について研究を行った。 食事画像と言語の関係については、新たに、深層学習により食事画像の特徴量を抽出し、それをもとに画像と言語の関係を分析する手法の開発を進めた。これにより、「文字列上では類似していないが、画像上で特徴量が似ている」類似文字列の取得ができることを確認した。 ユーザーの生活習慣の分析に関しては、まず、睡眠時間の分析について、昨年度に引き続き、Twitter上のユーザーの就寝時のツイートと睡眠時間の関係について、より詳細な分析を行った。このほか、ユーザーの音楽に関する趣味を分析する手法として、ユーザーのプロフィール情報を言語的特徴量として用いることで、音楽アーティストの分散表現を学習する手法を開発し、アーティストの傾向分析へ応用できることを確認した。また、ユーザーが音楽番組を視聴した際の感想ツイートや、音楽共有サイトに投稿されたユーザーの感想テキストを用いてアーティストを分類する手法や、テレビ番組を視聴する際のユーザーの反応分析についても研究を進めた。 また、テキストからユーザーの感情を推定し、精神状態の分析に役立てる手法についても研究を進めた。一般公開されている闘病に関するブログを、深層学習を用いて分析する手法について研究を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度に引き続き、食生活と睡眠について研究を進めた。これに加え、音楽等のユーザーの趣味に関する分析手法の開発も行い、ユーザーの生活パターンについて多方面から研究を進められていると考える。 数値と言語の解析のための基礎手法の開発に関しても、単語分散表現を応用することで、より直感的にわかりやすい分析結果を得られており、順調に研究が進展していると考える。 また、画像と言語の関係の分析についても、深層学習を利用することで有望な結果を得ており、今後さらに効果を検証する予定である。 WWWのレイアウト解析については、今年度までに得られた深層学習等に関する技術的知見を応用し、研究を進めていく予定である。
|
今後の研究の推進方策 |
生活習慣に関しては、これまでの研究で得られた睡眠や体重等と言語の関連分析手法を、血圧等他の指標にも適用することを目指す。食事画像と言語の分析については、単純な共起情報の利用のみならず、確率的生成モデルや深層学習モデルを利用したより深い分析手法の確立を目指す。数値と言語の関係分析については、基礎的な技術の開発は進んでいるので、今後はこれらの技術を、実際に健康情報解析に応用したときの効果を確認する予定である。また、レイアウト解析についての研究も、これまで他の課題について得られた技術的知見も応用し、開発を進めていく。
|
次年度使用額が生じた理由 |
物品に関して、特に、近年の深層学習に関する技術の進展、およびそのために必要となる計算機の性能に関して、刻一刻と状況が変化するため、より最新の状況に即した計算機の購入が研究の進展に有利であると考え、次年度に使用することとした。次年度に、最新の状況を反映した性能の計算機を購入する予定である。旅費に関しては、COVID-19の流行により、年度末に予定していた学会参加がキャンセルとなったために、使用時期が次年度にずれ込む見通しとなった。
|