研究課題/領域番号 |
15K00425
|
研究機関 | 徳島大学 |
研究代表者 |
北 研二 徳島大学, 大学院理工学研究部, 教授 (10243734)
|
研究分担者 |
吉田 稔 徳島大学, 大学院理工学研究部, 講師 (40361688)
松本 和幸 徳島大学, 大学院理工学研究部, 助教 (90509754)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | テキストの事実性解析 / ディープラーニング / テキストからの位置推定 |
研究実績の概要 |
本年度は、近年発展の著しいDeep Learningの手法の隆盛を受け、本研究計画に対するこれら手法の適用可能性の検討が不可欠とみて、各モジュールに対しDeep Learningの適用を行う研究を主に行った。 キーワード抽出部については、ユーザーの感情を推定するための研究において、文をsentence2vecによりベクトルに変換し、ニューラルネットワークにより感情を分類する手法を適用し、特に、中間層を2層とした場合に分類精度を向上させることができるという知見を得た。文書要約部に関しては、Web文書中の表形式をDeep Learningの手法に適用するためのベクトル表現(分散表現)に変換するための手法について研究を行った。また、画像理解については、画像の特徴量理解に役立つ画像生成モデルGANを用いて、顔画像認識や衣服を題材に、画像からの特徴抽出に対する研究を行った。 システム全体に関しては、感染症の発生と、その位置情報を対応付けるための研究を行い、「感染症大腸炎」や「ヘルパンギーナ」等、主に夏に流行する実際の感染症を対象に、ユーザーのTwitter上での発言をもとに、それが実際に当人の感染を示しているかの判定および、そのユーザーが住んでいる場所の推定を機械学習により行う研究を行った。さらに、当該感染症名を発言しているユーザー数を、実際に日本地図上に表示するシステムを作成した。また、その他の健康情報として、体重の増減に着目し、ユーザーの体重の増減を、Twitter上での発言から推定するための研究を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は、実際に感染症に関する発言を県名に対応付け、それを地図上に表示する機能までを実装した。この点に関しては、当初計画を上回るペースで進展している。また、画像特徴量の検出および表形式のベクトル表現に関する手法について進展したため、次年度の図表の理解に役立つことが期待される。頻度異常値検出については、まだ手付かずであるが、実際に地域と感染症名の対応付けを地図上に表示することが可能になったため、これが頻度異常値のしきい値設定に役立つものと考えられる。
|
今後の研究の推進方策 |
これまで得られた知見をもとに、図表の理解のための手法の研究を行っていく予定である。また、すでに発言と地域の対応付け、および地図上への表示について実装が完了しているため、これをもとに適切な頻度異常値検出手法を検討する予定である。個別手法についての評価はある程度完了しているが、システム全体の評価手法についても検討していく。
|