2015 Fiscal Year Research-status Report
WWW上の医療・健康情報マッチングのための統合的メディア解析
Project/Area Number |
15K00425
|
Research Institution | The University of Tokushima |
Principal Investigator |
北 研二 徳島大学, ソシオテクノサイエンス研究部, 教授 (10243734)
|
Co-Investigator(Kenkyū-buntansha) |
吉田 稔 徳島大学, ソシオテクノサイエンス研究部, 講師 (40361688)
松本 和幸 徳島大学, ソシオテクノサイエンス研究部, 助教 (90509754)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | ウェブインテリジェンス / 医療・健康情報 |
Outline of Annual Research Achievements |
本年度は、医療・健康情報の統合的理解のためのジオタグ情報利用、医療関連単語抽出、マルチモーダル解析に関して、それぞれ研究を進めた。 ジオタグ情報利用に関しては、Twitterのジオタグを利用するための手法について研究を進めた。具体的には、地域を限定したtweet(テキスト)集合を対象に単語抽出を行い、地域特有の単語を得ることができることを確認した。 医療・健康カテゴリに属する単語の抽出に関しては、「感染性胃腸炎」「気管支炎」のようないくつかの病名を設定し、それに関して情報がまとめられたWebサイトから単語の抽出を行った。これらの病名で検索して得られたTwitterのユーザーに対し、そのユーザーが本当に病気に感染しているか否かの事実性解析を行うための技術、さらに、本当に感染していた場合に、過去の発言(ツイート)を遡り、その徴候を表す単語が観測できるかどうかの検証を行い、Webサイトからの抽出単語とのある程度の関連性を確認することができた。また、病名だけでなく、「肩こり」等のより一般的な単語に関しても、同様の手法を適用するための研究を行った。また、Twitterユーザーの性格推定、および、性格に特徴的な単語を抽出するための研究を行い、性格と健康状態の関連という新たな研究に繋がる可能性を得られたほか、SNS上で多く観測される俗語に関して、その感情を推測するための研究を行った。 マルチモーダル情報のマッチングに関しては、画像認識のための有望な技術であるディープラーニングに関し、パラメータ学習のための環境を構築し、イラスト分類等、いくつかのタスクにおいて実際に手法の適用を行い、問題なく実行できることを確認した。また、表形式と周辺文章のマッチングを行うための新たな確率モデルを開発し、表形式中の数値単位推定タスクにおいてその有効性を確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は、SNSによる個人の医療体験と、Webページのようなある程度公的な知識を合的に活用するための研究であり、SNS解析とWebページ解析をともに行う必要がある。SNS解析に関しては、実際に病名や症状名で解析を行い、兆候となる単語を抽出するために、単語のスコア付け、および、関連Webサイトから単語を抽出し、SNS上の単語とのマッチングを計算するところまでを実現しており、当初計画を上回る進捗を得られていると考えている。またWebページ解析に関しては、グラフ解析、地図解析といった部分にはまだ手がつけられていないが、その基盤技術となる特徴抽出に関しては、ディープラーニングを行う環境を整えたことで、実現に向けて前進していると考える。表形式・数値情報の解析に関しては、確率モデルを応用して、周辺の文章との関連を発見し、さらに、それを応用して数値単位推定まで行う等、こちらは、当初計画を上回る成果を得られていると考える。
|
Strategy for Future Research Activity |
医療・健康単語の抽出に関しては順調に研究が進んでいるため、今年度も引き続き同様の方針で研究を進めるほか、半教師あり学習等を用いた辞書の拡大についても手法の検討を行う。表形式・数値表現の解析に関しては、本年度実現できなかった、構文構造等のより高度な言語情報をモデルに加えることを検討する。また、近年の研究動向として、ディープラーニング技術を応用した単語のベクトル表現がこの分野のスタンダードとして確立しつつあるため、その手法の適用性についても検討を行う。画像認識に関しては、同様にディープラーニング技術を、図や地図といった抽象的な画像に対し適用できるか否かについて、一般的な画像特徴量抽出手法の適用可能性と併せて検討する。Twitterの感情推定に関しては、俗語を対象とした感情付与技術についてある程度実現できたため、これをテキスト(ツイート)全体の感情推定に応用するための手法について検討を行う。
|
Causes of Carryover |
本年度は、医療・健康情報の統合的理解のためのジオタグ情報利用、医療関連単語抽出、マルチモーダル解析についての手法およびモデル設計を行い、比較的小規模な実験により評価を行ったため、物品費および人件費・謝金をあまり使用せずに研究を進めることができた。このため、次年度使用額が生じる結果となった。
|
Expenditure Plan for Carryover Budget |
本研究での提案手法およびモデルに関し、ある程度知見が得られつつあるため、もう少し大規模な実験を行うとともに、本研究に関する成果発表を積極的に行いたいと考えている。生じた次年度使用額は、本年度に得られた成果を国際会議で発表する際の旅費および会議参加費として用いる予定である。
|
Research Products
(7 results)