2021 Fiscal Year Research-status Report
SNS収集データをもとにしたAI技術を用いたWeb情報の推薦
Project/Area Number |
20K12411
|
Research Institution | Tokai University |
Principal Investigator |
星野 祐子 東海大学, 情報通信学部, 講師 (80435271)
|
Co-Investigator(Kenkyū-buntansha) |
山田 光穗 東海大学, 情報通信学部, 教授 (60366086) [Withdrawn]
石井 英里子 鹿児島県立短期大学, 文学科 英語英文学専攻, 准教授 (80580878)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | SNS / Twitter / Flicker / 画像のオブジェクト抽出 / Webページ / 視線情報 |
Outline of Annual Research Achievements |
本研究では、SNSから取得したテキストデータ、および画像データを用いて、日本人と外国人(英語話者)の投稿内容を抽出し、文化的背景の異なるユーザの興味/趣向の比較を行った。また、視線情報を用いたWeb閲覧データを用いたパーソナライズされた検索キーワードの提示システムの開発も行った。
SNSデータからの抽出では、まず、Twitterから対象エリアを指定して、投稿文章の収集を行った。次に日本語、英語別にLDAとBTMを用いたトピック抽出を行い、言語と抽出手法別にどのようなスポットやイベント、アクティビティが話題に上っているか比較を行った。対象エリアを都心三区(中央区、千代田区、港区)とした場合、小さなギャラリーで開催された展示会について、日本人の投稿はほぼなかったにも関わらず、外国人からの投稿が多くみられた。次に、TwitterとFlickerから対象エリアを指定して投稿画像を収集し、日本人と外国人別に投稿された画像にどのようなオブジェクトや場所が含まれているか比較を行った。この比較では日本人は緑の多い公園や動物など自然に関連するものが多く、外国人は自撮り写真のような人物、日本固有文化に関連した画像投稿が多くみられた。
Web閲覧中の視線情報を用いた検索キーワードの提示では、過去に閲覧したWebページの内容を3行程度に要約し、累積することで、歴史に関するワードや体験アクティビティに関するワードなど、よりパーソナライズされたキーワードを提示することができた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
作成したシステムのユーザインタフェースのユーザビリティや提示キーワードを用いた検索結果について、実際に使用してもらいフィードバックをいただき、修正を行いたいがコロナの影響もあり、対面での実施が難しいため。また、対象エリアを大学所在地近辺にしているが、他地域も比較対象としたい。しかし、遠方への外出が難しく、オブジェクト抽出を行うための学習データとなる画像の撮影等に行くことができなかったため。 プログラムの開発等は比較的順調に進んでいる。
|
Strategy for Future Research Activity |
画像からのオブジェクト抽出と視線情報を用いたWebページ閲覧情報からの検索キーワード提示を合わせることを考えている。Webページ上で注視時間の長い画像に含まれているオブジェクトを抽出することで、これまでの研究結果よりも、よりパーソナライズされた情報提示ができるか検討を行う。 また、対象エリアを広げて、より多くの観光スポットやアクティビティ関連の学習データを収集し、検出オブジェクト、トピックの増加、精度向上を目指す。
|
Causes of Carryover |
国内・国際学会中止・遠隔への変更による旅費、参加費に大きな変更が発生したため、差額が発生している。また、遠隔でできる作業を優先し、画像、動画からのオブジェクト抽出に必要な学習データを作成するため、学内での撮影、動画クリップの編集等の作業を実施したことにより人件費が発生している。
来年度、国内・海外での学会や学習データ用動画・画像撮影が可能となれば、旅費、撮影データ保存メディアの購入等をする予定である。現地での参加が難しいようであれば、リモート参加可能な国際会議や論文投稿を増やすことを検討しており、英文校閲等に使用したいと考えている。
|
Research Products
(14 results)