2021 Fiscal Year Annual Research Report
Information Retrieval on Social Web Sites That Gathered Multiple Opinions
Project/Area Number |
18K18161
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
莊司 慶行 青山学院大学, 理工学部, 助教 (30783039)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | オンラインレビュー / 意見の集約 / 情報検索 / ランキング / Learning to rank / BERT |
Outline of Annual Research Achievements |
本年度は、全体の目標であったランキングへの集計と、成果発表に注力して研究を進めた。 多人数の意見のランキングへの集計の研究課題について、国内最大手の映画レビューサイトの一つであるYahoo!映画の投稿を収集して研究を行った。具体的な研究事例として、レビューサイト上に投稿された「泣ける映画マイベスト10」などの個人作成のランキングを教師データとして、キーワードごとにランキングを学習する機械学習アルゴリズムを作成した。このモデルでは、「こういったレビューが書かれた映画は、こういうタイトルのランキングに登録されやすい」というように、レビュー表現とキーワードの意味的な関係を、BERTとニューラルネットワークを用いて学習している。これにより、単純に入力キーワードに近い内容のレビューを検索するよりも、高精度に映画を検索可能になった。 投稿者個人の信憑性の研究として、レビューから著者を推定する言語モデルによって、著者の特徴を重視したレビュー推薦の研究を行った。2件のレビューについて、それらが同一のレビュアに書かれたものであるかを分類するタスクによって、BERTの言語モデルをファインチューニングした。こうして学習した言語モデルでは、映画の内容やレビューの賛否などに左右されずに、レビュー本文の文体的な特徴に特に敏感なレビュー推薦が行えることが明らかになった。 ほかに、ビデオゲームに関するレビューをゲームごとに集約することで、タイトルを思い出せないゲームを探せる対話型うろ覚え検索アルゴリズムや、あるトピックに関する多人数の意見を効率的に収集する方法として、トピックとそれに対するコメントを相互再帰的にクロールするアルゴリズムについても提案した。 本年度の研究成果として、国際会議論文を6件、国際論文誌論文を2件、国内論文誌論文を1件、国内学会発表を8件、それぞれ発表し、1件の受賞に結び付いた。
|
Research Products
(18 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 文化財の特徴理解に特化したBERTモデル2022
Author(s)
三林亮太, 上田昌輝, 川原敬史, 松本直彰, 吉村拓真, 相原健郎, 神門典子, 莊司慶行, 中島悠太, 山本岳洋, 山本祐輔, 大島裕明
Organizer
第14回データ工学と情報マネジメントに関するフォーラム
-