研究課題/領域番号 |
18K18161
|
研究機関 | 青山学院大学 |
研究代表者 |
莊司 慶行 青山学院大学, 理工学部, 助教 (30783039)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | オンラインレビュー / 意見の集約 / 情報検索 / ランキング / Learning to rank |
研究実績の概要 |
本研究では「映画レビュー情報をもとに泣ける順に映画を並べる」などというように、多人数の意見を集約して1つのランキングを作成することを目標としており、これまでに「レビューに含まれるどの表現が実際に『泣ける』ことを示しているか」という表現レベルでの集計や「どのレビューが読み手に取って意思決定するうえで重要か(≒ランキングに強く反映させるべき)」といったレビュー単位での集計を行ってきた。 本年度は主に多人数の意見を集約してアイテムごとに集計し、実際にアイテムをランキングする方法について研究を行った。この研究では、実際の映画レビューサイトに投稿された「泣ける映画マイベスト10」などの個人作成のランキングをもとに、機械学習(Learning to Rank)技術を用いて映画を任意のクエリでランキング可能にした。また、「泣ける」などのキーワードクエリでは正解となるランキングを一意に特定できない場合があったため、映画の系列を例として入力すると、その例の隙間を埋めてランキングを作成するような例示検索システムについても提案した。ほかに、アイテム検索特有の問題として、検索者の語彙とアイテムに付随する情報の差を埋めつつアイテムをランキング化するため、映画のあらすじを抽象的なグラフとして扱うことで検索可能にする手法も提案した。 付随する研究として、オンライン地図サイトに投稿された地物レビューを集約して個人の学習内容と結びつけることで記憶に残りやすくする研究など、実際に集約した情報を情報利用者の記憶に残し活用可能にする研究を行った。 本年度の研究成果として、査読付き国際ワークショップで2件、査読付き国内ワークショップで1件、国内査読なしワークショップで7件の研究成果発表を行った。これらのうち5件の研究成果について、発表賞を受賞した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究自体はおおむね順調に進行しており、研究対象とするデータの拡大や、様々な知見や実用上のアプリケーションが提案されているが、論文化において査読付きワークショップ3件にとどまり、国際会議発表および論文誌発表に結び付かなかった。これはCOVID-19による協働学生の活動開始の遅れなどの影響である。 具体的な改善案として本年度はこれまでに得られた知見の論文化により力を入れて研究を進める。
|
今後の研究の推進方策 |
2021年度は研究の進捗と同時に成果発表に重点を置きながら研究を進める。 研究上の大きな課題として、大規模な言語モデルを実データから作成し、これまでに提案してきた手法をこのモデル上で動かす。本研究でこれまで進めてきたそれぞれの手法は、それぞれ異なるプリミティブな言語モデルを用いていた。ここで、近年支配的になりつつある高性能な言語モデルBERTを用いることで性能向上と一般化を目指す。 また、本年度までと同様に、多人数の意見を集約することによってもたらされる新しい検索モデルの提案や、映画レビュー以外の多人数の意見(ゲーム攻略サイトなどのCGMや、GitHub上のコメントなどを含む)への適用の研究を個別に行う。 加えて、本年度は特にこれまでの研究成果を論文や国際会議で発表することを重視して進める。具体的には、昨年度、本年度に国内会議で発表された内容をブラッシュアップし、それぞれ国際会議および論文誌論文として投稿する予定である。
|
次年度使用額が生じた理由 |
COVID-19の状況により2件の発表を行ったWEPIR国際ワークショップ、および7件の発表を行ったDEIM2021がオンライン開催に変更されたため、本年度主に使う予定だった旅費が大幅に削減されたため。
|