2023 Fiscal Year Research-status Report
Identifying Usefulness of User Review Considering Mention of Target Entity
Project/Area Number |
23K11228
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
白井 清昭 北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (30302970)
|
Co-Investigator(Kenkyū-buntansha) |
K. Natthawut 北陸先端科学技術大学院大学, 先端科学技術研究科, 講師 (40818100)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | レビューの有用性 / 評判情報分析 / 自然言語処理 |
Outline of Annual Research Achievements |
本研究課題は製品に関する情報を含むという観点から製品レビューの有用性を定義し、有用なレビューとそうでないレビューを自動的に識別する手法を探究することを目的とする。これを実現するために、レビューの中から製品に関係のある記述を検出するアプローチと、製品に関係のない記述を検出するアプローチを組み合わせて用いる。 本年度は、前者のアプローチについて研究を実施した。まず、レビューが意見に対する根拠を含み、かつその意見が製品に関連するものであるとき、そのレビューは有用であると想定した。そして、レビュー中の2つの文の組が意見とその根拠を含むかを判定するモデルを学習した。訓練データとして、(1)既存の談話関係がアノテーションされたコーパスを流用したデータセット、(2)談話標識を手がかりに自動構築したデータセット、(3)Chat GPTを用いて生成したデータセットの3つを組み合わせて用いた。さらに、(1)のデータセットを第1段階、(2)と(3)のデータセットを第2段階として、事前学習済みBERTモデルを2段階に分けてファインチューニングする手法を提案した。実験の結果、3つのデータセットを併用することで意見・根拠関係の判定の性能を向上させることができた。 次に、意見とその根拠を含むと判定された文の組に対し、その意見が製品に関連しているかを判定した。「家電」「化粧品」といった製品のジャンル毎に、そのジャンルに固有のキーワードをあらかじめ抽出し、レビュー中の文の組がそれらのキーワードを含むかによって製品への関連性の有無を判定した。既存のTF・IDFに基づく手法、YAKE!に基づく手法に加え、エントロピーに基づく手法を提案し、これら3つの手法を組み合わせることの有効性を実験的に確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
製品に関連する記述を含むかという観点からレビューの有用性を判定する方法として、製品に関する文やキーワードをあらかじめ取得し、これを手がかりに有用性を判定する手法を探究することを計画していた。今年度の研究はおおむねこの指針に沿ったものであり、十分な成果が得られたことを確認した。したがって、本研究課題は当初の計画通りに進んでいると言える。
|
Strategy for Future Research Activity |
製品に関係のある記述を検出するアプローチについては、これまでの研究をさらに発展させる予定である。具体的には、製品に関する情報をレビューだけではなく製品の説明文書からも得ることで、有用性判定の精度を向上させる。合わせて、製品に関係のな記述を検出するアプローチの研究にも着手する。有用でないレビューの集合を用意し、それに関する様々な埋め込み表現(抽象表現)を獲得することに取り組む。
|
Causes of Carryover |
研究の遂行に必要な計算機環境を整備するためのサーバやメモリなどの購入金額が当初よりも安く済んだことが原因である。次年度以降は、計算機環境の更なる整備に予算を使用すると同時に、場合によっては予算の使途を研究成果発表にかかる旅費などに変更することも検討する。
|
Research Products
(1 results)