研究課題/領域番号 |
23K11228
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
白井 清昭 北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (30302970)
|
研究分担者 |
K. Natthawut 北陸先端科学技術大学院大学, 先端科学技術研究科, 講師 (40818100)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | レビューの有用性 / 評判情報分析 / 自然言語処理 / 機械学習 |
研究開始時の研究の概要 |
通販サイトに投稿されたユーザレビューは,新しい製品を購入しようとするユーザにとって有益な情報である.しかし,製品を買っていないのにレビューを書いたり,製品以外のこと(ネットショップや配送業者)だけを書いたりするなど,中には有用ではないレビューも多く存在する.本研究は,製品に言及していないレビューを有用ではないレビューと定義し,製品レビューが有用か否かを判定することを目的とする.レビューと製品の説明文書の関連性を測ることで製品に言及したレビューを発見する手法と,製品以外のことに言及した特有の表現を学習することで製品に言及していないレビューを発見する手法を探究する.
|
研究実績の概要 |
本研究課題は製品に関する情報を含むという観点から製品レビューの有用性を定義し、有用なレビューとそうでないレビューを自動的に識別する手法を探究することを目的とする。これを実現するために、レビューの中から製品に関係のある記述を検出するアプローチと、製品に関係のない記述を検出するアプローチを組み合わせて用いる。 本年度は、前者のアプローチについて研究を実施した。まず、レビューが意見に対する根拠を含み、かつその意見が製品に関連するものであるとき、そのレビューは有用であると想定した。そして、レビュー中の2つの文の組が意見とその根拠を含むかを判定するモデルを学習した。訓練データとして、(1)既存の談話関係がアノテーションされたコーパスを流用したデータセット、(2)談話標識を手がかりに自動構築したデータセット、(3)Chat GPTを用いて生成したデータセットの3つを組み合わせて用いた。さらに、(1)のデータセットを第1段階、(2)と(3)のデータセットを第2段階として、事前学習済みBERTモデルを2段階に分けてファインチューニングする手法を提案した。実験の結果、3つのデータセットを併用することで意見・根拠関係の判定の性能を向上させることができた。 次に、意見とその根拠を含むと判定された文の組に対し、その意見が製品に関連しているかを判定した。「家電」「化粧品」といった製品のジャンル毎に、そのジャンルに固有のキーワードをあらかじめ抽出し、レビュー中の文の組がそれらのキーワードを含むかによって製品への関連性の有無を判定した。既存のTF・IDFに基づく手法、YAKE!に基づく手法に加え、エントロピーに基づく手法を提案し、これら3つの手法を組み合わせることの有効性を実験的に確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
製品に関連する記述を含むかという観点からレビューの有用性を判定する方法として、製品に関する文やキーワードをあらかじめ取得し、これを手がかりに有用性を判定する手法を探究することを計画していた。今年度の研究はおおむねこの指針に沿ったものであり、十分な成果が得られたことを確認した。したがって、本研究課題は当初の計画通りに進んでいると言える。
|
今後の研究の推進方策 |
製品に関係のある記述を検出するアプローチについては、これまでの研究をさらに発展させる予定である。具体的には、製品に関する情報をレビューだけではなく製品の説明文書からも得ることで、有用性判定の精度を向上させる。合わせて、製品に関係のな記述を検出するアプローチの研究にも着手する。有用でないレビューの集合を用意し、それに関する様々な埋め込み表現(抽象表現)を獲得することに取り組む。
|