研究課題/領域番号 |
19H04418
|
研究機関 | 筑波大学 |
研究代表者 |
上保 秀夫 筑波大学, 図書館情報メディア系, 准教授 (00571184)
|
研究分担者 |
松林 麻実子 筑波大学, 図書館情報メディア系, 講師 (10359581)
于 海涛 筑波大学, 図書館情報メディア系, 准教授 (30751052)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 情報検索 / 会話検索 |
研究実績の概要 |
言語表現データベース構築を継続して、システム視点での思考内容の言語表現データを収集した。具体的には、20のシステム視点思考に対して、それぞれ最大200件の言語表現データを獲得した。
また収集したユーザ視点の言語表現データから発言元になっている検索方略を推定する分類器を構築し、分析を実施した。具体的には、日本語話し言葉コーパスを用いて事前訓練された大規模言語モデル(BERT)に対して、本研究で収集したデータを用いたファインチューニングを実施、60カテゴリを判別可能な分類器を作成した。テストデータによる精度(F1スコア)は、0.82~1.00であり、判別が正確な方略とそうでないものを明らかにすることができた。
さらに、会話検索システムの開発に着手した。具体的には、商業用テキストチャットサービスのAPIを利用し、ユーザの入力に対して、検索結果を返すボットシステムを開発し、今後のシステム開発の実現可能性を検証した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
「研究実績の概要」にも記述した通り、言語表現データベースの更新、発話の検索方略推定分析、会話エージェント開発の着手など、今年度の研究実施計画で予定していた内容をおおむね達成できたため。
|
今後の研究の推進方策 |
次年度の前半は、着手した会話検索システムの開発を継続する。思考内容の推定分析で精度の高かったものから、1つずつ検索システム機能との連携方法を設計し、チャットシステム上に実装していく。 後半は、開発している会話検索システムの実験室型実験によるユーザ評価に着手する。この間は予備実験を行う期間として位置づけて、実験を行う上で必要な倫理審査やユーザへの教示書類の準備などを進める。また、共同研究者らと議論をして、評価を行う思考内容カテゴリーの優先順位などを決定する。ユーザ発話を入力として生成されたシステム出力内容の理解度を評価することを中心とする。予備実験は5名程度の実験参加者を対象に実施する。
|