• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

質問回答サイトにおける質問文に対する信憑性の高い回答文の抽出と選出手法の研究

研究課題

研究課題/領域番号 20K19933
研究機関京都府立大学

研究代表者

横山 友也  京都府立大学, 生命環境科学研究科, 特任助教 (20791130)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード質問回答サイト / 印象 / 因子 / 重回帰分析 / N-gram / 英語
研究実績の概要

(1) N-gramに基づいた構文情報の特徴量を用いた因子得点の推定
これまでの研究手法は、形態素解析に基づいた手法で抽出してきた構文情報の特徴量に依存度が大きかった。その結果、二次項を考慮する必要性も併せて、因子得点の推定に必要な重回帰式が複雑になっていた。そこで、構文解析の別な手法であるN-gramに基づく特徴量17種を形態素解析に基づく特徴量36種の代わりに新規特徴量として使用し、計58種の特徴量を説明変数、9因子の因子得点を目的変数として重回帰分析を実施し、本手法の有効性を検証した。N=2, 3, 4で分析を行ったところ、どの場合においても、9因子とも従来の形態素解析とほぼ同等もしくは良好な結果が得られ、2-gramの場合が最も有効的な手法である可能性を検証した。また、二次項を要した形態素解析の場合と異なり、N-gramの場合は単項のみで済むため、因子得点を算出するモデルの軽量化が期待される結果となっている。
(2) 2-gramに基づいた構文情報の特徴量を用いた因子得点の推定手法の英語の質問回答文への適用
本研究の課題の一つに、分析手法の英語への適用可能性が含まれる。その一環で、(1)で示した推定手法を英語の質問回答文30件に適用できるかどうかを、第一歩として2-gramの場合で検証を行った。これまでの分析で使用した英語の形態素解析26種のうち、品詞の単語に該当する特徴量8種に代わって2-gramに基づいた10種を使用し、計28種の特徴量を説明変数として使用する。(1)と同様に、9因子の因子得点を目的変数とし、重回帰分析を行ったところ、(1)の日本語の場合と同様に、英語の場合でも2-gramは形態素解析とほぼ同等もしくは良好な結果が得られている。当該の研究実績を、2022年7月開催予定の国際会議SNPD2022-Summerにて論文投稿ならびに研究発表を行う予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

これまでの研究の拡張として、研究実績に示した「(1) N-gramに基づいた構文情報の特徴量を用いた因子得点の推定」において、これまでの研究とは異なる分析手法を試みた場合の分析結果と傾向をさらに確認・担保するための知見が得られている。また、分析手法の他言語への汎用も視野に入れた知見として、研究実績に示した「(2) 2-gramに基づいた構文情報の特徴量を用いた因子得点の推定手法の英語の質問回答文への適用」において、他言語でも(1)の手法を適用することが可能であるという知見が得られている。これらの研究成果については、構文解析を用いた分析手法として目的をある程度は果たした状況となっている。
但し、構文解析の分析手法は限界を迎えつつあるため、現在は、続いて検討する予定である「意味解析を考慮した場合の分析」ならびに「客観的評価値の推定精度の向上」の検討を少しずつ進めており、比較的順調に進展しているといえる結果になっている。
但し、COVID-19の影響で、今後思うように分析が進展しない公算が大きくなりそうな側面の研究もある。「英語での手法の一般性の検証」において、「適切な回答者の選出」として、英語の質問文1件に対する回答文100件を5組・5段階で評価する印象評価実験の実施を、Deakin大学のDr. Morshedに依頼して、メルボルンで実験を実施する予定であった。ところが、COVID-19の世界的な蔓延のため、海外渡航が容易ではない状況が続いており、当初の計画通りに進める公算が非常に低い状態となっている。この件に関しては、恩師であり投稿論文の共著でもある京都工芸繊維大学の寶珍輝尚教授のご意見を賜り、相談したいと考えている。但し、現実的に実験を施行できるかどうかは別としても、実験に使用する英文の決定等、限られた環境下において可能な範囲でできることは進めてきている。

今後の研究の推進方策

(1)質問回答文の意味の考慮
これまでの申請者が行ってきた研究では、文章の意味を考慮することで適切な回答者の選出精度を向上させる余地がある。そこで、意味解析により、検索クエリと文書との類似度等を新たな特徴量として利用する。文章の意味を考慮するにあたり、word2vecを用いて各単語の意味のベクトルを平均化した値を新たな特徴量として使用する。これらの特徴量を用いて、因子得点の推定、ならびに適切な回答者の選出を再度行う。構文解析による特徴量のみを用いた場合と比較して、意味解析まで踏み込んだ時の選出精度の良好性を評価する。これにより、意味解析を行うことで適切な回答者の選出精度の向上が見込まれると予想される。
(2)客観的評価値の推定精度の向上
これまでの申請者が行ってきた研究では、主に因子得点を説明変数として、重回帰分析を用いて、国立情報学研究所が提供している客観的評価値の推定を試みたが、推定精度の向上と推定誤差の改善という課題が残っている。これらの問題を解消すべく、(a)で行った意味解析で得られる特徴量を説明変数に追加して、客観的評価値の推定を再度行う。これまでの研究では、word2vecを用いて、各単語の意味のベクトルを平均化した値を既に特徴量として使用している。ここでは、ベクトルの値の最大値または最小値などを新規特徴量として使用することを考えている。新たに分析を行った結果をこれまでの結果と比較し、推定結果の良好性を評価する。評価の結果、推定精度の向上と推定誤差の改良が見込まれると期待される。

次年度使用額が生じた理由

2020年度・2021年度ともCOVID-19の世界的な蔓延のため、当初参加を計画・予定していた国内外の学会が相次いで中止ないしはオンライン開催に切り替えられてしまい、旅費を充当することが全く不可能となった。このような事情のため、2020年度・2021年度とも当初計画予定より大幅に資金が余る状況となってしまった。しかしながら、COVID-19の終息が見込まれる可能性もあるため、2022年度は、参加を計画・予定している学会が従来の現地開催が可能となる公算が高くなるため、旅費として使用できる公算がある程度見込まれると考えられる。したがって、国際学会やシンポジウムでの研究発表を積極的に行っていきたい意向である。また、Linux専用の新規のデスクトップパソコンや、R, Python, MatLabなど自身の研究に関連する統計分野の参考書籍を適宜購入するなど、研究をより迅速かつ効率的に進めることができるように、前年度までの分の次年度使用額も含めて、使用していくことを検討している。

  • 研究成果

    (2件)

すべて 2022 2021

すべて 学会発表 (2件) (うち国際学会 1件、 招待講演 1件)

  • [学会発表] Estimation of Factor Scores from Feature Values of Statements to Obtain Potential Appropriate Respondents to Questioners at Japanese and English Q&A Sites2022

    • 著者名/発表者名
      Yuya Yokoyama
    • 学会等名
      International Symposium on Applied Informatics Innovations (ISAII 2022)
    • 招待講演
  • [学会発表] Application of 2-gram to Obtain Factor Scores of Statements Posted at Q&A Sites2021

    • 著者名/発表者名
      Yuya Yokoyama, Teruhisa Hochin and Hiroki Nomiya
    • 学会等名
      8th ACIS International Virtual Conference on Applied Computing & Information Technology (ACIT 2021)
    • 国際学会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi