研究課題/領域番号 |
20K19933
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 東京都立産業技術大学院大学 (2023) 京都府立大学 (2020-2022) |
研究代表者 |
横山 友也 東京都立産業技術大学院大学, 産業技術研究科, 助教 (20791130)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | Q&Aサイト / 因子得点 / N-gram / 重回帰分析 / 適合率 / 再現率 / 意味解析 / 他言語への汎用 / 質問回答サイト / 因子 / word2vec / 印象 / 英語 / ジャンル / 客観的評価値 |
研究開始時の研究の概要 |
インターネット社会において重要な質問回答サイトにおいて、質問者に適切な回答が返されることで、質問回答サイトが社会により有用な知恵袋となり、社会活動の効率的な促進を目的とする。 このために、本研究では、質問文に適切な回答ができるユーザを引き合わせる手法の開発を目標とする。文章から受ける印象の度合を利用し、質問者に適切な回答者を引き合わせる手法を特色とする。これまでの研究の延長として、質問回答文の意味の考慮と客観的評価値の推定精度の向上、さらに信憑性の高い回答文の抽出と選出手法を行うことで、適切な回答者の検索精度を向上させる。また、質問ジャンルの拡張や英語への適用など、適用範囲の拡大も目指していく。
|
研究成果の概要 |
これまでの研究手法は、形態素解析に基づいた手法が主であり、因子得点を推定するための重回帰式も複雑なモデルとなっていた。一方で、形態素解析と同様に構文解析として知られている方法としてN-gramがある。そこで、N-gramを主に特徴量に使用した場合の分析を進めた。その結果、N-gramに基づき、因子得点の推定ならびに適切な回答文を予期できる回答者の選出とも可能であることが見込める結果が得られている。 また、質問回答文の意味の考慮のためにword2vecを使用した。その結果、因子得点の推定に影響を及ぼすことを示した。さらに、これまでの提案手法を英語にも適用したところ、概ね適用可能であることも示した。
|
研究成果の学術的意義や社会的意義 |
質問回答文の形態素情報ならびに印象も着目することで、ユーザに回答者を引き合わせる研究を行うことで、同じ文意でも表現によって受ける印象が大きく異なることを考慮しているからである。また、N-gramを含めた構文解析結果や意味解析結果までも使用することで、文意に踏み込んだ解析が可能となる。 日本語で良好な結果が得られている手法を他言語に適用することで、日本語と他言語における質問回答文の印象を表す因子の共通点と相違点を明確にすることが可能である。これは、日本語と他言語の共通点と相違点であり、言語学上興味深い結果が得られることが期待される。これにより、日本語と他言語の更なる相互理解に寄与すると考えられる。
|