本年度は大きく二つの研究課題に取り組んだ。 一つ目の研究では、語の上位下位関係を用いて、入力クエリに対する同位語らしい語および上位語らしい語を発見する手法を提案した。提案手法では、語の上位下位関係を基に作られる2部グラフに対してHITSアルゴリズムを拡張した手法を適用することで、同位語らしさ、上位語らしさを求める。例えば、「落合博満」というクエリに対しては、同位語らしい語として「野村克也」や「イチロー」といった語が、上位語らしい語として「野球監督」や「野球選手」といった語が得られることが期待される。 実験では、クラウドソーシングを用いた大規模な実験を行い、提案手法の有用性を明らかにした。 二つ目の研究では、社会認知量に基づく典型度と、データ量に基づく典型度に差がある情報は意外であるという仮説の基、意外な情報の発見を目的とした。特に語間の関係の典型度に着目し、上記の仮説を検証するために、クラウドソーシングを用いて社会認知量に基づく関係の典型度および関係の意外度を取得した。さらに、語の認知度および同位語を考慮することで社会認知量に基づく典型度の推定手法を提案した。最後に、社会認知量に基づく典型度、データ量に基づく典型度、オブジェクトの認知度を用いて情報の意外度の推定を行った。本研究の手法を用いることで,既存手法により求められる関連度は高いが関係の認知度が低い語を「非典型的な語」としてユーザに提示することが可能になった。
|