研究実績の概要 |
テキスト情報「パスワードを変更してください」のみから、意味(「パスワード」+「変更」→<操作>)ではなく、印象(「パスワード」→{重要}、「変更」→{慎重})を抽出し、信憑性分類照合によって信憑性【注意】を判定する技術の開発をおこなうために、以下を実施した。 文書「動物園からライオンが逃げ出した」中のすべての語彙(「動物園」,「ライオン」,「逃げ出す」)に対する印象{楽しい,癒し,...}、{百獣の王,西武,怖い,...}、{ミス,恥,...}を取得し、それぞれの関連性を探索して文書から受ける印象{怖い,ミス,...}を決定する手法の考案を進めた。決定する印象は後の信憑性判定を考慮して一つではなく複数の集合とした。この手法で用いる印象知識は各語彙の関連が紐付いており、語彙間の関連度の探索によって印象語群の抽出がおこなえる。 また、小規模の文書データとして、一般的な文書、デマ投稿や詐欺メールなどと、対応する正規の文書を収集する。これらの文書を人手により信憑性の分類(【高い】【低い】【やや】【注意】など、分類名は仮とする)を実施し、それぞれについて印象を取得することで、印象の差異の調査をおこなった。差異のある印象については、各印象語に信憑性の分類を紐付けた信憑性辞書として保存する。 なお,構築済みの印象知識については、その内容が古くなっていると考えられるため、新たな印象を想起する語彙の収集、知識の拡充なども継続して実施している。
|