研究実績の概要 |
テキスト情報「パスワードを変更してください」のみから、意味(「パスワード」+「変更」→<操作>)ではなく、印象(「パスワード」→{重要}、「変更」→{慎重})を抽出し、信憑性分類照合によって信憑性【注意】を判定する技術の開発をおこなうために、以下を実施した。 文書「動物園からライオンが逃げ出した」中のすべての語彙(「動物園」,「ライオン」,「逃げ出す」)に対する印象{楽しい,癒し,...}、{百獣の王,西武, 怖い,...}、{ミス,恥,...}を取得し、それぞれの関連性を探索して文書から受ける印象語群{怖い,ミス,...}を抽出する。抽出した文書の印象語群から信憑性の分類{【低い】,【やや】,...}を取得し、分類照合 により【低い】と判定する手法の考案を進めた。ここで、分類が取得できない場合には、文書の印象語群各語に対する印象語を用いて信憑性を分類する。 また、小規模の文書データとして、一般的な文書、デマ投稿や詐欺メールなどと、対応する正規の文書を収集する。これらの文書を機械学習により分類し、分類の根拠となる特徴語から、信憑性の分類 (【高い】【低い】【やや】【注意】など、分類名は仮とする)のための印象の差異の調査をおこなった。 印象知識の拡充のために深層学習を用いて語彙の印象を想起させる調査もおこなった。機械的な印象抽出が可能となれば拡充コストの向上が見込まれるため、継続して調査する。人手による印象を想起する語彙の収集、知識の拡充なども継続して実施している。
|