2021 Fiscal Year Research-status Report
テキストから想起した印象抽出によるコンテンツ信憑性判定法の開発
Project/Area Number |
20K12028
|
Research Institution | The University of Tokushima |
Principal Investigator |
森田 和宏 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (20325252)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 印象知識 |
Outline of Annual Research Achievements |
テキスト情報「パスワードを変更してください」のみから、意味(「パスワード」+「変更」→<操作>)ではなく、印象(「パスワード」→{重要}、「変更」→{慎重})を抽出し、信憑性分類照合によって信憑性【注意】を判定する技術の開発をおこなうために、以下を実施した。 文書「動物園からライオンが逃げ出した」中のすべての語彙(「動物園」,「ライオン」,「逃げ出す」)に対する印象{楽しい,癒し,...}、{百獣の王,西武, 怖い,...}、{ミス,恥,...}を取得し、それぞれの関連性を探索して文書から受ける印象語群{怖い,ミス,...}を抽出する。抽出した文書の印象語群から信憑性の分類{【低い】,【やや】,...}を取得し、分類照合 により【低い】と判定する手法の考案を進めた。ここで、分類が取得できない場合には、文書の印象語群各語に対する印象語を用いて信憑性を分類する。 また、小規模の文書データとして、一般的な文書、デマ投稿や詐欺メールなどと、対応する正規の文書を収集する。これらの文書を機械学習により分類し、分類の根拠となる特徴語から、信憑性の分類 (【高い】【低い】【やや】【注意】など、分類名は仮とする)のための印象の差異の調査をおこなった。 印象知識の拡充のために深層学習を用いて語彙の印象を想起させる調査もおこなった。機械的な印象抽出が可能となれば拡充コストの向上が見込まれるため、継続して調査する。人手による印象を想起する語彙の収集、知識の拡充なども継続して実施している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
機械学習による印象抽出や分類の調査を新たに始めたため、信憑性判定手法の考案が予定通り進まなかった。
|
Strategy for Future Research Activity |
今後も研究計画に沿って研究を進める。次年度は、考案している信憑性判定手法に対する評価を実施する計画である。また、印象知識拡充のための新たな手法の調査も計画している。
|
Causes of Carryover |
本年度の研究に必要な物品が予定より少額で賄えたため,次年度使用額が生じた。次年度はバックアップ用品が多く必要になると予想されるため,次年度の研究費と合わせて使用する計画である。
|
Research Products
(1 results)