2023 Fiscal Year Annual Research Report
テキストから想起した印象抽出によるコンテンツ信憑性判定法の開発
Project/Area Number |
20K12028
|
Research Institution | The University of Tokushima |
Principal Investigator |
森田 和宏 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (20325252)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 印象知識 |
Outline of Annual Research Achievements |
テキスト情報「パスワードを変更してください」のみから、意味(「パスワード」+「変更」→<操作>)ではなく、印象(「パスワード」→{重要}、「変更」→{慎重})を抽出し、信憑性分類照合によって信憑性【注意】を判定する技術の開発をおこなうために、以下を実施した。文書「動物園からライオンが逃げ出した」中のすべての語彙(「動物園」、「ライオン」、「逃げ出す」)に対する印象{楽しい、癒し、...}、{百獣の王、西武、怖い、...}、{ミス、 恥、...}を取得し、それぞれの関連性を探索して文書から受ける印象語群{怖い、ミス、...}を抽出する。抽出した文書の印象語群から信憑性の分類{【低い】、【やや】、...}を取得し、分類照合により【低い】と判定する手法の開発を進めた。文書データとして、一般的な文書、デマ投稿や詐欺メールなどと、対応する正規の文書の収集を実施し、考案・開発した信憑性判定手法に対して、収集したコーパスを用いた精度の評価を実施した。分類が取得できない場合には、文書の印象語群各語に対する印象を取得し、印象語群を拡張することにより信憑性を分類する改善を可能な限り実施した。また、印象知識の拡充のために深層学習を用いて語彙の印象を想起させる調査の継続と調査を踏まえた印象知識獲得手法の考案を実施した。簡易的ではあるが精度評価も実施した。人手による印象を想起する語彙の収集、知識の拡充なども継続して実施した。
|