研究課題/領域番号 |
20K12028
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61060:感性情報学関連
|
研究機関 | 徳島大学 |
研究代表者 |
森田 和宏 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (20325252)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 印象知識 |
研究開始時の研究の概要 |
テキスト情報のみから、その文書の信憑性を判定するため、文書から受ける印象を印象語群として抽出し、印象語との信憑性分類照合により信憑性を判定する技術の開発をおこなう。研究期間中に印象抽出、信憑性判定技術の開発と、印象知識、信憑性辞書の構築・拡充、実験による評価を実施し、実時間で処理する技術を確立する。
|
研究実績の概要 |
テキスト情報「パスワードを変更してください」のみから、意味(「パスワード」+「変更」→<操作>)ではなく、印象(「パスワード」→{重要}、「変更」→{慎重})を抽出し、信憑性分類照合によって信憑性【注意】を判定する技術の開発をおこなうために、以下を実施した。文書「動物園からライオンが逃げ出した」中のすべての語彙(「動物園」、「ライオン」、「逃げ出す」)に対する印象{楽しい、癒し、...}、{百獣の王、西武、怖い、...}、{ミス、 恥、...}を取得し、それぞれの関連性を探索して文書から受ける印象語群{怖い、ミス、...}を抽出する。抽出した文書の印象語群から信憑性の分類{【低い】、【やや】、...}を取得し、分類照合により【低い】と判定する手法の開発を進めた。文書データとして、一般的な文書、デマ投稿や詐欺メールなどと、対応する正規の文書の収集を実施し、考案・開発した信憑性判定手法に対して、収集したコーパスを用いた精度の評価を実施した。分類が取得できない場合には、文書の印象語群各語に対する印象を取得し、印象語群を拡張することにより信憑性を分類する改善を可能な限り実施した。また、印象知識の拡充のために深層学習を用いて語彙の印象を想起させる調査の継続と調査を踏まえた印象知識獲得手法の考案を実施した。簡易的ではあるが精度評価も実施した。人手による印象を想起する語彙の収集、知識の拡充なども継続して実施した。
|