研究課題/領域番号 |
20K12028
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61060:感性情報学関連
|
研究機関 | 徳島大学 |
研究代表者 |
森田 和宏 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (20325252)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 印象知識 |
研究開始時の研究の概要 |
テキスト情報のみから、その文書の信憑性を判定するため、文書から受ける印象を印象語群として抽出し、印象語との信憑性分類照合により信憑性を判定する技術の開発をおこなう。研究期間中に印象抽出、信憑性判定技術の開発と、印象知識、信憑性辞書の構築・拡充、実験による評価を実施し、実時間で処理する技術を確立する。
|
研究実績の概要 |
テキスト情報「パスワードを変更してください」のみから、意味(「パスワード」+「変更」→<操作>)ではなく、印象(「パスワード」→{重要}、「変更」→{慎重})を抽出し、信憑性分類照合によって信憑性【注意】を判定する技術の開発をおこなうために、以下を実施した。文書「動物園からライオンが逃げ出した」中のすべての語彙(「動物園」、「ライオン」、「逃げ出す」)に対する印象{楽しい、癒し、...}、{百獣の王、西武、怖い、...}、{ミス、恥、...}を取得し、それぞれの関連性を探索して文書から受ける印象語群{怖い、ミス、...}を抽出する。抽出した文書の印象語群から信憑性の分類{【低い】、【やや】、...}を取得し、分類照合により【低い】と判定する手法を継続して進めた。分類が取得できない場合には、文書の印象語群各語に対する印象を取得し、印象語群を拡張することにより信憑性を分類する。小規模の文書データとして、一般的な文書、デマ投稿や詐欺メールなどと、対応する正規の文書の収集も継続して実施し、これらの文書の分類と、分類の根拠となる特徴語から、信憑性の分類(【高い】【低い】【やや】【注意】など、分類名は仮とする)のための印象の差異の調査もおこなった。 また、印象知識の拡充のために深層学習を用いて語彙の印象を想起させる調査も継続して実施している。人手による印象を想起する語彙の収集、知識の拡充なども継続して実施している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
今年度に信憑性判定の実験と評価を実施する予定であったが,他の業務の多忙により計画を変更し,次年度に実施することとした。
|
今後の研究の推進方策 |
次年度は、考案・開発している信憑性判定手法に対して、コーパスを用いた速度と精度を評価する実験と改善を実施する計画である。また、深層学習を用いて語彙の印象を想起させる調査を踏まえた印象知識拡充手法の考案と、人手による印象を想起する語彙の収集、知識拡充も継続して計画している。
|