研究課題/領域番号 |
22K19777
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分60:情報科学、情報工学およびその関連分野
|
研究機関 | 岡山大学 |
研究代表者 |
栗林 稔 岡山大学, 自然科学学域, 准教授 (50346235)
|
研究期間 (年度) |
2022-06-30 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2024年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2023年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2022年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 切り取り処理 / フェイクニュース / セマンティクス解析 / ファクトチェック / フェイクコンテンツ / マルチメディアセキュリティ / プロパガンダ / 切り取り |
研究開始時の研究の概要 |
本研究では,公式な動画発信の際に特定の範囲内であれば切り取り操作を許可するような前処理を施すことで,メディアによる編集の裁量権を損なわせることなく,悪意のある切り取りを困難にさせる.加工編集した際に生じる不自然な歪みを解析する従来研究の受け身的なアプローチではなく,積極的にコンテンツの編集許可権限を管理するアプローチにより実現させる. コンテンツ中の発言において,前後関係の文脈や意味関係を自動的に解釈し,関連する発言内容の箇所を一括りのシーンのように切り出すことは許可する.そのために,自動的に前後関係の文脈や意味関係を解釈させて,いくつかの時系列データとしてまとめから原本性保証処理を施す.
|
研究実績の概要 |
公式に公開される動画において,悪用される恐れのある箇所およびその前後関係を示す箇所を自動的に識別して,意図的な切り取り処理の有無を検知する枠組みを本研究では対象として,関連技術のサーベイを行った. 国内だけでなくグローバルな研究とするために,対象とする言語を英語に絞り,公式動画して首脳国家の公式動画を扱うこととして,誰でもアクセス可能で公式に公開されている動画データセットを取得した.次に,それらの動画の発言箇所から文字起こしを行い,その文章に対して形態素解析を実行して,単語レベルで分割したデータセットを作成するための環境を構築した. 文章の意味を解析するために適した手法に関して公開ライブラリやソフトウエアをいくつか検証してきた.動画中の発言に応じて,いくつかのセグメントに分割させて,各セグメントに対して前後関係の初期解析を実施し,発言内容が本来の意味から逸脱していないかを主観評価実験により手動でも検証を行った.今後は,この処理を自動化させるための手法を考案する予定である. 動画中の映像解析とフレーム間で生じる整合性についても,情報ハイディング技術とフォレンジクス技術を拡張させる形で適用させるアプローチについても並列して行った.本研究で想定している解析手法を意図的に誤らせるための敵対的攻撃に対する対策を考慮して,悪意のある改ざんやノイズ付加の有無を調べる手法を考案した.深層学習技術を用いて,人工的に動画の発言内容の音声を変更して,それに応じて映像箇所を改変する形で作成されるフェイクコンテンツへの対策を検討し,その解決策を考案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究で対象とするコンテンツ中の発言の意味をポジティブとネガティブの二値に置き換えて,本来の意味から逸脱しているか否かの判定とさせるところは方針を立てて,進めているが,セマンティクス解析をどのように適用させるかの具体的な方針がうまく立てられていない.また,特定の範囲内における切り貼り処理を許可するための前処理については,暗号技術との融合が必要であり,その関連技術のサーベイが進んでいない
|
今後の研究の推進方策 |
暗号技術を用いたコンテンツ保護技術に関しては,広島市立大学の稲村先生に新しく共同研究者として参画して頂いた.セマンティクス解析の箇所においては,生成系AIであるGPT-4を活用して,切り取り処理された動画中の発言箇所と元の動画中の発言箇所の意味の違いを判別させるような形で,自動判別できないか調べる予定である
|