研究課題/領域番号 |
20K12079
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 岡山大学 |
研究代表者 |
原 直 岡山大学, ヘルスシステム統合科学学域, 助教 (50402467)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | サウンドスケープ / 地域特性 / 可視化 / 音響シーン分類 / 深層学習 / 弱ラベル教師あり学習 / 環境音検出 / 地域特性の推定 / 地域特性の可視化 |
研究開始時の研究の概要 |
本研究課題では,観光地の雰囲気可視化を可能とする簡易なアノテーションに基づく深層学習方式に関する研究を行う. 可視化のために,環境音を入力とした深層学習モデルを学習し,地域の雰囲気の推定器を作成する. 一般には,精確なアノテーションを教師として深層学習を行うが,本研究ではより簡易なアノテーションのみを教師に用いて学習を行う方式を研究する. 本研究の特徴は,(1)深層学習に必要な環境音とアノテーションを収集する方式を確立し,(2)簡易なアノテーションを教師として環境音のみから地域の雰囲気を推定する方式を研究し,(3)具体事例として観光地の雰囲気を可視化するシステムを構築し,評価する.
|
研究成果の概要 |
地域特性のパラメータ化を進めるため,特に,ISO 12913 で標準化されているサウンドスケープの考え方を取り入れた.環境音聴取時に,ストリートビューの映像も同時に提示することで,音だけに依存しない場の印象や雰囲気にアノテーションを付与した. そして,DNNによる音からの地域特性の分類器に関する実験を行った.入力に音源情報を併用することで,推定精度は向上する.ここで,人手による音源情報ではなく,位置情報から自動取得可能な航空写真を利用するだけでも,一定の精度向上が見られることを確認した. さらに,コンセプトドリフトに基づく機械学習モデルの適応方式に関する研究も進めた.
|
研究成果の学術的意義や社会的意義 |
地域特性を表現するために,サウンドスケープの考え方を取り入れた.標準化された仕様を採用することは,より広範なデータ収録を容易とする.人の主観に基づくデータ収集において,基準がわかりやすいことは重要である. DNNに基づく地域特性の推定器は,音データさえ収録できれば,人手による詳細アノテーションが十分に無くとも,自動的に取得可能な情報源から,一定の推定精度が得られる.DNNには,多くの学習データが必要である.簡易アノテーションのみで十分という事実は,低コストに大量データを集めるための重要な知見である.また,継続的なデータ収集とシステム運用に向け,コンセプトドリフトに基づく研究から多くの知見を得た.
|