| 研究課題/領域番号 |
22K18006
|
| 研究種目 |
若手研究
|
| 配分区分 | 基金 |
| 審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
| 研究機関 | 名古屋工業大学 |
研究代表者 |
菊地 真人 名古屋工業大学, 工学(系)研究科(研究院), 助教 (60909878)
|
| 研究期間 (年度) |
2022-04-01 – 2026-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
| キーワード | 相互情報量 / 自己相互情報量 / 保守的な推定法 / 観測頻度 / しきい値 / 特徴選択法 |
| 研究開始時の研究の概要 |
相互情報量を推定する際は,事象の観測頻度に基づき,不偏推定量がよく用いられる.しかし不偏推定量による推定法は,頻度が低いときに真値の推定が困難で,推定値を過大に見積もる問題があり,これが相互情報量の利用範囲を狭めている.本研究では,確率分布を推定せずに最適化プロセスで相互情報量を直に求める直接推定法という枠組みを応用し,頻度の低さに応じて相互情報量をあえて低めに偏らせる“保守的な推定法”を実現する.また,保守的な推定法を特徴選択・特徴重み付けアルゴリズムへと導入し,有効性を検証する.本研究を通して,扱いが容易ではない低頻度データを相互情報量で有効活用する一方法を明らかにする.
|
| 研究実績の概要 |
本研究では,次に示す二つの「保守的な推定法」の実現を目的としている. ①しきい値なしの保守的な推定法:低頻度から推定される相互情報量をあえて低め(保守的)に見積もる.低頻度事象に対する相互情報量を過大推定することなく,無視されがちな少ない情報も効果的に扱うことが期待できる. ②しきい値ありの保守的な推定法:あるしきい値以上の頻度のみから相互情報量を推定する.その際,しきい値をわずかに上回る低頻度事象に対し,相互情報量を保守的に推定する.組み合わせ爆発を起こすような,しきい値が必須の実用事例への導入が期待できる. 前年度までの研究経過をうけて,推定対象を相互情報量から自己相互情報量に変更し,有効性の検証を試みた.コーパス中の単語の共起頻度をもとに連想語の組み合わせ(例:キリン,首)を予測するタスクに提案法を適用し,自己相互情報量の単純な推定法および頻度ベースの他手法と比較して良好な予測精度を示すことを確認した.現在,良好な性能の要因を明らかにするため,実験結果の分析を行っている.また本研究と関連する成果として,計算コストを軽量化した条件付き確率の保守的な推定法を提案し,大規模なデータマイニングタスクにおいて精度と計算コストの両面から有効性を確認した.この手法は,本計画に含まれる「しきい値ありの保守的な推定法」と同様の推定を条件付き確率に対して行うものである.本成果について3件の学会発表を行い,SMASH25 Winter Symposium奨励賞を受賞し,高く評価された.
|
| 現在までの達成度 |
現在までの達成度
3: やや遅れている
理由
当初の計画どおりに有効性の確認ができず,計画を変更したところ有効性を確認できたが,研究開始時の見込みと比較して進度がやや遅れていると判断した.
|
| 今後の研究の推進方策 |
自己相互情報量の保守的な推定法について,良好な実験結果が得られたため結果の分析を進めて論文としてまとめる.また,しきい値ありの保守的な推定法についても,特徴選択/特徴重み付けアルゴリズムに適用し,有効性の確認を行いたい.
|