研究課題/領域番号 |
22K18006
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 名古屋工業大学 |
研究代表者 |
菊地 真人 名古屋工業大学, 工学(系)研究科(研究院), 助教 (60909878)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 相互情報量 / 保守的な推定法 / 観測頻度 |
研究開始時の研究の概要 |
相互情報量を推定する際は,事象の観測頻度に基づき,不偏推定量がよく用いられる.しかし不偏推定量による推定法は,頻度が低いときに真値の推定が困難で,推定値を過大に見積もる問題があり,これが相互情報量の利用範囲を狭めている.本研究では,確率分布を推定せずに最適化プロセスで相互情報量を直に求める直接推定法という枠組みを応用し,頻度の低さに応じて相互情報量をあえて低めに偏らせる“保守的な推定法”を実現する.また,保守的な推定法を特徴選択・特徴重み付けアルゴリズムへと導入し,有効性を検証する.本研究を通して,扱いが容易ではない低頻度データを相互情報量で有効活用する一方法を明らかにする.
|
研究実績の概要 |
2022年度は,相互情報量に対する保守的な推定法の定式化に取り組んだ.具体的には,確率分布の推定を介さずに相互情報量を直に求める“直接推定法”に変更を加え,保守的な推定法を実現することにした.直接推定法では推定量の導出過程で正則化が用いられ,推定値を保守的に見積もるために,正則化の作用を利用できる.一方で直接推定法は,連続空間上で定義される相互情報量のために提案されており,本研究で想定する離散空間上で定義される相互情報量の推定にそのまま適用できない.そこで,直接推定法で元々使用するガウス関数由来の基底関数を,離散空間で得られる要素の種類毎に定義される単純な基底関数へと変更し,離散空間上での適応を可能とした. 加えて,ごく低頻度にしきい値を設け,それ以上の観測頻度から尤度比を保守的に見積もる方法の提案および評価を行った.さらに,本手法を尤度比の特殊な形式である条件付き確率の推定へと拡張し,組み合わせ爆発を伴う関係抽出タスクにて評価を行った.結果として,ごく低頻度の無視によるタスクの効率化,保守的な推定による有用性の両観点から一定の有効性を確認できた.本成果を査読なし国内会議,査読あり国際会議にて発表した.相互情報量は定義中に尤度比を含み,尤度比に関する定式化も直接推定法に基づいている.そこで,来年度に実施予定の研究計画「頻度にしきい値を設け,相互情報量を保守的に見積もる手法の提案」にこれらの成果を活用する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
使用する頻度に制限を設けず相互情報量を保守的に見積もる方法について,定式化できることを確認したが,評価実験や成果発表には至っていない.一方,来年度に実施予定であった計画の一部に関して,前倒しで準備を進めることができた.
|
今後の研究の推進方策 |
定式化が完了済みの成果については評価実験を行い,成果を本年度中に学術論文としてまとめる予定である.評価実験は当初の予定通り,特徴抽出アルゴリズム等を用いた単純なものを考えている.しきい値ありの保守的な推定法については,本年度の成果をもとに定式化を試みる.しかし本年度の成果から,推定値を保守的に見積もるプロセスに関して問題点も明らかになったため,必要に応じてその改善策の考案も行う.
|