研究課題/領域番号 |
19H04128
|
研究機関 | 北海道大学 |
研究代表者 |
工藤 峰一 北海道大学, 情報科学研究院, 教授 (60205101)
|
研究分担者 |
今井 英幸 北海道大学, 情報科学研究院, 教授 (10213216)
中村 篤祥 北海道大学, 情報科学研究院, 准教授 (50344487)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | 不頻出事象 / パターン認識 / インバランス問題 / 希少疾患 |
研究実績の概要 |
本年度の実績を当初計画に照らしてまとめる: ・不頻出事象の予測に関して、統計的な手法を中心に決定木以外の方法を検討する。→不頻出事象が広くはImbalance問題におけるTail labelsとして扱われている状況に鑑み、それらの方法論を調査した。結果としてFew-shot learningあるいはZero-shot learningの枠組みが有望であることがわかりさらに詳しく方法論を調査した。 ・データマイニング手法に関する調査を進める。特に、レア・アソシエーションルールに関して網羅的な調査を行う。→前述の状況からデータマイニング手法についての調査は一時中断し、統計的手法に重心をおいて調査した。 ・希少疾患予測のための手法とデータベースに関して再度調査を行う。また、現在有効とされる方法論の整理と改良に取り組む。→データベースの調査が一通り終わり、汎用の機械学習の手法がそのまま適用できるほどのデータが集まらないことがわかった。結果として、自動でデータを作成し追加するなど、限られた実データを最大限に利用する方式の検討を開始した。 ・スーパークラスとサブクラスによるクラス決定木の解析を始める。→クラス階層と表現を改め、サンプル数におけるバランスを重視した階層構築と特徴選択を重視した階層構築を行い従来と比較してTail Labelでの識別率を上げることに成功した。 現在これらに関して国際会議論文として成果をまとめている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
出席予定であった各種国際会議がオンライン開催となったため、成果発表はできたものの意見交換や状況調査がままならなかった。また、指導学生との打ち合わせも対面での指導において時間が十分採れず、進展に陰りがあった。
|
今後の研究の推進方策 |
扱うべき問題と対象となる方法論が明確になったため、今後はよりシャープに手法の改良と提案を行う。指導学生との研究相談も徐々に対面で行えるようになってきたのでピッチを上げて研究をすすめる。
|