Project/Area Number |
19H04128
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Hokkaido University |
Principal Investigator |
工藤 峰一 北海道大学, 情報科学研究院, 教授 (60205101)
|
Co-Investigator(Kenkyū-buntansha) |
今井 英幸 北海道大学, 情報科学研究院, 教授 (10213216)
中村 篤祥 北海道大学, 情報科学研究院, 教授 (50344487)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥17,030,000 (Direct Cost: ¥13,100,000、Indirect Cost: ¥3,930,000)
Fiscal Year 2023: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2022: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2021: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2020: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2019: ¥4,940,000 (Direct Cost: ¥3,800,000、Indirect Cost: ¥1,140,000)
|
Keywords | 不頻出事象 / パターン認識 / 高齢者の異変検知 / マルチラベル分類 / ロングテール分布 / 独居高齢者 / 異変検知 / 認知症 / インバランス問題 / ロングテイル / 希少疾患 / ロングテール / オーバーラップ問題 / 不頻出事象の予測 / マイノリティクラス / データマイニング |
Outline of Research at the Start |
非頻出なコトやモノの認識や予測を行うことは、希少疾患の発見や見逃していた事項の想起、新しい着想への手がかりの入手、など、「気づき」や「発見」を与える上で有効である。しかし一方では、非頻出ゆえのデータ不足や見分けの難しさなど、固有の難しさを抱える。本研究では、パターン認識分野とデータマニング分野において、この挑戦的課題に取り組む。 基本方針は、他の多数の候補から非頻出事象を「識別」するのではなく、個々の非頻出事象が該当するどうかを「同定」する点にあり、疑わしい場合、更なる証拠を調査して「確定」する。本研究グループの有するこれまでの技術を動員して効果のある方法論を新しく築く。
|
Outline of Annual Research Achievements |
不頻出事象の分析と予測を目指す一連の研究の中にあって本年度は、理論検討としてマルチラベル分類の高性能化、ロングテール分布におけるテールラベルの分析と分類、実問題として独居高齢者の異変検知の実現に向けた基礎研究を行った。詳細は以下の通りである。
・マルチラベル分類ではサンプル数に極端な差がみられるロングテール分布が多く(エクストリームマルチラベル分類)、高精度分類が難しい。そこでまず本研究では、それほどラベル数が多くない問題において識別性能の向上を図った。サンプルバランスの均一化を重視する手法とラベルに依存して有効な特徴を選出する手法の2手法を検討した。結果として前者の有効性を確認した。 ・ロングテール分布はマルチラベル分類問題に多く見られ、特にテールラベルの予測が難しい。そこで申請者らが開発した可視化手法を利用してテールラベルを持つサンプルの分布を調査した。結果として、2種類の発生原因(既存ラベルの細分によって発生したか、新規な分類対象として発生したか)に対応した異なる分布の存在を確認したことに加え、ヘッドラベルと共起するテールラベルが多いことを確認した。 ・実応用として、各種センサを張り巡らしたスマートホームにおいて独居高齢者の異変を検知する研究を進めており、異変検知アルゴリズムの開発の前段階としてセンサデータ発生シミュレータを開発した。バーチャルスマートホームに住むバーチャルな住人が起こした異変をセンサー値として獲得するものである。これまでの手法と違い多くの異変を扱える上に、認知症レベルに応じて異変の発生頻度や程度が自動で変化する機能を有する。このシミュレータは1年分のセンサデータを約30分で生成でき、部屋のレイアウトや住人の行動も柔軟に変更できるため、多様な状況を短時間でシミュレートできる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
理論的な検討として、マルチラベル問題、とりわけロングテール分布となるエクストリームマルチラベル分類を扱っている。しかし、テールラベルは数個という訓練サンプルしかない上にヘッドラベルとの共起性も高いため、それらを高精度で認識することの難しい。結果として、ラベル数が数十から数百のマルチラベル問題に関しては従来手法を超す識別器を構成しつつあるものの、テールラベルに関しては分析段階に留まっている。 一方、実応用としての独居高齢者の異変検知に関しては順調に進展しており、代表的な6種類の異変を含むシミュレーションデータの生成に成功した。特に、認知症の進みにより生じる準寝たきりや不外出などの長期的な異変も組み込んであるため実用性が高い。これにより今後異変検知の研究へと進む準備が整ったと考えている。
以上により、おおむね順調と判断する。
|
Strategy for Future Research Activity |
理論的検討として引き続き、マルチラベル問題とロングテール分布を扱う。対象とする一つの問題だけを扱う限りテールラベルのサンプル数は限られるため、今後は、転移学習の枠組みを用いて類似構造を持った他の問題を取り入れる検討を行う。また、連合学習としての検討も始める。 実応用としての独居高齢者の異変検知に関しては、異変を含むセンサデータのシミュレーションを終えたのでいよいよ異変検知アルゴリズムの開発に着手する。基本となるアルゴリズムは次年度中に完成する予定である。
|