研究課題/領域番号 |
19K12139
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 宮崎大学 |
研究代表者 |
山森 一人 宮崎大学, 工学部, 教授 (50293395)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 機械学習 / スモールデータ / 数理モデル / 決定木 / ネットワークセキュリティ / 拡張重み更新型自己組織化マップ / 強化学習 / ヒューリスティック / 自己組織化マップ / 学習サンプル / 分散 / ソフトコンピューティング |
研究開始時の研究の概要 |
本研究では,多数の学習サンプルを得ることが困難な生命系現象を対象に,少数の未整理かつ分散の大きいデータから適切な学習サンプルを構築する手法,および少ない学習サンプルでも過学習を起こさず汎化能力の高い学習アルゴリズムを確立することを目的とする.具体的には,研究代表者が関与したたんぱく質発現量からの食品機能性(複数のがん抑制活性)推定を題材に,生命活動を反映した数理モデルにより生成した学習サンプルと,ベクトルの要素を波のサンプル点と見做した距離関数を導入した拡張重み更新型自己組織化マップを併用することで,高精度かつ汎化能力の高い学習モデルの確立を目指す.
|
研究成果の概要 |
現在の機械学習では,学習に膨大なデータを要する.本研究では,観測や再現が困難な問題について,現象を近似する数理モデルと機械学習を組み合わせて解決するアプローチを試みた.題材としては,研究代表者が共同研究者として関わった,たんぱく質発現量から生理活性値を推定する問題,およびデータ数は多いもののその信頼性に疑義がありデータ数を削減せざるを得ないネットワークセキュリティ分野における侵入検知問題を扱った.前者については仮想データ生成までは行ったものの,推定プログラムは開発途中である.後者について,データ数を縮減しつつ学習結果の精度評価を行い,GBDT系アルゴリズムが優秀であることを示した.
|
研究成果の学術的意義や社会的意義 |
現代のAIでは,適切な結果を得るためには膨大な数の学習サンプルを必要とする.一方,観測が困難であったり再現が難しいなど,多数の学習サンプルを準備することが難しい課題も存在する.本研究では,学習データを補うため数理モデルを作成し,モデルに従って学習サンプルを生成することで精度よく学習が行うことが可能なアプローチを模索した.例題として,たんぱく質発現量から生理活性値を推定する問題,および学習データ数は豊富なものの信頼性に疑義があるコンピュータシステムへの侵入検知問題を取り上げた.前者については推定プログラムを作成し,後者についてはブースティングを併用した決定木アプローチが有効であることを示した.
|