2022 Fiscal Year Final Research Report
Development of small data processing method combined with mathmatical model and machine learning approarch
Project/Area Number |
19K12139
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61040:Soft computing-related
|
Research Institution | University of Miyazaki |
Principal Investigator |
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 機械学習 / スモールデータ / 数理モデル / 決定木 / ネットワークセキュリティ |
Outline of Final Research Achievements |
Recent machine learning algorithms require a large number of training samples. In this research, I try to combine the mathematical model that can approximate the phenomena and the machine learning approach to solve some problems that are hard to observe the phenomena or hard to reproduce the experimental results again. I picked up two problems; one was to estimate the physiological activities from the protein expression levels, and the other was to detect the intrusion into the computer systems. For the first one, I rewrote the Linux-based programs into an integrated program. For the second one, I showed Gradient Boosted Decision Tree algorithm was suitable and robust for the small number of training samples.
|
Free Research Field |
ソフトコンピューティング
|
Academic Significance and Societal Importance of the Research Achievements |
現代のAIでは,適切な結果を得るためには膨大な数の学習サンプルを必要とする.一方,観測が困難であったり再現が難しいなど,多数の学習サンプルを準備することが難しい課題も存在する.本研究では,学習データを補うため数理モデルを作成し,モデルに従って学習サンプルを生成することで精度よく学習が行うことが可能なアプローチを模索した.例題として,たんぱく質発現量から生理活性値を推定する問題,および学習データ数は豊富なものの信頼性に疑義があるコンピュータシステムへの侵入検知問題を取り上げた.前者については推定プログラムを作成し,後者についてはブースティングを併用した決定木アプローチが有効であることを示した.
|