研究課題/領域番号 |
19K20244
|
研究機関 | 大阪工業大学 |
研究代表者 |
尾花 将輝 大阪工業大学, 情報科学部, 講師 (00710071)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | ログ解析 / 異常動作検知 / システムログ / アプリケーションログ |
研究実績の概要 |
2019~2021年度の成果から新たな不吉なログを半自動で検出できるフレームワークを新たに提案し,論文投稿を行った.新たな手法は2019,2020年度の分析結果よりエラーログとして出力されないログの中に正常動作したログメッセージと異常動作したログメッセージには明確な差があることがわかり,これらを半自動で検出するフレームワークの提案を2022年度は行った.2021年度にはこれらの分析結果を基に異常動作をするログメッセージは正常動作したログメッセージに比べ出力されることが稀であるというアプローチを基に新たな異常動作をするログメッセージの検出手法を提案し,論文投稿を行った. 2022年度に提案した稀なログメッセージ検出手法として,ログメッセージの整形,変数のマスク化,出現頻度の高いログメッセージの除去,除去したログメッセージをクラスタリングするという4つの工程により稀なログメッセージを抽出した.具体的な手法としてはログ解析手法であるDrainを適用し,ステータスチェックといった正常かつ莫大に出力されるログの除去を行う.次にDrainで除去されなかったログメッセージを自然言語処理でクラスタリングを行い,クラスタサイズが小さいログメッセージの集合を稀なログメッセージとして抽出した.また,これらの少数のログメッセージに異常動作のログメッセージが含まれるかについての調査を行った. また,提案する手法を2019~2021年度まで実際に運用しているオープンソースソフトウェアのログに適用し,莫大なログメッセージから異常動作のログメッセージを絞り込むことができた.今後は更なる調査を行い,これらをまとめて論文誌に投稿する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2021年度の成果を基に,稀に出力されるログメッセージには異常動作が含まれることが多いというアプローチの基に,新たな異常動作検知手法を提案した.これらの手法をツールとして実装した.ツールの実装には既存手法であるログ解析手法であるDrainやTF/IDFといった自然言語を用いて行った.手法として学習を用いる事も想定したが,障害が含まれるログメッセージの分類が難しい,または学習データの作成が困難である点よりクラスタリングを用いた. また,2019年度から運用している各種サービスのログデータに適用した. 各種サービスのログメッセージのフォーマットに統一が無く,エラーログとの明確な分類の無いログにも関わらずバグ原因となるログメッセージを抽出することが確認できた.これらの内容をまとめて学会で発表を行ったが,コロナ渦の影響により論文誌投稿のための更なるデータ分析に遅れが生じている.
|
今後の研究の推進方策 |
2021年度の研究成果で得られた知見を基に2022年度は異常動作ログメッセージの検出するための手法を提案した,しかし,コロナ渦の影響で学会への投稿や論文誌の投稿が遅れており,使用額に差が生じている.また,2023年度は2022年度で提案した手法を更に他の障害やアプリケーションやへの適用し,更なる調査を行うことを予定している. また,2023年度の計画としてこれまでの研究成果を充実化し,それらを論文誌に投稿する予定である.そのため,論文投稿料と過去の研究データ保存用のコンピュータとHDD,またはSSDの購入を予定している.
|
次年度使用額が生じた理由 |
2022年度の研究成果より,不吉なログから障害を半自動で検出する手法の提案まで行ったが,提案手法を論文として投稿することが遅れているため使用額に差が生じた. 2023年度の使用計画としては,提案した手法を論文誌,または学会への投稿するための投稿費用と研究データのバックアップ用HDDやSSDの購入を予定している.
|