研究課題/領域番号 |
19K20244
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 大阪工業大学 |
研究代表者 |
尾花 将輝 大阪工業大学, 情報科学部, 講師 (00710071)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | ログ解析 / 異常動作検知 / システムログ / アプリケーションログ / 障害検知 / システム運用 / Webアプリケーション / 自然言語 / クラスタリング / ソフトウェア保守・運用効率化 / 情報システム / ソフトウェアログ / ソフトウェア学 |
研究開始時の研究の概要 |
本研究の目的は情報システムから出力されるログをパターン認識や,学習することで,開発者が想定しないエラーを自動で検知する事である.本研究では開発者が想定しないエラーが出力されたログメッセージを「不吉なログ」と呼び,不吉なログを検出するために 1) システムログ,ソフトウェアログのフォーマット統一手法 2) パターン認識,学習等による不吉なログの検出 3) 不吉なログによるシステムの品質と関連についての分析 を行う.膨大なシステムログから不吉なログを自動で検出できれば迅速な障害対応が可能にできると考えられる.
|
研究実績の概要 |
2019~2021年度の成果から新たな不吉なログを半自動で検出できるフレームワークを新たに提案し,論文投稿を行った.新たな手法は2019,2020年度の分析結果よりエラーログとして出力されないログの中に正常動作したログメッセージと異常動作したログメッセージには明確な差があることがわかり,これらを半自動で検出するフレームワークの提案を2022年度は行った.2021年度にはこれらの分析結果を基に異常動作をするログメッセージは正常動作したログメッセージに比べ出力されることが稀であるというアプローチを基に新たな異常動作をするログメッセージの検出手法を提案し,論文投稿を行った. 2022年度に提案した稀なログメッセージ検出手法として,ログメッセージの整形,変数のマスク化,出現頻度の高いログメッセージの除去,除去したログメッセージをクラスタリングするという4つの工程により稀なログメッセージを抽出した.具体的な手法としてはログ解析手法であるDrainを適用し,ステータスチェックといった正常かつ莫大に出力されるログの除去を行う.次にDrainで除去されなかったログメッセージを自然言語処理でクラスタリングを行い,クラスタサイズが小さいログメッセージの集合を稀なログメッセージとして抽出した.また,これらの少数のログメッセージに異常動作のログメッセージが含まれるかについての調査を行った. また,提案する手法を2019~2021年度まで実際に運用しているオープンソースソフトウェアのログに適用し,莫大なログメッセージから異常動作のログメッセージを絞り込むことができた.今後は更なる調査を行い,これらをまとめて論文誌に投稿する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2021年度の成果を基に,稀に出力されるログメッセージには異常動作が含まれることが多いというアプローチの基に,新たな異常動作検知手法を提案した.これらの手法をツールとして実装した.ツールの実装には既存手法であるログ解析手法であるDrainやTF/IDFといった自然言語を用いて行った.手法として学習を用いる事も想定したが,障害が含まれるログメッセージの分類が難しい,または学習データの作成が困難である点よりクラスタリングを用いた. また,2019年度から運用している各種サービスのログデータに適用した. 各種サービスのログメッセージのフォーマットに統一が無く,エラーログとの明確な分類の無いログにも関わらずバグ原因となるログメッセージを抽出することが確認できた.これらの内容をまとめて学会で発表を行ったが,コロナ渦の影響により論文誌投稿のための更なるデータ分析に遅れが生じている.
|
今後の研究の推進方策 |
2021年度の研究成果で得られた知見を基に2022年度は異常動作ログメッセージの検出するための手法を提案した,しかし,コロナ渦の影響で学会への投稿や論文誌の投稿が遅れており,使用額に差が生じている.また,2023年度は2022年度で提案した手法を更に他の障害やアプリケーションやへの適用し,更なる調査を行うことを予定している. また,2023年度の計画としてこれまでの研究成果を充実化し,それらを論文誌に投稿する予定である.そのため,論文投稿料と過去の研究データ保存用のコンピュータとHDD,またはSSDの購入を予定している.
|