数理論理手法と人工知能手法の融合に基づくマルウェアの自動意味理解

研究課題

研究課題/領域番号	20K20625
研究種目	挑戦的研究(開拓)
配分区分	基金
審査区分	中区分60:情報科学、情報工学およびその関連分野
研究機関	北陸先端科学技術大学院大学
研究代表者	小川瑞史北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (40362024)
研究分担者	NGUYEN MinhLe 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (30509401) 寺内多智弘早稲田大学, 理工学術院, 教授 (70447150) 関浩之名古屋大学, 情報学研究科, 教授 (80196948)
研究期間 (年度)	2020-07-30 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	25,870千円 (直接経費: 19,900千円、間接経費: 5,970千円) 2025年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2024年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2023年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2022年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2021年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2020年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
キーワード	動的記号実行 / 命令セット / バイナリコード / マルウェア / 自然言語処理 / RE-DOS攻撃 / プライバシー / マルウェア解析 / 記号実行 / API / ネィティブコード / マルウェア意味解析 / 形式的意味自動抽出 / 形式仕様自動抽出 / 深層学習
研究開始時の研究の概要	人間には解釈困難なバイナリコードに対し(1)操作的意味はレジスタ・フラッグ・メモリ・スタック上の状態遷移系として定義可能、(2)各命令仕様はリジッドな自然言語記述、(3)エミュレータ等テスト環境が完備などの観察に立脚し、英文マニュアルから命令の操作的意味自動抽出によりBE-PUM(x86), Corana(ARM), SiMIPS(MIPS)等のツールをGitHubで公開してきた。本研究は、多数のMPU/MCUの動的記号実行器の自動生成に加え、構造隠蔽前のペイロードの自動復元・抽出を行い、教師無し学習による特徴抽出、自然言語処理を用いた意味解釈を通じた新規感染手法検出・系統樹生成を目的とする。
研究実績の概要	R5年度の研究は、代表者および分担者（グエン）は形式手法ツール開発および実装および実験、分担者（寺内、関）は主にセキュリティに関する基礎理論部分について研究を進めた。代表者は、指導する博士課程学生 Nguyen Van Anh氏と共同でAndroid/apk上の記号実行器HyberidSE https://github.com/vananhnt/corana の研究開発（ロレーヌ大学と共同）を進めた。また、過去に開発した x86/win上の記号実行器 BE-PUMを用いて、パッカーを用いた制御構想隠蔽を持つマルウェア群に対し、グラフカーネルに基づく類似性に基づくパッカー同定・Entry検出を試み、良好な結果を得た。分担者（グエン）は、インストラクションマニュアルと同様に論理構造を明確に持つ法令文書を対象に深層学習や生成AIを応用した論理帰結構造の抽出を進めた。現在、インストラクションマニュアルへの同様な手法の適用による形式的意味抽出を検討している。分担者（寺内）は、近年注目されるスクリプト言語に対するRE-DOS攻撃の理論的基礎として、後方参照や先読みといった拡張機能を含む正規表現の表現力についての研究を行った。加えて、文字列抽出のための拡張正規表現の合成・修正に関する研究を行った。さらに、代数的エフェクトを含むプログラムの型による静的解析に関する研究を行った。分担者（関）は、ゲームにおけるプレイヤーの勝利目的をそのプレイヤー（ユーザ）のプライバシー情報とみなし，ゲームを観測する敵対者がプレイヤーの勝利目的を推測するのをできる限り困難とするような戦略（識別不能戦略）および，どのプレイヤーも単独では推測困難性を大きくすることはできないような戦略の組（目的識別不能均衡）を定義し，それらに関する判定問題の判定可能性や計算量を解析した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究で以前より進めてきたx86/win上のBE-PUM実装（もともとは32bit版であったが、現在、ベトナムの研究協力者、Le Quy Don技術大学のPhan Viet Anh博士のグループにより64bit版への拡張の実装を進めている）に加え、代表者の進めるAnroid/apk上の記号実行器 HyberidSEのプロトタイプ実装が完成した。Apk形式はEntryを記述するmanifest.xml, dex bytecode, .soに含まれる native code からなりOSライブラリAPIの呼出も持つため、異環境をシームレスにつなぐ必要がある。しかし異環境下の環境の受け渡しは容易ではなくインターフェースの（半）自動抽出などを試みている。現在、x86/win上のマルウェア上での実験に加え、Androidマルウェアを含むapkファイル群上の実験を開始している。x86/winマルウェアはパッカー利用によるバイナリコードの暗号化・復号化などが代表的なパッカーにより施されるのに比べ、Android/apkマルウェアはmanifest.xmlの記述隠蔽によるEntry秘匿や、dex bytecodeのnative codeへのコンパイル、native codeの動的読み込みなどと手法が異なることを観察している。なお、論文投稿が遅れているが、現在、2件の国際会議投稿を準備中である。分担者（グエン）の研究の進捗は、今後の記号実行器のサポートするインストラクションセットの拡張にむけて応用を期待している。また分担者（寺内、関）の研究の進捗は現状までは直接に記号実行器の開発実装には関連していないが、今後、記号実行器により得られた制御フローグラフに対する（AI手法を含む）統計的解析手法のターゲットとなる性質　として利用する予定である。
今後の研究の推進方策	マルウェアを含むバイナリコードの形式手法としての記号実行器の開発実装は、現在までに x86-32/Win (BE-PUM), ARM-32/Android (CORANA, HybridsSE), MIPS-32/linux (SIMIPS) に対して行ってきた。近年の潮流として、インストラクションセットは PCはx86, スマホやタブレットはARMが主流であるが、新たな流れとして、制御装置におけるMPUをFPGAでRISC-Vインストラクションセットの実装が散見される。今後、x86-32, ARM-32 の64bit への拡張に加え、ベトナム国家大学ハノイ校との協働で RISC-V に対する記号実行器の開発実装の可能性を模索している。これは過去にインストラクションマニュアルからの各インストラクションの形式的意味の実装をルールベースの古典的自然言語処理に加え、深層学習やLLMを用いた自動化を検討し一定の成功を収めてきた。この手法の適用を、分担者（グエン）と共同で行う。記号実行器の実装がされると、得られる最も大事な情報は制御構造グラフ(Control Flow Graph)である。制御構造グラフの類似性、脆弱性を持つ特徴的な制御列、また情報のソースからリークへの到達可能性など、ターゲットとなるセキュリティの性質の形式化に基づき、マルウェア分類、脆弱性および脆弱性攻撃の検出、情報の漏洩可能性、悪意の侵略可能性などの性質の自動検出をめざす。

報告書

(4件)

研究成果
(24件)

すべて 2024 2023 2022 2021 2020 その他

すべて国際共同研究 (2件) 雑誌論文 (7件) (うち国際共著 3件、査読あり 7件、オープンアクセス 5件) 学会発表 (13件) (うち国際学会 10件) 備考 (2件)

[国際共同研究] ロレーヌ大学(フランス)
- 関連する報告書
  2023 実施状況報告書
[国際共同研究] Le Quy Don技術大学(ベトナム)
- 関連する報告書
  2023 実施状況報告書
[雑誌論文] Attentive deep neural networks for legal document retrieval.2024
- 著者名/発表者名
  Ha-Thanh Nguyen, Manh-Kien Phi, Xuan-Bach Ngo, Vu Tran, Le-Minh Nguyen, Minh-Phuong Tu
- 雑誌名
  
  Artif. Intell. Law
  
  巻: 32(1) 号: 1 ページ: 57-86
- DOI
  10.1007/s10506-022-09341-8
- 関連する報告書
  2023 実施状況報告書
- 査読あり / 国際共著
[雑誌論文] On Lookaheads in Regular Expressions with Backreferences2023
- 著者名/発表者名
  Nariyoshi Chida, Tachio Terauchi.
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E106.D 号: 5 ページ: 959-975
- DOI
  10.1587/transinf.2022EDP7098
- ISSN
  0916-8532, 1745-1361
- 年月日
  2023-05-01
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] 代数的エフェクトハンドラを持つ言語のためのトレースエフェクト2023
- 著者名/発表者名
  川俣楓河, 寺内多智弘
- 雑誌名
  
  コンピュータソフトウェア
  
  巻: 40 号: 2 ページ: 2_19-2_48
- DOI
  10.11309/jssst.40.2_19
- ISSN
  0289-6540
- 年月日
  2023-04-21
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Reduction of Register Pushdown Systems with Freshness Property to Pushdown Systems in LTL Model Checking2022
- 著者名/発表者名
  TAKATA Yoshiaki、SENDA Ryoma、SEKI Hiroyuki
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E105.D 号: 9 ページ: 1620-1623
- DOI
  10.1587/transinf.2022EDL8030
- ISSN
  0916-8532, 1745-1361
- 年月日
  2022-09-01
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] SM-BERT-CR: a deep learning approach for case law retrieval with supporting model2022
- 著者名/発表者名
  Vuong Yen Thi-Hai、Bui Quan Minh、Nguyen Ha-Thanh、Nguyen Thi-Thu-Trang、Tran Vu、Phan Xuan-Hieu、Satoh Ken、Nguyen Le-Minh
- 雑誌名
  
  Artificial Intelligence and Law
  
  巻: 30 号: 3 ページ: 1-28
- DOI
  10.1007/s10506-022-09319-6
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Complexity results on register context-free grammars and related formalisms2022
- 著者名/発表者名
  Senda Ryoma、Takata Yoshiaki、Seki Hiroyuki
- 雑誌名
  
  Theoretical Computer Science
  
  巻: 923 ページ: 99-125
- DOI
  10.1016/j.tcs.2022.04.055
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Reachability of Patterned Conditional Pushdown Systems2020
- 著者名/発表者名
  Li Xin、Gardy Patrick、Deng Yu-Xin、Seki Hiroyuki
- 雑誌名
  
  Journal of Computer Science and Technology
  
  巻: 35 号: 6 ページ: 1295-1311
- DOI
  10.1007/s11390-020-0541-z
- 関連する報告書
  2020 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[学会発表] Answer Refinement Modification: Refinement Type System for Algebraic Effects and Handlers.2024
- 著者名/発表者名
  Fuga Kawamata, Taro Sekiyama, Hiroshi Unno, Tachio Terauchi
- 学会等名
  51st ACM SIGPLAN-SIGACT Symposium on Principles of Programming Languages (POPL 2024)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Original Entry Point detection based on graph similarity.2023
- 著者名/発表者名
  Pham Thanh Hung, Mizuhito Ogawa
- 学会等名
  16th International Symposium on Foundations & Practice of Security (FPS 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Repairing Regular Expressions for Extraction.2023
- 著者名/発表者名
  Nariyoshi Chida, Tachio Terauchi
- 学会等名
  44th ACM SIGPLAN Conference on Programming Language Design and Implementation (PLDI 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] On the Expressive Power of Regular Expressions with Backreferences.2023
- 著者名/発表者名
  Taisei Nogami, Tachio Terauchi
- 学会等名
  48th Mathematical Foundations of Computer Science (MFCS 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] A Game-theoretic Approach to Indistinguishability of Winning Objectives as User Privacy,2023
- 著者名/発表者名
  Rindo Nakanishi, Yoshiaki Takata, Hiroyuki Seki
- 学会等名
  20th International Colloquium on Theoretical Aspects of Computing (ICTAC 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Modular Primal-Dual Fixpoint Logic Solving for Temporal Verification2023
- 著者名/発表者名
  Hiroshi Unno, Tachio Terauchi, Yu Gu, Eric Koskinen
- 学会等名
  50th ACM SIGPLAN-SIGACT Symposium on Principles of Programming Languages (POPL 2023), pp.2111-2140
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] 後方参照付正規表現の表現力について2023
- 著者名/発表者名
  野上大成, 寺内多智弘
- 学会等名
  ソフトウェア科学会第25回プログラミングおよびプログラミング言語ワークショップ (PPL 2023)
- 関連する報告書
  2022 実施状況報告書
[学会発表] Automatic Stub Generation for Dynamic Symbolic Execution of ARM binary2022
- 著者名/発表者名
  Nguyen Van Anh, Mizuhito Ogawa .
- 学会等名
  11th International Symposium on Information and Communication Technology (SoICT 2022), pp.352-359
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Repairing DoS Vulnerability of Real-World Regexes2022
- 著者名/発表者名
  Nariyoshi Chida, Tachio Terauchi
- 学会等名
  43rd IEEE Symposium on Security and Privacy (S&P 2022), pp.2060-2077
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] On Lookaheads in Regular Expressions with Backreferences2022
- 著者名/発表者名
  Nariyoshi Chida, Tachio Terauchi
- 学会等名
  7th International Conference on Formal Structures for Computation and Deduction (FSCD 2022), LIPICS Vol. 228, pp.15:1-15:18
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Active Learning for Deterministic Bottom-up Nominal Tree Automata2022
- 著者名/発表者名
  Rindo Nakanishi, Yoshiaki Takata, Hiroyuki Seki
- 学会等名
  19th International Colloquium on Theoretical Aspects of Computing (ICTAC 2022), LNCS 13572, pp.342-359
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Constraint-based Relational Verification2021
- 著者名/発表者名
  Hiroshi Unno, Tachio Terauchi, Eric Koskinen
- 学会等名
  33rd International Conference on Computer-Aided Verification (CAV 2021), Springer LNCS 12759, pp.742-766
- 関連する報告書
  2021 実施状況報告書
[学会発表] Reactive Synthesis from Visibly Register Pushdown Automata2021
- 著者名/発表者名
  Ryoma Senda, Yoshiaki Takata, Hiroyuki Seki
- 学会等名
  18th International Colloquium on Theoretical Aspects of Computing (ICTAC 2021), Springer LNCS 12819, pp.334-353
- 関連する報告書
  2021 実施状況報告書
[備考] Corana（実装公開）
- URL
  https://github.com/anhvvcs/corana
- 関連する報告書
  2021 実施状況報告書
[備考] Corana/API（実装公開）
- URL
  https://github.com/vananhnt/corana
- 関連する報告書
  2021 実施状況報告書

数理論理手法と人工知能手法の融合に基づくマルウェアの自動意味理解

研究代表者

小川 瑞史 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (40362024)

25,870千円 (直接経費: 19,900千円、間接経費: 5,970千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] ロレーヌ大学(フランス)

関連する報告書

[国際共同研究] Le Quy Don技術大学(ベトナム)

関連する報告書

[雑誌論文] Attentive deep neural networks for legal document retrieval.2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] On Lookaheads in Regular Expressions with Backreferences2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] 代数的エフェクトハンドラを持つ言語のためのトレースエフェクト2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] Reduction of Register Pushdown Systems with Freshness Property to Pushdown Systems in LTL Model Checking2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] SM-BERT-CR: a deep learning approach for case law retrieval with supporting model2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Complexity results on register context-free grammars and related formalisms2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Reachability of Patterned Conditional Pushdown Systems2020

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Answer Refinement Modification: Refinement Type System for Algebraic Effects and Handlers.2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Original Entry Point detection based on graph similarity.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Repairing Regular Expressions for Extraction.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] On the Expressive Power of Regular Expressions with Backreferences.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] A Game-theoretic Approach to Indistinguishability of Winning Objectives as User Privacy,2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Modular Primal-Dual Fixpoint Logic Solving for Temporal Verification2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 後方参照付正規表現の表現力について2023

著者名/発表者名

学会等名

小川瑞史北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (40362024)