2022 年度実施状況報告書

トランスデューサ理論を駆使するソフトウェア検証

研究課題

研究課題/領域番号	19K11899
研究機関	東京工業大学
研究代表者	南出靖彦東京工業大学, 情報理工学院, 教授 (50252531)
研究期間 (年度)	2019-04-01 – 2024-03-31
キーワード	ソフトウェア検証 / トランスデューサ / 形式言語 / 文字列制約
研究実績の概要	本年度には，以下の研究を行なった．＊後方参照を含む拡張正規表現マッチングの計算量解析の研究を継続した．解析の精度を改善するため，集合と木のモナドを組み合わせたモナドを用いるアプローチについて研究を進め，正規表現の微分の考え方を全体に適用することで，これまでより精度の高い解析を実現した．これまでの研究で実装した解析器に本方式を実装し，既存の解析結果と比較した結果，全体の3 分の1 近くの正規表現でオーダの次数が1 以上下がっており, 解析精度が向上されていることを確認できた. 解析の後半は，Berglund らによる非決定性トランスデューサの出力増加率判定に基づいているが，解析内で用いられる複数の変換を組み合わせて単純化するなどの改良を行なった．＊先読み付き文脈自由文法は文脈自由文法と解析表現文法（PEG）の両方を拡張したものである．本年度の研究では，まず，先読み付き言語の区間に基づく意味論を導入した．この区間による意味論は，3値論理に基づく意味論に理論的には完全に対応するものであるが，より形式言語理論の古典的な意味論に近いものになっている．また，先読み付き正規表現の微分を先読み付き文脈自由文法の微分に拡張し，微分による所属判定の計算量が文字列長nに対して，O(n^3)となることを示した．＊トランスデューサを用いたソフトウェア検証の基礎として，自然言語で書かれた仕様を自然言語処理を用いて形式化する研究を行なった．古典的な半単一化を用いた処理と，Transformer を用いた機械翻訳を組み合わせることで，HMTL5字句解析仕様の主要部分を形式化することができた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由拡張正規表現マッチングの計算量解析においては，2021年度までの研究で先読み付き決定性トランスデューサの出力増加率解析を用いた計算量解析手続きの構築と判定器の実装ができており一定の成果が得られていた．今年度には，後方参照を含む正規表現について，非決定性トランスデューサの出力増加率解析を用いることで精度の改善することができた．非決定性トランスデューサを用いた解析の枠組みはより適用範囲が広く，今後の応用が見込める．先読み付き文脈自由文法に関する研究は，閉包性，微分，所属判定など主要な理論的な性質を解明が本年度の研究までに完了している．未解決の問題としては，任意の先読み付き文脈自由文法を任意の語に対して，所属，非所属が決まる文法に変換できるかがあるが，非常に難しい問題と考えている．
今後の研究の推進方策	これまでの研究で整数引数を持つ文字列演算を含む文字列制約の充足可能性判定手続きを設計し，その実装と評価を行なってきた．今後は，この充足可能性判定の実用性を高めるために，Parikhオートマトンの空性判定の効率的な実装の研究を行う予定である．SMTソルバーの代わりに整数計画法のソルバーを用いることを検討している．
次年度使用額が生じた理由	当初の研究期間のうち３年間は，新型コロナウイルスの感染拡大のため，国際会議，国内会議の多くがオンライン開催になり出張の機会が大きく減ったため，次年度使用額が生じた．現在は多くの会議が現地開催になっているので，次年度使用額は国内外の研究者との交流を促進するために使用する予定である．

研究成果
(7件)

すべて 2023 2022

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (5件)

[雑誌論文] 非決定性 Streaming String Transducer と Parikh オートマトンを用いた文字列制約の充足可能性判定2023
- 著者名/発表者名
  釜野雅基, 福田大我, 南出靖彦
- 雑誌名
  
  コンピュータソフトウェア
  
  巻: 40 ページ: 117-136
- DOI
  10.11309/jssst.40.1_117
- 査読あり / オープンアクセス
[雑誌論文] Program Logic for Higher-Order Probabilistic Programs in Isabelle/HOL2022
- 著者名/発表者名
  Michikazu Hirata, Yasuhiko Minamide, Tetsuya Sato
- 雑誌名
  
  LNCS（International Symposium on Functional and Logic Programming）
  
  巻: LNCS 13215 ページ: 57-74
- DOI
  10.1007/978-3-030-99461-7_4
- 査読あり
[学会発表] Derivatives of Context-Free Grammars with Lookahead2023
- 著者名/発表者名
  嵜貴之, 南出靖彦
- 学会等名
  第142回プログラミング研究発表会
[学会発表] 拡張正規表現マッチングの保守的計算量解析における後方参照の解析精度向上2023
- 著者名/発表者名
  川村瑠, 南出靖彦
- 学会等名
  第25回プログラミングおよびプログラミング言語ワークショップ
[学会発表] 混合整数線形計画問題を利用したParikhオートマトンの高速な空性判定とPCPへの応用（ポスター）2023
- 著者名/発表者名
  大森章裕, 南出靖彦
- 学会等名
  第25回プログラミングおよびプログラミング言語ワークショップ
[学会発表] 整数パラメータ付き文字列制約のトランスデューサに基づく解法とその応用例（ポスター）2023
- 著者名/発表者名
  釜野雅基, 宮地風汰, 南出靖彦
- 学会等名
  第25回プログラミングおよびプログラミング言語ワークショップ
[学会発表] HTML5 字句解析仕様に対する自動的な形式表現への変換（ポスター）2023
- 著者名/発表者名
  五十嵐彩夏, 南出靖彦
- 学会等名
  第25回プログラミングおよびプログラミング言語ワークショップ

2022 年度 実施状況報告書

トランスデューサ理論を駆使するソフトウェア検証

研究代表者

南出 靖彦 東京工業大学, 情報理工学院, 教授 (50252531)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 非決定性 Streaming String Transducer と Parikh オートマトンを用いた文字列制約の充足可能性判定2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Program Logic for Higher-Order Probabilistic Programs in Isabelle/HOL2022

著者名/発表者名

雑誌名

DOI

[学会発表] Derivatives of Context-Free Grammars with Lookahead2023

著者名/発表者名

学会等名

[学会発表] 拡張正規表現マッチングの保守的計算量解析における後方参照の解析精度向上2023

著者名/発表者名

学会等名

[学会発表] 混合整数線形計画問題を利用したParikhオートマトンの高速な空性判定とPCPへの応用（ポスター）2023

著者名/発表者名

学会等名

[学会発表] 整数パラメータ付き文字列制約のトランスデューサに基づく解法とその応用例（ポスター）2023

著者名/発表者名

学会等名

[学会発表] HTML5 字句解析仕様に対する自動的な形式表現への変換（ポスター）2023

著者名/発表者名

学会等名

2022 年度実施状況報告書

南出靖彦東京工業大学, 情報理工学院, 教授 (50252531)