2018 Fiscal Year Research-status Report

機械学習アルゴリズムのための離散データ上の関数に対する解析的最適化数理の構成

Research Project

Project/Area Number	17K19973
Research Institution	Kyoto University
Principal Investigator	山本章博京都大学, 情報学研究科, 教授 (30230535)
Co-Investigator(Kenkyū-buntansha)	西野正彬日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 研究主任 (90794529)
Project Period (FY)	2017-06-30 – 2020-03-31
Keywords	離散構造 / BDD / 帰納論理プログラミング
Outline of Annual Research Achievements	本研究は，自然言語データからの機械学習に対して，学習結果の意味解釈が難しいベクトルデータ表現を介ぜずに，言語データの持つ係り受け構造や構文木などの自然な構造を直接扱うための最適化数理を構築することを目的としている．一方で，既存の離散最適理論の多くは自然数を対象にしているが，理論上はすべての離散構造は自然数に埋め込めるものの，それでは学習結果に意味解釈可能性を与えるという本研究の動機を達成しない．昨年度に得られた研究成果として，一階述語論理における確定節形式の論理式に対してて順序関係による完備束を定義した上で，機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムの開発を行ったが，本年度はその理論を洗練した上で，帰納論理プログラミング国際会議に論文を投稿した結果，採択され，発表を行った．20年以上にわたって開催されっている国際会議において，確定節形式の論理式の持つ自然な完備束構造を利用しながらZDD・BDDを構築するアルゴリズムが認知された．さらに一階述語論理は，数学の文書を形式化することに端を発しているため，構文解析が一意に可能な文だけを対象とし，構文解析木を直接扱うようなデータモデルである．昨年度のもう一つの成果においても文脈自由文法もこの範疇のモデルである．この制約を弱くして，構文解析を行わずに単語列や文字列を直接扱うようなモデルも提案されているが，機械学習の結果が完備束にならない，という問題点が古くから指摘され，機械学習アルゴリズムの設計を困難にしていた．そこで，列の長さに着目した新たな順序構造を定義した上で，機械学習アルゴリズムの設計を行った．アルゴリズムは動的計画法に基づく最適化アルゴリズムとなっている．さらにこのアルゴリズムは，最近提唱され注目されている強指数時間仮説(SETH)を認めれば，これ以上の改良が困難であることも示した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 一階述語論理を節形式論理に制限して順序関係による完備束を定義した上で，機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムをまとめた論文が国際会議に採択され，初期の成果は達成した．さらに年度当初の計画のうちの一つは達成された．さらに，長年問題とされていた，構文解析を行わずに文からの機械学習の手法について，長さという新たな視点を導入することで，強指数時間仮説との関係を明確にすることができた．この成果は，本件研究の目標である離散データ解析の基礎手法の定式化について，今後の展開方法について一つの方向性を与えたものと考えている．
Strategy for Future Research Activity	一階述語論理を利用して機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムをまとめた論文は国際会議に採択され，一応の国際的評価を受けたが，さらに学術雑誌論文としてまとめあげたい．また，Galois対応を利用した完備束解析を応用することにより．離散データ解析の理論を深化させたい．一方，構文解析を行わずに単語列や文字列を直接扱うモデルによる機械学習アルゴリズムについては，動的計画法を用いることで強指数時間仮説を用いた理論的限界を示したが，このときには順序関係として「列の長さ」を利用したことがポイントであった．そこで，「列の長さ」によるGalois対応を明確にすること目指すとともに，構文木モデルにおけるGalois対応において「列の長さ」に対応する概念は何なのか，列モデルと構文木アルゴリズムの解析手法の違いを明確にし，理論を見通しの良いものにしたい．
Causes of Carryover	昨年度からの研究成果を学術雑誌に投稿するために時間を要し，投稿料を支払っていないので，翌年度に持ち越す．また，本年度新たに得た成果の国際的会議への発表あるいは論文誌へのが翌年度になる見込みであるため，その分を持ち越す．

Research Products
(2 results)

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

[Presentation] 文字列データの線形最小汎化問題に対するアルゴリズム2019
- Author(s)
  里見琢聞, 小林靖明, 山本章博
- Organizer
  人工知能学会第109回人工知能基本問題研究会(SIG-FPAI)
[Presentation] Using Binary Decision Diagrams to Enumerate Inductive Logic2018
- Author(s)
  Hikaru Shindo, Masaaki Nishino, Akihiro Yamamoto
- Organizer
  28th International Conference on Inductive Logic Programming (ILP 2018),
- Int'l Joint Research