2018 Fiscal Year Research-status Report
機械学習アルゴリズムのための離散データ上の関数に対する解析的最適化数理の構成
Project/Area Number |
17K19973
|
Research Institution | Kyoto University |
Principal Investigator |
山本 章博 京都大学, 情報学研究科, 教授 (30230535)
|
Co-Investigator(Kenkyū-buntansha) |
西野 正彬 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 研究主任 (90794529)
|
Project Period (FY) |
2017-06-30 – 2020-03-31
|
Keywords | 離散構造 / BDD / 帰納論理プログラミング |
Outline of Annual Research Achievements |
本研究は,自然言語データからの機械学習に対して,学習結果の意味解釈が難しいベクトルデータ表現を介ぜずに,言語データの持つ係り受け構造や構文木など の自然な構造を直接扱うための最適化数理を構築することを目的としている.一方で,既存の離散最適理論の多くは自然数を対象にしているが,理論上はすべて の離散構造は自然数に埋め込めるものの,それでは学習結果に意味解釈可能性を与えるという本研究の動機を達成しない. 昨年度に得られた研究成果として,一階述語論理における確定節形式の論理式に対してて順序関係による完備束を定義した上で,機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムの開発を行ったが,本年度はその理論を洗練した上で,帰納論理プログラミング国際会議に論文を投稿した結果,採択され,発表を行った.20年以上にわたって開催されっている国際会議において,確定節形式の論理式の持つ自然な完備束構造を利用しながらZDD・BDDを構築するアルゴリズムが認知された. さらに一階述語論理は,数学の文書を形式化することに端を発しているため,構文解析が一意に可能な文だけを対象とし,構文解析木を直接扱うようなデータモデルである.昨年度のもう一つの成果においても文脈自由文法もこの範疇のモデルである.この制約を弱くして,構文解析を行わずに単語列や文字列を直接扱うようなモデルも提案されているが,機械学習の結果が完備束にならない,という問題点が古くから指摘され,機械学習アルゴリズムの設計を困難にしていた.そこで,列の長さに着目した新たな順序構造を定義した上で,機械学習アルゴリズムの設計を行った.アルゴリズムは動的計画法に基づく最適化アルゴリズムとなっている.さらにこのアルゴリズムは,最近提唱され注目されている強指数時間仮説(SETH)を認めれば,これ以上の改良が困難であることも示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
一階述語論理を節形式論理に制限して順序関係による完備束を定義した上で,機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムをまとめた論文が国際会議に採択され,初期の成果は達成した.さらに年度当初の計画の うちの一つは達成された.さらに,長年問題とされていた,構文解析を行わずに文からの機械学習の手法について,長さという新たな視点を導入することで,強指数時間仮説との関係を明確にすることができた.この成果は,本件研究の目標である離散データ解析の基礎手法の定式化について,今後の展開方法について一つの方向性を与えたものと考えている.
|
Strategy for Future Research Activity |
一階述語論理を利用して機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムをまとめた論文は国際会議に採択され,一応の国際的評価を受けたが,さらに学術雑誌論文としてまとめあげたい.また,Galois対応を利用した完備束解析を応用することにより.離散データ解析の理論を深化させたい. 一方,構文解析を行わずに単語列や文字列を直接扱うモデルによる機械学習アルゴリズムについては,動的計画法を用いることで強指数時間仮説を用いた理論的限界を示したが,このときには順序関係として「列の長さ」を利用したことがポイントであった.そこで,「列の長さ」によるGalois対応を明確にすること目指すとともに,構文木モデルにおけるGalois対応において「列の長さ」に対応する概念は何なのか,列モデルと構文木アルゴリズムの解析手法の違いを明確にし,理論を見通しの良いものにしたい.
|
Causes of Carryover |
昨年度からの研究成果を学術雑誌に投稿するために時間を要し,投稿料を支払っていないので,翌年度に持ち越す.また,本年度新たに得た成果の国際的会議への発表あるいは論文誌へのが翌年度になる見込みであるため,その分を持ち越す.
|
Research Products
(2 results)