研究課題/領域番号 |
17K19973
|
研究機関 | 京都大学 |
研究代表者 |
山本 章博 京都大学, 情報学研究科, 教授 (30230535)
|
研究分担者 |
西野 正彬 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 研究主任 (90794529)
|
研究期間 (年度) |
2017-06-30 – 2020-03-31
|
キーワード | 離散構造 / BDD / 帰納論理プログラミング |
研究実績の概要 |
本研究は,自然言語データからの機械学習に対して,学習結果の意味解釈が難しいベクトルデータ表現を介ぜずに,言語データの持つ係り受け構造や構文木などの自然な構造を直接扱うための最適化数理を構築することを目的としている.一方で,既存の離散最適理論の多くは自然数を対象にしているが,理論上はすべての離散構造は自然数に埋め込めるものの,それでは学習結果に意味解釈可能性を与えるという本研究の動機を達成しない.そこで,既存の理論において,データ構造が再帰的に定義できる点とデータ集合の表現に順序関係による完備束を定義できる点に着目した上で,穂年度は,離散データ解析の基礎手法の定式化と,具体的な最適化手法としてデータ圧縮を利用した場合の完備束の扱いについて研究を行った.結果として,自然言語データのモデルの一つである文脈自由言語と一階述語論理言語を対象とした.文脈自由言語については,与えられた語または文を導出するすべての構文木を圧縮形であるZDDを用いて構成するアルゴリズムの開発を行った.一階述語論理言語については節形式論理に制限して順序関係による完備束を定義した上で,機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムの開発を行った.他の自然言語データのモデルと比較して,文脈自由言語と一階述語論理の言語には,それぞれ形式言語理論と数理論理学による意味が厳密に与えられているので,本研究の動機である学習結果もまた形式言語理論と数理論理学を用いて解釈することが可能である.このような機械学習は前者は文法推論,後者は帰納論理プログラミングとよばれていて,20年以上にわたって研究されているが,自然な完備束構造を利用しながらZDD・BDDを構築するアルゴリズムは本研究で初めて開発されたものであり,本研究の目的を達成する一つの成果と考えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
文脈自由言語において,与えられた語または文を導出するすべての構文木を圧縮形であるZDDを用いて構成するアルゴリズムの開発,および一階述語論理を節形式論理に制限して順序関係による完備束を定義した上で,機械学習の結果をBDDを用いた圧縮形で構成するアルゴリズムの開発を行ったので,年度当初の計画のうちの一つは達成された.しかしながら,この方法の背後にある数理構造については,まだ理論的な詳細さに欠けている点があり,もう一つの目標である離散データ解析の基礎手法の定式化については十分な結果が得られていないと考えている.
|
今後の研究の推進方策 |
成果となったアルゴリズムについては,国際会議で発表すべく準備を進めている.その準備の中で,十分さに欠けていた離散データ解析の基礎手法の定式化について進展させ,論文としての完成度をあげ,平成30年度の計画である半順序関係のもとでの離散データ解析の理論の展開につなげてゆきたい.さらに,計画にあるように,離散凸解析と完備束の関係の研究を開始するとともに,Galois対応を利用した完備束解析を応用することにより.離散データ解析の理論を深化させる計画である.
|
次年度使用額が生じた理由 |
本年度の研究成果について,学術雑誌発表と国際会議発表を行うには,次年度発行の雑誌と次年度開催の会議にしか間に合わないため,次年度使用額が生じた.
|