研究課題/領域番号 |
17K19973
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
研究分野 |
情報科学、情報工学およびその関連分野
|
研究機関 | 京都大学 |
研究代表者 |
山本 章博 京都大学, 情報学研究科, 教授 (30230535)
|
研究分担者 |
西野 正彬 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 特別研究員 (90794529)
|
研究期間 (年度) |
2017-06-30 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2018年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2017年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 機械学習 / 文脈自由文法 / 木構造 / 一階述語論理 / 帰納論理プログラミング / 最小汎化 / 文脈自由言語 / 木構造データ / 文字列データ / 距離計算 / 離散構造 / 構文解析木 / pq-gram距離 / BDD / 離散最適化 / 文字列構造 |
研究成果の概要 |
機械学習は自然言語データの処理における基本技術となっている.自然言語データを数ベクトルのデータに変換した上で,深層学習など最新の機械学習技術を適用する方法は学習結果の意味を解釈しづらく,さらには文のもつ自然な構造がベクトルという平坦な構造で適切に表現できる保証はない.本研究では,自然言語データの数理的なモデルである文脈自由言語の構文解析木,一階述語論理の文,語の列の直接の代数化であるパターンを対象とした機械学習のための最適化数理とアルゴリズムを構築した.
|
研究成果の学術的意義や社会的意義 |
機械学習は自然言語データの処理における基本技術となっている.特に自然言語データを自然数ベクトルのデータに変換した上で,深層学習など最新の機械学習技術を適用する方法は大きな成果を上げつつある.しかし,深層学習は学習結果の意味を解釈しづらく,さらには文のもつ自然な構造がベクトルという平坦な構造で適切に表現できる保証はない.本研究で扱った,語の列である自然言語データ,あるいはそこから抽出した構文木を直接扱う機械学習アルゴリズムを用いれば,解釈可能な構造を表現した結果を出力することが期待される.
|