研究概要 |
文字列の例から形式文法を自動的に合成する文法推論は機械学習の重要なテーマである.われわれはこれまでの研究によって,上向き構文解析の結果から不足している規則のみを生成する規則合成方式と規則集合探索を組み合わせて,文脈自由文法を漸次学習するシステムSynapseを作成し,これが基本的な文脈自由文法を自動合成できることを示した.この2年間の研究の主な成果は次のように要約できる. ・システムに規則生成のための新しい方式(ブリッジ法)を組み込み,これが従来用いていた帰納的CYKアルゴリズムより効率が高いことを示した.ブリッジ法では,正例の文字列の構文解析に失敗したとき,不完全な導出木の欠けた部分を補うような規則が生成される. ・これまでの最小規則探索に加えて,直列探索と呼ばれる探索方式を用いることによって,最小ではないが正しい規則集合(文法)をはるかに高速に合成できることを示した. ・これまでのSynapseでは合成できる文法の形式が変形Chomsky標準形に制限されていたが,一般のChomsky標準形とその拡張形式の規則も合成できるように拡張された. ・本方式を確定節文法(DCG : definite clause grammar)の合成などに拡張する方法について考察し実験した. 残された研究課題は,これらの方式を改良・拡大して合成できる文法の範囲をさらに拡張し,機械学習への応用をはかることである.具体的な目標として,より複雑な文法を合成できるように帰納推論方式をさらに解析し改良すること,論理文法の合成および構文的パタン認識への合成への応用などがある.
|