2004 Fiscal Year Annual Research Report
脳に範をとる記号処理システム-文法の処理と獲得の統一モデル-
Project/Area Number |
15500095
|
Research Institution | Keio University |
Principal Investigator |
櫻井 彰人 慶應義塾大学, 理工学部, 教授 (00303339)
|
Keywords | 言語モデル / 浅い意味解析 |
Research Abstract |
本年度は、文法構造の知見に基づく文法獲得モデル、知識伝達過程のモデル化による言語処理過程の位置付け、ILPによるコーパスからの文法獲得、意味格をもつコーパスであるFrameNet IIを用いた様々な意味構造獲得について、理論検討及び実験を行った。ここでは、文法構造の知見に基づく文法獲得モデルとFrameNet IIを用いた浅い意味解析について報告する。 従来、ニューラルネットワークを用いた構文規則の獲得実験では、再帰型ニューラルネットワーク(RNN)が用いられ、一定の成果が得られてきた。しかし、RNNのみでは、自然言語文法に必須の統語範疇が獲得できていないことが知られている(神経素子活動分布のクラスタが構文範疇として解釈可能ではある。本実験では、RNNを2種類用いて文法獲得をさせた。一方のRNNは他方のRNNの神経素子活動をモニタしながら、活動状況を入力として学習を行う。その結果、構文範疇の獲得が、単純な構文に対しては可能となり、また、神経回路網の損傷に対してロバストな回路を構築した。 人間の構文規則の知識は、入力文の構文解析および出力文の生成に現れる知識として記憶されている。従って構文規則の獲得は、一つには、構文解析方法の獲得として考えることができる。そこで、shift-reduceパーザーを獲得する実験を行った。実験には、構文規則は記号体系であるため、記号規則の機械学習アルゴリズムであるILPを用いた。また、コーパスにはPenn TreeBankの中のATISコーパスを用いた。従来提案されていた方法の欠点(実行時の高メモリ・時間コスト)を軽減するため学習単位を統語範疇とし、合理的な負例を生成するため統語範疇レベルでの負例生成方法を案出した。これにより、構文解析の標準的な評価規準で80%程度の正解率が得られた。さらに、解析によって得られる解析木上の誤りを負例として学習しなおす、再学習機構を考えた。これによれば、正解率が90%弱にまで向上することが確かめられた。
|
Research Products
(2 results)