研究課題/領域番号 |
21520398
|
研究機関 | 静岡大学 |
研究代表者 |
近藤 真 静岡大学, 情報学部, 教授 (30225627)
|
研究期間 (年度) |
2009-04-01 – 2014-03-31
|
キーワード | 言語学 / 計算機科学 / 構文意味解析 |
研究概要 |
本研究で採用している意味表現は自立語の意味がフレームで表現されており、各フレームは属性・値のペアの集合として記述されている。この値には語自体が持つ値(システムの知識に該当)を格納する知識値、統語的な修飾関係に基づいて決定される値を格納する修飾値、統語的修飾関係によらない文脈情報に基づいて決定される値を格納する伝搬値の3種類がある。前年度までのシステムでは、入力文の意味を先行文脈やシステムが保持している知識に位置づける際に、入力文中の概念と対応する概念を先行文脈やシステムの知識から検出していた。その検出にあたっては、概念間の上位・下位関係や全体・部分関係に基づいて検出を行なっていた。 いっぽう、現実の対話においては、先行文脈で言及された概念と入力文中との概念のあいだで意味の限定(値の伝搬)が起こる際に、上位・下位関係や全体・部分関係にない概念間で意味の限定が起こる場合がある。このような問題に対応するため、ある全体現象が連続する複数の部分現象によって構成される場合に着目し、その部分現象間での意味の限定を可能にする連続現象モデルを設計した。 連続現象モデルでは、全体現象を構成する各部分現象の生起順序が抽象的にモデル化されており、全体現象の中で必ず生起する現象と随意的に生起する現象とが明示的に表現されている。連続現象モデルはいわばひな型のようなものであり、これに基づいて具体的な連続現象のインスタンスが文脈中に展開される。この連続現象モデルを用いることで、部分現象間の生起順序が決定され、その生起順序を手がかりとして時間・場所に関する値を部分現象間で伝搬することが可能になった。今年度は旅行現象と宿泊現象の連続現象モデルと、部分現象間での連続現象モデルに基づく値の伝搬ルールを設計・実装し、先行システムに組み込んだ。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は前年度まで扱うことのできなかった、上位・下位/全体・部分関係にない概念間での意味の限定を実現するための要素技術として、連続現象モデルの設計・実装を行なった。実装にあたっては、旅行現象と宿泊現象の2種類の連続現象モデルを実装し、これらのモデルを利用した意味の伝搬のためのルールを実装した。 これらの連続現象モデルは、いわば旅行・宿泊といった現象に関して、人間が一般的に理解している現象列をシステムの知識としてモデル化したものであると言える。現実の対話においては、人間はこのような個別の現象に関する知識を組み合わせて文脈・発話の理解を行なっていると考えられる。そのため、開発されたシステムでは、各モデル単独での意味の伝搬に加えて、2つのモデルが相互作用するような文脈での意味の伝搬についても実装を行なった。 2種類の現象に関する知識を利用する際には、それらのあいだに相互作用が起こらない場合と相互作用が起こる場合とが考えられる。さらに、相互作用が起こる場合には、一方の知識が、もう一方の知識の一部を詳細化したものである場合と、両者の知識がその一部を共有している場合とが考えられる。別の言い方をすると、相互作用が起こらない場合は、それぞれの知識を交わりを持たない独立した知識集合であると見なすことができ、相互作用が起こる場合には、一方がもう一方の部分集合である場合と、両者が空でない交わりを持つ知識集合である場合とがある。今年度、実装した旅行現象と宿泊現象の連続現象モデルは、旅行現象がその一部として宿泊現象を含むという関係にある。旅行現象と宿泊現象とのあいだで、適切な意味の伝搬が達成されていることが確認されたため、「おおむね順調に進展している」と判断する。
|
今後の研究の推進方策 |
今年度の連続現象モデルの設計・実装では、旅行現象と宿泊現象の2種類の連続現象モデルを開発し、それぞれの連続現象モデルを独立して用いた場合の意味の伝搬と、これら2つのモデルが相互作用するような文脈での意味の伝搬について、実装されたシステムが期待通りの振る舞いを示すことを確認した。これら2つのモデルは旅行現象が宿泊現象を包含する関係にある。意味理解において2種類の知識が相互作用する場合、その相互作用のしかたには、一方が他方を包含する場合だけでなく、両者のあいだで共有される知識があるような場合も存在する。このようなタイプの知識の相互作用(意味の伝搬)については、今後さらなる検討を要する。 また、設計・実装する連続現象モデルの種類を増やすことを通して、より一般性の高い連続現象モデルの設計手順を開発する必要がある。現象の種類に依存しない、連続現象モデルの一般的なひな型を作成することで、実用化に際して必ず必要となる個別の連続現象モデルの設計コストが軽減されることが期待される。 現在のシステムは、構文意味解析に成功する限りにおいて、期待された性能を発揮しているが、構文意味解析に失敗する事例も少なくない。その失敗の大半が形態素解析の失敗に起因しているため、システムの頑健性を高めるために形態素解析の性能を上げる必要がある。幸い、本システムは文脈の意味情報を参照することが容易な意味表現を用いているため、文脈情報を利用して形態素解析の性能を上げることが、今後さらに研究・開発を進めるために必要であると考える。
|