研究課題/領域番号 |
03452167
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
研究分担者 |
山本 幹雄 豊橋技術科学大学, 工学部, 教務職員 (40210562)
奥山 徹 豊橋技術科学大学, 工学部, 講師 (30177191)
|
キーワード | 音声対話 / 自然言語処理 / 助詞 / 倒置 / 自然言語解析 / 対話システム / 文生成 / 文脈処理 |
研究概要 |
書き言葉に対する文法・解析技術をあいまいな音声発話文に適用する際、まず問題となる助詞落ち・倒置についての分析と解析手法の開発、及び対話文の意味的な曖昧さを解消するための質問生成システムを試作した。 助詞落ち・倒置の分析には、実際の人間の対話を書き起こしたテキスト約1800文を使用した。名詞文節の約4%の助詞が省略されており、省略される助詞は「が、を、に、は」など述部に係る場合に必須格の機能を持つものが80%を占めていた。係り先の性質としては、述部に係る助詞落ち名詞文節の99%が最も近くの述部に係る。また、係り関係(格)については、述部の格構造の簡単な意味制約によって、90%が推定できることが分かった。倒置に関しては、述部に係る文節が倒置される場合が94%を占めており、倒置された句が1つ前の文節に係る場合が91%であった。以上の分析をもとに助詞落ちと倒置を復元するメカニズムを提案した。語彙が700の小規模な実験タスクで評価した結果、助詞落ち、倒置共に90%の例を正しく解析できることが分かった。 対話における発話文は文法的に正しく解析できても、意味的に曖昧な場合が多くある。このような場合、人間はその曖昧さを解消するための質問を行う。現在の技術では、計算機が曖昧さを解消する機能は人間よりも劣るため、曖昧さに関する質問を積極的に生成するべきであると考え、このような質問を生成するシステムを試作した。本システムでは意味・文脈の知識を使用して、できるだけ曖昧さの解消を図り、2つ以上の曖昧さが残った場合に質問文を生成する。曖昧さを解消するために以下の3種類の知識を使用した。(1)以前に発話された文の内容、(2)動詞が名詞などの間に取れる意味的な関係の集合、(3)疑問代名詞が質問している意味的な内容の候補。これら3種類の知識は、それぞれ候補の制約として機能し、すべての制約を満たす解が最終的な候補となる。
|