1997 Fiscal Year Annual Research Report
文書検索機能を持つ日本語質問応答システムの開発に関する研究
Project/Area Number |
09780347
|
Research Institution | Kyushu University |
Principal Investigator |
峯 恒憲 九州大学, 大学院・システム情報科学研究科, 助教授 (30243851)
|
Keywords | 類似度計算 / 格フレーム / コーパス / 係り受け解析 / 情報検索 / 用例ベース / 知識獲得 / 対話システム |
Research Abstract |
本年度は、次のことを行った。 1.係り受け情報を利用した情報検索システムの性能評価とその高速化 2.自然言語処理で利用する知識の一つとしての格フレームの獲得法に関する研究 3.情報処理教育システムの利用を促すためのツールの試作 1では、与えられた文書中から必要な情報を抽出するのにどのような係り受け情報が有効となるか、また、その時の重みの与え方をどうすべきかを調べた。入力文の中に含まれる係り受け情報の含有率と適合率(抽出された検索結果のうち、解答として適当である割合)の関係について調べた所、複文の場合、係り受け情報が70%以上含まれていれば、98%程度の適合率が得られ、50〜70%含まれる時、適合率が40%にまで落ちることがわかった。しかし、この7割以下しか含まれない場合の質問で抽出される検索結果も、その中に含まれる正しい結果の数も非常に多いため、照合が取れない係り受け構造に対して、それを構成する語の、意味的に類似した語への置き換え(シソ-ラス展開)が非常に重要となることがわかった。 この検索システムについての成果の一部は、国際学会(PACLING97)及び情報処理学会の全国大会で報告した。また、このシステムの高速化と、解析したデータの保存方法についての検討を行うとともに、その試作を行った。また、実験システムを公開することにより、ユーザ(学生ら)からの質問を記録し、これらと解答とのパタン化の準備を進めた。更に、対話機能導入の試作版として、検索結果の絞り込みを対話を通して行うことができるように、ユーザーの入力に対するシステム側の質問のパターンを決めた。 対話機能の実現には、高速な解析システムの開発と、意味や構文の曖昧さを削減するための知識が必要であり、そのための2.の知識(格フレーム)の獲得法に関する研究を行い、NLPR97や研究会、全国大会などで報告した。特に今年度は、日本語の動詞として数の多いサ変動詞の格フレームの獲得方法について調べた。この研究は、複合名詞の解析や、省略語の解析にも応用できるものであるため、対話機能の実現に欠かすことのできない重要な研究である。また、これら獲得した格フレームを利用した構文解析システムを実装し、その性能評価を行った。 更に、3では、共同研究者と、プログラムの動作理解を助けるための補助ツールの開発を行った。この成果については、ICCE97等で報告した。
|
-
[Publications] Tsunenori Mine et.al.: "Japanese Document Retrieval System on WWW using Dependency Relations between Words" Proc.of Pacific Association for Computational LINGuistics'97. 209-215 (1997)
-
[Publications] Hiroyuki Sato et.al.: "On Web visualizing how programs run for teaching 2300 students" Proc.of International Conference on Computers in Education'97. 952-954 (1997)
-
[Publications] Tsunenori Mine et.al.: "Case Frame Acquisition and Verd Sense Disambiguation on a Large Scale Electronic Dictionary" Proc.of Natural Language Processing Pacific Rim Symposium'97. 221-226 (1997)
-
[Publications] 峯恒憲他: "九州大学における一般情報処理教育支援システムについて" 電子情報通信学会デジタルドキュメント研究会研究報告. DD97-49. 39-46 (1997)
-
[Publications] 橋本 順子他: "既存の和語動詞の格フレームを利用したサ変動詞の格フレーム獲得" 情報処理学会自然言語処理研究会研究報告. NL97-26. 55-62 (1997)
-
[Publications] 麻生 和昭他: "単語間の係り受け関係を利用したWWW上での日本語テキスト検索システム" 情報処理学会全国大会講演論文集. 5N-04. 129-130 (1997)
-
[Publications] 廣川 佐千男他: "12回で学ぶ情報処理" 学術図書出版, 209 (1997)