2003 Fiscal Year Annual Research Report
単語と文書の意味クラスをベースとするスクリプトの自動学習に関する研究
Project/Area Number |
15680005
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
鳥澤 健太郎 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (70282712)
|
Keywords | スクリプト / 自然言語処理 / 統計的自然言語処理 / 常識的知識 / 機械学習 |
Research Abstract |
本提案の研究目標は、「スクリプト」を大量のテキストから自動的に学習することである。スクリプトとは70年代にSchankらが提案した知識表現で、様々な出来事が辿る典型的な経緯を表現するものである。学習されたスクリプトは、自然言語で書かれた文書を処理する際に、陽に記述されていないことを補間するために使われる。仮に「私はビールを注文した。」という表現が文書中に表れたとすると、同じ文書に「私はビールを飲んだ。」という記述が無かったとしても、通常は「私がビールを飲んだ」可能性が高い。スクリプトとはそのような常識的な出来事の流れを記述したものでありこれにより「私はビールを注文した」という表現だけから、「ビールを飲んだのはだれですか?」といった質問に対する答えを推論できる。このような推論により、近年研究が盛んな質問応答システムや、自動要約システムの性能向上が可能となる。 本年度はスクリプト学習のベースとなる「推論規則の学習」ならびに、将来的に予想されるデータの過疎性に対処するための単語の上位・下位関係の学習に関する研究を行った。推論規則の学習では「酒を飲み、酔った」のような並列動詞句と呼ばれる構造から推論規則を学習する手法について研究した。より具体的には、「並列動詞句に頻繁に現れる二つの動詞が同一の名詞を共有しやすいときに、推論の関係が成立しやすい」という仮説をたてて、学習を行った。また、単語の上位・下位関係に関しては、WWW上のHTML文書に現れる箇条書きに注目し、その箇条書きとDF/IDF値などの統計量を用いることによって、単語の上位・下位関係を学習する手法について研究をおこない、良好な結果を得ている。
|
Research Products
(5 results)
-
[Publications] Keiji Shinzato, Kentaro Torisawa: "Acquiring Hyponymy Relations from Web Documents"Proceedings of Human Language Technology/North American Chapter of Association of Computational Linguistics 2004. (in print). (2004)
-
[Publications] Naoki Yoshinaga, Yusuke Miyao, Kentaro Torisawa, Jun'ichi Tsujii: "Parsing Comparison across Grammar Formalisms using Strongly Equivalent Grammar"Traitement Automatique des Langue, Special Issue on Evolutions in Parsing. 44・3(in print). (2003)
-
[Publications] Kentaro Torisawa: "An Unsupervised Learning Method for Commonsensical Inference Rules on Events"in Proceedings of the Second CoLogNet-ElsNET Symposium. 146-153 (2003)
-
[Publications] Naoki Yoshinaga, Kentaro Torisawa, Jun'ichi Tsujii: "Comparison between CFG filtering techniques for LTAG and HPSG"In the Proceedings of the 41st ACL companion volume. 185-188 (2003)
-
[Publications] Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii: "Extracting attributes and their values from Web pages, chapter in Web Document Analysis - Challenges and Opportunities"World Scientific - Series in Machine Perception and Artificial Intelligence. (2003)