2002 Fiscal Year Annual Research Report
Project/Area Number |
12480089
|
Research Institution | NARA INSTITUTE OF SCIENCE AND TECHNOLOGY |
Principal Investigator |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
|
Co-Investigator(Kenkyū-buntansha) |
大谷 朗 大阪学院大学, 情報学部, 講師 (50283817)
MIYAMOTO Edson 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (60335479)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
|
Keywords | 統計的係り受け解析 / 制約に基づく言語処理 / 主辞駆動区構造文法 / 生成語彙 / 機械学習 / サポートベクターマシン / 統計処理と制約処理の融合 |
Research Abstract |
電子化された言語データの増加に伴い、統計的言語処理が盛んに研究されているが、多くは表面的な言語処理が対象であり、詳細な意味解析など深い言語処理を行うには適切でない。一方で、主辞駆動句構造文法に代表される制約に基づく文法では、個々の単語に詳細な言語情報を記述し、単語固有の文法現象を説明することができるが、制約に合致する文の間の解釈の優先度の違いを説明できないこと、制約に少しでも違反する文の解析を行うことができないなどの欠点がある。 本研究では、これら両者の欠点を補うため、高精度の単語係り受け解析を統計情報に基づく頑健な方法で実現し、得られた統語構造を利用して、制約に基づく文法による詳細な解析を行うことを目的とし、その際、制約違反を緩和するために、生成語彙理論で導入されたタイプ強制や共構成という演算を実装するためのソフトウェアシステムとインタフェースを構築した。 係り受け解析については、サポートベクターマシンという機械学習を用い、上昇型に決定的に解析を行うアルゴリズムを提案し、日本語および英語の解析システムを構築した。制約に基づく文法として、主辞駆動句構造文法に基づく日本語文法を引き続き開発するとともに、タイプ強制と共構成という高次の生成演算を行うメカニズムを実装した。また、統計解析および文法情報を受け取って、文解析を行い、その過程を表示するためのユーザインタフェースを構築した。
|
Research Products
(6 results)
-
[Publications] 工藤拓, 松本裕治: "チャッキングの段階適用による日本語係り受け解析"情報処理学会論文誌. 43・6. 1834-1842 (2002)
-
[Publications] Taku Kudo, Yuji Matsumoto: "Japanese Dependency Analysis using Cascaded Chunking"Proc. 6^<th> Conference on Natural Language Learning. CoNLL02. 63-69 (2002)
-
[Publications] Edson Miyamoto: "Case markers as clause boundary inducers in Japanese"Journal of Psycholinguistic Research. 31・4. 307-346 (2002)
-
[Publications] 大谷朗, 松本裕治: "NAIST JPSGにおける授受構文の形式化"日本認知科学会第19回大会論文集. 19. 86-87 (2002)
-
[Publications] Ryu Iida, Kentaro Inui, Hiroya Takamura, Yuji Matsumoto: "Incorporating Contextual Clues in Trainable Models for Coreference Resolution"EACL2003 Workshop on The Computational Treatment of Anaphora. (to appear). (2003)
-
[Publications] 森本芳弘, 松本裕治: "HPSGの単一化の機能拡張と実行過程の追跡システムの実装"言語処理学会第9回年次大会発表論文集. 9. 429-432 (2003)