2000 Fiscal Year Annual Research Report
Project/Area Number |
12480089
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
|
Co-Investigator(Kenkyū-buntansha) |
宮田 高志 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (00283929)
|
Keywords | 統計的自然言語処理 / 制約に基づく文法 / 係り受け解析 / 単一化文法 / 主辞駆動句構造文法 / 統合処理 / 自然言語処理 / 構文解析 |
Research Abstract |
統計的な言語解析と制約に基づく文法の融合を目指し、本年度は、それぞれの手法の開発を中心に行った。統計的言語解析においては、Support Vector Machine(SVM)という学習アルゴリズムに基づいて高精度の係り受け解析が可能なシステムを開発した。日本語の文節同士の係り受けのしやすさをSVMによって学習し、その結果を擬似的な確率値に変換することにより、従来法である確率モデルを利用する解析法を示した。さらに、文節間の係り受けのしやすさを直接用いることにより、単純な係り受け解析の段階適用により、効率よく精度も高い解析その結果、従来のどの統計的係り受け解析よりも精度の高い手法を提案することができた。また、制約に基づく文法については、主辞駆動句構造文法(HPSG)に基づく実用的な日本語文法の開発を目指して、いくつかの言語現象について検討し、実現のための手法を提案した。具体的には、次の3点について研究を行った。(1)日本語の格助詞の取り扱いについて網羅的な現象の調査を行い、格助詞を伴う様々な表現が処理可能な統一的な枠組みを提案した。(2)日本語のサ変名詞およびそれを用言化する機能動詞「する」の取り扱いについて考察し、基本的な語彙記述を与えることによって現象の説明ができることを示した。(3)日本語の複文構造について研究し、複文の接続表現とテンスやアスペクトなど動詞の有限性の記述との間の関係を記述する方法を提案し、それによって、複文における統語構造の曖昧性の問題を自然に解消する枠組みの提案を行った。
|
Research Products
(6 results)
-
[Publications] 大谷朗,宮田高志,松本裕治: "HPSGに基づく日本語の格助詞に関する-考察"日本認知科学会第17回大会発表論文集. 17. 136-137 (2000)
-
[Publications] Taku Kudoh and Yuji Matsumoto: "Japanese Dependency Structure Analysis Based on Support Vector Machines"Proceedings of the 2000 Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. 5. 18-25 (2000)
-
[Publications] 大谷朗,宮田高志,松本裕治: "HPSGにもとづく日本語文法について-実装に向けての精緻化・拡張-"自然言語処理. 7(5). 19-49 (2000)
-
[Publications] 大谷朗,宮田高志,松本裕治: "述語の隣接と述部の付加における意味的階層性"情報処理学会自然言語処理研究会研究報告. 2000-NL-140. 103-110 (2000)
-
[Publications] 宮田高志,山本薫,松本裕治: "Support Vector Machine による英語係り受け解析"情報処理学会自然言語処理研究会研究報告. 2000-NL-140. 135-142 (2000)
-
[Publications] Takashi Miyata,Akira Ohtani,Yuji Matsumoto: "An HPSG Account of the Hierarchical Clause Formation in Japanese : HPSG-Based Japanese Grammar for Practical Parsing"Proceedings the 15th Pacific Asia Conference on Language,Information and Computation. 15. 305-316 (2001)