2013 Fiscal Year Annual Research Report
大域情報を利用した同時処理による自然言語解析手法の研究
Project/Area Number |
23240020
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
|
Co-Investigator(Kenkyū-buntansha) |
新保 仁 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90311589)
DUH Kevin 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80637322)
小町 守 首都大学東京, システムデザイン研究科, 准教授 (60581329)
|
Project Period (FY) |
2011-04-01 – 2014-03-31
|
Keywords | 自然言語処理 / 形態素解析 / 統語解析 / 機械学習 / 言語資源 / 述語項構造解析 |
Research Abstract |
自然言語処理の基本的な解析法である単語分かち書き,品詞解析,統語解析,述語項構造解析に対して,広い情報および複数の処理の同時処理に関する研究を行った. 英語に関して,品詞解析と統語解析をつなぐ情報として機能的な役割をする複単語表現の辞書を構築し,品詞解析と複単語表現の同定を同時に解析する手法を実装し,品詞解析の精度向上が可能であることを示した.また,複文構造を構成する接続表現を抽出し,その自動同定システムを構築した.そして,自動同定された接続表現の情報を素性として利用することで統語解析の性能向上が可能であることを示した.固定的な英語の複単語表現と句動詞を網羅的に収集し,辞書として整理した.また,英語の依存構造解析において,複数の解の候補の大域的な違いを同時に考慮することを可能にするため,構文森として表現された依存構造の解候補の中から最適な候補を抽出するアルゴリズムを提案した. 述語項構造解析の精度向上を目指し,中国語の述語項構造解析に適用可能な様々な素性とそれらを同時に利用する方法を適用し,その効果を調べるとともに,従来法を上回る精度を達成する素性の組み合わせと解析方法を提案した.また,日本語の述語項構造解析に対して,Markov Logic Networksによる同時制約を記述することにより,複数の項の関係を考慮した述語項構造解析を実装し,従来手法を上回る性能を達成した. 単語や言語表現の意味的類似度の計算性能の向上のためにハブの抑制が重要であることを示し,ハブの抑制方法を提案した.複合表現の意味計算において両単語の意味が同時に影響し合う現象を考慮した意味計算手法を提案した.
|
Current Status of Research Progress |
Reason
25年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
25年度が最終年度であるため、記入しない。
|