2007 Fiscal Year Annual Research Report
自動獲得した世界知識に基づく自然言語テキスト中の関連性認識
Project/Area Number |
06J11710
|
Research Institution | The University of Tokyo |
Principal Investigator |
笹野 遼平 The University of Tokyo, 大学院・情報理工学系研究科, 特別研究員(DC1)
|
Keywords | 自然言語処理 / 照応解析 / 固有表現抽出 / 格フレーム構築 / ゼロ照応解析 |
Research Abstract |
構造的言語処理を用いた固有表現抽出システムの構築、固有表現抽出技術や大規模コーパスを用いた高精度なフレーム辞書の構築、構築した格フレームに基づく確率的なゼロ照応解析システムの構築を行った。 固有表現抽出システムの構築では、先行研究で主に用いられてきた局所的な情報に加えて、先行する文中に出現した解析対象と同表記の形態素の解析結果や、係り受け解析、共参照解析、固有表現情報付き格フレームを用いた格解析結果などから得られるより大域的な情報を素性として用いたSVMに基づく判定機を構築することにより、既存の手法よりも高精度な固有表現抽出を実現した。(IJCNLP2008で発表) 格フレーム構築に関しては、まず格フレームの用例スパースネスの問題に対処するため、コーパスサイズの拡大、および、固有表現解析技術などを用いた用例の汎化による格フレームのカバレッジへの影響の調査を行い、大規模なコーパスおよび用例の汎化により、高カバレッジな格フレームを構築できることを確認した。また、出現分布に基づく単語間類似度を用いて格フレームを構築することによりシソーラスに依らない格フレーム構築を実現した。(言語処理学会第14回年次大会で発表) ゼロ照応解析に関しては、用例の汎化情報を含む大規模な格フレームを用いたゼロ代名詞の自動検出、さらに、共参照解析技術や固有表現解析技術、大規模格フレームなどに基づく確率的な評価を用いたゼロ代名詞解析を統合した、ゼロ照応解析システムを構築し、従来よりも高精度なゼロ照応解析を実現した。(未発表)
|
Research Products
(3 results)