2009 Fiscal Year Annual Research Report
Project/Area Number |
20800029
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松吉 俊 Nara Institute of Science and Technology, 情報科学研究科, 特任助教 (10512163)
|
Keywords | 言語資源 / 言い換え / 述語句 / 自然言語処理 / 言語学 |
Research Abstract |
本研究の自的は、類似した意味を持つ述語句(類義述語句)を同定するために必要な語彙的知識を整理して体系化するとともに、それらの知識を集積し、知識データベースを編纂することである。前年度に構築した知識データベースを用いて類義述語句を同定する調査実験を行い、その結果に基づいて、本年度は、以下の2つに関して研究を行った。 1.エントリーの標準化:知識データベース利用時に発生した、単位の不一致の問題と表記のゆれの問題を解決するため、国立国語研究所が配布している形態素解析用辞書UniDicの単位と語彙素を用いて、知識データベース内のエントリーを標準化し、関係知識の適用範囲を拡大させた。具体的には、次のことを行った。(1)前年度に構築した知識データベースから、出現頻度の高い動詞を前件に持つ約19,000の関係知識と、形容詞を前件に持つ約2,000の関係知識を抽出した。(2)これらのエントリーを、プログラムと人手により、UniDicの単位で語彙素と対応付けた。最終的に、語彙素単位で16,157エントリー、実際に文に出現するレベルの単位である書字形基本形単位で351,264エントリーの関係知識を得た。 2.モダリティ表現辞書の編纂:機能語や複合辞のように述語句のモダリティに直接関与する動詞や形容詞についての知識を整備することが、モダリティ解析処理に有用であることから、それらの辞書を編纂した。具体的には、次のことを行った。(1)辞書情報として記述すべき項目について調査・検討し、辞書の仕様を定めた。(2)内省に基づき、動詞3,145語、形容詞・形容動詞517語に対して、下位の述語に関与する、態度、真偽判断、価値判断のモダリティの情報を人手で記述した。
|
Research Products
(4 results)