2008 Fiscal Year Annual Research Report
Project/Area Number |
20800029
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松吉 俊 Nara Institute of Science and Technology, 情報科学研究科, 特任助教 (10512163)
|
Keywords | 言語資源 / 言い換え / 述語句 / 自然言語処理 / 言語学 |
Research Abstract |
本研究の目的は、類似した意味を持つ述語句(類義述語句)を同定するために必要な語彙的知識を整理して体系化するとともに、それらの知識を集積し知識データベースを編纂することである。本年度は、以下の2つに関して研究を行った。 1.類義述語句同定に必要な語彙的知識の体系化:類義述語句同定に際して、あらかじめ語彙的知識として記述しておくべき情報の種類を整理した。具体的には、次のことを行った。(1)計算機で利用可能な既存の言語資源を調査し、それらにおいては、特に、動詞間および形容詞間の類義・反義に関する知識が不十分であると判断した。(2)この問題に対する1つの解として、複数のシソーラスと補助的な二項関係リストからなる知識体系を設計した。 2.同定の基盤となる知識データベースの編纂:上記1.の体系に従い、知識データベースの仕様を定め、実際にデータベースの編纂を始めた。具体的には、次のことを行った。(1)反義関係を考慮した既存のシソーラスの意味クラスを人手で拡張し、新たに語義単位で約1万の動詞と約3,500の形容詞を追加することにより、19,456エントリーからなる述語シソーラスを構築した。(2)国語辞典の見出し語と、その語釈文に存在する述語との間に人手で関係を付与することにより、10,115の類義関係知識、1,432の反義関係知識、4,755の上位関係知識を整備・集積した。(3)出現頻度の高い1,376の動詞(の語義)に対して、それがとりえる複数の項構造間の項の対応関係を人手で付与した。
|