2007 Fiscal Year Annual Research Report
語彙意味論に基づく言い換え計算機構の工学的実現と言い換え知識獲得への応用
Project/Area Number |
17300047
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
乾 健太郎 Nara Institute of Science and Technology, 情報科学研究科, 准教授 (60272689)
|
Co-Investigator(Kenkyū-buntansha) |
竹内 孔一 岡山大学, 大学院・自然科学研究科, 講師 (80311174)
藤田 篤 名古屋大学, 大学院・工学研究科, 助教 (10402801)
中谷 健太郎 甲南大学, 文学部, 准教授 (80388751)
|
Keywords | 自然言語処理 / 含意関係認識 / 言い換え / 語彙知識 / 語彙意味論 / 述語項構造 / 知識獲得 / 語彙概念構造 |
Research Abstract |
本研究の目的は,動詞などの述語とその項からなる述語項構造を事態表現の基本単位と仮定し,語彙意味論等の言語学的知見をふまえて述語項構造間の同義・含意関係に関する基本知識を設計整備することであった.これに対し,(1)動詞語釈文の構造化,(2)語彙概念構造(LCS)に基づく事態上位オントロジーの構築,(3)コーパスからの事態間関係獲得,の互いに相補的な3つのアプローチを提案し,以下の成果を得た. (1)動詞語釈文の構造化国語辞典の語釈文から述語項構造間の基本的な意味関係を収集する研究に取り組んだ.例えば,動詞「倒す」の語釈文「立っている物に力を加え傾け、横にする」からは,「XがYを倒す→XがYを横にする(上位下位関係)」の他,「→XがYに力を加える(行為-手段関係)」,多様な意味関係が収集できる.実際に岩波国語辞典第5版の収録動詞(11469語)から8種類の意味関係を合わせて約3万5千件収集した. (2)LCSに音尽く事態上位オントロジーの構築LCSにおける動詞意味分析の枠組みに基づき,高頻度動詞約4千語,7千語義について5階層からなる意味分類を行った.最下層は約千クラスに分類されており,例えば,「所属・客体変化」のクラスには「配属する,取り立てる,引き抜く,立てる,招く」などが属し,これらはすべて同じ項構造を持つ.これにより,(1)の語釈文の構造化だけでは捉えられない基本概念間の同義・含意関係をカバーできる. (3)コーパスからの事態間関係知識の獲得「〜したため〜した」のような共起パターンと項共有情報を併用することにより,大規模なテキストデータから事態間関係知識を自動的に獲得する研究に取り組み,5億文規模のコーパスから行為-効果関係や行為-手段関係等が1万を超える規模で80%以上の精度で獲得できることを確認した.
|
Research Products
(8 results)