2001 Fiscal Year Annual Research Report
既存の言語資源からの大規模語彙的言い換え知識の自動獲得
Project/Area Number |
13780293
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
乾 健太郎 九州工業大学, 情報工学部, 助教授 (60272689)
|
Keywords | 自然言語処理 / 自然言語生成 / 言い換え / 言語知識獲得 / 慣用表現 / 言語資源 |
Research Abstract |
本研究では,語彙的言い換えの方法として,(1)シソーラス(類義語辞書)上の同概念語に置換する方法(同概念語への言い換え),(2)国語辞典の語釈文に置換する方法(語釈文への言い換え),の二つを考えている.言い換えの対象は,普通名詞,および動詞・形容詞のうち,基本語(数千語レベル)でないものとする.基本語彙の基準には,NTTの「日本語の語彙特性1:単語の親密度」を用いた.本年度は次の研究に取り組んだ. ・上記(1)のタスクについては,(a)単語間共起制約,(b)語釈文の比較により抽出される単語対の共通/個別特徴,(C)共通/個別特徴と文脈の重なり,といった手がかりを利用してこれを解決する試みを進めた. ・上記(2)のタスクについては,語釈文への置換後に必要となる様々な修正/整形処理を整理し,これを言い換えを構成する部品群として定義した.また,それらの一部を,我々が開発中の上言い換え実験システム上に実装し,その振舞いを調べる実験を行った. ・「足を運ぶ⇒行く/通う」のような慣用的な内容語相当表現の言い換え知識を,(a)対訳つき格フレーム辞書,(b)verb alteration,(c)語釈文,などを組み合わせることによって安価に獲得する方法について検討し,いくつかの予備実験を行った.現在,人手で作成した格交替規則40個,国語辞典から半自動的に作成・洗練した慣用句言い換え規則約4,100個,機械翻訳用対訳辞書から抽出・洗練した動詞格フレーム言い換え規則約4,000個をその振舞いを調べる実験を進めている.
|