2007 Fiscal Year Annual Research Report
連接語に着目した専門用語の体系化および技術動向分析への応用
Project/Area Number |
19700152
|
Research Institution | Hiroshima City University |
Principal Investigator |
難波 英嗣 Hiroshima City University, 情報科学研究科, 講師 (50345378)
|
Keywords | 専門用語 / シソーラス / 特許 / 格フレーム |
Research Abstract |
例えば,「形態素解析」「機械翻訳」「データベース」「形態素」という4つの専門用語のうち「形態素解析する」や「機械翻訳する」は存在するが,「データベースする」や「形態素する」という表現は存在しない,隣接用語「する」をとりうる専門用語の多くは,何らかの入力があり,それを処理して出力するものであると考えられる.平成19年度は,このような専門用語を対象に,格フレーム辞書の構築を行った.これまでに,「見る」や「食べる」などの一般的な動詞を対象に,大規模な文書集合から格フレーム辞書を構築するという研究は行われているが,本研究では,それをサ変動詞「する」に隣接可能な専門用語に適用する点が従来研究と異なる. 一般に,専門用語+「する。」という表現を含む文は「AをBにCする。」という構造になっている場合が多く,このような文のヲ格を抽出すればそれがある専門用語の入力に,またニ格を抽出すればそれが出力になっていると考えられる.例えば,「機械翻訳」の場合,Aとして「英語」や「英語文書」などが,Aとして「日本語」や「日本語文書」等が収集できると思われる,同様に形態素解析の場合,Bとして「文書」「テキスト」「文」等が収集できる.本研究では,1993年〜2002年の公開特許公報から「する。」を含む文約2000万文を抽出・構文解析器し,専門用語の格フレーム辞書を構築した.この辞書を用いることで,例えば「構文解析」という用語は.「文」や「日本語入力文」などを入力とし,「木構造」を出力するシステムである,という知識を得ることができた.
|