研究概要 |
専門用語語彙の体系的収集手法の構築を目的として,平成16年度は,これまで作成してきた専門用語変形ルールの洗練・拡充を行った。具体的には,(1)3要素以上から成る複合語を扱うルールの自動生成を行うプリコンパイラの作成と,(2)各ルールのパフォーマンスの調査に基づく有用なルールの選別を行い,異形抽出のパフォーマンスの向上を実現した(同義表現および関連語を80%以上の精度で抽出できるようになった)。この成果については既に研究発表を行っている。 また,平成17年度に実施を計画している分類語彙集構築手法の検討の準備作業として,専門用語変形ルールを適用した関連用語収集システムの試作を行った。具体的には,(1)専門用語変形ルールと,変形後の異形のタイプ(表す概念に関する元の用語との関係)との対応付けの整理と,(2)抽出した異形から収集の対象とする関連用語に加工するためのルールの作成を行い,さらに(3)実際にそれらを実装したシステムを作成した。収集対象としている関連用語のタイプは,共通するカテゴリに属する関連語,類種関係の下位語,そして,それらの関連語・下位語および元の用語の同義表現である。また,収集の情報源としたのは,ウェブページおよび大学のシラバスである。 上述のシステムを評価するために,情報処理分野の専門用語を対象として収集パフォーマンスの評価を行った。当該分野の統制語彙として「EDR電子化辞書」の記載語を用いて,それらの関連用語の収集を行った結果,約80%の精度で,関係のタイプまで区別したうえで関連用語が抽出できることが確認できた。この成果の一部については既に研究発表を行っている。
|