本研究では、階層的に整理された専門用語集を用いて表題を解析することにより、科学技術論文を階層的かつ詳細に分類することを実現する。本年度は、以下のことを行なった。 1. 調査・実験用データの整備 (1) 専門用語集のオンライン化:岩波情報科学辞典の「用語の木」と呼ばれる階層的専門用語集を計算機で利用可能な形式に整えた。 (2) 論文表題データベースの作成:人工知能学会誌10年分の論文表題をデータベース化した。 2. 論文表題言い換えの実現 論文表題中の複合名詞に動詞的概念を表す名詞が含まれている場合、それを動詞に言い換える方法を検討し、実現した。この方法により、通常、名詞句として構成される論文表題を文に言い換えることができる。これにより、論文表題の内容を「何をどうした」という形で捉えることが可能となった。 3. 表題解析による論文分類システムの試作 表題中に存在する専門用語を見つけ、それに基づき論文を分類するシステムを試作した。本システムは、まず、「における」「に基づく」などの機能語を用いて論文表題をいくつかの複合名詞句に分割する。次に、これらの複合名詞句と専門用語集との照合を行ない、複合名詞句に含まれる専門用語を発見する。最後に、発見された専門用語に基づき、その論文に割り当てるべき分類コードを決定する。この方法は、予備実験において、70%以上の高い精度で正しく分類コードを決定できることができた。
|