2001 Fiscal Year Annual Research Report
Project/Area Number |
12878058
|
Research Institution | Kyoto University |
Principal Investigator |
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
|
Keywords | 用語定義文 / ワールドワイドウェブ / 定義文抽出 / 自動編集 |
Research Abstract |
本研究の目的は、与えられた用語に対して、(1)その用語が説明されているウェブページを見つけ出し、(2)そのページから用語の説明だけを抜き出し、(3)それらを整理して提示するシステムを実現することである。昨年度の研究で、プロトタイプシステムを実現することができたので、今年度は、各部の改良と調整を行なった。 【a.ペ-ジ収集の改良】 これまではページ収集にGooとInfoseekを利用していたが、これに加えてLycosを利用し、収集するページを増やした。 【b.用語説明の抽出】 これまでは、形態素解析結果に基づき用語を定義する文(用語定義文)を判定し、用語を説明する段落(用語説明)を抽出していた。文を構文解析し、その結果に基づき定義文を判定するプログラムを作成し、この部分の改良を試みたが、結果は芳しくなかった。 【c.用語説明のグループ化】 プログラムの一部を変更し、グループ化モジュールの高速化を実現した。 2年間の研究により、ウェブを仮想的な辞書・辞典化することができることを実証した。これにより、当初の目的を達成できたと考える。しかしながら、精度(品質)と速度については、さらなる改善が必要である。 なお、本システムのアーキテクチャが他の言語に対しても有効であることを実証するために、英語に対してほぼ同様のシステムを実現し、動作することを確認した。
|
Research Products
(1 results)