2004 Fiscal Year Annual Research Report
Semantic Webの高度化のためのオントロジーの自動生成に関する研究
Project/Area Number |
15650025
|
Research Institution | Nagoya University |
Principal Investigator |
長尾 確 名古屋大学, エコトピア科学研究機構, 教授 (70343209)
|
Co-Investigator(Kenkyū-buntansha) |
松原 茂樹 名古屋大学, 情報連携基盤センター, 助教授 (20303589)
傳 康晴 千葉大学, 文学部・行動科学科, 助教授 (70291458)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
|
Keywords | Semantic Web / オントロジー / 用語辞典 / 言語的アノテーション / 用語ネットワーク / コーパス / 確率的アルゴリズム |
Research Abstract |
Semantic Webは、オントロジーに基づくコンテンツの意味内容記述に基づくグローバルな知識ベースであり、近年盛んに研究活動が行われている。そのベースとなるオントロジーを作成するために、辞典のような自然言語で記述・体系化された知識源の、人間と機械の共同作業による意味構造化を目指す。そこで、昨年度に引き続き、用語辞典(認知科学辞典)コンテンツをXML(Extensible Markup Language)によって構造化し、用語の定義文に対して、言語構造や語彙情報に基づく言語的アノテーションの付与を行った。これは、言語的アノテーションに関する研究代表者らの研究成果であるアノテーション作成支援システムを用いることによって、半自動的に行った。 今年度は、昨年度の実験結果を踏まえて、辞典項目への言語的アノテーションによって構築される用語のネットワーク構造の修正・補完を行った。たとえば、ネットワーク構造の構成要素に欠落があり、関係が正しく導かれない場合は、XML構造化されたコーパスを用いて、欠けている部分の補完を試みた。論文のカテゴリー分け、未知語の認定などには機械学習の手法を用いた。人間は、コーパスから得られるネットワーク構造を吟味し、用語のネットワーク構造に付け加える作業を行った。同一の用語が異なる分野あるいは異なる文脈で使われる現象を、機械学習の手法を用いて発見し、用語を細分化した。これは、用語に属性を付与することによって行った。ベイジアンネットワークに基づく確率的アルゴリズムによって、複数の分野が混在する文脈において、用語の属性が適切に分類できることを確認した。これらの作業を通じて、オントロジーの構築法を提案した。
|