研究課題/領域番号 |
15650025
|
研究種目 |
萌芽研究
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 名古屋大学 |
研究代表者 |
長尾 確 名古屋大学, エコトピア科学研究機構, 教授 (70343209)
|
研究分担者 |
松原 茂樹 名古屋大学, 情報連携基盤センター, 助教授 (20303589)
傳 康晴 千葉大学, 文学部・行動科学科, 助教授 (70291458)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
|
研究期間 (年度) |
2003 – 2004
|
研究課題ステータス |
完了 (2004年度)
|
配分額 *注記 |
3,300千円 (直接経費: 3,300千円)
2004年度: 1,100千円 (直接経費: 1,100千円)
2003年度: 2,200千円 (直接経費: 2,200千円)
|
キーワード | Semantic Web / オントロジー / 用語辞典 / 言語的アノテーション / 用語ネットワーク / コーパス / 確率的アルゴリズム / 語彙ネットワーク / 検索・推論システム |
研究概要 |
Semantic Webは、オントロジーに基づくコンテンツの意味内容記述に基づくグローバルな知識ベースであり、近年盛んに研究活動が行われている。そのベースとなるオントロジーを作成するために、辞典のような自然言語で記述・体系化された知識源の、人間と機械の共同作業による意味構造化を目指す。そこで、昨年度に引き続き、用語辞典(認知科学辞典)コンテンツをXML(Extensible Markup Language)によって構造化し、用語の定義文に対して、言語構造や語彙情報に基づく言語的アノテーションの付与を行った。これは、言語的アノテーションに関する研究代表者らの研究成果であるアノテーション作成支援システムを用いることによって、半自動的に行った。 今年度は、昨年度の実験結果を踏まえて、辞典項目への言語的アノテーションによって構築される用語のネットワーク構造の修正・補完を行った。たとえば、ネットワーク構造の構成要素に欠落があり、関係が正しく導かれない場合は、XML構造化されたコーパスを用いて、欠けている部分の補完を試みた。論文のカテゴリー分け、未知語の認定などには機械学習の手法を用いた。人間は、コーパスから得られるネットワーク構造を吟味し、用語のネットワーク構造に付け加える作業を行った。同一の用語が異なる分野あるいは異なる文脈で使われる現象を、機械学習の手法を用いて発見し、用語を細分化した。これは、用語に属性を付与することによって行った。ベイジアンネットワークに基づく確率的アルゴリズムによって、複数の分野が混在する文脈において、用語の属性が適切に分類できることを確認した。これらの作業を通じて、オントロジーの構築法を提案した。
|